Tre righe in piu` tanto per committare ...

[gapil.git] / fileintro.tex
diff --git a/fileintro.tex b/fileintro.tex

index bc08ca9a92f230fbd32f3e232ea8cf3c89e44ddc..c03e36032d1b25e5e39a42c322eb9b982a0cf4e2 100644 (file)
--- a/fileintro.tex
+++ b/fileintro.tex
@@ -11,11 +11,11 @@ Questo significa che si pu
  dalla seriale, alla parallela, alla console, e agli stessi dischi attraverso i
  cosiddetti file di dispositivo (i \textit{device files}). Questi sono dei file
  speciali agendo sui quali i programmi possono leggere, scrivere e compiere
-operazioni direttamente sulle perferiche, usando le stesse funzioni che si
+operazioni direttamente sulle periferiche, usando le stesse funzioni che si
  usano per i normali file di dati.
  
  In questo capitolo forniremo un'introduzione alle principali caratteristiche
-di questa interfaccia, su come essa viene implementata in linux e su come sono
+di questa interfaccia, su come essa viene implementata in Linux e su come sono
  organizzati i file nel sistema.
  
  
@@ -26,18 +26,20 @@ Visto il ruolo fondamentale che i files vengono ad assumere in un sistema
  unix, è anzitutto opportuno fornire un'introduzione dettagliata su come essi
  vengono trattati dal sistema. In particolare occorre tenere presente dov'è che
  si situa il limite fondamentale fra kernel space e user space che tracciavamo
-al Cap.~\ref{cha:intro_unix}.
+al \capref{cha:intro_unix}.
  
  Partiamo allora da come viene strutturata nel sistema la disposizione dei
  file: per potervi accedere il kernel usa una apposita interfaccia che permetta
  di strutturare l'informazione tenuta sullo spazio grezzo disponibile sui
-dischi, cioè quello che si chiama un \textit{filesystem}. 
+dischi, cioè quello che si chiama un \textit{filesystem} (useremo per brevità
+questo nome al posto della più prolissa traduzione italiana sistema di file). 
  
  Sarà attraverso quest'ultimo che il kernel andrà a gestire l'accesso ai dati
  memorizzati all'interno del disco stesso, strutturando l'informazione in files
-e directory.  Per poter accedere ai file contenuti in un disco occorrerà
-perciò attivare il filesystem, questo viene fatto \textsl{montando} il disco
-(o la partizione del disco).
+e directory (su questo aspetto torneremo con maggiori dettagli in
+\secref{sec:filedir_filesystem}).  Per poter accedere ai file contenuti in un
+disco occorrerà perciò attivare il filesystem, questo viene fatto
+\textsl{montando} il disco (o la partizione del disco).
  
  %In generale un filesystem piazzerà opportunamente sul disco dei blocchi di
  %informazioni riservate che tengono conto degli inodes allocati, di quelli
@@ -64,25 +66,38 @@ oggetti visti attraverso l'interfaccia che manipola i files come le FIFO, i
  link, i socket e gli stessi i file di dispositivo (questi ultimi, per
  convenzione, sono inseriti nella directory \texttt{/dev}).
  
-\subsection{Il \textit{virtual filesystem} di linux}
+\subsection{Il \textit{virtual filesystem} di Linux}
  \label{sec:fileintr_vfs}
  
-Esamineremo adesso come viene implementato l'accesso ai files in linux. Questa
-sezione riporta informazioni sui dettagli di come il kernel gestisce i files,
-ed è basata sul documento di Richard Goochs distribuito coi sorgenti del
-kernel (\texttt{linux/Documentation/vfs.txt}).
-
+Esamineremo adesso come viene implementato l'accesso ai files in Linux. Questa
+sezione riporta informazioni sui dettagli di come il kernel gestisce i files.
  L'argomento è abbastanza ``esoterico'' e questa sezione può essere saltata ad
  una prima lettura; è bene però tenere presente che vengono introdotti qui
  alcuni termini che potranno comparire in seguito, come \textit{inode},
  \textit{dentry}, \textit{dcache}.
  
-In linux il concetto di \textit{everything is a file} è stato implementato
+In Linux il concetto di \textit{everything is a file} è stato implementato
  attraverso il \textit{virtual filesystem} (da qui in avanti VFS) che è
-l'interfaccia astratta che il kernel rende disponibile ai programmi in user
-space attraverso la quale vengono manipolati i files; esso provvede anche
-un'astrazione delle operazioni di manipolazione sui files che permette la
-coesistenza di diversi filesystem all'interno dello stesso albero.
+l'interfaccia che il kernel rende disponibile ai programmi in user space
+attraverso la quale vengono manipolati i files; esso provvede un livello di
+indirezione che permette di collegare le operazioni di manipolazione sui files
+alle operazioni di I/O e gestisce l'organizzazione di questi ultimi nei vari
+modi in cui diversi filesystem la effettuano, permettendo la coesistenza
+di filesystem differenti all'interno dello stesso albero delle directory
+
+Quando un processo esegue una system call che opera su un file il kernel
+chiama sempre una funzione implementata nel VFS; la funzione eseguirà le
+manipolazioni sulle strutture generiche e ridirigendo la chiamata alla
+opportune routine del filesystem specifico a cui si fa riferimento, saranno
+queste a chiamare le funzioni di piu basso livello che eseguono le operazioni
+di I/O sul dispositivo fisico, secondo lo schema riportato in \nfig.
+
+\begin{figure}[htb]
+  \centering
+  
+  \caption{Schema delle operazioni del VFS}
+  \label{fig:fileintro_VFS_scheme}
+\end{figure}
  
  La funzione più importante implementata dal VFS è la system call \texttt{open}
  che permette di aprire un file. Dato un pathname viene eseguita una ricerca
@@ -127,8 +142,9 @@ una struttura di tipo \texttt{file} in cui viene inserito un puntatore alla
  dentry e una struttura \verb|f_ops| che contiene i puntatori ai metodi che
  implementano le operazioni disponibili sul file. In questo modo i processi in
  user space possono accedere alle operazioni attraverso detti metodi, che
-saranno diversi a seconda del tipo di file (o dispositivo) aperto. Un elenco
-delle operazioni disponibili è riportato in \ntab.
+saranno diversi a seconda del tipo di file (o dispositivo) aperto (su questo
+torneremo in dettaglio in \secref{sec:fileunix_fd}). Un elenco delle operazioni
+previste dal kernel è riportato in \ntab.
  
  \begin{table}[htb]
    \centering
@@ -173,8 +189,9 @@ diversi filesystem (come quelli usati da Windows o MacOs) 
  
  In unix è implementata da qualunque filesystem standard una forma elementare
  (ma adatta alla maggior parte delle esigenze) di controllo di accesso ai
-files. Torneremo sull'argomento in dettaglio più avanti, qui ci limitiamo ad
-una introduzione dei concetti essenziali.
+files. Torneremo sull'argomento in dettaglio più avanti (vedi
+\secref{sec:filedir_access_control}), qui ci limitiamo ad una introduzione dei
+concetti essenziali.
  
  Si tenga conto poi che quanto diremo è vero solo per filesystem di tipo Unix,
  e non è detto che sia applicabile (ed infatti non è vero per il filesystem di
@@ -184,7 +201,7 @@ di controllo di accesso molto pi
  
  Ad ogni file Unix associa sempre l'utente che ne è proprietario (il cosiddetto
  \textit{owner}) e il gruppo di appartenenza, secondo il meccanismo degli uid e
-gid spiegato in Sez.~\ref{sec:intro_usergroup}, e un insieme di permessi che
+gid accennato in \secref{sec:intro_usergroup}, e un insieme di permessi che
  sono divisi in tre classi, e cioè attribuiti rispettivamente al proprietario,
  a qualunque utente faccia parte del gruppo cui appartiene il file, e a tutti
  gli altri utenti.
@@ -194,10 +211,10 @@ significativi sono usati a gruppi di tre per indicare i permessi base di
  lettura, scrittura ed esecuzione (indicati rispettivamente con le lettere
  \textit{w}, \textit{r} \textit{x}) applicabili rispettivamente al
  proprietario, al gruppo, a tutti (una descrizione più dettagliata dei vari
-permessi associati ai file è riportata in \ref{sec:filedir_suid_sgid}).  I
+permessi associati ai file è riportata in \secref{sec:filedir_suid_sgid}).  I
  restanti tre bit sono usati per indicare alcune caratteristiche più complesse
  (\textit{suid}, \textit{sgid}, e \textit{sticky}) su cui pure torneremo in
-seguito (vedi \ref{sec:filedir_suid_sgid} e \ref{sec:filedir_stiky}).
+seguito (vedi \secref{sec:filedir_suid_sgid} e \secref{sec:filedir_sticky}).
  
  Tutte queste informazioni sono tenute per ciascun file nell'inode. Quando un
  processo cerca l'accesso al file esso controlla i propri uid e gid
@@ -209,14 +226,14 @@ pertanto accesso senza restrizione a qualunque file del sistema.
  
  In realtà il procedimento è più complesso di quanto descritto in maniera
  elementare qui; inoltre ad un processo sono associati diversi identificatori,
-torneremo su questo in maggiori dettagli in seguito in \ref{sec:proc_perms}.
+torneremo su questo in maggiori dettagli in seguito in \secref{sec:proc_perms}.
  
  \subsection{I tipi di files}
  \label{sec:fileintr_file_types}
  
  Come detto in precedenza esistono vari tipi di oggetti implementati del VFS
  per i quali è disponibile l'interfaccia astratta da esso provveduta. Un elenco
-dei vari tipi di file è il seguente:
+dei vari tipi di file definiti nel VFS è il seguente:
   
  \begin{table}[htb]
    \begin{center}
@@ -252,17 +269,18 @@ accesso.  Una delle differenze principali con altri sistemi operativi (come il
  VMS o Windows) è che per Unix tutti i file di dati sono identici e contengono
  un flusso continuo di bytes; non esiste cioè differenza per come vengono visti
  dal sistema file di diverso contenuto o formato (come nel caso di quella fra
-file di testo e binari che c'è in windows) né c'è una strutturazione a record
+file di testo e binari che c'è in Windows) né c'è una strutturazione a record
  per il cosiddetto ``accesso diretto'' come nel caso del VMS.
  %  (con i kernel
  % della serie 2.4 è disponibile una forma di accesso diretto ai dischi il
  % \textit{raw access} che però non ha nulla a che fare con questo).
  
-Una seconda differenza è nel formato dei file ascii; in Unix la fine riga è
+Una seconda differenza è nel formato dei file ASCII; in Unix la fine riga è
  codificata in maniera diversa da Windows o MacIntosh, in particolare il fine
  riga è il carattere \texttt{LF} (o \verb|\n|) al posto del \texttt{CR}
-(\verb|\r|) del mac e del \texttt{CR LF} di windows. Questo può causare alcuni
-problemi qualora si facciano assunzioni sul terminatore della riga.
+(\verb|\r|) del mac e del \texttt{CR LF} di Windows. Questo può causare alcuni
+problemi qualora nei programmi si facciano assunzioni sul terminatore della
+riga.
  
  
  \section{Una panoramica sull'uso dei file}
@@ -306,7 +324,7 @@ operazioni di controllo sul particolare tipo di oggetto del VFS scelto occorre
  usare l'interfaccia standard di unix coi file descriptors. Allo stesso modo
  devono essere usati i file descriptor se si vuole ricorrere a modalità
  speciali di I/O come il polling o il non-bloccante (vedi
-\ref{sec:file_bohhhhh}).
+\secref{sec:file_xxx}).
  
  Gli stream forniscono un'interfaccia di alto livello costruita sopra quella
  dei file descriptor, che tratta tutti i file nello stesso modo, con
@@ -358,7 +376,7 @@ Questo 
  ogni processo avrà la sua posizione corrente nel file, che non sarà
  influenzata da quello che altri processi possono fare. Anzi, aprire un file
  significa appunto creare ed inizializzare una tale struttura, per cui se si
-apre due volte lo stesso file all'interno dello stesso processo, si otterrano
+apre due volte lo stesso file all'interno dello stesso processo, si otterranno
  due file descriptor o due stream che avranno ancora una posizione corrente nel
  file assolutamente indipendente.
  
@@ -366,11 +384,11 @@ Si tenga conto inoltre che un'altro dei dati contenuti nella struttura di
  accesso è un riferimento all'inode del file, pertanto anche se il file viene
  cancellato da un altro processo, sarà sempre possibile mantenere l'accesso ai
  dati, e lo spazio su disco non verrà rilasciato fintanto che il file non sarà
-chiuso e l'ultimo riferimento cancellato. È pertanto possibile (e pratica
-comune) aprire un file provvisorio per cancellarlo immediatamente dopo; in
-questo modo all'uscita del programma il file scomparirà definitivamente dal
-disco, ma il file ed il suo contenuto saranno disponibili per tutto il tempo
-in cui il processo è attivo.
+chiuso e l'ultimo riferimento cancellato. È pertanto possibile (come vedremo
+in dettaglio in \secref{sec:filedir_link}) aprire un file provvisorio per
+cancellarlo immediatamente dopo; in questo modo all'uscita del programma il
+file scomparirà definitivamente dal disco, ma il file ed il suo contenuto
+saranno disponibili per tutto il tempo in cui il processo è attivo.
  
  Ritorneremo su questo più avanti, quando tratteremo l'input/output sui file,
  esaminando in dettaglio come tutto ciò viene realizzato.