Prosegue la risistemazione degli indici. Trattata CLONE_FS.

[gapil.git] / fileio.tex
diff --git a/fileio.tex b/fileio.tex

index a963c9622103bdf58b2ae3d4246dcbe0951b0056..c5f805e9da412961fcf45878acc9347cd0cfd8b5 100644 (file)
--- a/fileio.tex
+++ b/fileio.tex
@@ -29,13 +29,13 @@ ultime le caratteristiche più avanzate.
  
  
  Come visto in sez.~\ref{sec:file_vfs_work} il kernel mette a disposizione
-tramite il \itindex{Virtual~File~System} \textit{Virtual File System} una
-serie di \textit{system call} che consentono di operare sui file in maniera
-generale. Abbiamo trattato quelle relative alla gestione delle proprietà dei
-file nel precedente capitolo, vedremo quelle che si applicano al contenuto dei
-file in questa sezione, iniziando con una breve introduzione sull'architettura
-dei \textit{file descriptor} per poi trattare le funzioni di base e le
-modalità con cui consentono di gestire i dati memorizzati sui file.
+tramite il \textit{Virtual File System} una serie di \textit{system call} che
+consentono di operare sui file in maniera generale. Abbiamo trattato quelle
+relative alla gestione delle proprietà dei file nel precedente capitolo,
+vedremo quelle che si applicano al contenuto dei file in questa sezione,
+iniziando con una breve introduzione sull'architettura dei \textit{file
+  descriptor} per poi trattare le funzioni di base e le modalità con cui
+consentono di gestire i dati memorizzati sui file.
  
  
  \subsection{I \textit{file descriptor}}
@@ -53,10 +53,10 @@ comunicazione con il kernel che renda possibile operare su di esso. Questo si
  fa aprendo il file con la funzione \func{open} (vedi
  sez.~\ref{sec:file_open_close}) che provvederà a localizzare \itindex{inode}
  l'\textit{inode} del file e inizializzare i puntatori che rendono disponibili
-le funzioni che il \itindex{Virtual~File~System} VFS mette a disposizione
-(quelle di tab.~\ref{tab:file_file_operations}). Una volta terminate le
-operazioni, il file dovrà essere chiuso, e questo chiuderà il canale di
-comunicazione impedendo ogni ulteriore operazione.
+le funzioni che il VFS mette a disposizione (quelle di
+tab.~\ref{tab:file_file_operations}). Una volta terminate le operazioni, il
+file dovrà essere chiuso, e questo chiuderà il canale di comunicazione
+impedendo ogni ulteriore operazione.
  
  All'interno di ogni processo i file aperti sono identificati da un numero
  intero non negativo, che viene chiamato \textit{file descriptor}.  Quando un
@@ -834,9 +834,9 @@ per i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che
  non supportano questa funzione, come ad esempio per i file di
  terminale.\footnote{altri sistemi, usando \const{SEEK\_SET}, in questo caso
    ritornano il numero di caratteri che vi sono stati scritti.} Lo standard
-POSIX però non specifica niente in proposito. Inoltre alcuni
-\index{file!speciali} file speciali, ad esempio \file{/dev/null}, non causano
-un errore ma restituiscono un valore indefinito.
+POSIX però non specifica niente in proposito. Inoltre alcuni file speciali, ad
+esempio \file{/dev/null}, non causano un errore ma restituiscono un valore
+indefinito.
  
  \itindbeg{sparse~file} 
  \index{file!\textit{hole}|(} 
@@ -1490,8 +1490,8 @@ prototipi sono:
  {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
    caso \var{errno} assumerà uno dei valori: 
    \begin{errlist}
-  \item[\errcode{EINVAL}] \param{fd} è un \index{file!speciali} file speciale
-    che non supporta la sincronizzazione.
+  \item[\errcode{EINVAL}] \param{fd} è un file speciale che non supporta la
+    sincronizzazione.
    \end{errlist}
    ed inoltre \errval{EBADF}, \errval{EIO} e \errval{EROFS} nel loro
    significato generico.}
@@ -1560,19 +1560,18 @@ Un problema generale che si pone con l'uso della funzione \func{open}, così
  come per le altre funzioni che prendono come argomenti dei
  \itindsub{pathname}{relativo} \textit{pathname} relativi, è la possibilità,
  quando un \textit{pathname} relativo non fa riferimento ad un file posto
-direttamente nella \index{directory~di~lavoro} directory di lavoro corrente,
-che alcuni dei componenti del \textit{pathname} vengano modificati in
-parallelo alla chiamata a \func{open}, cosa che lascia aperta la possibilità
-di una \itindex{race~condition} \textit{race condition} in cui c'è spazio per
-un \itindex{symlink~attack} \textit{symlink attack} (si ricordi quanto visto
-per \func{access} in sez.~\ref{sec:file_perm_management}).
-
-Inoltre come già accennato, la \index{directory~di~lavoro} directory di lavoro
-corrente è una proprietà del singolo processo; questo significa che quando si
-lavora con i \itindex{thread} \textit{thread} essa sarà la stessa per tutti,
-ma esistono molti casi in cui sarebbe invece utile che ogni singolo
-\itindex{thread} \textit{thread} avesse la sua \index{directory~di~lavoro}
-directory di lavoro.
+direttamente nella directory di lavoro corrente, che alcuni dei componenti del
+\textit{pathname} vengano modificati in parallelo alla chiamata a \func{open},
+cosa che lascia aperta la possibilità di una \itindex{race~condition}
+\textit{race condition} in cui c'è spazio per un \itindex{symlink~attack}
+\textit{symlink attack} (si ricordi quanto visto per \func{access} in
+sez.~\ref{sec:file_perm_management}).
+
+Inoltre come già accennato, la directory di lavoro corrente è una proprietà
+del singolo processo; questo significa che quando si lavora con i
+\textit{thread} essa sarà la stessa per tutti, ma esistono molti casi in cui
+sarebbe invece utile che ogni singolo \textit{thread} avesse la sua directory
+di lavoro.
  
  Per risolvere questi problemi, riprendendo una interfaccia già presente in
  Solaris, a fianco delle normali funzioni che operano sui file (come
@@ -1599,7 +1598,7 @@ sarà la base della risoluzione dei \itindsub{pathname}{relativo}
  passare il relativo file descriptor alle varie funzioni che useranno quella
  directory come punto di partenza per la risoluzione. In questo modo, anche
  quando si lavora con i \itindex{thread} \textit{thread}, si può mantenere una
-\index{directory~di~lavoro} directory di lavoro diversa per ciascuno di essi.
+directory di lavoro diversa per ciascuno di essi.
  
  Questo metodo, oltre a risolvere i problemi di \itindex{race~condition}
  \textit{race condition}, consente anche di ottenere aumenti di prestazioni
@@ -1620,8 +1619,7 @@ esame la nuova funzione di sistema \funcd{openat}, avremo il prototipo:
  \fhead{fcntl.h}
  \fdecl{int openat(int dirfd, const char *pathname, int flags)}
  \fdecl{int openat(int dirfd, const char *pathname, int flags, mode\_t mode)}
-\fdesc{Apre un file a partire da una directory di \index{directory~di~lavoro}
-  lavoro.} 
+\fdesc{Apre un file a partire da una directory di lavoro.} 
  }
  
  {La funzione ritorna gli stessi valori e gli stessi codici di errore di
@@ -1641,11 +1639,11 @@ relativo questo sarà risolto rispetto alla directory indicata
  da \param{dirfd}. Qualora invece si usi un \itindsub{pathname}{assoluto}
  \textit{pathname} assoluto \param{dirfd} verrà semplicemente ignorato. Infine
  se per \param{dirfd} si usa il valore speciale \const{AT\_FDCWD}, la
-risoluzione sarà effettuata rispetto alla directory di
-\index{directory~di~lavoro} lavoro corrente del processo. Si tenga presente
-però che questa, come le altre costanti \texttt{AT\_*}, è definita in
-\headfile{fcntl.h}, pertanto se la si vuole usare occorrerà includere comunque
-questo file, anche per le funzioni che non sono definite in esso.
+risoluzione sarà effettuata rispetto alla directory di lavoro corrente del
+processo. Si tenga presente però che questa, come le altre costanti
+\texttt{AT\_*}, è definita in \headfile{fcntl.h}, pertanto se la si vuole
+usare occorrerà includere comunque questo file, anche per le funzioni che non
+sono definite in esso.
  
  Così come il comportamento, anche i valori di ritorno e le condizioni di
  errore delle nuove funzioni sono gli stessi delle funzioni classiche, agli
@@ -2876,12 +2874,11 @@ sez.~\ref{sec:file_stream_thread}).
  Come per i file descriptor anche per gli \textit{stream} è possibile spostarsi
  all'interno di un file per effettuare operazioni di lettura o scrittura in un
  punto prestabilito, sempre che l'operazione di riposizionamento sia supportata
-dal file sottostante lo \textit{stream}, nel caso cioè in cui si ha a che
-fare con quello che viene detto un file ad \textsl{accesso casuale}. Dato che
-in un sistema Unix esistono vari tipi di file, come le fifo ed i
-\index{file!di~dispositivo} file di dispositivo (ad esempio i terminali), non
-è scontato che questo sia vero in generale, pur essendolo sempre nel caso di
-file di dati.
+dal file sottostante lo \textit{stream}, nel caso cioè in cui si ha a che fare
+con quello che viene detto un file ad \textsl{accesso casuale}. Dato che in un
+sistema Unix esistono vari tipi di file, come le fifo ed i file di dispositivo
+(ad esempio i terminali), non è scontato che questo sia vero in generale, pur
+essendolo sempre nel caso di file di dati.
  
  Con Linux ed in generale in ogni sistema unix-like la posizione nel file, come
  abbiamo già visto in sez.~\ref{sec:file_lseek}, è espressa da un intero
@@ -3294,11 +3291,11 @@ adiacente al buffer.\footnote{questa tecnica è spiegata in dettaglio e con
  Questa è una delle vulnerabilità più sfruttate per guadagnare accessi non
  autorizzati al sistema (i cosiddetti \textit{exploit}), basta infatti inviare
  una stringa sufficientemente lunga ed opportunamente forgiata per
-sovrascrivere gli indirizzi di ritorno nello \itindex{stack} \textit{stack}
-(supposto che la \func{gets} sia stata chiamata da una subroutine), in modo da
-far ripartire l'esecuzione nel codice inviato nella stringa stessa, che in
-genere contiene uno \textit{shell code}, cioè una sezione di programma che
-lancia una shell da cui si potranno poi eseguire altri programmi.
+sovrascrivere gli indirizzi di ritorno nello \textit{stack} (supposto che la
+\func{gets} sia stata chiamata da una subroutine), in modo da far ripartire
+l'esecuzione nel codice inviato nella stringa stessa, che in genere contiene
+uno \textit{shell code}, cioè una sezione di programma che lancia una shell da
+cui si potranno poi eseguire altri programmi.
  
  La funzione \func{fgets} non ha i precedenti problemi di \func{gets} in quanto
  prende in ingresso la dimensione del buffer \param{size}, che non verrà mai
@@ -3418,10 +3415,9 @@ dimensioni del buffer suddetto.
  Se il buffer di destinazione è sufficientemente ampio la stringa viene scritta
  subito, altrimenti il buffer viene allargato usando \func{realloc} e la nuova
  dimensione ed il nuovo puntatore vengono restituiti indietro, si noti infatti
-come entrambi gli argomenti siano dei \itindex{value~result~argument}
-\textit{value result argument}, per i quali vengono passati dei puntatori
-anziché i valori delle variabili, secondo quanto abbiamo descritto in
-sez.~\ref{sec:proc_var_passing}).
+come entrambi gli argomenti siano dei \textit{value result argument}, per i
+quali vengono passati dei puntatori anziché i valori delle variabili, secondo
+quanto abbiamo descritto in sez.~\ref{sec:proc_var_passing}).
  
  Se si passa alla funzione l'indirizzo di un puntatore impostato a \val{NULL} e
  \var{*n} è zero, la funzione provvede da sola all'allocazione della memoria
@@ -3429,9 +3425,8 @@ necessaria a contenere la linea. In tutti i casi si ottiene dalla funzione un
  puntatore all'inizio del testo della linea letta. Un esempio di codice può
  essere il seguente: 
  \includecodesnip{listati/getline.c} 
-e per evitare \itindex{memory~leak} \textit{memory leak} occorre ricordarsi di
-liberare la memoria allocata dalla funzione eseguendo una \func{free} su
-\var{ptr}.
+e per evitare \textit{memory leak} occorre ricordarsi di liberare la memoria
+allocata dalla funzione eseguendo una \func{free} su \var{ptr}.
  
  Il valore di ritorno di \func{getline} indica il numero di caratteri letti
  dallo \textit{stream}, quindi compreso il \textit{newline}, ma non lo zero di
@@ -3493,8 +3488,8 @@ L'output formattato viene eseguito con una delle 13 funzioni della famiglia
  
  
  Le funzioni usano la stringa \param{format} come indicatore del formato con
-cui dovrà essere scritto il contenuto degli argomenti, il cui numero
-\index{funzioni!variadic} è variabile e dipende dal formato stesso.
+cui dovrà essere scritto il contenuto degli argomenti, il cui numero è
+variabile e dipende dal formato stesso.
  
  Le prime due servono per scrivere su file (lo \itindex{standard~output}
  \textit{standard output} o quello specificato) la terza permette di scrivere
@@ -3566,12 +3561,12 @@ non possa essere sovrascritto.
  La parte più complessa delle funzioni di scrittura formattata è il formato
  della stringa \param{format} che indica le conversioni da fare, e da cui
  deriva anche il numero degli argomenti che dovranno essere passati a seguire:
-si noti come tutte queste funzioni siano \index{funzioni!variadic}
-\textit{variadic}, prendendo un numero di argomenti variabile che dipende
-appunto da quello che si è specificato in \param{format}.
+si noti come tutte queste funzioni siano ``\textit{variadic}'', prendendo un
+numero di argomenti variabile che dipende appunto da quello che si è
+specificato in \param{format}.
  
  La stringa di formato è costituita da caratteri normali (tutti eccetto
-``\texttt{\%}''), che vengono passati invariati all'output, e da direttive di
+``\texttt{\%}''), che vengono passati invariati in uscita, e da direttive di
  conversione, in cui devono essere sempre presenti il carattere
  ``\texttt{\%}'', che introduce la direttiva, ed uno degli specificatori di
  conversione (riportati in tab.~\ref{tab:file_format_spec}) che la conclude.
@@ -3647,11 +3642,11 @@ dettagliate dei vari formati possono essere trovati nella pagina di manuale di
      \cmd{L}  & Una conversione in virgola mobile corrisponde a un
                 \ctyp{double}.\\
      \cmd{q}  & Sinonimo di \cmd{ll}.\\
-    \cmd{j}  & Una conversione intera corrisponde a un \type{intmax\_t} o 
-               \type{uintmax\_t}.\\
-    \cmd{z}  & Una conversione intera corrisponde a un \type{size\_t} o 
-               \type{ssize\_t}.\\
-    \cmd{t}  & Una conversione intera corrisponde a un \type{ptrdiff\_t}.\\
+    \cmd{j}  & Una conversione intera corrisponde a un \ctyp{intmax\_t} o 
+               \ctyp{uintmax\_t}.\\
+    \cmd{z}  & Una conversione intera corrisponde a un \ctyp{size\_t} o 
+               \ctyp{ssize\_t}.\\
+    \cmd{t}  & Una conversione intera corrisponde a un \ctyp{ptrdiff\_t}.\\
      \hline
    \end{tabular}
    \caption{Il modificatore di tipo di dato per il formato di \func{printf}}
@@ -3681,11 +3676,10 @@ sez.~\ref{sec:proc_variadic}), sono \funcd{vprintf}, \funcd{vfprintf} e
  Con queste funzioni diventa possibile selezionare gli argomenti che si
  vogliono passare ad una funzione di stampa, passando direttamente la lista
  tramite l'argomento \param{ap}. Per poter far questo ovviamente la lista
-variabile\index{funzioni!variadic} degli argomenti dovrà essere opportunamente
-trattata (l'argomento è esaminato in sez.~\ref{sec:proc_variadic}), e dopo
-l'esecuzione della funzione l'argomento
-\param{ap} non sarà più utilizzabile (in generale dovrebbe essere eseguito un
-\code{va\_end(ap)} ma in Linux questo non è necessario). 
+variabile degli argomenti dovrà essere opportunamente trattata (l'argomento è
+esaminato in sez.~\ref{sec:proc_variadic}), e dopo l'esecuzione della funzione
+l'argomento \param{ap} non sarà più utilizzabile (in generale dovrebbe essere
+eseguito un \code{va\_end(ap)} ma in Linux questo non è necessario).
  
  Come per \func{sprintf} anche per \func{vsprintf} esiste una analoga
  \funcd{vsnprintf} che pone un limite sul numero di caratteri che vengono
@@ -3725,11 +3719,10 @@ sono:
  Entrambe le funzioni prendono come argomento \param{strptr} che deve essere
  l'indirizzo di un puntatore ad una stringa di caratteri, in cui verrà
  restituito (si ricordi quanto detto in sez.~\ref{sec:proc_var_passing} a
-proposito dei \itindex{value~result~argument} \textit{value result argument})
-l'indirizzo della stringa allocata automaticamente dalle funzioni. Occorre
-inoltre ricordarsi di invocare \func{free} per liberare detto puntatore quando
-la stringa non serve più, onde evitare \itindex{memory~leak} \textit{memory
-  leak}.
+proposito dei \textit{value result argument}) l'indirizzo della stringa
+allocata automaticamente dalle funzioni. Occorre inoltre ricordarsi di
+invocare \func{free} per liberare detto puntatore quando la stringa non serve
+più, onde evitare \textit{memory leak}.
  
  % TODO verificare se mettere prototipi di \func{dprintf} e \func{vdprintf}
  
@@ -3958,12 +3951,12 @@ Ovviamente se si usa un buffer specificato dall'utente questo deve essere
  stato allocato e rimanere disponibile per tutto il tempo in cui si opera sullo
  \textit{stream}. In genere conviene allocarlo con \func{malloc} e disallocarlo
  dopo la chiusura del file; ma fintanto che il file è usato all'interno di una
-funzione, può anche essere usata una \index{variabili!automatiche} variabile
-automatica. In \headfile{stdio.h} è definita la macro \const{BUFSIZ}, che
-indica le dimensioni generiche del buffer di uno \textit{stream}, queste
-vengono usate dalla funzione \func{setbuf}.  Non è detto però che tale
-dimensione corrisponda sempre al valore ottimale (che può variare a seconda
-del dispositivo).
+funzione, può anche essere usata una variabile automatica. In
+\headfile{stdio.h} è definita la macro \const{BUFSIZ}, che indica le
+dimensioni generiche del buffer di uno \textit{stream}, queste vengono usate
+dalla funzione \func{setbuf}.  Non è detto però che tale dimensione
+corrisponda sempre al valore ottimale (che può variare a seconda del
+dispositivo).
  
  Dato che la procedura di allocazione manuale è macchinosa, comporta dei
  rischi, come delle scritture accidentali sul buffer, e non assicura la scelta