Reindicizzazione
[gapil.git] / fileio.tex
index eb448e3efb0678c1924ee0f1a1b4d88a68f384e6..77769ece37748d09c809388d4df7af03f8be0e41 100644 (file)
@@ -29,13 +29,13 @@ ultime le caratteristiche più avanzate.
 
 
 Come visto in sez.~\ref{sec:file_vfs_work} il kernel mette a disposizione
-tramite il \itindex{Virtual~File~System} \textit{Virtual File System} una
-serie di \textit{system call} che consentono di operare sui file in maniera
-generale. Abbiamo trattato quelle relative alla gestione delle proprietà dei
-file nel precedente capitolo, vedremo quelle che si applicano al contenuto dei
-file in questa sezione, iniziando con una breve introduzione sull'architettura
-dei \textit{file descriptor} per poi trattare le funzioni di base e le
-modalità con cui consentono di gestire i dati memorizzati sui file.
+tramite il \textit{Virtual File System} una serie di \textit{system call} che
+consentono di operare sui file in maniera generale. Abbiamo trattato quelle
+relative alla gestione delle proprietà dei file nel precedente capitolo,
+vedremo quelle che si applicano al contenuto dei file in questa sezione,
+iniziando con una breve introduzione sull'architettura dei \textit{file
+  descriptor} per poi trattare le funzioni di base e le modalità con cui
+consentono di gestire i dati memorizzati sui file.
 
 
 \subsection{I \textit{file descriptor}}
@@ -53,10 +53,10 @@ comunicazione con il kernel che renda possibile operare su di esso. Questo si
 fa aprendo il file con la funzione \func{open} (vedi
 sez.~\ref{sec:file_open_close}) che provvederà a localizzare \itindex{inode}
 l'\textit{inode} del file e inizializzare i puntatori che rendono disponibili
-le funzioni che il \itindex{Virtual~File~System} VFS mette a disposizione
-(quelle di tab.~\ref{tab:file_file_operations}). Una volta terminate le
-operazioni, il file dovrà essere chiuso, e questo chiuderà il canale di
-comunicazione impedendo ogni ulteriore operazione.
+le funzioni che il VFS mette a disposizione (quelle di
+tab.~\ref{tab:file_file_operations}). Una volta terminate le operazioni, il
+file dovrà essere chiuso, e questo chiuderà il canale di comunicazione
+impedendo ogni ulteriore operazione.
 
 All'interno di ogni processo i file aperti sono identificati da un numero
 intero non negativo, che viene chiamato \textit{file descriptor}.  Quando un
@@ -762,7 +762,8 @@ file. È possibile impostarla ad un valore qualsiasi con la funzione di sistema
     \item[\errcode{EINVAL}] \param{whence} non è un valore valido.
     \item[\errcode{EOVERFLOW}] \param{offset} non può essere rappresentato nel
       tipo \type{off\_t}.
-    \item[\errcode{ESPIPE}] \param{fd} è una pipe, un socket o una fifo.
+    \item[\errcode{ESPIPE}] \param{fd} è una \textit{pipe}, un socket o una
+      \textit{fifo}.
   \end{errlist}
   ed inoltre \errval{EBADF} nel suo significato generico.}
 \end{funcproto}
@@ -833,22 +834,23 @@ per i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che
 non supportano questa funzione, come ad esempio per i file di
 terminale.\footnote{altri sistemi, usando \const{SEEK\_SET}, in questo caso
   ritornano il numero di caratteri che vi sono stati scritti.} Lo standard
-POSIX però non specifica niente in proposito. Inoltre alcuni
-\index{file!speciali} file speciali, ad esempio \file{/dev/null}, non causano
-un errore ma restituiscono un valore indefinito.
+POSIX però non specifica niente in proposito. Inoltre alcuni file speciali, ad
+esempio \file{/dev/null}, non causano un errore ma restituiscono un valore
+indefinito.
 
 \itindbeg{sparse~file} 
+\index{file!\textit{hole}|(} 
 
 Infine si tenga presente che, come accennato in sez.~\ref{sec:file_file_size},
 con \func{lseek} è possibile impostare una posizione anche oltre la corrente
 fine del file. In tal caso alla successiva scrittura il file sarà esteso a
 partire da detta posizione, con la creazione di quello che viene chiamato
-\index{file!\textit{hole}} ``\textsl{buco}'' (in gergo \textit{hole}) nel
-file.  Il nome deriva dal fatto che nonostante la dimensione del file sia
-cresciuta in seguito alla scrittura effettuata, lo spazio vuoto fra la
-precedente fine del file ed la nuova parte scritta dopo lo spostamento non
-corrisponde ad una allocazione effettiva di spazio su disco, che sarebbe
-inutile dato che quella zona è effettivamente vuota.
+``\textsl{buco}'' (in gergo \textit{hole}) nel file.  Il nome deriva dal fatto
+che nonostante la dimensione del file sia cresciuta in seguito alla scrittura
+effettuata, lo spazio vuoto fra la precedente fine del file ed la nuova parte
+scritta dopo lo spostamento non corrisponde ad una allocazione effettiva di
+spazio su disco, che sarebbe inutile dato che quella zona è effettivamente
+vuota.
 
 Questa è una delle caratteristiche specifiche della gestione dei file di un
 sistema unix-like e si dice che il file in questione è uno \textit{sparse
@@ -893,19 +895,18 @@ inutilizzato.
 A partire dal kernel 3.1, riprendendo una interfaccia adottata su Solaris,
 sono state aggiunti due nuovi valori per l'argomento \param{whence}, riportati
 nella seconda sezione di tab.~\ref{tab:lseek_whence_values}, che consentono di
-riconoscere la presenza di \index{file!\textit{hole}} \textit{hole}
-all'interno dei file ad uso di quelle applicazioni (come i programmi di
-backup) che possono salvare spazio disco nella copia degli \textit{sparse
-  file}. Una applicazione può così determinare la presenza di un
-\index{file!\textit{hole}} \textit{hole} usando \const{SEEK\_HOLE} all'inizio
-del file e determinare poi l'inizio della successiva sezione di dati usando
+riconoscere la presenza di \textit{hole} all'interno dei file ad uso di quelle
+applicazioni (come i programmi di backup) che possono salvare spazio disco
+nella copia degli \textit{sparse file}. Una applicazione può così determinare
+la presenza di un \textit{hole} usando \const{SEEK\_HOLE} all'inizio del file
+e determinare poi l'inizio della successiva sezione di dati usando
 \const{SEEK\_DATA}. Per compatibilità con i filesystem che non supportano
 questa funzionalità è previsto comunque che in tal caso \const{SEEK\_HOLE}
 riporti sempre la fine del file e \const{SEEK\_DATA} il valore
 di \param{offset}.
 
 Inoltre la decisione di come riportare (o di non riportare) la presenza di un
-\index{file!\textit{hole}} buco in un file è lasciata all'implementazione del
+buco in un file è lasciata all'implementazione del
 filesystem, dato che esistono vari motivi per cui una sezione di un file può
 non contenere dati ed essere riportata come tale (ad esempio può essere stata
 preallocata con \func{fallocate}, vedi sez.~\ref{sec:file_fadvise}) oltre a
@@ -914,6 +915,7 @@ valori non garantisce la mappatura della effettiva allocazione dello spazio
 disco di un file, per il quale esiste una specifica operazione di controllo
 (vedi sez.~\ref{sec:file_fcntl_ioctl}).
 
+\index{file!\textit{hole}|)} 
 
 
 \subsection{Le funzioni per la lettura di un file}
@@ -968,12 +970,12 @@ continuare a ricevere zero come valore di ritorno.
 
 Con i \textsl{file regolari} questa è l'unica situazione in cui si può avere
 un numero di byte letti inferiore a quello richiesto, ma questo non è vero
-quando si legge da un terminale, da una fifo o da una pipe. In tal caso
-infatti, se non ci sono dati in ingresso, la \func{read} si blocca (a meno di
-non aver selezionato la modalità non bloccante, vedi
-sez.~\ref{sec:file_noblocking}) e ritorna solo quando ne arrivano; se il numero
-di byte richiesti eccede quelli disponibili la funzione ritorna comunque, ma
-con un numero di byte inferiore a quelli richiesti.
+quando si legge da un terminale, da una \textit{fifo} o da una
+\textit{pipe}. In tal caso infatti, se non ci sono dati in ingresso, la
+\func{read} si blocca (a meno di non aver selezionato la modalità non
+bloccante, vedi sez.~\ref{sec:file_noblocking}) e ritorna solo quando ne
+arrivano; se il numero di byte richiesti eccede quelli disponibili la funzione
+ritorna comunque, ma con un numero di byte inferiore a quelli richiesti.
 
 Lo stesso comportamento avviene caso di lettura dalla rete (cioè su un socket,
 come vedremo in sez.~\ref{sec:sock_io_behav}), o per la lettura da certi file
@@ -1070,10 +1072,10 @@ prototipo è:
     potuto scrivere qualsiasi dato.
   \item[\errcode{EINVAL}] \param{fd} è connesso ad un oggetto che non consente
     la scrittura o si è usato \const{O\_DIRECT} ed il buffer non è allineato.
-  \item[\errcode{EPIPE}] \param{fd} è connesso ad una pipe il cui altro capo è
-    chiuso in lettura; in questo caso viene anche generato il segnale
-    \signal{SIGPIPE}, se questo viene gestito (o bloccato o ignorato) la
-    funzione ritorna questo errore.
+  \item[\errcode{EPIPE}] \param{fd} è connesso ad una \textit{pipe} il cui
+    altro capo è chiuso in lettura; in questo caso viene anche generato il
+    segnale \signal{SIGPIPE}, se questo viene gestito (o bloccato o ignorato)
+    la funzione ritorna questo errore.
   \end{errlist}
   ed inoltre \errval{EBADF}, \errval{EFAULT}, \errval{EIO}, \errval{EISDIR},
   \errval{ENOSPC} nel loro significato generico.}
@@ -1313,9 +1315,9 @@ cancellato nel file descriptor restituito come copia.
 L'uso principale di questa funzione è nella shell per la redirezione dei file
 standard di tab.~\ref{tab:file_std_files} fra l'esecuzione di una \func{fork}
 e la successiva \func{exec}. Diventa così possibile associare un file (o una
-pipe) allo \itindex{standard~input} \textit{standard input} o allo
+\textit{pipe}) allo \itindex{standard~input} \textit{standard input} o allo
 \itindex{standard~output} \textit{standard output} (vedremo un esempio in
-sez.~\ref{sec:ipc_pipe_use}, quando tratteremo le pipe). 
+sez.~\ref{sec:ipc_pipe_use}, quando tratteremo le \textit{pipe}).
 
 Ci si può chiedere perché non sia in questo caso sufficiente chiudere il file
 standard che si vuole redirigere e poi aprire direttamente con \func{open} il
@@ -1488,8 +1490,8 @@ prototipi sono:
 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
   caso \var{errno} assumerà uno dei valori: 
   \begin{errlist}
-  \item[\errcode{EINVAL}] \param{fd} è un \index{file!speciali} file speciale
-    che non supporta la sincronizzazione.
+  \item[\errcode{EINVAL}] \param{fd} è un file speciale che non supporta la
+    sincronizzazione.
   \end{errlist}
   ed inoltre \errval{EBADF}, \errval{EIO} e \errval{EROFS} nel loro
   significato generico.}
@@ -1558,19 +1560,18 @@ Un problema generale che si pone con l'uso della funzione \func{open}, così
 come per le altre funzioni che prendono come argomenti dei
 \itindsub{pathname}{relativo} \textit{pathname} relativi, è la possibilità,
 quando un \textit{pathname} relativo non fa riferimento ad un file posto
-direttamente nella \index{directory~di~lavoro} directory di lavoro corrente,
-che alcuni dei componenti del \textit{pathname} vengano modificati in
-parallelo alla chiamata a \func{open}, cosa che lascia aperta la possibilità
-di una \itindex{race~condition} \textit{race condition} in cui c'è spazio per
-un \itindex{symlink~attack} \textit{symlink attack} (si ricordi quanto visto
-per \func{access} in sez.~\ref{sec:file_perm_management}).
-
-Inoltre come già accennato, la \index{directory~di~lavoro} directory di lavoro
-corrente è una proprietà del singolo processo; questo significa che quando si
-lavora con i \itindex{thread} \textit{thread} essa sarà la stessa per tutti,
-ma esistono molti casi in cui sarebbe invece utile che ogni singolo
-\itindex{thread} \textit{thread} avesse la sua \index{directory~di~lavoro}
-directory di lavoro.
+direttamente nella directory di lavoro corrente, che alcuni dei componenti del
+\textit{pathname} vengano modificati in parallelo alla chiamata a \func{open},
+cosa che lascia aperta la possibilità di una \itindex{race~condition}
+\textit{race condition} in cui c'è spazio per un \itindex{symlink~attack}
+\textit{symlink attack} (si ricordi quanto visto per \func{access} in
+sez.~\ref{sec:file_perm_management}).
+
+Inoltre come già accennato, la directory di lavoro corrente è una proprietà
+del singolo processo; questo significa che quando si lavora con i
+\textit{thread} essa sarà la stessa per tutti, ma esistono molti casi in cui
+sarebbe invece utile che ogni singolo \textit{thread} avesse la sua directory
+di lavoro.
 
 Per risolvere questi problemi, riprendendo una interfaccia già presente in
 Solaris, a fianco delle normali funzioni che operano sui file (come
@@ -1597,7 +1598,7 @@ sarà la base della risoluzione dei \itindsub{pathname}{relativo}
 passare il relativo file descriptor alle varie funzioni che useranno quella
 directory come punto di partenza per la risoluzione. In questo modo, anche
 quando si lavora con i \itindex{thread} \textit{thread}, si può mantenere una
-\index{directory~di~lavoro} directory di lavoro diversa per ciascuno di essi.
+directory di lavoro diversa per ciascuno di essi.
 
 Questo metodo, oltre a risolvere i problemi di \itindex{race~condition}
 \textit{race condition}, consente anche di ottenere aumenti di prestazioni
@@ -1618,8 +1619,7 @@ esame la nuova funzione di sistema \funcd{openat}, avremo il prototipo:
 \fhead{fcntl.h}
 \fdecl{int openat(int dirfd, const char *pathname, int flags)}
 \fdecl{int openat(int dirfd, const char *pathname, int flags, mode\_t mode)}
-\fdesc{Apre un file a partire da una directory di \index{directory~di~lavoro}
-  lavoro.} 
+\fdesc{Apre un file a partire da una directory di lavoro.} 
 }
 
 {La funzione ritorna gli stessi valori e gli stessi codici di errore di
@@ -1639,11 +1639,11 @@ relativo questo sarà risolto rispetto alla directory indicata
 da \param{dirfd}. Qualora invece si usi un \itindsub{pathname}{assoluto}
 \textit{pathname} assoluto \param{dirfd} verrà semplicemente ignorato. Infine
 se per \param{dirfd} si usa il valore speciale \const{AT\_FDCWD}, la
-risoluzione sarà effettuata rispetto alla directory di
-\index{directory~di~lavoro} lavoro corrente del processo. Si tenga presente
-però che questa, come le altre costanti \texttt{AT\_*}, è definita in
-\headfile{fcntl.h}, pertanto se la si vuole usare occorrerà includere comunque
-questo file, anche per le funzioni che non sono definite in esso.
+risoluzione sarà effettuata rispetto alla directory di lavoro corrente del
+processo. Si tenga presente però che questa, come le altre costanti
+\texttt{AT\_*}, è definita in \headfile{fcntl.h}, pertanto se la si vuole
+usare occorrerà includere comunque questo file, anche per le funzioni che non
+sono definite in esso.
 
 Così come il comportamento, anche i valori di ritorno e le condizioni di
 errore delle nuove funzioni sono gli stessi delle funzioni classiche, agli
@@ -2178,7 +2178,7 @@ il nome indicato nel precedente prototipo), è riportata di seguito:
   sufficiente per creare il \textit{file lease}, \errcode{EACCES} se non si è
   il proprietario del file e non si hanno i privilegi di
   amministratore.\footnote{per la precisione occorre la capacità
-    \itindex{capabilities} \const{CAP\_LEASE}.}
+     \const{CAP\_LEASE}.}
 
   Il supporto il supporto per i \textit{file lease}, che consente ad un
   processo che detiene un \textit{lease} su un file di riceve una notifica
@@ -2202,7 +2202,7 @@ il nome indicato nel precedente prototipo), è riportata di seguito:
   del buffer associato alla \textit{pipe} \param{fd} (vedi
   sez.~\ref{sec:ipc_pipes}) o $-1$ in caso di errore, il terzo argomento viene
   ignorato. Non sono previsti errori diversi da \errval{EBADF}, che viene
-  restituito anche se il file descriptor non è una pipe. Il comando è
+  restituito anche se il file descriptor non è una \textit{pipe}. Il comando è
   specifico di Linux, è disponibile solo a partire dal kernel 2.6.35, ed è
   utilizzabile solo se si è definita la macro \macro{\_GNU\_SOURCE}.
 
@@ -2218,12 +2218,12 @@ il nome indicato nel precedente prototipo), è riportata di seguito:
   inferiore, il valore specificato viene in genere arrotondato per eccesso al
   valore ritenuto più opportuno dal sistema, pertanto una volta eseguita la
   modifica è opportuno rileggere la nuova dimensione con
-  \const{F\_GETPIPE\_SZ}. I processi non privilegiati\footnote{{per la
-      precisione occorre la capacità \itindex{capabilities}
-      \const{CAP\_SYS\_RESOURCE}.}} non possono impostare un valore valore
-  superiore a quello indicato da \sysctlfile{fs/pipe-size-max}.  Il comando è
-  specifico di Linux, è disponibile solo a partire dal kernel 2.6.35, ed è
-  utilizzabile solo se si è definita la macro \macro{\_GNU\_SOURCE}.
+  \const{F\_GETPIPE\_SZ}. I processi non privilegiati\footnote{per la
+    precisione occorre la capacità \const{CAP\_SYS\_RESOURCE}.} non possono
+  impostare un valore valore superiore a quello indicato da
+  \sysctlfile{fs/pipe-size-max}.  Il comando è specifico di Linux, è
+  disponibile solo a partire dal kernel 2.6.35, ed è utilizzabile solo se si è
+  definita la macro \macro{\_GNU\_SOURCE}.
 
 \end{basedescript}
 
@@ -2874,12 +2874,11 @@ sez.~\ref{sec:file_stream_thread}).
 Come per i file descriptor anche per gli \textit{stream} è possibile spostarsi
 all'interno di un file per effettuare operazioni di lettura o scrittura in un
 punto prestabilito, sempre che l'operazione di riposizionamento sia supportata
-dal file sottostante lo \textit{stream}, nel caso cioè in cui si ha a che
-fare con quello che viene detto un file ad \textsl{accesso casuale}. Dato che
-in un sistema Unix esistono vari tipi di file, come le fifo ed i
-\index{file!di~dispositivo} file di dispositivo (ad esempio i terminali), non
-è scontato che questo sia vero in generale, pur essendolo sempre nel caso di
-file di dati.
+dal file sottostante lo \textit{stream}, nel caso cioè in cui si ha a che fare
+con quello che viene detto un file ad \textsl{accesso casuale}. Dato che in un
+sistema Unix esistono vari tipi di file, come le fifo ed i file di dispositivo
+(ad esempio i terminali), non è scontato che questo sia vero in generale, pur
+essendolo sempre nel caso di file di dati.
 
 Con Linux ed in generale in ogni sistema unix-like la posizione nel file, come
 abbiamo già visto in sez.~\ref{sec:file_lseek}, è espressa da un intero