Aggiornamento anno note di copyright, dimenticato da gennaio...
[gapil.git] / fileunix.tex
index 1b4edcef570024767a173bb753c8788fedf87132..8a1be8993c0be40b69033f0b6fd7b9897fbd984f 100644 (file)
@@ -1,6 +1,6 @@
 %% fileunix.tex
 %%
-%% Copyright (C) 2000-2007 Simone Piccardi.  Permission is granted to
+%% Copyright (C) 2000-2008 Simone Piccardi.  Permission is granted to
 %% copy, distribute and/or modify this document under the terms of the GNU Free
 %% Documentation License, Version 1.1 or any later version published by the
 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
@@ -261,34 +261,34 @@ ritorno il file descriptor con il valore pi
                          titolarità del file viste in
                          sez.~\ref{sec:file_ownership_management}. Con questa
                          opzione l'argomento \param{mode} deve essere
-                         specificato. \\ 
+                         specificato.\\ 
     \const{O\_EXCL}    & Usato in congiunzione con \const{O\_CREAT} fa sì che
                          la precedente esistenza del file diventi un
                          errore\protect\footnotemark\ che fa fallire
-                         \func{open} con \errcode{EEXIST}. \\ 
+                         \func{open} con \errcode{EEXIST}.\\
     \const{O\_NONBLOCK}& Apre il file in modalità non bloccante, e
                          comporta che \func{open} ritorni immediatamente anche
                          quando dovrebbe bloccarsi (l'opzione ha senso solo per
-                         le fifo, vedi sez.~\ref{sec:ipc_named_pipe}). \\
+                         le fifo, vedi sez.~\ref{sec:ipc_named_pipe}).\\
     \const{O\_NOCTTY}  & Se \param{pathname} si riferisce ad un dispositivo di
                          terminale, questo non diventerà il terminale di
                          controllo, anche se il processo non ne ha ancora uno
-                         (si veda sez.~\ref{sec:sess_ctrl_term}). \\ 
+                         (si veda sez.~\ref{sec:sess_ctrl_term}).\\ 
     \const{O\_SHLOCK}  & Apre il file con uno shared lock (vedi
                          sez.~\ref{sec:file_locking}). Specifica di BSD, 
-                         assente in Linux. \\ 
+                         assente in Linux.\\ 
     \const{O\_EXLOCK}  & Apre il file con un lock esclusivo (vedi
                          sez.~\ref{sec:file_locking}). Specifica di BSD, 
                          assente in Linux.\\ 
     \const{O\_TRUNC}   & Se usato su un file di dati aperto in scrittura,
                          ne tronca la lunghezza a zero; con un terminale o una
                          fifo viene ignorato, negli altri casi il
-                         comportamento non è specificato. \\ 
+                         comportamento non è specificato.\\ 
     \const{O\_NOFOLLOW}& Se \param{pathname} è un link simbolico la chiamata
                          fallisce. Questa è un'estensione BSD aggiunta in Linux
                          dal kernel 2.1.126. Nelle versioni precedenti i link
                          simbolici sono sempre seguiti, e questa opzione è
-                         ignorata. \\
+                         ignorata.\\
     \const{O\_DIRECTORY}&Se \param{pathname} non è una directory la chiamata
                          fallisce. Questo flag è specifico di Linux ed è stato
                          introdotto con il kernel 2.1.126 per evitare dei 
@@ -297,11 +297,11 @@ ritorno il file descriptor con il valore pi
                          \func{opendir} viene chiamata su una fifo o su un
                          dispositivo associato ad una unità a nastri, non deve
                          dispositivo a nastri; non deve essere utilizzato
-                         al di fuori dell'implementazione di \func{opendir}. \\
-    \const{O\_LARGEFILE}&nel caso di sistemi a 32 bit che supportano file di
+                         al di fuori dell'implementazione di \func{opendir}.\\
+    \const{O\_LARGEFILE}&Nel caso di sistemi a 32 bit che supportano file di
                          grandi dimensioni consente di aprire file le cui
                          dimensioni non possono essere rappresentate da numeri
-                         a 31 bit. \\
+                         a 31 bit.\\
     \hline
     \hline  % modalità di operazione coi file
     \const{O\_APPEND}  & Il file viene aperto in \itindex{append~mode}
@@ -317,24 +317,24 @@ ritorno il file descriptor con il valore pi
                          leggere e quello di \func{write} in caso di
                          impossibilità di scrivere immediatamente. Questa
                          modalità ha senso solo per le fifo e per alcuni file
-                         di dispositivo. \\ 
+                         di dispositivo.\\ 
     \const{O\_NDELAY}  & In Linux\footnotemark\ è sinonimo di 
                          \const{O\_NONBLOCK}.\\
     \const{O\_ASYNC}   & Apre il file per l'I/O in modalità asincrona (vedi
                          sez.~\ref{sec:file_asyncronous_io}). Quando è
                          impostato viene generato il segnale \const{SIGIO}
                          tutte le volte che sono disponibili dati in input
-                         sul file. \\  
+                         sul file.\\  
     \const{O\_SYNC}    & Apre il file per l'input/output sincrono: ogni
                          \func{write} bloccherà fino al completamento della
                          scrittura di tutti i dati sull'hardware
                          sottostante.\\  
-    \const{O\_FSYNC}   & sinonimo di \const{O\_SYNC}, usato da BSD. \\
+    \const{O\_FSYNC}   & Sinonimo di \const{O\_SYNC}, usato da BSD.\\
     \const{O\_DSYNC}   & Variante di I/O sincrono definita da POSIX; presente
                          dal kernel 2.1.130 come sinonimo di
-                         \const{O\_SYNC}. \\
+                         \const{O\_SYNC}.\\
     \const{O\_RSYNC}   & Variante analoga alla precedente, trattata allo stesso
-                         modo. \\
+                         modo.\\
     \const{O\_NOATIME} & Blocca l'aggiornamento dei tempi di accesso dei
                          file (vedi sez.~\ref{sec:file_file_times}). Per molti
                          filesystem questa funzionalità non è disponibile per
@@ -350,6 +350,9 @@ ritorno il file descriptor con il valore pi
                          alle dimensioni dei blocchi del filesystem; per il
                          kernel 2.6 basta che siano allineati a multipli di 512
                          byte.\\
+    \const{O\_CLOEXEC} & Attiva la modalità di \textit{close-on-exec} (vedi
+                         sez.~\ref{sec:file_sharing} e
+                         \ref{sec:file_fcntl}).\footnotemark\\  
     \hline
   \end{tabular}
   \caption{Valori e significato dei vari bit del \textit{file status flag}.}
@@ -369,7 +372,7 @@ ritorno il file descriptor con il valore pi
 \footnotetext[5]{l'opzione origina da SVr4, dove però causava il ritorno da
   una \func{read} con un valore nullo e non con un errore, questo introduce
   un'ambiguità, dato che come vedremo in sez.~\ref{sec:file_read} il ritorno di
-  zero da parte di \func{read} ha il significato di una end-of-file.}
+  zero da parte di \func{read} ha il significato di una \textit{end-of-file}.}
 
 \footnotetext[6]{l'opzione è stata introdotta dalla SGI in IRIX, e serve
   sostanzialmente a permettere ad alcuni programmi (in genere database) la
@@ -378,6 +381,10 @@ ritorno il file descriptor con il valore pi
   anche in FreeBSD, senza limiti di allineamento dei buffer. In Linux è stata
   introdotta con il kernel 2.4.10, le versioni precedenti la ignorano.}
 
+\footnotetext[7]{introdotto con il kernel 2.6.23, per evitare una
+  \itindex{race~condition} \textit{race condition} che si può verificare con i
+  \itindex{thread} \textit{thread}, fra l'apertura del file e l'impostazione
+  della suddetta modalità con \func{fcntl}.}
 
 Questa caratteristica permette di prevedere qual è il valore del file
 descriptor che si otterrà al ritorno di \func{open}, e viene talvolta usata da
@@ -393,10 +400,11 @@ sez.~\ref{sec:file_sharing}) ed 
 all'inizio del file.
 
 L'argomento \param{mode} indica i permessi con cui il file viene creato; i
-valori possibili sono gli stessi già visti in sez.~\ref{sec:file_perm_overview}
-e possono essere specificati come OR binario delle costanti descritte in
-tab.~\ref{tab:file_bit_perm}. Questi permessi sono filtrati dal valore di
-\var{umask} (vedi sez.~\ref{sec:file_perm_management}) per il processo.
+valori possibili sono gli stessi già visti in
+sez.~\ref{sec:file_perm_overview} e possono essere specificati come OR binario
+delle costanti descritte in tab.~\ref{tab:file_bit_perm}. Questi permessi sono
+filtrati dal valore di \itindex{umask} \textit{umask} (vedi
+sez.~\ref{sec:file_perm_management}) per il processo.
 
 La funzione prevede diverse opzioni, che vengono specificate usando vari bit
 dell'argomento \param{flags}.  Alcuni di questi bit vanno anche a costituire
@@ -555,9 +563,9 @@ essersi spostata, ma noi scriveremo alla posizione impostata in precedenza
   condition}, vedi sez.~\ref{sec:file_atomic}).
 
 Non tutti i file supportano la capacità di eseguire una \func{lseek}, in
-questo caso la funzione ritorna l'errore \errcode{EPIPE}. Questo, oltre che per
-i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che non
-supportano questa funzione, come ad esempio per i file di
+questo caso la funzione ritorna l'errore \errcode{ESPIPE}. Questo, oltre che
+per i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che
+non supportano questa funzione, come ad esempio per i file di
 terminale.\footnote{altri sistemi, usando \const{SEEK\_SET}, in questo caso
   ritornano il numero di caratteri che vi sono stati scritti.} Lo standard
 POSIX però non specifica niente in proposito. Infine alcuni file speciali, ad
@@ -632,7 +640,7 @@ rieseguire la funzione.  Torneremo in dettaglio sull'argomento in
 sez.~\ref{sec:sig_gen_beha}.  La seconda si verifica quando il file è aperto
 in modalità non bloccante (vedi sez.~\ref{sec:file_noblocking}) e non ci sono
 dati in ingresso: la funzione allora ritorna immediatamente con un errore
-\errcode{EAGAIN}\footnote{BSD usa per questo errore la costante
+\errcode{EAGAIN}\footnote{in BSD si usa per questo errore la costante
   \errcode{EWOULDBLOCK}, in Linux, con le \acr{glibc}, questa è sinonima di
   \errcode{EAGAIN}.} che indica soltanto che non essendoci al momento dati
 disponibili occorre provare a ripetere la lettura in un secondo tempo.
@@ -644,7 +652,7 @@ dagli albori di Unix, ma nella seconda versione delle \textit{Single Unix
   l'emulazione per i vecchi kernel che non hanno la system call, è stato
   aggiunto con la versione 2.1, in versioni precedenti sia del kernel che
   delle librerie la funzione non è disponibile.} (quello che viene chiamato
-normalmente Unix98, vedi sez.~\ref{sec:intro_opengroup}) è stata introdotta la
+normalmente Unix98, vedi sez.~\ref{sec:intro_xopen}) è stata introdotta la
 definizione di un'altra funzione di lettura, \funcd{pread}, il cui prototipo è:
 \begin{prototype}{unistd.h}
 {ssize\_t pread(int fd, void * buf, size\_t count, off\_t offset)}
@@ -888,7 +896,7 @@ di una singola system call (per i dettagli sull'uso di questa caratteristica
 si veda sez.~\ref{sec:ipc_file_lock}).
 
 
-\subsection{La funzioni \func{sync} e \func{fsync}}
+\subsection{Le funzioni \func{sync} e \func{fsync}}
 \label{sec:file_sync}
 
 Come accennato in sez.~\ref{sec:file_close} tutte le operazioni di scrittura
@@ -922,9 +930,9 @@ valore tradizionale, usato da BSD, per l'update dei dati 
 in Linux il valore utilizzato è di 5 secondi; con le nuove versioni\footnote{a
   partire dal kernel 2.2.8} poi, è il kernel che si occupa direttamente di
 tutto quanto attraverso il demone interno \cmd{bdflush}, il cui comportamento
-può essere controllato attraverso il file \file{/proc/sys/vm/bdflush} (per il
-significato dei valori si può leggere la documentazione allegata al kernel in
-\file{Documentation/sysctl/vm.txt}).
+può essere controllato attraverso il file \procfile{/proc/sys/vm/bdflush} (per
+il significato dei valori si può leggere la documentazione allegata al kernel
+in \file{Documentation/sysctl/vm.txt}).
 
 Quando si vogliono scaricare soltanto i dati di un file (ad esempio essere
 sicuri che i dati di un database sono stati registrati su disco) si possono
@@ -932,7 +940,7 @@ usare le due funzioni \funcd{fsync} e \funcd{fdatasync}, i cui prototipi sono:
 \begin{functions}
   \headdecl{unistd.h}
   \funcdecl{int fsync(int fd)}
-  Sincronizza dati e metadati del file \param{fd}
+  Sincronizza dati e meta-dati del file \param{fd}
   \funcdecl{int fdatasync(int fd)}
   Sincronizza i dati del file \param{fd}.
   
@@ -947,7 +955,7 @@ usare le due funzioni \funcd{fsync} e \funcd{fdatasync}, i cui prototipi sono:
 
 Entrambe le funzioni forzano la sincronizzazione col disco di tutti i dati del
 file specificato, ed attendono fino alla conclusione delle operazioni;
-\func{fsync} forza anche la sincronizzazione dei metadati del file (che
+\func{fsync} forza anche la sincronizzazione dei meta-dati del file (che
 riguardano sia le modifiche alle tabelle di allocazione dei settori, che gli
 altri dati contenuti \index{inode} nell'inode che si leggono con \func{fstat},
 come i tempi del file).
@@ -960,7 +968,7 @@ disco) che deve essere effettuata esplicitamente.\footnote{in realt
   delle directory.}
 
 
-\subsection{La funzioni \func{dup} e \func{dup2}}
+\subsection{Le funzioni \func{dup} e \func{dup2}}
 \label{sec:file_dup}
 
 Abbiamo già visto in sez.~\ref{sec:file_sharing} come un processo figlio
@@ -991,7 +999,7 @@ alla stessa voce nella \textit{file table}; per questo si dice che il nuovo
 file descriptor è \textsl{duplicato}, da cui il nome della funzione.
 
 \begin{figure}[htb]
-  \centering \includegraphics[width=15cm]{img/filedup}
+  \centering \includegraphics[width=14cm]{img/filedup}
   \caption{Schema dell'accesso ai file duplicati}
   \label{fig:file_dup}
 \end{figure}
@@ -1065,9 +1073,10 @@ parallelo alla chiamata a \func{open}, e questo lascia aperta la possibilit
 di una \itindex{race~condition} \textit{race condition}.
 
 Inoltre come già accennato, la directory di lavoro corrente è una proprietà
-del singolo processo; questo significa che quando si lavora con i thread essa
-sarà la stessa per tutti, ma esistono molti casi in cui sarebbe invece utile
-che ogni singolo thread avesse la sua directory di lavoro. 
+del singolo processo; questo significa che quando si lavora con i
+\itindex{thread} \textit{thread} essa sarà la stessa per tutti, ma esistono
+molti casi in cui sarebbe invece utile che ogni singolo \itindex{thread}
+\textit{thread} avesse la sua directory di lavoro.
 
 Per risolvere questi problemi, riprendendo una interfaccia già presente in
 Solaris, a fianco delle normali funzioni che operano sui file (come
@@ -1090,13 +1099,13 @@ stesso.
 L'idea è che si apra prima la directory che si vuole usare come base dei
 pathname relativo, e si passi il file descriptor alla funzione che userà
 quella directory come punto di partenza per la risoluzione.\footnote{in questo
-  modo, anche quando si lavora con i thread, si può mantenere anche una
-  directory di lavoro diversa per ciascuno di essi.}  Con queste funzioni si
-possono anche ottenere grossi aumenti di prestazioni quando si devono eseguire
-operazioni su delle sezioni di albero dei file che prevedono gerarchie molto
-profonde e grandi quantità di file e directory, dato che basta eseguire la
-risoluzione di un pathname una sola volta (nell'apertura della directory) e
-non per ciascun file che essa contiene.
+  modo, anche quando si lavora con i \itindex{thread} \textit{thread}, si può
+  mantenere anche una directory di lavoro diversa per ciascuno di essi.}  Con
+queste funzioni si possono anche ottenere grossi aumenti di prestazioni quando
+si devono eseguire operazioni su delle sezioni di albero dei file che
+prevedono gerarchie molto profonde e grandi quantità di file e directory, dato
+che basta eseguire la risoluzione di un pathname una sola volta (nell'apertura
+della directory) e non per ciascun file che essa contiene.
 
 La sintassi generale di queste nuove funzioni è che esse prendano come primo
 argomento il file descriptor della directory da usare come base, mentre gli
@@ -1547,17 +1556,20 @@ operazioni che sono predefinite per qualunque file,\footnote{in particolare
   (cioè di tipo \texttt{int *}) su cui sarà restituito il valore.
 \end{basedescript}
 
-Si noti però come la gran parte di queste operazioni (per essere precisi le
-prime sei dell'elenco) siano effettuabili in maniera generica anche tramite
-l'uso di \func{fcntl}. Le due funzioni infatti sono molto simili e la presenza
-di questa sovrapposizione è principalmente dovuta al fatto che alle origini di
-Unix i progettisti considerarono che era necessario trattare diversamente
-rispetto alle operazione di controllo delle modalità di I/O file e dispositivi
-usando \func{fcntl} per i primi e \func{ioctl} per i
-secondi;\footnote{all'epoca tra l'altro i dispositivi che usavano \func{ioctl}
-  erano sostanzialmente solo i terminali, il che spiega l'uso comune di
-  \errcode{ENOTTY} come codice di errore.} oggi non è più così ma le due
-funzioni sono rimaste.
+% TODO aggiungere FIBMAP e FIEMAP, vedi http://lwn.net/Articles/260832
+
+
+Si noti però come la gran parte di queste operazioni specifiche dei file (per
+essere precisi le prime sei dell'elenco) siano effettuabili in maniera
+generica anche tramite l'uso di \func{fcntl}. Le due funzioni infatti sono
+molto simili e la presenza di questa sovrapposizione è principalmente dovuta
+al fatto che alle origini di Unix i progettisti considerarono che era
+necessario trattare diversamente rispetto alle operazione di controllo delle
+modalità di I/O file e dispositivi usando \func{fcntl} per i primi e
+\func{ioctl} per i secondi;\footnote{all'epoca tra l'altro i dispositivi che
+  usavano \func{ioctl} erano sostanzialmente solo i terminali, il che spiega
+  l'uso comune di \errcode{ENOTTY} come codice di errore.} oggi non è più così
+ma le due funzioni sono rimaste.
 
 
 % LocalWords:  descriptor system call cap like kernel sez l'inode inode VFS tab