Piccole modifiche ed integrazioni.
[gapil.git] / fileio.tex
index dc5bdfa2d45b291a0e6ff3304af097350b9a5f30..9ab3f032b55c9ecaf9629c1e7187b09da3a558d0 100644 (file)
@@ -537,24 +537,23 @@ univoco con l'uso delle funzioni di sez.~\ref{sec:file_temp_file}.
 Una volta aperto il file vi si potrà leggere o scrivere a seconda che siano
 utilizzati \const{O\_RDWR} o \const{O\_WRONLY}, mentre l'uso di
 \func{O\_RDONLY} non è consentito, non avendo molto senso ottenere un file
-descriptor da cui non si potrà comunque mai leggere nulla. L'unico altro flag
-che può essere utilizzato insieme a \const{O\_TMPFILE} è \const{O\_EXCL}, che
-in questo caso assume però un significato diverso da quello ordinario, dato
-che in questo caso non avrebbe senso fallire se il file non esiste, dato che
-questo è sempre vero.
-
-L'uso di \const{O\_EXCL} attiene all'altro possibile impiego di
-\const{O\_TMPFILE} oltre a quello della creazione sicura di un file temporaneo
-come sostituto di \func{tmpfile}: la possibilità di creare un eventuale
-contenuto iniziale ed impostare permessi, proprietario e attributi estesi con
-\func{fchmod}, \func{fchown} e \func{fsetxattr} operando sul file descriptor,
-senza possibilità di \textit{race condition} ed interferenze esterne, per poi
-far apparire il tutto sul filesystem in un secondo tempo utilizzando
-\func{linkat} sul file descriptor (torneremo su questo in
-sez.~\ref{sec:file_openat}) per dargli un nome. Questa operazione però non
-sarà possibile se si è usato \const{O\_EXCL}, che in questo caso viene ad
-assumere il significato di escludere la possibilità di far esistere il file
-anche in un secondo tempo.
+descriptor su un file che nasce vuoto per cui non si potrà comunque leggere
+nulla. L'unico altro flag che può essere utilizzato insieme a
+\const{O\_TMPFILE} è \const{O\_EXCL}, che in questo caso assume però un
+significato diverso da quello ordinario, dato che in questo caso il file
+associato al file descriptor non esiste comunque.
+
+L'uso di \const{O\_EXCL} attiene infatti all'altro possibile impiego di
+\const{O\_TMPFILE} oltre a quello citato della creazione sicura di un file
+temporaneo come sostituto sicuro di \func{tmpfile}: la possibilità di creare
+un contenuto iniziale per un file ed impostarne permessi, proprietario e
+attributi estesi con \func{fchmod}, \func{fchown} e \func{fsetxattr}, senza
+possibilità di \textit{race condition} ed interferenze esterne, per poi far
+apparire il tutto sul filesystem in un secondo tempo utilizzando \func{linkat}
+sul file descriptor (torneremo su questo in sez.~\ref{sec:file_openat}) per
+dargli un nome. Questa operazione però non sarà possibile se si è usato
+\const{O\_EXCL}, che in questo caso viene ad assumere il significato di
+escludere la possibilità di far esistere il file anche in un secondo tempo.
 
 % NOTE: per O_TMPFILE vedi: http://kernelnewbies.org/Linux_3.11
 % https://lwn.net/Articles/558598/ http://lwn.net/Articles/619146/
@@ -848,24 +847,32 @@ Si ricordi che quando un processo termina tutti i suoi file descriptor vengono
 automaticamente chiusi, molti programmi sfruttano questa caratteristica e non
 usano esplicitamente \func{close}. In genere comunque chiudere un file senza
 controllare lo stato di uscita di \func{close} un è errore; molti filesystem
-infatti implementano la tecnica del cosiddetto \textit{write-behind}, per cui
-una \func{write} può avere successo anche se i dati non sono stati
-effettivamente scritti su disco. In questo caso un eventuale errore di I/O
-avvenuto in un secondo tempo potrebbe sfuggire, mentre verrebbe riportato alla
-chiusura esplicita del file. Per questo motivo non effettuare il controllo può
-portare ad una perdita di dati inavvertita.\footnote{in Linux questo
-  comportamento è stato osservato con NFS e le quote su disco.}
+infatti implementano la tecnica del cosiddetto \itindex{write-behind}
+\textit{write-behind}, per cui una \func{write} può avere successo anche se i
+dati non sono stati effettivamente scritti su disco. In questo caso un
+eventuale errore di I/O avvenuto in un secondo tempo potrebbe sfuggire, mentre
+verrebbe riportato alla chiusura esplicita del file. Per questo motivo non
+effettuare il controllo può portare ad una perdita di dati
+inavvertita.\footnote{in Linux questo comportamento è stato osservato con NFS
+  e le quote su disco.}
 
 In ogni caso una \func{close} andata a buon fine non garantisce che i dati
 siano stati effettivamente scritti su disco, perché il kernel può decidere di
 ottimizzare l'accesso a disco ritardandone la scrittura. L'uso della funzione
-\func{sync} (vedi sez.~\ref{sec:file_sync}) effettua esplicitamente il
-\emph{flush} dei dati, ma anche in questo caso resta l'incertezza dovuta al
-comportamento dell'hardware, che a sua volta può introdurre ottimizzazioni
-dell'accesso al disco che ritardano la scrittura dei dati. Da questo deriva
-l'abitudine di alcuni sistemisti di ripetere tre volte il comando omonimo
-prima di eseguire lo shutdown di una macchina.
-
+\func{sync} (vedi sez.~\ref{sec:file_sync}) effettua esplicitamente lo scarico
+dei dati, ma anche in questo caso resta l'incertezza dovuta al comportamento
+dell'hardware, che a sua volta può introdurre ottimizzazioni dell'accesso al
+disco che ritardano la scrittura dei dati. Da questo deriva l'abitudine di
+alcuni sistemisti di ripetere tre volte il comando omonimo prima di eseguire
+lo shutdown di una macchina.
+
+Si tenga comunque presente che ripetere la chiusura in caso di fallimento non
+è opportuno, una volta chiamata \func{close} il file descriptor viene comunque
+rilasciato, indipendentemente dalla presenza di errori, e se la riesecuzione
+non comporta teoricamente problemi (se non la sua inutilità) se fatta
+all'interno di un processo singolo, nel caso si usino i \textit{thread} si
+potrebbe chiudere un file descriptor aperto nel contempo da un altro
+\textit{thread}.
 
 \subsection{La gestione della posizione nel file}
 \label{sec:file_lseek}
@@ -1039,11 +1046,11 @@ riporti sempre la fine del file e \const{SEEK\_DATA} il valore
 di \param{offset}.
 
 Inoltre la decisione di come riportare (o di non riportare) la presenza di un
-buco in un file è lasciata all'implementazione del
-filesystem, dato che esistono vari motivi per cui una sezione di un file può
-non contenere dati ed essere riportata come tale (ad esempio può essere stata
-preallocata con \func{fallocate}, vedi sez.~\ref{sec:file_fadvise}) oltre a
-quelle classiche appena esposte. Questo significa che l'uso di questi nuovi
+buco in un file è lasciata all'implementazione del filesystem, dato che oltre
+a quelle classiche appena esposte esistono vari motivi per cui una sezione di
+un file può non contenere dati ed essere riportata come tale (ad esempio può
+essere stata preallocata con \func{fallocate}, vedi
+sez.~\ref{sec:file_fadvise}). Questo significa che l'uso di questi nuovi
 valori non garantisce la mappatura della effettiva allocazione dello spazio
 disco di un file, per il quale esiste una specifica operazione di controllo
 (vedi sez.~\ref{sec:file_fcntl_ioctl}).
@@ -1076,20 +1083,23 @@ il cui prototipo è:
     per \param{size} o si è usato \const{O\_DIRECT} ed il buffer non è
     allineato.
   \item[\errval{EIO}] si è tentata la lettura dal terminale di controllo
-    essendo in background (vedi sez.~\ref{sec:term_io_design}).
+    essendo in background ignorando o bloccando \const{SIGTTIN} (vedi
+    sez.~\ref{sec:term_io_design}) o per errori di basso livello sul supporto.
   \end{errlist}
   ed inoltre \errval{EBADF}, \errval{EFAULT} e \errval{EISDIR}, nel loro
   significato generico.}
 \end{funcproto}
 
 La funzione tenta di leggere \param{count} byte dal file \param{fd} a partire
-dalla posizione corrente, scrivendoli nel buffer \param{buf}. Dopo la lettura
-la posizione sul file è spostata automaticamente in avanti del numero di byte
-letti. Se \param{count} è zero la funzione restituisce zero senza nessun altro
-risultato. Inoltre che non è detto che la funzione \func{read} restituisca il
-numero di byte richiesto, ci sono infatti varie ragioni per cui la funzione
-può restituire un numero di byte inferiore: questo è un comportamento normale,
-e non un errore, che bisogna sempre tenere presente.
+dalla posizione corrente, scrivendoli nel buffer \param{buf}.\footnote{fino ad
+  un massimo di \const{0x7ffff000} bytes, indipendentemente che l'architettura
+  sia a 32 o 64 bit.} Dopo la lettura la posizione sul file è spostata
+automaticamente in avanti del numero di byte letti. Se \param{count} è zero la
+funzione restituisce zero senza nessun altro risultato. Inoltre che non è
+detto che la funzione \func{read} restituisca il numero di byte richiesto, ci
+sono infatti varie ragioni per cui la funzione può restituire un numero di
+byte inferiore: questo è un comportamento normale, e non un errore, che
+bisogna sempre tenere presente.
 
 La prima e più ovvia di queste ragioni è che si è chiesto di leggere più byte
 di quanto il file ne contenga. In questo caso il file viene letto fino alla
@@ -1115,7 +1125,7 @@ come vedremo in sez.~\ref{sec:sock_io_behav}), o per la lettura da certi file
 di dispositivo, come le unità a nastro, che restituiscono sempre i dati ad un
 singolo blocco alla volta, o come le linee seriali, che restituiscono solo i
 dati ricevuti fino al momento della lettura, o i terminali, per i quali si
-applicano inoltre ulteriori condizioni che approfondiremo in
+applicano anche ulteriori condizioni che approfondiremo in
 sez.~\ref{sec:sess_terminal_io}.
 
 Infine anche le due condizioni segnalate dagli errori \errcode{EINTR} ed
@@ -1158,26 +1168,29 @@ funzione di sistema, \funcd{pread}, il cui prototipo è:
 
 La funzione prende esattamente gli stessi argomenti di \func{read} con lo
 stesso significato, a cui si aggiunge l'argomento \param{offset} che indica
-una posizione sul file. Identico è il comportamento ed il valore di
-ritorno. La funzione serve quando si vogliono leggere dati dal file senza
-modificare la posizione corrente.
-
-L'uso di \func{pread} è equivalente all'esecuzione di una \func{read} seguita
-da una \func{lseek} che riporti al valore precedente la posizione corrente sul
-file, ma permette di eseguire l'operazione atomicamente. Questo può essere
+una posizione sul file a partire dalla quale verranno i \param{count}
+bytes. Identico è il comportamento ed il valore di ritorno, ma la posizione
+corrente sul file resterà invariata.  Il valore di \param{offset} fa sempre
+riferimento all'inizio del file.
+
+L'uso di \func{pread} è equivalente all'esecuzione di una \func{lseek} alla
+posizione indicata da \param{offset} seguita da una \func{read}, seguita da
+un'altra \func{lseek} che riporti al valore iniziale della posizione corrente
+sul file, ma permette di eseguire l'operazione atomicamente. Questo può essere
 importante quando la posizione sul file viene condivisa da processi diversi
-(vedi sez.~\ref{sec:file_shared_access}).  Il valore di
-\param{offset} fa sempre riferimento all'inizio del file.
+(vedi sez.~\ref{sec:file_shared_access}) ed è particolarmente utile in caso di
+programmazione \textit{multi-thread} (vedi sez.~\ref{cha:threads}) quando
+all'interno di un processo si vuole che le operazioni di un \textit{thread}
+non possano essere influenzata da eventuali variazioni della posizione sul
+file effettuate da altri \textit{thread}.
 
 La funzione \func{pread} è disponibile anche in Linux, però diventa
 accessibile solo attivando il supporto delle estensioni previste dalle
-\textit{Single Unix Specification} con la definizione della macro:
-\begin{Example}
-#define _XOPEN_SOURCE 500
-\end{Example}
-e si ricordi di definire questa macro prima dell'inclusione del file di
-dichiarazioni \headfile{unistd.h}.
-
+\textit{Single Unix Specification} con un valore della macro
+\macro{\_XOPEN\_SOURCE} maggiore o uguale a 500 o a partire dalla \acr{glibc}
+2.12 con un valore dalla macro \macro{\_POSIX\_C\_SOURCE} maggiore o uguale al
+varore \val{200809L}.  Si ricordi di definire queste macro prima
+dell'inclusione del file di dichiarazione \headfile{unistd.h}.
 
 
 \subsection{Le funzioni per la scrittura di un file}
@@ -1198,6 +1211,10 @@ prototipo è:
   \begin{errlist}
   \item[\errcode{EAGAIN}] ci si sarebbe bloccati, ma il file era aperto in
     modalità \const{O\_NONBLOCK}.
+  \item[\errcode{EDESTADDRREQ}] si è eseguita una scrittura su un socket di
+    tipo \textit{datagram} (vedi sez.~\ref{sec:sock_type}) senza aver prima
+    connesso il corrispondente con \func{connect} (vedi
+    sez.~\ref{sec:UDP_sendto_recvfrom}).
   \item[\errcode{EFBIG}] si è cercato di scrivere oltre la dimensione massima
     consentita dal filesystem o il limite per le dimensioni dei file del
     processo o su una posizione oltre il massimo consentito.
@@ -1205,13 +1222,14 @@ prototipo è:
     potuto scrivere qualsiasi dato.
   \item[\errcode{EINVAL}] \param{fd} è connesso ad un oggetto che non consente
     la scrittura o si è usato \const{O\_DIRECT} ed il buffer non è allineato.
+%  \item[\errcode{EPERM}] la scrittura è proibita da un \textit{file seal}.
   \item[\errcode{EPIPE}] \param{fd} è connesso ad una \textit{pipe} il cui
     altro capo è chiuso in lettura; in questo caso viene anche generato il
     segnale \signal{SIGPIPE}, se questo viene gestito (o bloccato o ignorato)
     la funzione ritorna questo errore.
   \end{errlist}
-  ed inoltre \errval{EBADF}, \errval{EFAULT}, \errval{EIO}, \errval{EISDIR},
-  \errval{ENOSPC} nel loro significato generico.}
+  ed inoltre \errval{EBADF}, \errval{EDQUOT}, \errval{EFAULT}, \errval{EIO},
+  \errval{EISDIR}, \errval{ENOSPC} nel loro significato generico.}
 \end{funcproto}
 
 
@@ -1233,9 +1251,10 @@ Per i file ordinari il numero di byte scritti è sempre uguale a quello
 indicato da \param{count}, a meno di un errore. Negli altri casi si ha lo
 stesso comportamento di \func{read}.
 
-Anche per \func{write} lo standard Unix98 definisce un'analoga \funcd{pwrite}
-per scrivere alla posizione indicata senza modificare la posizione corrente
-nel file, il suo prototipo è:
+Anche per \func{write} lo standard Unix98 (ed i successivi POSIX.1-2001 e
+POSIX.1-2008) definiscono un'analoga \funcd{pwrite} per scrivere alla
+posizione indicata senza modificare la posizione corrente nel file, il suo
+prototipo è:
 
 \begin{funcproto}{
 \fhead{unistd.h}
@@ -1248,7 +1267,11 @@ nel file, il suo prototipo è:
   \func{write} e \func{lseek}.}
 \end{funcproto}
 
-\noindent e per essa valgono le stesse considerazioni fatte per \func{pread}.
+\noindent per questa funzione valgono le stesse considerazioni fatte per
+\func{pread}, a cui si aggiunge il fatto che su Linux, a differenza di quanto
+previsto dallo standard POSIX che richiederebbe di ignorarlo, se si è aperto
+il file con \const{O\_APPEND} i dati saranno comunque scritti in coda al file,
+ignorando il valore di \param{offset}.
 
 
 \section{Caratteristiche avanzate}
@@ -1273,7 +1296,7 @@ diversi.
 
 \begin{figure}[!htb]
   \centering
-  \includegraphics[width=12cm]{img/filemultacc}
+  \includegraphics[width=11cm]{img/filemultacc}
   \caption{Schema dell'accesso allo stesso file da parte di due processi 
     diversi}
   \label{fig:file_mult_acc}
@@ -1292,7 +1315,7 @@ la sua modalità di accesso e versioni proprie di tutte le proprietà che
 vengono mantenute nella sua voce della \textit{file table}. Questo ha
 conseguenze specifiche sugli effetti della possibile azione simultanea sullo
 stesso file, in particolare occorre tenere presente che:
-\begin{itemize}
+\begin{itemize*}
 \item ciascun processo può scrivere indipendentemente, dopo ciascuna
   \func{write} la posizione corrente sarà cambiata solo nel processo
   scrivente. Se la scrittura eccede la dimensione corrente del file questo
@@ -1301,17 +1324,19 @@ stesso file, in particolare occorre tenere presente che:
 \item se un file è in modalità \const{O\_APPEND} tutte le volte che viene
   effettuata una scrittura la posizione corrente viene prima impostata alla
   dimensione corrente del file letta dalla struttura \kstruct{inode}. Dopo la
-  scrittura il file viene automaticamente esteso.
+  scrittura il file viene automaticamente esteso. Questa operazione avviene
+  atomicamente, ogni altro processo che usi \const{O\_APPEND} vedrà la
+  dimensione estesa e continuerà a scrivere in coda al file.
 \item l'effetto di \func{lseek} è solo quello di cambiare il campo
   \var{f\_pos} nella struttura \kstruct{file} della \textit{file table}, non
   c'è nessuna operazione sul file su disco. Quando la si usa per porsi alla
-  fine del file la posizione viene impostata leggendo la dimensione corrente
-  dalla struttura \kstruct{inode}.
-\end{itemize}
+  fine del file la posizione viene impostata leggendo la attuale dimensione
+  corrente dalla struttura \kstruct{inode}.
+\end{itemize*}
 
 \begin{figure}[!htb]
   \centering
-  \includegraphics[width=12cm]{img/fileshar}
+  \includegraphics[width=11cm]{img/fileshar}
   \caption{Schema dell'accesso ai file da parte di un processo figlio}
   \label{fig:file_acc_child}
 \end{figure}
@@ -1425,7 +1450,7 @@ questo motivo si dice che il nuovo file descriptor è ``\textsl{duplicato}'',
 da cui il nome della funzione.
 
 \begin{figure}[!htb]
-  \centering \includegraphics[width=12cm]{img/filedup}
+  \centering \includegraphics[width=11cm]{img/filedup}
   \caption{Schema dell'accesso ai file duplicati}
   \label{fig:file_dup}
 \end{figure}