Aggiunte alla shared memory

[gapil.git] / fileunix.tex
diff --git a/fileunix.tex b/fileunix.tex

index 0f1f22565e8b03ade3c9d2da68ed57478b015c30..9f4e4a8d7ed781434b2783441fe70b3c51b8d614 100644 (file)
--- a/fileunix.tex
+++ b/fileunix.tex
@@ -1,3 +1,13 @@
+%% fileunix.tex
+%%
+%% Copyright (C) 2000-2002 Simone Piccardi.  Permission is granted to
+%% copy, distribute and/or modify this document under the terms of the GNU Free
+%% Documentation License, Version 1.1 or any later version published by the
+%% Free Software Foundation; with the Invariant Sections being "Prefazione",
+%% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
+%% license is included in the section entitled "GNU Free Documentation
+%% License".
+%%
  \chapter{I file: l'interfaccia standard Unix}
  \label{cha:file_unix_interface}
  
@@ -295,10 +305,10 @@ sempre il file descriptor con il valore pi
  
  \footnotetext[2]{la pagina di manuale di \func{open} segnala che questa
    opzione è difettosa su NFS, e che i programmi che la usano per stabilire un
-  file di lock (vedi \secref{sec:ipc_file_lock}) possono incorrere in una race
+  \textsl{file di lock}\index{file di lock} possono incorrere in una race
    condition\index{race condition}.  Si consiglia come alternativa di usare un
    file con un nome univoco e la funzione \func{link} per verificarne
-  l'esistenza.}
+  l'esistenza (vedi \secref{sec:ipc_file_lock}).}
  
  \footnotetext[3]{\textit{Denial of Service}, si chiamano così attacchi miranti
    ad impedire un servizio causando una qualche forma di carico eccessivo per
@@ -320,7 +330,7 @@ visti in \secref{sec:file_std_descr}: se ad esempio si chiude lo standard
  input e si apre subito dopo un nuovo file questo diventerà il nuovo standard
  input (avrà cioè il file descriptor 0).
  
-Il nuovo file descriptor non è condiviso con nessun altro processo, (torneremo
+Il nuovo file descriptor non è condiviso con nessun altro processo (torneremo
  sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in
  \secref{sec:file_sharing}). Il nuovo file descriptor è impostato per restare
  aperto attraverso una \func{exec} (come accennato in \secref{sec:proc_exec}) e
@@ -364,7 +374,7 @@ ciascuno di questi bit. Dette costanti possono essere combinate fra di loro
  con un OR aritmetico per costruire il valore (in forma di maschera binaria)
  dell'argomento \param{flags} da passare alla \func{open} per specificarne il
  comportamento. I due flag \macro{O\_NOFOLLOW} e \macro{O\_DIRECTORY} sono
-estensioni specifiche di Linux, e deve essere usata definita la macro
+estensioni specifiche di Linux, e deve essere definita la macro
  \macro{\_GNU\_SOURCE} per poterli usare.
  
  Nelle prime versioni di Unix i valori di \param{flag} specificabili per
@@ -373,7 +383,7 @@ questo motivo per creare un nuovo file c'era una system call apposita,
  \func{creat}, il cui prototipo è:
  \begin{prototype}{fcntl.h}
    {int creat(const char *pathname, mode\_t mode)}
-  Crea un nuovo file vuoto, con i permessi specificati da \var{mode}. É del
+  Crea un nuovo file vuoto, con i permessi specificati da \var{mode}. È del
    tutto equivalente a \code{open(filedes, O\_CREAT|O\_WRONLY|O\_TRUNC, mode)}. 
  \end{prototype}
  \noindent adesso questa funzione resta solo per compatibilità con i vecchi 
@@ -460,16 +470,19 @@ seguenti valori\footnote{per compatibilit
    questi valori possono essere rimpiazzati rispettivamente con 0, 1 e 2 o con
    \macro{L\_SET}, \macro{L\_INCR} e \macro{L\_XTND}.}:
  \begin{basedescript}{\desclabelwidth{2.0cm}}
-\item[\macro{SEEK\_SET}] si fa riferimento all'inizio del file: il valore di
-  \var{offset} è la nuova posizione.
+\item[\macro{SEEK\_SET}] si fa riferimento all'inizio del file: il valore
+  (sempre positivo) di \param{offset} indica direttamente la nuova posizione
+  corrente.
  \item[\macro{SEEK\_CUR}] si fa riferimento alla posizione corrente del file:
-  \var{offset} può essere negativo e positivo.
-\item[\macro{SEEK\_END}] si fa riferimento alla fine del file: il valore di
-  \var{offset} può essere negativo e positivo.
+  ad essa viene sommato \param{offset} (che può essere negativo e positivo)
+  per ottenere la nuova posizione corrente.
+\item[\macro{SEEK\_END}] si fa riferimento alla fine del file: alle dimensioni
+  del file viene sommato \param{offset} (che può essere negativo e positivo)
+  per ottenere la nuova posizione corrente.
  \end{basedescript}
  
  Come accennato in \secref{sec:file_file_size} con \func{lseek} è possibile
-impostare la posizione corrente anche al di la della fine del file, e alla
+impostare la posizione corrente anche oltre la fine del file, e alla
  successiva scrittura il file sarà esteso. La chiamata non causa nessuna
  attività di input/output, si limita a modificare la posizione corrente nel
  kernel (cioè \var{f\_pos} in \var{file}, vedi \figref{fig:file_proc_file}).
@@ -479,11 +492,11 @@ Dato che la funzione ritorna la nuova posizione, usando il valore zero per
  funzione con \code{lseek(fd, 0, SEEK\_CUR)}. 
  
  Si tenga presente inoltre che usare \macro{SEEK\_END} non assicura affatto che
-successiva scrittura avvenga alla fine del file, infatti se questo è stato
+la successiva scrittura avvenga alla fine del file, infatti se questo è stato
  aperto anche da un altro processo che vi ha scritto, la fine del file può
-essersi spostata, ma noi scriveremo alla posizione impostata in precedenza.
-(questa è una potenziale sorgente di 
-\textit{race condition}\index{race condition}, vedi \secref{sec:file_atomic}).
+essersi spostata, ma noi scriveremo alla posizione impostata in precedenza
+(questa è una potenziale sorgente di \textit{race condition}\index{race
+  condition}, vedi \secref{sec:file_atomic}).
  
  Non tutti i file supportano la capacità di eseguire una \func{lseek}, in
  questo caso la funzione ritorna l'errore \macro{EPIPE}. Questo, oltre che per
@@ -491,7 +504,7 @@ i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che non
  supportano questa funzione, come ad esempio per i file di
  terminale.\footnote{altri sistemi, usando \macro{SEEK\_SET}, in questo caso
    ritornano il numero di caratteri che vi sono stati scritti.} Lo standard
-POSIX però non specifica niente al proposito. Infine alcuni file speciali, ad
+POSIX però non specifica niente in proposito. Infine alcuni file speciali, ad
  esempio \file{/dev/null}, non causano un errore ma restituiscono un valore
  indefinito.
  
@@ -500,8 +513,9 @@ indefinito.
  \label{sec:file_read}
  
  
-Una volta che un file è stato aperto su possono leggere i dati che contiene
-utilizzando la funzione \func{read}, il cui prototipo è:
+Una volta che un file è stato aperto (con il permesso in lettura) su possono
+leggere i dati che contiene utilizzando la funzione \func{read}, il cui
+prototipo è:
  \begin{prototype}{unistd.h}{ssize\_t read(int fd, void * buf, size\_t count)}
    
    Cerca di leggere \var{count} byte dal file \var{fd} al buffer \var{buf}.
@@ -535,7 +549,7 @@ sua fine, e la funzione ritorna regolarmente il numero di byte letti
  effettivamente. 
  
  Raggiunta la fine del file, alla ripetizione di un'operazione di lettura,
-otterremmo il ritorno immediato di \func{read} con uno zero.  La condizione
+otterremmo il ritorno immediato di \func{read} con uno zero.  La condizione di
  raggiungimento della fine del file non è un errore, e viene segnalata appunto
  da un valore di ritorno di \func{read} nullo. Ripetere ulteriormente la
  lettura non avrebbe nessun effetto se non quello di continuare a ricevere zero
@@ -558,15 +572,15 @@ singolo blocco alla volta.
  In realtà anche le due condizioni segnalate dagli errori \macro{EINTR} e
  \macro{EAGAIN} non sono errori. La prima si verifica quando la \func{read} è
  bloccata in attesa di dati in ingresso e viene interrotta da un segnale; in
-tal caso l'azione da prendere è quella di rieseguire la funzione. Torneremo in
-dettaglio sull'argomento in \secref{sec:sig_gen_beha}.
+tal caso l'azione da intraprendere è quella di rieseguire la funzione.
+Torneremo in dettaglio sull'argomento in \secref{sec:sig_gen_beha}.
  
  La seconda si verifica quando il file è in modalità non bloccante (vedi
  \secref{sec:file_noblocking}) e non ci sono dati in ingresso: la funzione
  allora ritorna immediatamente con un errore \macro{EAGAIN}\footnote{sotto BSD
-  questo per questo errore viene usata la costante \macro{EWOULDBLOCK}, in
-  Linux, con le glibc, questa è sinonima di \macro{EAGAIN}.} che nel caso
-indica soltanto che occorrerà provare a ripetere la lettura.
+  per questo errore viene usata la costante \macro{EWOULDBLOCK}, in Linux, con
+  le glibc, questa è sinonima di \macro{EAGAIN}.} che indica soltanto che
+occorrerà provare a ripetere la lettura.
  
  La funzione \func{read} è una delle system call fondamentali, esistenti fin
  dagli albori di Unix, ma nella seconda versione delle \textit{Single Unix
@@ -593,7 +607,7 @@ Cerca di leggere \var{count} byte dal file \var{fd}, a partire dalla posizione
  \end{verbatim}
  
  Questa funzione serve quando si vogliono leggere dati dal file senza
-modificarne la posizione corrente. È equivalente alla esecuzione di una
+modificare la posizione corrente. È equivalente all'esecuzione di una
  \func{read} seguita da una \func{lseek} che riporti al valore precedente la
  posizione corrente sul file, ma permette di eseguire l'operazione
  atomicamente. Questo può essere importante quando la posizione sul file viene
@@ -604,8 +618,8 @@ condivisa da processi diversi (vedi \secref{sec:file_sharing}).  Il valore di
  \subsection{La funzione \func{write}}
  \label{sec:file_write}
  
-Una volta che un file è stato aperto su può scrivere su di esso utilizzando la
-funzione \func{write}, il cui prototipo è:
+Una volta che un file è stato aperto (con il permesso in scrittura) su può
+scrivere su di esso utilizzando la funzione \func{write}, il cui prototipo è:
  \begin{prototype}{unistd.h}{ssize\_t write(int fd, void * buf, size\_t count)}
    
    Scrive \var{count} byte dal buffer \var{buf} sul file \var{fd}.
@@ -676,7 +690,7 @@ dell'argomento sar
  \label{sec:file_sharing}
  
  In \secref{sec:file_fd} abbiamo descritto brevemente l'architettura
-dell'interfaccia coi file da parte di un processo, mostrando in
+dell'interfaccia con i file da parte di un processo, mostrando in
  \figref{fig:file_proc_file} le principali strutture usate dal kernel;
  esamineremo ora in dettaglio le conseguenze che questa architettura ha nei
  confronti dell'accesso allo stesso file da parte di processi diversi.
@@ -736,7 +750,7 @@ riferimento alla stessa voce nella \textit{file table}, condividendo cos
  posizione corrente sul file. Questo ha le conseguenze descritte a suo tempo in
  \secref{sec:proc_fork}: in caso di scrittura contemporanea la posizione
  corrente nel file varierà per entrambi i processi (in quanto verrà modificato
-\var{f\_pos} che è la stesso per entrambi).
+\var{f\_pos} che è lo stesso per entrambi).
  
  Si noti inoltre che anche i flag di stato del file (quelli impostati
  dall'argomento \param{flag} di \func{open}) essendo tenuti nella voce della
@@ -750,10 +764,10 @@ voce della \textit{file table}.
  
  
  
-\subsection{Operazioni atomiche coi file}
+\subsection{Operazioni atomiche con i file}
  \label{sec:file_atomic}
  
-Come si è visto in un sistema Unix è sempre possibile per più processi
+Come si è visto in un sistema unix-like è sempre possibile per più processi
  accedere in contemporanea allo stesso file, e che le operazioni di lettura e
  scrittura possono essere fatte da ogni processo in maniera autonoma in base
  ad una posizione corrente nel file che è locale a ciascuno di essi.
@@ -763,19 +777,18 @@ problema, quando si andr
  maniera imprevedibile.  Il sistema però fornisce in alcuni casi la possibilità
  di eseguire alcune operazioni di scrittura in maniera coordinata anche senza
  utilizzare meccanismi di sincronizzazione più complessi (come il \textit{file
-  locking}, che esamineremo in \secref{cha:file_advanced}).
+  locking}, che esamineremo in \secref{sec:file_locking}).
  
  Un caso tipico di necessità di accesso condiviso in scrittura è quello in cui
  vari processi devono scrivere alla fine di un file (ad esempio un file di
-log). Come accennato in \secref{sec:file_lseek} impostare la posizione alla fine
-del file e poi scrivere può condurre ad una 
-\textit{race condition}\index{race condition}: 
-infatti può succedere che un secondo processo scriva alla fine
-del file fra la \func{lseek} e la \func{write}; in questo caso, come abbiamo
-appena visto, il file sarà esteso, ma il nostro primo processo avrà ancora la
-posizione corrente impostata con la \func{lseek} che non corrisponde più alla
-fine del file, e la successiva \func{write} sovrascriverà i dati del secondo
-processo.
+log). Come accennato in \secref{sec:file_lseek} impostare la posizione alla
+fine del file e poi scrivere può condurre ad una \textit{race
+  condition}\index{race condition}: infatti può succedere che un secondo
+processo scriva alla fine del file fra la \func{lseek} e la \func{write}; in
+questo caso, come abbiamo appena visto, il file sarà esteso, ma il nostro
+primo processo avrà ancora la posizione corrente impostata con la \func{lseek}
+che non corrisponde più alla fine del file, e la successiva \func{write}
+sovrascriverà i dati del secondo processo.
  
  Il problema è che usare due system call in successione non è un'operazione
  atomica; il problema è stato risolto introducendo la modalità
@@ -786,17 +799,19 @@ avviene all'interno di una singola system call (la \func{write}) che non
  essendo interrompibile da un altro processo costituisce un'operazione atomica.
  
  Un altro caso tipico in cui è necessaria l'atomicità è quello in cui si vuole
-creare un file di lock, bloccandosi se il file esiste. In questo caso la
-sequenza logica porterebbe a verificare prima l'esistenza del file con una
-\func{stat} per poi crearlo con una \func{creat}; di nuovo avremmo la
-possibilità di una race condition\index{race condition} da parte di un altro
-processo che crea lo stesso file fra il controllo e la creazione.
-
-Per questo motivo sono stati introdotti pe \func{open} i due flag
+creare un \textsl{file di lock}\index{file di lock}, bloccandosi se il file
+esiste. In questo caso la sequenza logica porterebbe a verificare prima
+l'esistenza del file con una \func{stat} per poi crearlo con una \func{creat};
+di nuovo avremmo la possibilità di una race condition\index{race condition} da
+parte di un altro processo che crea lo stesso file fra il controllo e la
+creazione.
+
+Per questo motivo sono stati introdotti per \func{open} i due flag
  \macro{O\_CREAT} e \macro{O\_EXCL}. In questo modo l'operazione di controllo
  dell'esistenza del file (con relativa uscita dalla funzione con un errore) e
  creazione in caso di assenza, diventa atomica essendo svolta tutta all'interno
-di una singola system call.
+di una singola system call (per i dettagli sull'uso di questa caratteristica
+si veda \secref{sec:ipc_file_lock}).
  
  
  \subsection{La funzioni \func{sync} e \func{fsync}}
@@ -810,10 +825,11 @@ secondo tempo rispetto al momento della esecuzione della \func{write}.
  Per questo motivo, quando è necessaria una sincronizzazione dei dati, il
  sistema mette a disposizione delle funzioni che provvedono a forzare lo
  scarico dei dati dai buffer del kernel.\footnote{come già accennato neanche
-  questo da la garanzia assoluta che i dati siano integri dopo la chiamata,
-  l'hardware dei dischi è in genere dotato di un suo meccanismo interno che
-  può ritardare ulteriormente la scrittura effettiva.} La prima di queste
-funzioni è \func{sync} il cui prototipo è:
+  questo dà la garanzia assoluta che i dati siano integri dopo la chiamata,
+  l'hardware dei dischi è in genere dotato di un suo meccanismo interno di
+  ottimizzazione per l'accesso al disco che può ritardare ulteriormente la
+  scrittura effettiva.} La prima di queste funzioni è \func{sync} il cui
+prototipo è:
  \begin{prototype}{unistd.h}{int sync(void)}
    
    Sincronizza il buffer della cache dei file col disco.
@@ -828,9 +844,13 @@ kernel.
  La funzione viene usata dal comando \cmd{sync} quando si vuole forzare
  esplicitamente lo scarico dei dati su disco, o dal demone di sistema
  \cmd{update} che esegue lo scarico dei dati ad intervalli di tempo fissi: il
-valore tradizionale per l'update dei dati è ogni 30 secondi, ma in Linux era
-di 5 secondi; con le nuove versioni poi, è il kernel che si occupa
-direttamente di tutto quanto.
+valore tradizionale, usato da BSD, per l'update dei dati è ogni 30 secondi, ma
+in Linux il valore utilizzato è di 5 secondi; con le nuove versioni\footnote{a
+  partire dal kernel 2.2.8} poi, è il kernel che si occupa direttamente di
+tutto quanto attraverso il demone interno \cmd{bdflush}, il cui comportamento
+può essere controllato attraverso il file \file{/proc/sys/vm/bdflush} (per il
+significato dei valori si può leggere la documentazione allegata al kernel in
+\file{Documentation/sysctl/vm.txt}).
  
  Quando si vogliono scaricare soltanto i dati di un file (ad esempio essere
  sicuri che i dati di un database sono stati registrati su disco) si possono
@@ -843,7 +863,7 @@ usare le due funzioni \func{fsync} e \func{fdatasync}, i cui prototipi sono:
    Sincronizza i dati del file \param{fd}.
    
    \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
-    nel qual caso i codici restituiti in \var{errno} sono:
+    nel qual caso \var{errno} assume i valori:
    \begin{errlist}
    \item[\macro{EINVAL}] \param{fd} è un file speciale che non supporta la
      sincronizzazione.
@@ -853,8 +873,10 @@ usare le due funzioni \func{fsync} e \func{fdatasync}, i cui prototipi sono:
  
  Entrambe le funzioni forzano la sincronizzazione col disco di tutti i dati del
  file specificato, ed attendono fino alla conclusione delle operazioni;
-\func{fsync} forza anche la sincronizzazione dei metadata dell'inode (i dati
-di \var{fstat} come i tempi del file). 
+\func{fsync} forza anche la sincronizzazione dei metadati del file (che
+riguardano sia le modifiche alle tabelle di allocazione dei settori, che gli
+altri dati contenuti nell'inode che si leggono con \var{fstat} come i tempi
+del file).
  
  Si tenga presente che questo non comporta la sincronizzazione della
  directory che contiene il file (e scrittura della relativa voce su
@@ -908,8 +930,9 @@ sull'altro (dato che quello che viene modificato 
  della \textit{file table} a cui entrambi fanno riferimento). L'unica
  differenza fra due file descriptor duplicati è che ciascuno avrà il suo
  \textit{file descriptor flag}; a questo proposito va specificato che nel caso
-di \func{dup} il flag di \textit{close on exec} viene sempre cancellato nella
-copia.
+di \func{dup} il flag di \textit{close-on-exec}\index{close-on-exec} (vedi
+\secref{sec:proc_exec} e \secref{sec:file_fcntl}) viene sempre cancellato
+nella copia.
  
  L'uso principale di questa funzione è per la redirezione dell'input e
  dell'output fra l'esecuzione di una \func{fork} e la successiva \func{exec};
@@ -989,10 +1012,11 @@ valori 
    \macro{EINVAL} se \param{arg} è negativo o maggiore del massimo consentito o
    \macro{EMFILE} se il processo ha già raggiunto il massimo numero di
    descrittori consentito.
-\item[\macro{F\_SETFD}] imposta il valore del \textit{file descriptor flag}
-  al valore specificato con \param{arg}. Al momento l'unico bit usato è
-  quello di \textit{close on exec}, identificato dalla costante
-  \macro{FD\_CLOEXEC}.
+\item[\macro{F\_SETFD}] imposta il valore del \textit{file descriptor flag} al
+  valore specificato con \param{arg}. Al momento l'unico bit usato è quello di
+  \textit{close-on-exec}\index{close-on-exec}, identificato dalla costante
+  \macro{FD\_CLOEXEC}, che serve a richiedere che il file venga chiuso nella
+  esecuzione di una \func{exec} (vedi \secref{sec:proc_exec}).
  \item[\macro{F\_GETFD}] ritorna il valore del \textit{file descriptor flag} di
    \var{fd}, se \macro{FD\_CLOEXEC} è impostato i file descriptor aperti
    vengono chiusi attraverso una \func{exec} altrimenti (il comportamento