Aggiunte e correzioni

[gapil.git] / fileadv.tex
diff --git a/fileadv.tex b/fileadv.tex

index 6095c58be49f145cd25548c7051d29b7cc95e77b..0d6e2f08d1f3160ce34f94cd4b847d0ebc9526dd 100644 (file)
--- a/fileadv.tex
+++ b/fileadv.tex
@@ -78,7 +78,7 @@ con la funzione \func{select}, il cui prototipo 
    
    \bodydesc{La funzione in caso di successo restituisce il numero di file
      descriptor (anche nullo) che sono attivi, e -1 in caso di errore, nel qual
-    caso \var{errno} viene impostata ai valori:
+    caso \var{errno} assumerà uno dei valori:
    \begin{errlist}
    \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
    degli insiemi.
@@ -169,7 +169,8 @@ Come accennato l'interfaccia di \func{select} 
  System V ha introdotto una sua interfaccia per gestire l'\textit{I/O
    multiplexing}, basata sulla funzione \func{poll},\footnote{la funzione è
    prevista dallo standard XPG4, ed è stata introdotta in Linux come system
-  call a partire dal kernel 2.1.23 e dalle \acr{libc} 5.4.28.} il cui prototipo è:
+  call a partire dal kernel 2.1.23 e dalle \acr{libc} 5.4.28.} il cui
+prototipo è:
  \begin{prototype}{sys/poll.h}
    {int poll(struct pollfd *ufds, unsigned int nfds, int timeout)}
  
@@ -178,7 +179,7 @@ specificati da \param{ufds}.
    
  \bodydesc{La funzione restituisce il numero di file descriptor con attività in
    caso di successo, o 0 se c'è stato un timeout; in caso di errore viene
-  restituito  -1 ed \var{errno} viene impostata ai valori:
+  restituito  -1 ed \var{errno} assumerà uno dei valori:
    \begin{errlist}
    \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
    degli insiemi.
@@ -278,7 +279,7 @@ sostituisce i precedenti, ed aggiunge a \func{select} una nuova funzione
    
    \bodydesc{La funzione in caso di successo restituisce il numero di file
      descriptor (anche nullo) che sono attivi, e -1 in caso di errore, nel qual
-    caso \var{errno} viene impostata ai valori:
+    caso \var{errno} assumerà uno dei valori:
    \begin{errlist}
    \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
    degli insiemi.
@@ -308,7 +309,7 @@ del test e riabilitandolo poi grazie all'uso di \param{sigmask}.
  
  
  
-\subsection{L'\textsl{I/O asincrono}}
+\subsection{L'I/O asincrono}
  \label{sec:file_asyncronous_io}
  
  Una modalità alternativa all'uso dell'\textit{I/O multiplexing} è quella di
@@ -352,7 +353,7 @@ attraverso la struttura \type{siginfo\_t}, utilizzando la forma estesa
  \secref{sec:sig_sigaction}).
  
  Per far questo però occorre utilizzare le funzionalità dei segnali real-time
-(vedi \secref{sec:sig_real_time}) imopstando esplicitamente con il comando
+(vedi \secref{sec:sig_real_time}) impostando esplicitamente con il comando
  \macro{F\_SETSIG} di \func{fcntl} un segnale real-time da inviare in caso di
  I/O asincrono (il segnale predefinito è \macro{SIGIO}). In questo caso il
  manipolatore tutte le volte che riceverà \macro{SI\_SIGIO} come valore del
@@ -388,10 +389,11 @@ implementata sia direttamente nel kernel, che in user space attraverso l'uso
  di thread. Al momento\footnote{fino ai kernel della serie 2.4.x, nella serie
    2.5.x è però iniziato un lavoro completo di riscrittura di tutto il sistema
    di I/O, che prevede anche l'introduzione di un nuovo layer per l'I/O
-  asincrono.} esiste una sola versione stabile di questa interfaccia, quella
-delle \acr{glibc}, che è realizzata completamente in user space.  Esistono
-comunque vari progetti sperimentali (come il KAIO della SGI, o i patch di
-Benjamin La Haise) che prevedono un supporto diretto da parte del kernel.
+  asincrono (effettuato a partire dal 2.5.32).} esiste una sola versione
+stabile di questa interfaccia, quella delle \acr{glibc}, che è realizzata
+completamente in user space.  Esistono comunque vari progetti sperimentali
+(come il KAIO della SGI, o i patch di Benjamin La Haise) che prevedono un
+supporto diretto da parte del kernel.
  
  Lo standard prevede che tutte le operazioni di I/O asincrono siano controllate
  attraverso l'uso di una apposita struttura \type{aiocb} (il cui nome sta per
@@ -503,7 +505,7 @@ appena descritta; i rispettivi prototipi sono:
    \param{aiocbp}.
    
    \bodydesc{Le funzioni restituiscono 0 in caso di successo, e -1 in caso di
-    errore, nel qual caso \var{errno} viene impostata ai valori:
+    errore, nel qual caso \var{errno} assumerà uno dei valori:
    \begin{errlist}
    \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato.
    \item[\macro{ENOSYS}] La funzione non è implementata.
@@ -674,8 +676,8 @@ specifica operazione; il suo prototipo 
    operazioni specificate da \param{list}.
    
    \bodydesc{La funzione restituisce 0 se una (o più) operazioni sono state
-    completate, e -1 in caso di errore nel qual caso \var{errno} viene
-    impostata ai valori:
+    completate, e -1 in caso di errore nel qual caso \var{errno} assumerà uno
+    dei valori:
      \begin{errlist}
      \item[\macro{EAGAIN}] Nessuna operazione è stata completata entro
        \param{timeout}.
@@ -706,7 +708,7 @@ lettura o scrittura; il suo prototipo 
    secondo la modalità \param{mode}.
    
    \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
-    errore, nel qual caso \var{errno} viene impostata ai valori:
+    errore, nel qual caso \var{errno} assumerà uno dei valori:
      \begin{errlist}
      \item[\macro{EAGAIN}] Nessuna operazione è stata completata entro
        \param{timeout}.
@@ -773,8 +775,8 @@ prototipi sono:
    specificati da \param{vector}.
    
    \bodydesc{Le funzioni restituiscono il numero di byte letti o scritti in
-    caso di successo, e -1 in caso di errore, nel qual caso \var{errno} viene
-    impostata ai valori:
+    caso di successo, e -1 in caso di errore, nel qual caso \var{errno}
+    assumerà uno dei valori:
    \begin{errlist}
    \item[\macro{EBADF}] si è specificato un file descriptor sbagliato.
    \item[\macro{EINVAL}] si è specificato un valore non valido per uno degli
@@ -817,7 +819,7 @@ I buffer da utilizzare sono indicati attraverso l'argomento \param{vector} che
  \param{count}.  Ciascuna struttura dovrà essere inizializzata per
  opportunamente per indicare i vari buffer da/verso i quali verrà eseguito il
  trasferimento dei dati. Essi verranno letti (o scritti) nell'ordine in cui li
-si sono specificati nel vattore \var{vector}.
+si sono specificati nel vettore \var{vector}.
  
  
  \subsection{File mappati in memoria}
@@ -840,7 +842,7 @@ memoria, quanto di memoria mappata su file.
    \centering
    \includegraphics[width=9.5cm]{img/mmap_layout}
    \caption{Disposizione della memoria di un processo quando si esegue la
-  mappatuara in memoria di un file.}
+  mappatura in memoria di un file.}
    \label{fig:file_mmap_layout}
  \end{figure}
  
@@ -880,7 +882,7 @@ in memoria di un file; il suo prototipo 
    
    \bodydesc{La funzione restituisce il puntatore alla zona di memoria mappata
      in caso di successo, e \macro{MAP\_FAILED} (-1) in caso di errore, nel
-    qual caso \var{errno} viene impostata ai valori:
+    qual caso \var{errno} assumerà uno dei valori:
      \begin{errlist}
      \item[\macro{EBADF}] Il file descriptor non è valido, e non si è usato
        \macro{MAP\_ANONYMOUS}.
@@ -1000,7 +1002,7 @@ come maschera binaria ottenuta dall'OR di uno o pi
                               argomenti \param{fd} e \param{offset} sono
                               ignorati.\footnotemark\\
      \macro{MAP\_ANON}      & Sinonimo di \macro{MAP\_ANONYMOUS}, deprecato.\\
-    \macro{MAP\_FILE}      & Valore di compatibiità, deprecato.\\
+    \macro{MAP\_FILE}      & Valore di compatibilità, deprecato.\\
      \hline
    \end{tabular}
    \caption{Valori possibili dell'argomento \param{flag} di \func{mmap}.}
@@ -1037,7 +1039,7 @@ di memoria che si estende fino al bordo della pagina successiva.
    \centering
    \includegraphics[width=10cm]{img/mmap_boundary}
    \caption{Schema della mappatura in memoria di una sezione di file di
-    dimensioni non corripondenti al bordo di una pagina.}
+    dimensioni non corrispondenti al bordo di una pagina.}
    \label{fig:file_mmap_boundary}
  \end{figure}
  
@@ -1128,7 +1130,7 @@ contenuto della memoria mappata con il file su disco; il suo prototipo 
    Sincronizza i contenuti di una sezione di un file mappato in memoria.
    
    \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
-    errore nel qual caso \var{errno} viene impostata ai valori:
+    errore nel qual caso \var{errno} assumerà uno dei valori:
      \begin{errlist}
      \item[\macro{EINVAL}] O \param{start} non è multiplo di \macro{PAGESIZE},
      o si è specificato un valore non valido per \param{flags}.
@@ -1184,7 +1186,7 @@ mappatura della memoria usando la funzione \func{munmap}, il suo prototipo 
    Rilascia la mappatura sulla sezione di memoria specificata.
  
    \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
-    errore nel qual caso \var{errno} viene impostata ai valori:
+    errore nel qual caso \var{errno} assumerà uno dei valori:
      \begin{errlist}
      \item[\macro{EINVAL}] L'intervallo specificato non ricade in una zona
        precedentemente mappata.
@@ -1230,12 +1232,153 @@ sovrapposizioni, e garantire la atomicit
  \label{sec:file_record_locking}
  
  La prima modalità di file locking che è stata implementata nei sistemi
-unix-like è quella che viene usualmente chiamata \textit{advisory locking}, in
-quanto è il processo, e non il sistema, che si incarica di verificare se
-esiste una condizione di blocco per l'accesso ai file.
+unix-like è quella che viene usualmente chiamata \textit{advisory
+  locking},\footnote{Stevens in APUE fa riferimento a questo argomento come al
+  \textit{record locking}, dizione utilizzata anche dal manuale delle
+  \acr{glibc}; nelle pagine di manuale si parla di \textit{discretionary file
+    lock} per \func{fcntl} e di \textit{advisory locking} per \func{flock},
+  mentre questo nome viene usato anche da Stevens per riferirsi al
+  \textit{file locking} di POSIX. Dato che la dizione \textit{record locking}
+  è quantomeno ambigua in quanto non esiste niente che possa fare riferimento
+  al concetto di \textit{record}, alla fine si è scelto di mantenere il nome
+  \textit{advisory locking}.} in quanto sono i singoli processi, e non il
+sistema, che si incaricano di asserire e verificare se esistono delle
+condizioni di blocco per l'accesso ai file.  Questo significa che le funzioni
+\func{read} o \func{write} non risentono affatto della presenza di un
+eventuale blocco, e che sta ai vari processi controllare esplicitamente lo
+stato dei file condivisi prima di accedervi ed implementare opportunamente un
+protocollo di accesso.
+
+In Linux sono disponibili due interfacce per utilizzare l'\textit{advisory
+  locking}, la prima è quella derivata da BSD, che è basata sulla funzione
+\func{flock}, la seconda è quella standardizzata da POSIX.1 (originaria di
+System V), che è basata sulla funzione \func{fcntl}.  I \textit{file lock}
+sono implementati in maniera completamente indipendente nelle due interfacce,
+che pertanto possono coesistere senza interferenze.
+
+In generale si distinguono due tipologie di blocco per un file: la prima è il
+cosiddetto \textit{shared lock}, detto anche \textit{read lock} in quanto
+serve a bloccare l'accesso in scrittura su un file affinché non venga
+modificato mentre lo si legge. Si parla di \textsl{blocco condiviso} in quanto
+più processi possono richiedere contemporaneamente uno \textit{shared lock}
+per proteggere un accesso in lettura.
+
+La seconda è il cosiddetto \textit{exclusive lock}, detto anche \textit{write
+  lock} in quanto serve a bloccare l'accesso su un file da parte di altri (sia
+in lettura che in scrittura) mentre lo si sta scrivendo. Si parla di
+\textsl{blocco esclusivo} appunto perché un solo processo alla volta può
+richiedere un \textit{exclusive lock} per proteggere un accesso in scrittura.
+
+Entrambe le interfacce garantiscono che quando si richiede un \textit{file
+  lock} su un file su cui ne sia già presente un altro che non ne consente
+l'acquisizione (uno \textit{shared lock} su un file con un \textit{exclusive
+  lock}, o un \textit{exclusive lock} su un file con altro \textit{file lock})
+la funzione blocca il processo fintanto che \textit{file lock} preesistente
+non viene rimosso.
+
+L'interfaccia classica usata da BSD permette di eseguire il blocco solo su un
+intero file, funzione usata per richiedere e rimuovere un \textit{file lock} è
+\func{flock}, il cui prototipo è:
+\begin{prototype}{sys/file.h}{int flock(int fd, int operation)}
+  
+  Applica o rimuove un \textit{file lock} sul file \param{fd}.
+  
+  \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
+    errore, nel qual caso \var{errno} assumerà uno dei valori:
+    \begin{errlist}
+    \item[\macro{EWOULDBLOCK}] Il file ha già un blocco attivo, e si è
+      specificato \macro{LOCK\_NB}.
+    \end{errlist}
+  }
+\end{prototype}
  
+Il comportamento della funzione è specificato dal valore dell'argomento
+\param{operation}, da passare come maschera binaria dei valori riportati in 
+\tabref{tab:file_flock_operation}.
  
+\begin{table}[htb]
+  \centering
+  \footnotesize
+  \begin{tabular}[c]{|l|l|}
+    \hline
+    \textbf{Valore} & \textbf{Significato} \\
+    \hline
+    \hline
+    \macro{LOCK\_SH} & Asserisce uno \textit{shared lock} sul file.\\ 
+    \macro{LOCK\_EX} & Asserisce un \textit{esclusive lock} sul file.\\
+    \macro{LOCK\_UN} & Sblocca il file.\\
+    \macro{LOCK\_NB} & Impedisce che la funzione si blocchi nella
+                       richiesta di un \textit{file lock}.\\
+    \hline    
+  \end{tabular}
+  \caption{Valori dell'argomento \param{operation} di \func{flock}.}
+  \label{tab:file_flock_operation}
+\end{table}
  
+La funzione blocca direttamente il file (cioè rispetto allo schema di
+\secref{fig:file_stat_struct} fa riferimento all'inode, non al file
+descriptor). Pertanto sia \func{dup} che \func{fork} non creano altre istanze
+di un \textit{file lock}.
+
+La seconda interfaccia per l'\textit{advisory locking} disponibile in Linux è
+quella standardizzata da POSIX, basata sulla funzione \func{fcntl}. Abbiamo
+già trattato questa funzione nelle sue molteplici funzionalità in
+\secref{sec:file_fcntl}, quando la si impiega per il \textit{file locking}
+però essa viene usata secondo il prototipo:
+\begin{prototype}{fcntl.h}{int fcntl(int fd, int cmd, struct flock *lock)}
+  
+  Applica o rimuove un \textit{file lock} sul file \param{fd}.
+  
+  \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
+    errore, nel qual caso \var{errno} assumerà uno dei valori:
+    \begin{errlist}
+    \item[\macro{EACCES}] L'operazione è proibita per la presenza di
+      \textit{file lock} da parte di altri processi.
+    \item[\macro{ENOLCK}] Il sistema non ha le risorse per il locking: ci sono
+      troppi segmenti di lock aperti, si è esaurita la tabella dei lock, o il
+      protocollo per il locking remoto è fallito.
+    \item[\macro{EDEADLK}] Si è richiesto un lock su una regione bloccata da
+      un altro processo che è a sua volta in attesa dello sblocco di un lock
+      mantenuto dal processo corrente; si avrebbe pertanto un
+      \textit{deadlock}. Non è garantito che il sistema riconosca sempre
+      questa situazione.
+    \item[\macro{EINTR}] La funzione è stata interrotta da un segnale prima di
+      poter acquisire un lock.
+    \end{errlist}
+    ed inoltre \macro{EBADF}, \macro{EFAULT}.
+  }
+\end{prototype}
+
+Al contrario di \func{flock} con \func{fcntl} è possibile bloccare anche solo
+delle sezioni di un file. La funzione prende come argomento 
+
+
+\begin{figure}[!htb]
+  \footnotesize \centering
+  \begin{minipage}[c]{15cm}
+    \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{}
+struct struct {
+    short int l_type;   /* Type of lock: F_RDLCK, F_WRLCK, or F_UNLCK.  */
+    short int l_whence; /* Where `l_start' is relative to (like `lseek').  */
+    off_t l_start;      /* Offset where the lock begins.  */
+    off_t l_len;        /* Size of the locked area; zero means until EOF.  */
+    pid_t l_pid;        /* Process holding the lock.  */
+};
+    \end{lstlisting}
+  \end{minipage} 
+  \normalsize 
+  \caption{La struttura \type{flock}, usata da \func{fcntl} per il file
+    locking.} 
+  \label{fig:struct_flock}
+\end{figure}
+
+
+
+
+Si tenga conto che \func{flock} non è in grado di eseguire il \textit{file
+  locking} su NFS, se si ha questa necessità occorre usare \func{fcntl} che
+funziona anche attraverso NFS, posto che il server supporti il \textit{file
+  locking}.
  
  \subsection{Il \textit{mandatory locking}}
  \label{sec:file_mand_locking}
@@ -1249,14 +1392,14 @@ opportune verifiche nei processi, questo verrebbe comunque rispettato.
  
  Per poter utilizzare il \textit{mandatory locking} è stato introdotto un
  utilizzo particolare del bit \acr{suid}. Se si ricorda quanto esposto in
-\secref{sec:file_suid_sgid}), esso viene di norma utlizzato per cambiare
-l'\textit{effective user ID} con cui viene eseguito un programma, ed è
-pertanto sempre associato alla presenza del permesso di esecuzione. Impostando
-questo bit su un file senza permesso di esecuzione in un sistema che supporta
-il \textit{mandatory locking}, fa sì che quest'ultimo venga attivato per il
-file in questione. In questo modo una combinaizone dei permessi
-originariamente non contemplata, in quanto senza significato, diventa
-l'indicazione della presenza o meno del \textit{mandatory locking}.
+\secref{sec:file_suid_sgid}), esso viene di norma utilizzato per cambiare
+l'userid effettivo con cui viene eseguito un programma, ed è pertanto sempre
+associato alla presenza del permesso di esecuzione. Impostando questo bit su
+un file senza permesso di esecuzione in un sistema che supporta il
+\textit{mandatory locking}, fa sì che quest'ultimo venga attivato per il file
+in questione. In questo modo una combinazione dei permessi originariamente non
+contemplata, in quanto senza significato, diventa l'indicazione della presenza
+o meno del \textit{mandatory locking}.