d744a758905558b00fe24189ce811a6b41c9a064
[gapil.git] / fileadv.tex
1 \chapter{La gestione avanzata dei file}
2 \label{cha:file_advanced}
3
4 In questo capitolo affronteremo le tematiche relative alla gestione avanzata
5 dei file, che non sono state trattate in \capref{cha:file_unix_interface},
6 dove ci si è limitati ad una panoramica delle funzioni base. In particolare
7 tratteremo delle funzioni di input/output avanzato e del \textit{file
8   locking}.
9
10
11 \section{Le funzioni di I/O avanzato}
12 \label{sec:file_advanced_io}
13
14 In questa sezione esamineremo le funzioni che permettono una gestione più
15 sofisticata dell'I/O su file, a partire da quelle che permettono di gestire
16 l'accesso contemporaneo a più file, per concludere con la gestione dell'I/O
17 mappato in memoria.
18
19
20 \subsection{La modalità di I/O \textsl{non-bloccante}}
21 \label{sec:file_noblocking}
22
23 Abbiamo visto in \secref{sec:sig_gen_beha}, affrontando la suddivisione fra
24 \textit{fast} e \textit{slow} system call, che in certi casi le funzioni di
25 I/O possono bloccarsi indefinitamente.\footnote{si ricordi però che questo può
26   accadere solo per le pipe, i socket ed alcuni file di dispositivo; sui file
27   normali le funzioni di lettura e scrittura ritornano sempre subito.}  Ad
28 esempio le operazioni di lettura possono bloccarsi quando non ci sono dati
29 disponibili sul descrittore su cui si sta operando.
30
31 Questo comportamento causa uno dei problemi più comuni che ci si trova ad
32 affrontare nelle operazioni di I/O, che è quello che si verifica quando si
33 devono eseguire operazioni che possono bloccarsi su più file descriptor:
34 mentre si è bloccati su uno di questi file su di un'altro potrebbero essere
35 presenti dei dati, così che nel migliore dei casi si avrebbe una lettura
36 ritardata inutilmente, e nel peggiore si potrebbe addirittura arrivare ad un
37 deadlock.
38
39 Abbiamo già accennato in \secref{sec:file_open} che però è possibile prevenire
40 questo tipo di comportamento aprendo un file in modalità
41 \textsl{non-bloccante}, attraverso l'uso del flag \macro{O\_NONBLOCK} nella
42 chiamata di \func{open}. In questo caso le funzioni di input/output che
43 altrimenti si sarebbero bloccate ritornano immediatamente, restituendo
44 l'errore \macro{EAGAIN}.
45
46 L'utilizzo di questa modalità di I/O permette di risolvere il problema
47 controllando a turno i vari file descriptor, in un ciclo in cui si ripete
48 l'accesso fintanto che esso non viene garantito.  Ovviamente questa tecnica,
49 detta \textit{polling}, è estremamente inefficiente: si tiene costantemente
50 impiegata la CPU solo per eseguire in continuazione delle system call che
51 nella gran parte dei casi falliranno. Per evitare questo, come vedremo in
52 \secref{sec:file_multiplexing}, è stata introdotta una nuova interfaccia di
53 programmazione, che comporta comunque l'uso della modalità di I/O non
54 bloccante.
55
56
57
58 \subsection{L'I/O multiplexing}
59 \label{sec:file_multiplexing}
60
61 Per superare il problema di dover usare il \textit{polling} per controllare la
62 possibilità di effettuare operazioni su un file aperto in modalità non
63 bloccante, sia BSD che System V hanno introdotto delle nuove funzioni in grado
64 di sospendere l'esecuzione di un processo in attesa che l'accesso diventi
65 possibile.  Il primo ad introdurre questa modalità di operazione, chiamata
66 usualmente \textit{I/O multiplexing}, è stato BSD,\footnote{la funzione è
67   apparsa in BSD4.2 e standardizzata in BSD4.4, ma è stata portata su tutti i
68   sistemi che supportano i \textit{socket}, compreso le varianti di System V.}
69 con la funzione \func{select}, il cui prototipo è:
70 \begin{functions}
71   \headdecl{sys/time.h}
72   \headdecl{sys/types.h}
73   \headdecl{unistd.h}
74   \funcdecl{int select(int n, fd\_set *readfds, fd\_set *writefds, fd\_set
75     *exceptfds, struct timeval *timeout)}
76   
77   Attende che uno dei file descriptor degli insiemi specificati diventi
78   attivo.
79   
80   \bodydesc{La funzione in caso di successo restituisce il numero di file
81     descriptor (anche nullo) che sono attivi, e -1 in caso di errore, nel qual
82     caso \var{errno} viene settata ai valori:
83   \begin{errlist}
84   \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
85   degli insiemi.
86   \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
87   \item[\macro{EINVAL}] Si è specificato per \param{n} un valore negativo.
88   \end{errlist}
89   ed inoltre \macro{ENOMEM}.
90 }
91 \end{functions}
92
93 La funzione mette il processo in stato di \textit{sleep} (vedi
94 \tabref{tab:proc_proc_states}) fintanto che almeno uno dei file descriptor
95 degli insiemo specificati (\param{readfds}, \param{writefds} e
96 \param{exceptfds}), non diventa attivo, per un tempo massimo specificato da
97 \param{timeout}.
98
99 Per specificare quali file descriptor si intende \textsl{selezionare}, la
100 funzione usa un particolare oggetto, il \textit{file descriptor set},
101 identificato dal tipo \type{fd\_set}, che serve ad identificare un insieme di
102 file descriptor, (in maniera analoga a come un \textit{signal set}, vedi
103 \secref{sec:sig_sigset}, identifica un insieme di segnali). Per la
104 manipolazione di questi \textit{file descriptor set} si possono usare delle
105 opportune macro di preprocessore:
106 \begin{functions}
107   \headdecl{sys/time.h}
108   \headdecl{sys/types.h}
109   \headdecl{unistd.h}
110   \funcdecl{FD\_ZERO(fd\_set *set)}
111   Inizializza l'insieme (vuoto).
112
113   \funcdecl{FD\_SET(int fd, fd\_set *set)}
114   Inserisce il file descriptor \param{fd} nell'insieme.
115
116   \funcdecl{FD\_CLR(int fd, fd\_set *set)}
117   Rimuove il file descriptor \param{fd} nell'insieme.
118   
119   \funcdecl{FD\_ISSET(int fd, fd\_set *set)}
120   Controlla se il file descriptor \param{fd} è nell'insieme.
121 \end{functions}
122
123 In genere un \textit{file descriptor set} può contenere fino ad un massimo di
124 \macro{FD\_SETSIZE} file descriptor.  Questo valore in origine corrispondeva
125 al limite per il numero massimo di file aperti\footnote{ad esempio in Linux,
126   fino alla serie 2.0.x, c'era un limite di 256 file per processo.}, ma
127 quando, come nelle versioni più recenti del kernel, non c'è più un limite
128 massimo, esso indica le dimensioni massime dei numeri usati nei \textit{file
129   descriptor set}.
130
131 La funzione richiede di specificare tre insiemi distinti di file descriptor;
132 il primo, \param{readfds}, verrà osservato per rilevare la disponibilità di
133 effettuare una lettura, il secondo, \param{writefds}, per verificare la
134 possibilità effettuare una scrittura ed il terzo, \param{exceptfds}, per
135 verificare l'esistenza di condizioni eccezionali (come i messaggi urgenti su
136 un \textit{socket}\index{socket}, vedi \secref{sec:xxx_urgent}).
137
138 La funzione inoltre richiede anche di specificare, tramite l'argomento
139 \param{n}, un valore massimo del numero dei file descriptor usati
140 nell'insieme; si può usare il già citato \macro{FD\_SETSIZE}, oppure il numero
141 più alto dei file descriptor usati nei tre insiemi, aumentato di uno.
142
143 Infine l'argomento \param{timeout}, specifica un tempo massimo di
144 attesa\footnote{il tempo è valutato come \textit{elapsed time}.} prima che la
145 funzione ritorni; se settato a \macro{NULL} la funzione attende
146 indefinitamente. Si può specificare anche un tempo nullo (cioè una \var{struct
147   timeval} con i campi settati a zero), qualora si voglia semplicemente
148 controllare lo stato corrente dei file descriptor.
149
150 La funzione restituisce il totale dei file descriptor pronti nei tre insiemi,
151 il valore zero indica sempre che si è raggiunto un timeout. Ciascuno dei tre
152 insiemi viene sovrascritto per indicare quale file descriptor è pronto per le
153 operazioni ad esso relative, in modo da poterlo controllare con la macro
154 \macro{FD\_ISSET}. In caso di errore la funzione restituisce -1 e gli insiemi
155 non vengono toccati.
156
157 In Linux \func{select} modifica anche il valore di \param{timeout}, settandolo
158 al tempo restante; questo è utile quando la funzione viene interrotta da un
159 segnale, in tal caso infatti si ha un errore di \macro{EINTR}, ed occorre
160 rilanciare la funzione; in questo modo non è necessario ricalcolare tutte le
161 volte il tempo rimanente.\footnote{questo può causare problemi di portabilità
162   sia quando si trasporta codice scritto su Linux che legge questo valore, sia
163   quando si usano programmi scritti per altri sistemi che non dispongono di
164   questa caratteristica e ricalcolano \param{timeout} tutte le volte. In
165   genere la caratteristica è disponibile nei sistemi che derivano da System V
166   e non disponibile per quelli che derivano da BSD.}
167
168 Come accennato l'interfaccia di \func{select} è una estensione di BSD; anche
169 System V ha introdotto una sua interfaccia per gestire l'\textit{I/O
170   multiplexing}, basata sulla funzione \func{poll},\footnote{la funzione è
171   prevista dallo standard XPG4, ed è stata introdotta in Linux come system
172   call a partire dal kernel 2.1.23 e dalle libc 5.4.28.} il cui prototipo è:
173 \begin{prototype}{sys/poll.h}
174   {int poll(struct pollfd *ufds, unsigned int nfds, int timeout)}
175
176 La funzione attente un cambiamento di stato per uno dei file descriptor
177 specificati da \param{ufds}.
178   
179 \bodydesc{La funzione restituisce il numero di file descriptor con attività in
180   caso di successo, o 0 se c'è stato un timeout; in caso di errore viene
181   restituito  -1 ed \var{errno} viene settata ai valori:
182   \begin{errlist}
183   \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
184   degli insiemi.
185   \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
186   \end{errlist}
187   ed inoltre \macro{EFAULT} e \macro{ENOMEM}.}
188 \end{prototype}
189
190 La funzione tiene sotto controllo un numero \param{ndfs} di file descriptor
191 specificati attraverso un vettore di puntatori a strutture di tipo
192 \type{pollfd}, la cui definizione è riportata in \figref{fig:file_pollfd}.
193 Come \func{select} anche \func{poll} permette di interrompere l'attesa dopo un
194 certo tempo, che va specificato attraverso \param{timeout} in numero di
195 millesecondi (un valore negativo indica un'attesa indefinita).
196
197 \begin{figure}[!htb]
198   \footnotesize \centering
199   \begin{minipage}[c]{15cm}
200     \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{}
201 struct pollfd {
202         int fd;           /* file descriptor */
203         short events;     /* requested events */
204         short revents;    /* returned events */
205 };
206     \end{lstlisting}
207   \end{minipage} 
208   \normalsize 
209   \caption{La struttura \type{pollfd}, utilizzata per specificare le modalità
210     di controllo di un file descriptor alla funzione \func{poll}.}
211   \label{fig:file_pollfd}
212 \end{figure}
213
214 Per ciascun file da controllare deve essere opportunamente predisposta una
215 struttura \type{pollfd}; nel campo \var{fd} deve essere specificato il file
216 descriptor, mentre nel campo \var{events} il tipo di evento su cui si vuole
217 attendere; quest'ultimo deve essere specificato come maschera binaria dei
218 primi tre valori riportati in \tabref{tab:file_pollfd_flags} (gli altri
219 vengono utilizzati solo per \var{revents} come valori in uscita).
220
221 \begin{table}[htb]
222   \centering
223   \footnotesize
224   \begin{tabular}[c]{|l|c|l|}
225     \hline
226     \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
227     \hline
228     \hline
229     \macro{POLLIN}    & 0x001 & È possibile la lettura immediata.\\
230     \macro{POLLPRI}   & 0x002 & Sono presenti dati urgenti.\\
231     \macro{POLLOUT}   & 0x004 & È possibile la scrittura immediata.\\
232     \hline
233     \macro{POLLERR}   & 0x008 & C'è una condizione di errore.\\
234     \macro{POLLHUP}   & 0x010 & Si è vericato un hung-up.\\
235     \macro{POLLNVAL}  & 0x020 & Il file descriptor non è aperto.\\
236     \hline
237     \macro{POLLRDNORM}& 0x040 & Sono disponibili in lettura dati normali.\\ 
238     \macro{POLLRDBAND}& 0x080 & Sono disponibili in lettura dati ad alta 
239                                 priorità. \\
240     \macro{POLLWRNORM}& 0x100 & È possibile la scrittura di dati normali.  \\ 
241     \macro{POLLWRBAND}& 0x200 & È possibile la scrittura di dati ad 
242                                 alta priorità. \\
243     \macro{POLLMSG}   & 0x400 & Estensione propria di Linux.\\
244     \hline    
245   \end{tabular}
246   \caption{Costanti per l'identificazione dei vari bit dei campi
247     \var{events} e \var{revents} di \type{pollfd}.}
248   \label{tab:file_pollfd_flags}
249 \end{table}
250
251 La funzione ritorna, restituendo il numero di file per i quali si è verificata
252 una delle condizioni di attesa richieste o un errore. Lo stato dei file
253 all'uscita della funzione viene restituito nel campo \var{revents} della
254 relativa struttura \type{pollfd}, che viene settato alla maschera binaria dei
255 valori riportati in \tabref{tab:file_pollfd_flags}, ed oltre alle tre
256 condizioni specificate tramite \var{events} può riportare anche l'occorrere di
257 una condizione di errore.
258
259 Lo standard POSIX è rimasto a lungo senza primitive per l'\textit{I/O
260   multiplexing}, che è stata introdotto con le ultime revisioni dello standard
261 (POSIX 1003.1g-2000 e POSIX 1003.1-2001). Esso prevede che tutte le funzioni
262 ad esso relative vengano dichiarate nell'header \file{sys/select.h}, che
263 sostituisce i precedenti, ed aggiunge a \func{select} una nuova funzione
264 \func{pselect},\footnote{il supporto per lo standard POSIX 1003.1-2001, ed
265   l'header \file{sys/select.h}, compaiono in Linux a partire dalle \acr{glibc}
266   2.0. Le \acr{libc4} e \acr{libc5} non contengono questo header, le
267   \acr{glibc} 2.0 contengono una definizione sbagliata di \func{psignal},
268   senza l'argomento \param{sigmask}, la definizione corretta è presente dalle
269   \acr{glibc} 2.1-2.2.1 se si è definito \macro{\_GNU\_SOURCE} e nelle
270   \acr{glibc} 2.2.2-2.2.4 se si è definito \macro{\_XOPEN\_SOURCE} con valore
271   maggiore di 600.} il cui prototipo è:
272 \begin{prototype}{sys/select.h}
273   {int pselect(int n, fd\_set *readfds, fd\_set *writefds, fd\_set *exceptfds,
274     struct timespec *timeout, sigset\_t *sigmask)}
275   
276   Attende che uno dei file descriptor degli insiemi specificati diventi
277   attivo.
278   
279   \bodydesc{La funzione in caso di successo restituisce il numero di file
280     descriptor (anche nullo) che sono attivi, e -1 in caso di errore, nel qual
281     caso \var{errno} viene settata ai valori:
282   \begin{errlist}
283   \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
284   degli insiemi.
285   \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
286   \item[\macro{EINVAL}] Si è specificato per \param{n} un valore negativo.
287   \end{errlist}
288   ed inoltre \macro{ENOMEM}.}
289 \end{prototype}
290
291 La funzione è sostanzialmente identica a \func{select}, solo che usa una
292 struttura \type{timespec} per indicare con maggiore precisione il timeout e
293 non ne aggiorna il valore in caso di interruzione, inoltre prende un argomento
294 aggiuntivo \param{sigmask} che è il puntatore ad una maschera di segnali (si
295 veda \secref{sec:sig_sigmask}). La maschera corrente viene sostituita da
296 questa immediatamente prima di eseguire l'attesa, e ripristinata al ritorno
297 della funzione.
298
299 L'uso di \param{sigmask} è stato introdotto allo scopo di prevenire possibili
300 race condition\footnote{in Linux però, non esistendo una system call apposita,
301   la funzione è implementata nelle \acr{glibc} usando \func{select}, e la
302   possibilità di una race condition resta.} quando si deve eseguire un test su
303 una variabile settata da un manipolatore sulla base dell'occorrenza di un
304 segnale per decidere se lanciare \func{select}. Fra il test e l'esecuzione è
305 presente una finestra in cui potrebbe arrivare il segnale che non sarebbe
306 rilevato; la race condition diventa superabile disabilitando il segnale prima
307 del test e riabilitandolo poi grazie all'uso di \param{sigmask}.
308
309
310
311 \subsection{L'\textsl{I/O asincrono}}
312 \label{sec:file_asyncronous_io}
313
314 Una modalità alternativa all'uso dell'\textit{I/O multiplexing} è quella di
315 fare ricorso al cosiddetto \textsl{I/O asincrono}. Il concetto base
316 dell'\textsl{I/O asincrono} è che le funzioni di I/O non attendono il
317 completamento delle operazioni prima di ritornare, così che il processo non
318 viene bloccato.  In questo modo diventa ad esempio possibile effettuare una
319 richiesta preventiva di dati, in modo da poter effettuare in contemporanea le
320 operazioni di calcolo e quelle di I/O.
321
322 Abbiamo accennato in \secref{sec:file_open} che è possibile, attraverso l'uso
323 del flag \macro{O\_ASYNC},\footnote{l'uso del flag di \macro{O\_ASYNC} e dei
324   comandi \macro{F\_SETOWN} e \macro{F\_GETOWN} per \func{fcntl} è specifico
325   di Linux e BSD.} aprire un file in modalità asincrona, così come è possibile
326 attivare in un secondo tempo questa modalità settando questo flag attraverso
327 l'uso di \func{fcntl} con il comando \macro{F\_SETFL} (vedi
328 \secref{sec:file_fcntl}).
329
330 In realtà in questo caso non si tratta di I/O asincrono vero e proprio, quanto
331 di un meccanismo asincrono di notifica delle variazione dello stato del file
332 descriptor; quello che succede è che il sistema genera un segnale (normalmente
333 \macro{SIGIO}, ma è possibile usarne altri) tutte le volte che diventa
334 possibile leggere o scrivere dal file descriptor che si è posto in questa
335 modalità. Si può inoltre selezionare, con il comando \macro{F\_SETOWN} di
336 \func{fcntl}, quale processo (o gruppo di processi) riceverà il segnale.
337
338 Uno dei problemi che si presenta con l'implementazione usuale di questa
339 modalità di I/O è che essa può essere usata in maniera immediata aprendo in
340 modalità asincrona un solo file per processo, altrimenti ad ogni segnale si
341 dovrebbe provvedere ad effettuare un controllo (utilizzando di nuovo
342 \func{select}) su tutti i file tenuti in modalità asincrona per distinguere
343 quelli cui è dovuta l'emissione del segnale.
344
345 Linux però supporta una estensione che permette di evitare tutto questo
346 facendo ricorso alle informazioni aggiuntive restituite attraverso la
347 struttura \type{siginfo\_t} quando il manipolatore del segnale viene
348 installato come \macro{SA\_SIGINFO} (si riveda quanto illustrato in
349 \secref{sec:sig_sigaction}).
350
351 Per attivare questa caratteristica occorre settare esplicitamente il segnale
352 da inviare in caso di I/O asincrono (di norma sempre \macro{SIGIO}) con il
353 comando \macro{F\_SETSIG} di \func{fcntl}. In questo caso il manipolatore
354 tutte le volte che riceverà \macro{SI\_SIGIO} come valore del campo
355 \var{si\_code}\footnote{il valore resta \macro{SI\_SIGIO} qualunque sia il
356   segnale che si è associato all'I/O asincrono, ed indica appunto che il
357   segnale è stato generato a causa di attività nell'I/O asincrono.} di
358 \type{siginfo\_t}, troverà nel campo \var{si\_fd} il valore del file
359 descriptor che ha generato il segnale. In questo modo è possibile identificare
360 immediatamente il file evitando completamente l'uso di funzioni come
361 \func{poll} o \func{select}. Inoltre, a differenza degli altri segnali, il
362 sistema mantiene una coda per \macro{SIGIO}, in modo che arrivi un segnale per
363 ogni file attivo.
364
365 Benché la modalità di apertura asincrona di un file possa risultare utile in
366 varie occasioni (in particolar modo con i socket e gli altri file per i quali
367 le funzioni di I/O sono system call lente), essa è comunque limitata alla
368 notifica della disponibilità del file descriptor per le operazioni di I/O, e
369 non ad uno svolgimento asincrono delle medesime.  Lo standard POSIX.1b
370 definisce invece una interfaccia apposita per l'I/O asincrono, che prevede un
371 insieme di funzioni dedicate, completamente separato rispetto a quelle usate
372 normalmente.
373
374 In generale questa interfaccia è completamente astratta e può essere
375 implementata sia direttamente nel kernel, che in user space attraverso l'uso
376 di thread. Al momento\footnote{fino ai kernel della serie 2.4.x, nella serie
377   2.5.x è però iniziato un lavoro completo di riscrittura di tutto il sistema
378   di I/O, che prevede anche l'introduzione di un nuovo layer per l'I/O
379   asincrono.} esiste una sola versione stabile, quella delle \acr{glibc}, che
380 è realizzata completamente in user space; esistono comunque vari progetti
381 (come il KAIO della SGI, o i patch di Benjamin La Haise) che prevedono un
382 supporto diretto all'interno del kernel.
383
384
385
386
387 \subsection{I/O multiplo}
388 \label{sec:file_multiple_io}
389
390 Un caso abbastanza comune è quello in cui ci si trova a dover affrontare una
391 serie multipla di operazioni di I/O, come una serie di letture o scritture di
392 vari buffer. In questo caso 
393
394
395
396 \subsection{File mappati in memoria}
397 \label{sec:file_memory_map}
398
399
400
401
402
403
404 \section{Il file locking}
405 \label{sec:file_locking}
406
407 In \secref{sec:file_sharing} abbiamo preso in esame le modalità in cui un
408 sistema unix-like gestisce la condivisione dei file da parte di processi
409 diversi. In quell'occasione si è visto come, con l'eccezione dei file aperti
410 in \textit{append mode}, quando più processi scrivono contemporaneamente sullo
411 stesso file non è possibile determinare la sequenza in cui essi opereranno.
412
413 Questo causa la possibilità di race condition\index{race condition}; in
414 generale le situazioni più comuni sono due: l'interazione fra un processo che
415 scrive e altri che leggono, in cui questi ultimi possono leggere informazioni
416 scritte solo in maniera parziale o incompleta; o quella in cui diversi
417 processi scrivono, mescolando in maniera imprevedibile il loro output sul
418 file.
419
420 In tutti questi casi il \textit{file locking} è la tecnica che permette di
421 evitare le race condition, attraverso una serie di funzioni che permettono di
422 bloccare l'accesso al file da parte di altri processi, così da evitare le
423 sovrapposizioni, e garantire la atomicità delle operazioni di scrittura.
424
425
426 \subsection{L'\textit{advisory locking}}
427 \label{sec:file_record_locking}
428
429 La prima modalità di file locking che è stata implementata nei sistemi
430 unix-like è quella che viene usualmente chiamata \textit{advisory locking}, in
431 quanto è il processo, e non il sistema, che si incarica di verificare se
432 esiste una condizione di blocco per l'accesso ai file.
433
434
435
436
437 \subsection{Il \textit{mandatory locking}}
438 \label{sec:file_mand_locking}
439
440 Il \textit{mandatory locking} è una opzione introdotta inizialmente in SVr4, 
441
442
443
444
445
446
447 %%% Local Variables: 
448 %%% mode: latex
449 %%% TeX-master: "gapil"
450 %%% End: