1 \chapter{La gestione avanzata dei file}
2 \label{cha:file_advanced}
4 In questo capitolo affronteremo le tematiche relative alla gestione avanzata
5 dei file, che non sono state trattate in \capref{cha:file_unix_interface},
6 dove ci si è limitati ad una panoramica delle funzioni base. In particolare
7 tratteremo delle funzioni di input/output avanzato e del \textit{file
11 \section{Le funzioni di I/O avanzato}
12 \label{sec:file_advanced_io}
14 In questa sezione esamineremo le funzioni che permettono una gestione più
15 sofisticata dell'I/O su file, a partire da quelle che permettono di gestire
16 l'accesso contemporaneo a più file, per concludere con la gestione dell'I/O
20 \subsection{La modalità di I/O \textsl{non-bloccante}}
21 \label{sec:file_noblocking}
23 Abbiamo visto in \secref{sec:sig_gen_beha}, affrontando la suddivisione fra
24 \textit{fast} e \textit{slow} system call, che in certi casi le funzioni di
25 I/O possono bloccarsi indefinitamente.\footnote{si ricordi però che questo può
26 accadere solo per le pipe, i socket ed alcuni file di dispositivo; sui file
27 normali le funzioni di lettura e scrittura ritornano sempre subito.} Ad
28 esempio le operazioni di lettura possono bloccarsi quando non ci sono dati
29 disponibili sul descrittore su cui si sta operando.
31 Questo comportamento causa uno dei problemi più comuni che ci si trova ad
32 affrontare nelle operazioni di I/O, che è quello che si verifica quando si
33 devono eseguire operazioni che possono bloccarsi su più file descriptor:
34 mentre si è bloccati su uno di questi file su di un'altro potrebbero essere
35 presenti dei dati, così che nel migliore dei casi si avrebbe una lettura
36 ritardata inutilmente, e nel peggiore si potrebbe addirittura arrivare ad un
39 Abbiamo già accennato in \secref{sec:file_open} che però è possibile prevenire
40 questo tipo di comportamento aprendo un file in modalità
41 \textsl{non-bloccante}, attraverso l'uso del flag \macro{O\_NONBLOCK} nella
42 chiamata di \func{open}. In questo caso le funzioni di input/output che
43 altrimenti si sarebbero bloccate ritornano immediatamente, restituendo
44 l'errore \macro{EAGAIN}.
46 L'utilizzo di questa modalità di I/O permette di risolvere il problema
47 controllando a turno i vari file descriptor, in un ciclo in cui si ripete
48 l'accesso fintanto che esso non viene garantito. Ovviamente questa tecnica,
49 detta \textit{polling}, è estremamente inefficiente: si tiene costantemente
50 impiegata la CPU solo per eseguire in continuazione delle system call che
51 nella gran parte dei casi falliranno. Per evitare questo, come vedremo in
52 \secref{sec:file_multiplexing}, è stata introdotta una nuova interfaccia di
53 programmazione, che comporta comunque l'uso della modalità di I/O non
58 \subsection{L'I/O multiplexing}
59 \label{sec:file_multiplexing}
61 Per superare il problema di dover usare il \textit{polling} per controllare la
62 possibilità di effettuare operazioni su un file aperto in modalità non
63 bloccante, sia BSD che System V hanno introdotto delle nuove funzioni in grado
64 di sospendere l'esecuzione di un processo in attesa che l'accesso diventi
65 possibile. Il primo ad introdurre questa modalità di operazione, chiamata
66 usualmente \textit{I/O multiplexing}, è stato BSD,\footnote{la funzione è
67 apparsa in BSD4.2 e standardizzata in BSD4.4, ma è stata portata su tutti i
68 sistemi che supportano i \textit{socket}, compreso le varianti di System V.}
69 con la funzione \func{select}, il cui prototipo è:
72 \headdecl{sys/types.h}
74 \funcdecl{int select(int n, fd\_set *readfds, fd\_set *writefds, fd\_set
75 *exceptfds, struct timeval *timeout)}
77 Attende che uno dei file descriptor degli insiemi specificati diventi
80 \bodydesc{La funzione in caso di successo restituisce il numero di file
81 descriptor (anche nullo) che sono attivi, e -1 in caso di errore, nel qual
82 caso \var{errno} viene settata ai valori:
84 \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
86 \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
87 \item[\macro{EINVAL}] Si è specificato per \param{n} un valore negativo.
89 ed inoltre \macro{ENOMEM}.
93 La funzione mette il processo in stato di \textit{sleep} (vedi
94 \tabref{tab:proc_proc_states}) fintanto che almeno uno dei file descriptor
95 degli insiemo specificati (\param{readfds}, \param{writefds} e
96 \param{exceptfds}), non diventa attivo, per un tempo massimo specificato da
99 Per specificare quali file descriptor si intende \textsl{selezionare}, la
100 funzione usa un particolare oggetto, il \textit{file descriptor set},
101 identificato dal tipo \type{fd\_set}, che serve ad identificare un insieme di
102 file descriptor, (in maniera analoga a come un \textit{signal set}, vedi
103 \secref{sec:sig_sigset}, identifica un insieme di segnali). Per la
104 manipolazione di questi \textit{file descriptor set} si possono usare delle
105 opportune macro di preprocessore:
107 \headdecl{sys/time.h}
108 \headdecl{sys/types.h}
110 \funcdecl{FD\_ZERO(fd\_set *set)}
111 Inizializza l'insieme (vuoto).
113 \funcdecl{FD\_SET(int fd, fd\_set *set)}
114 Inserisce il file descriptor \param{fd} nell'insieme.
116 \funcdecl{FD\_CLR(int fd, fd\_set *set)}
117 Rimuove il file descriptor \param{fd} nell'insieme.
119 \funcdecl{FD\_ISSET(int fd, fd\_set *set)}
120 Controlla se il file descriptor \param{fd} è nell'insieme.
123 In genere un \textit{file descriptor set} può contenere fino ad un massimo di
124 \macro{FD\_SETSIZE} file descriptor. Questo valore in origine corrispondeva
125 al limite per il numero massimo di file aperti\footnote{ad esempio in Linux,
126 fino alla serie 2.0.x, c'era un limite di 256 file per processo.}, ma
127 quando, come nelle versioni più recenti del kernel, non c'è più un limite
128 massimo, esso indica le dimensioni massime dei numeri usati nei \textit{file
131 La funzione richiede di specificare tre insiemi distinti di file descriptor;
132 il primo, \param{readfds}, verrà osservato per rilevare la disponibilità di
133 effettuare una lettura, il secondo, \param{writefds}, per verificare la
134 possibilità effettuare una scrittura ed il terzo, \param{exceptfds}, per
135 verificare l'esistenza di condizioni eccezionali (come i messaggi urgenti su
136 un \textit{socket}\index{socket}, vedi \secref{sec:xxx_urgent}).
138 La funzione inoltre richiede anche di specificare, tramite l'argomento
139 \param{n}, un valore massimo del numero dei file descriptor usati
140 nell'insieme; si può usare il già citato \macro{FD\_SETSIZE}, oppure il numero
141 più alto dei file descriptor usati nei tre insiemi, aumentato di uno.
143 Infine l'argomento \param{timeout}, specifica un tempo massimo di
144 attesa\footnote{il tempo è valutato come \textit{elapsed time}.} prima che la
145 funzione ritorni; se settato a \macro{NULL} la funzione attende
146 indefinitamente. Si può specificare anche un tempo nullo (cioè una \var{struct
147 timeval} con i campi settati a zero), qualora si voglia semplicemente
148 controllare lo stato corrente dei file descriptor.
150 La funzione restituisce il totale dei file descriptor pronti nei tre insiemi,
151 il valore zero indica sempre che si è raggiunto un timeout. Ciascuno dei tre
152 insiemi viene sovrascritto per indicare quale file descriptor è pronto per le
153 operazioni ad esso relative, in modo da poterlo controllare con la macro
154 \macro{FD\_ISSET}. In caso di errore la funzione restituisce -1 e gli insiemi
157 In Linux \func{select} modifica anche il valore di \param{timeout}, settandolo
158 al tempo restante; questo è utile quando la funzione viene interrotta da un
159 segnale, in tal caso infatti si ha un errore di \macro{EINTR}, ed occorre
160 rilanciare la funzione; in questo modo non è necessario ricalcolare tutte le
161 volte il tempo rimanente.\footnote{questo però può causare problemi di
162 portabilità sia quando si trasporta codice scritto su Linux che legge questo
163 valore, sia quando si usano programmi scritti per altri sistemi che non
164 dispongono di questa caratteristica e ricalcolano \param{timeout} tutte le
165 volte. In genere la caratteristica è disponibile nei sistemi che derivano da
166 System V e non disponibile per quelli che derivano da BSD.}
168 Come accennato l'interfaccia di \func{select} è una estensione di BSD; anche
169 System V ha introdotto una sua interfaccia per gestire l'\textit{I/O
170 multiplexing}, basata sulla funzione \func{poll},\footnote{la funzione è
171 prevista dallo standard XPG4, ed è stata introdotta in Linux come system
172 call a partire dal kernel 2.1.23 e dalle libc 5.4.28.} il cui prototipo è:
173 \begin{prototype}{sys/poll.h}
174 {int poll(struct pollfd *ufds, unsigned int nfds, int timeout)}
176 La funzione attente un cambiamento di stato per uno dei file descriptor
177 specificati da \param{ufds}.
179 \bodydesc{La funzione restituisce il numero di file descriptor con attività in
180 caso di successo, o 0 se c'è stato un timeout; in caso di errore viene
181 restituito -1 ed \var{errno} viene settata ai valori:
183 \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
185 \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
187 ed inoltre \macro{EFAULT} e \macro{ENOMEM}.}
190 La funzione tiene sotto controllo un numero \param{ndfs} di file descriptor
191 specificati attraverso un vettore di puntatori a strutture di tipo
192 \type{pollfd}, la cui definizione è riportata in \figref{fig:file_pollfd}.
193 Come \func{select} anche \func{poll} permette di interrompere l'attesa dopo un
194 certo tempo, che va specificato attraverso \param{timeout} in numero di
195 millesecondi (un valore negativo indica un'attesa indefinita).
198 \footnotesize \centering
199 \begin{minipage}[c]{15cm}
200 \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{}
202 int fd; /* file descriptor */
203 short events; /* requested events */
204 short revents; /* returned events */
209 \caption{La struttura \type{pollfd}, utilizzata per specificare le modalità
210 di controllo di un file descriptor alla funzione \func{poll}.}
211 \label{fig:file_pollfd}
214 Per ciascun file da controllare deve essere opportunamente predisposta una
215 struttura \type{pollfd}; nel campo \var{fd} deve essere specificato il file
216 descriptor, mentre nel campo \var{events} il tipo di evento su cui si vuole
217 attendere; quest'ultimo deve essere specificato come maschera binaria dei
218 primi tre valori riportati in \tabref{tab:file_pollfd_flags} (gli altri
219 vengono utilizzati solo per \var{revents} come valori in uscita).
224 \begin{tabular}[c]{|l|c|l|}
226 \textbf{Flag} & \textbf{Valore} & \textbf{Significato} \\
229 \macro{POLLIN} & 0x001 & È possibile la lettura immediata.\\
230 \macro{POLLPRI} & 0x002 & Sono presenti dati urgenti.\\
231 \macro{POLLOUT} & 0x004 & È possibile la scrittura immediata.\\
233 \macro{POLLERR} & 0x008 & C'è una condizione di errore.\\
234 \macro{POLLHUP} & 0x010 & Si è vericato un hung-up.\\
235 \macro{POLLNVAL} & 0x020 & Il file descriptor non è aperto.\\
237 \macro{POLLRDNORM}& 0x040 & Sono disponibili in lettura dati normali.\\
238 \macro{POLLRDBAND}& 0x080 & Sono disponibili in lettura dati ad alta
240 \macro{POLLWRNORM}& 0x100 & È possibile la scrittura di dati normali. \\
241 \macro{POLLWRBAND}& 0x200 & È possibile la scrittura di dati ad
243 \macro{POLLMSG} & 0x400 & Estensione propria di Linux.\\
246 \caption{Costanti per l'identificazione dei vari bit dei campi
247 \var{events} e \var{revents} di \type{pollfd}.}
248 \label{tab:file_pollfd_flags}
251 La funzione ritorna, restituendo il numero di file per i quali si è verificata
252 una delle condizioni di attesa richieste o un errore. Lo stato dei file
253 all'uscita della funzione viene restituito nel campo \var{revents} della
254 relativa struttura \type{pollfd}, che viene settato alla maschera binaria dei
255 valori riportati in \tabref{tab:file_pollfd_flags}, ed oltre alle tre
256 condizioni specificate tramite \var{events} può riportare anche l'occorrere di
257 una condizione di errore.
259 Lo standard POSIX è rimasto a lungo senza primitive per l'\textit{I/O
260 multiplexing}, che è stata introdotto con le ultime revisioni dello standard
261 (POSIX 1003.1g-2000 e POSIX 1003.1-2001). Esso prevede che tutte le funzioni
262 ad esso relative vengano dichiarate nell'header \file{sys/select.h}, che
263 sostituisce i precedenti, ed aggiunge a \func{select} una nuova funzione
264 \func{pselect},\footnote{il supporto per lo standard POSIX 1003.1-2001, ed
265 l'header \file{sys/select.h}, compaiono in Linux a partire dalle \acr{glibc}
266 2.0. Le \acr{libc4} e \acr{libc5} non contengono questo header, le
267 \acr{glibc} 2.0 contengono una definizione sbagliata di \func{psignal},
268 senza l'argomento \param{sigmask}, la definizione corretta è presente dalle
269 \acr{glibc} 2.1-2.2.1 se si è definito \macro{\_GNU\_SOURCE} e nelle
270 \acr{glibc} 2.2.2-2.2.4 se si è definito \macro{\_XOPEN\_SOURCE} con valore
271 maggiore di 600.} il cui prototipo è:
272 \begin{prototype}{sys/select.h}
273 {int pselect(int n, fd\_set *readfds, fd\_set *writefds, fd\_set *exceptfds,
274 struct timespec *timeout, sigset\_t *sigmask)}
276 Attende che uno dei file descriptor degli insiemi specificati diventi
279 \bodydesc{La funzione in caso di successo restituisce il numero di file
280 descriptor (anche nullo) che sono attivi, e -1 in caso di errore, nel qual
281 caso \var{errno} viene settata ai valori:
283 \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
285 \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
286 \item[\macro{EINVAL}] Si è specificato per \param{n} un valore negativo.
288 ed inoltre \macro{ENOMEM}.}
291 La funzione è sostanzialmente identica a \func{select}, solo che usa una
292 struttura \type{timespec} per indicare con maggiore precisione il timeout e
293 non ne aggiorna il valore in caso di interruzione, inoltre prende un argomento
294 aggiuntivo \param{sigmask} che è il puntatore ad una maschera di segnali (si
295 veda \secref{sec:sig_sigmask}). La maschera corrente viene sostituita da
296 questa immediatamente prima di eseguire l'attesa, e ripristinata al ritorno
299 L'uso di \param{sigmask} è stato introdotto allo scopo di prevenire possibili
300 race condition\footnote{in Linux però, non esistendo una system call apposita,
301 la funzione è implementata nelle \acr{glibc} usando \func{select}, e la
302 possibilità di una race condition resta.} quando si deve eseguire un test su
303 una variabile settata da un manipolatore sulla base dell'occorrenza di un
304 segnale per decidere se lanciare \func{select}. Fra il test e l'esecuzione è
305 presente una finestra in cui potrebbe arrivare il segnale che non sarebbe
306 rilevato; la race condition diventa superabile disabilitando il segnale prima
307 del test e riabilitandolo poi grazie all'uso di \param{sigmask}.
311 \subsection{L'\textsl{I/O asincrono}}
312 \label{sec:file_asyncronous_io}
314 Una modalità alternativa all'uso dell'\textit{I/O multiplexing} è quella di
315 fare ricorso al cosiddetto \textsl{I/O asincrono}. Il concetto base
316 dell'\textsl{I/O asincrono} è che le funzioni di I/O non attendono il
317 completamento delle operazioni prima di ritornare, così che il processo non
318 viene bloccato. In questo modo diventa ad esempio possibile effettuare una
319 richiesta preventiva di dati, in modo da poter effettuare in contemporanea le
320 operazioni di calcolo e quelle di I/O.
322 Abbiamo accennato in \secref{sec:file_open} che è possibile, attraverso l'uso
323 del flag \macro{O\_ASYNC},\footnote{l'uso del flag di \macro{O\_ASYNC} e dei
324 comandi \macro{F\_SETOWN} e \macro{F\_GETOWN} per \func{fcntl} è specifico
325 di Linux e BSD.} aprire un file in modalità asincrona, così come è possibile
326 attivare in un secondo tempo questa modalità settando questo flag attraverso
327 l'uso di \func{fcntl} con il comando \macro{F\_SETFL} (vedi
328 \secref{sec:file_fcntl}).
330 In realtà in questo caso non si tratta di I/O asincrono vero e proprio, quanto
331 di un meccanismo asincrono di notifica delle variazione dello stato del file
332 descriptor; quello che succede è che il sistema genera un segnale (normalmente
333 \macro{SIGIO}, ma è possibile usarne altri) tutte le volte che diventa
334 possibile leggere o scrivere dal file descriptor che si è posto in questa
335 modalità. Si può inoltre selezionare, con il comando \macro{F\_SETOWN} di
336 \func{fcntl}, quale processo (o gruppo di processi) riceverà il segnale.
338 Uno dei problemi che si presenta con l'implementazione usuale di questa
339 modalità di I/O è che essa può essere usata in maniera immediata aprendo in
340 modalità asincrona un solo file per processo, altrimenti ad ogni segnale si
341 dovrebbe provvedere ad effettuare un controllo (utilizzando di nuovo
342 \func{select}) su tutti i file tenuti in modalità asincrona per distinguere
343 quelli cui è dovuta l'emissione del segnale.
345 Linux però supporta una estensione che permette di evitare tutto questo
346 facendo ricorso alle informazioni aggiuntive restituite attraverso la
347 struttura \type{siginfo\_t} quando il manipolatore del segnale viene
348 installato come \macro{SA\_SIGINFO} (si riveda quanto illustrato in
349 \secref{sec:sig_sigaction}).
351 Per attivare questa caratteristica occorre settare esplicitamente il segnale
352 da inviare in caso di I/O asincrono (di norma sempre \macro{SIGIO}) con il
353 comando \macro{F\_SETSIG} di \func{fcntl}. In questo caso il manipolatore
354 tutte le volte che riceverà \macro{SI\_SIGIO} come valore del campo
355 \var{si\_code}\footnote{il valore resta \macro{SI\_SIGIO} qualunque sia il
356 segnale che si è associato all'I/O asincrono, ed indica appunto che il
357 segnale è stato generato a causa di attività nell'I/O asincrono.} di
358 \type{siginfo\_t}, troverà nel campo \var{si\_fd} il valore del file
359 descriptor che ha generato il segnale. In questo modo è possibile identificare
360 immediatamente il file evitando completamente l'uso di funzioni come
361 \func{poll} o \func{select}. Inoltre, a differenza degli altri segnali, il
362 sistema mantiene una coda per \macro{SIGIO}, in modo che arrivi un segnale per
366 Benché la modalità di apertura asincrona di un file possa risultare utile in
367 varie occasioni (in particolar modo con i socket e gli altri file per i quali
368 le funzioni di I/O sono system call lente), essa è comunque limitata alla
369 notifica della disponibilità del file descriptor per le operazioni di I/O, e
370 non ad uno svolgimento asincrono delle medesime. Lo standard POSIX.1b
371 definisce invece una interfaccia apposita per l'I/O asincrono, che prevede un
372 insieme di funzioni dedicate, completamente separato rispetto a quelle usate
375 In generale questa interfaccia è completamente astratta e può essere
376 implementata sia direttamente nel kernel, che attraverso l'uso di thread. Al
377 momento\footnote{fino ai kernel della serie 2.4.x sono presenti solo le due
378 alternative citate, nella serie 2.5.x è però iniziato un lavoro completo di
379 riscrittura di tutto il sistema di I/O, che prevede anche l'introduzione di
380 un nuovo layer per l'I/O asincrono.} sono disponibili due implementazioni,
381 una in user space, che è integrata nelle \acr{glibc}, ed una ibrida, che si
382 appoggia ad una estensione del kernel (il cosiddetto KAIO, non incluso nella
383 versione ufficiale) prodotta da SGI. Quest'ultima ha funzionalità più limitate
384 ma prestazioni nettamente superiori.
386 Alle funzioni definite essa si può accedere includendo \file{unistd.h} e
387 definendo la macro \macro{\_POSIX\_ASYNCHRONOUS\_IO}, mentre alla
388 implementazione di KAIO si accede includendo \file{linux/aio.h}; ambedue però
389 usano la stessa interfaccia di programmazione.
394 \subsection{I/O multiplo}
395 \label{sec:file_multiple_io}
397 Un caso abbastanza comune è quello in cui ci si trova a dover affrontare una
398 serie multipla di operazioni di I/O, come una serie di letture o scritture di
399 vari buffer. In questo caso
403 \subsection{File mappati in memoria}
404 \label{sec:file_memory_map}
411 \section{Il file locking}
412 \label{sec:file_locking}
414 In \secref{sec:file_sharing} abbiamo preso in esame le modalità in cui un
415 sistema unix-like gestisce la condivisione dei file da parte di processi
416 diversi. In quell'occasione si è visto come, con l'eccezione dei file aperti
417 in \textit{append mode}, quando più processi scrivono contemporaneamente sullo
418 stesso file non è possibile determinare la sequenza in cui essi opereranno.
420 Questo causa la possibilità di race condition\index{race condition}; in
421 generale le situazioni più comuni sono due: l'interazione fra un processo che
422 scrive e altri che leggono, in cui questi ultimi possono leggere informazioni
423 scritte solo in maniera parziale o incompleta; o quella in cui diversi
424 processi scrivono, mescolando in maniera imprevedibile il loro output sul
427 In tutti questi casi il \textit{file locking} è la tecnica che permette di
428 evitare le race condition, attraverso una serie di funzioni che permettono di
429 bloccare l'accesso al file da parte di altri processi, così da evitare le
430 sovrapposizioni, e garantire la atomicità delle operazioni di scrittura.
433 \subsection{L'\textit{advisory locking}}
434 \label{sec:file_record_locking}
436 La prima modalità di file locking che è stata implementata nei sistemi
437 unix-like è quella che viene usualmente chiamata \textit{advisory locking}, in
438 quanto è il processo, e non il sistema, che si incarica di verificare se
439 esiste una condizione di blocco per l'accesso ai file.
444 \subsection{Il \textit{mandatory locking}}
445 \label{sec:file_mand_locking}
447 Il \textit{mandatory locking} è una opzione introdotta inizialmente in SVr4,
456 %%% TeX-master: "gapil"