Sistemati gli indici.
[gapil.git] / fileadv.tex
1 \chapter{La gestione avanzata dei file}
2 \label{cha:file_advanced}
3
4 In questo capitolo affronteremo le tematiche relative alla gestione avanzata
5 dei file, che non sono state trattate in \capref{cha:file_unix_interface},
6 dove ci si è limitati ad una panoramica delle funzioni base. In particolare
7 tratteremo delle funzioni di input/output avanzato e del \textit{file
8   locking}.
9
10
11 \section{Le funzioni di I/O avanzato}
12 \label{sec:file_advanced_io}
13
14 In questa sezione esamineremo le funzioni che permettono una gestione più
15 sofisticata dell'I/O su file, a partire da quelle che permettono di gestire
16 l'accesso contemporaneo a più file, per concludere con la gestione dell'I/O
17 mappato in memoria.
18
19
20 \subsection{La modalità di I/O \textsl{non-bloccante}}
21 \label{sec:file_noblocking}
22
23 Abbiamo visto in \secref{sec:sig_gen_beha}, affrontando la suddivisione fra
24 \textit{fast} e \textit{slow} system call, che in certi casi le funzioni di
25 I/O possono bloccarsi indefinitamente.\footnote{si ricordi però che questo può
26   accadere solo per le pipe, i socket ed alcuni file di dispositivo; sui file
27   normali le funzioni di lettura e scrittura ritornano sempre subito.}  Ad
28 esempio le operazioni di lettura possono bloccarsi quando non ci sono dati
29 disponibili sul descrittore su cui si sta operando.
30
31
32 Questo comportamento causa uno dei problemi più comuni che ci si trova ad
33 affrontare nelle operazioni di I/O, che è quello che si verifica quando si
34 devono eseguire operazioni che possono bloccarsi su più file descriptor:
35 mentre si è bloccati su uno di questi file su di un'altro potrebbero essere
36 presenti dei dati, così che nel migliore dei casi si avrebbe una lettura
37 ritardata inutilmente, e nel peggiore si potrebbe addirittura arrivare ad un
38 deadlock.
39
40 Abbiamo già accennato in \secref{sec:file_open} che però è possibile prevenire
41 questo tipo di comportamento aprendo un file in modalità
42 \textsl{non-bloccante}, attraverso l'uso del flag \macro{O\_NONBLOCK} nella
43 chiamata di \func{open}. In questo caso le funzioni di input/output che
44 altrimenti si sarebbero bloccate ritornano immediatamente, restituendo
45 l'errore \macro{EAGAIN}.
46
47 L'utilizzo di questa modalità di I/O permette di risolvere il problema
48 controllando a turno i vari file descriptor, in un ciclo in cui si ripete
49 l'accesso fintanto che esso non viene garantito.  Ovviamente questa tecnica,
50 detta \textit{polling}, è estremamente inefficiente: si tiene costantemente
51 impiegata la CPU solo per eseguire in continuazione delle system call che
52 nella gran parte dei casi falliranno. Per evitare questo, come vedremo in
53 \secref{sec:file_multiplexing}, è stata introdotta una nuova interfaccia di
54 programmazione, che comporta comunque l'uso della modalità di I/O non
55 bloccante.
56
57 \subsection{Le funzioni \func{poll} e \func{select}}
58 \label{sec:file_multiplexing}
59
60 Per superare il problema di dover usare il \textit{polling} controllare la
61 disponibilità di accesso ad un file aperto in modalità non bloccante, sia BSD
62 che SysV hanno introdotto delle nuove funzioni in grado di sospendere
63 l'esecuzione di un processo fino a che l'accesso diventi possibile; il primo
64 ad introdurre questa nuova interfaccia, chiamata usualmente \textit{I/O
65   multiplexing}, è stato BSD, con l'introduzione della funzione \func{select},
66 il cui prototipo è:
67 \begin{prototype}{sys/select.h}
68   {int select(int n, fd\_set *readfds, fd\_set *writefds, fd\_set *exceptfds,
69     struct timeval *timeout)}
70
71 Attende che un certo insieme di file descriptor cambi stato.
72   
73 \bodydesc{La funzione restituisce il numero di file descriptor, anche nullo,
74   che hanno cambiato stato in caso di successo e -1 in caso di errore, nel
75   qual caso \var{errno} viene settata ai valori:
76   \begin{errlist}
77   \item[\macro{EBADF}] Si è specificato un file descriptor sbagliato in uno
78   degeli insiemi.
79   \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
80   \item[\macro{EINVAL}] Si è specificato per \param{n} un valore negativo.
81   \end{errlist}
82   ed inoltre \macro{ENOMEM}.
83 }
84 \end{prototype}
85
86 La funzione mette il processo in stato di \textit{sleep} (vedi
87 \tabref{tab:proc_proc_states}) fintanto che non viene rilevate dell'attività
88 sull'insieme dei file descriptor specificati (\param{readfds},
89 \param{writefds} e \param{exceptfds}), per un tempo massimo specificato da
90 \param{timeout}. 
91
92 Per specificare quali file descriptor si intende selezionare, la funzione usa
93 un particolare oggetto, il \textit{file descriptor set}, identificato dal tipo
94 \type{fd\_set}, che serve ad identificare un insieme di file descriptor, in
95 maniera analoga a come un \textit{signal set} (vedi \secref{sec:sig_sigset})
96 identifica un insieme di segnali. Per la manipolazione di questi \textit{file
97   descriptor set} si possono usare delle opportune macro di preprocessore:
98 \begin{functions}
99   \headdecl{sys/select.h}
100   \funcdecl{FD\_ZERO(fd\_set *set)}
101   Inizializza l'insieme (vuoto).
102
103   \funcdecl{FD\_SET(int fd, fd\_set *set)}
104   Inserisce il file descriptor \param{fd} nell'insieme.
105
106   \funcdecl{FD\_CLR(int fd, fd\_set *set)}
107   Rimuove il file descriptor \param{fd} nell'insieme.
108   
109   \funcdecl{FD\_ISSET(int fd, fd\_set *set)}
110   Controlla se il file descriptor \param{fd} è nell'insieme.
111 \end{functions}
112
113 In genere un \textit{file descriptor set} può contenere fino ad un massimo di
114 \macro{FD\_SETSIZE} file descriptor.  Questo a seconda del sistema può essere
115 il limite del numero massimo di file aperti\footnote{ad esempio in Linux, fino
116   alla serie 2.0.x, c'era un limite di 256 file per processo.}, ma quando,
117 come nelle versioni più recenti del kernel, questo limite non c'è un massimo,
118 esso indica le dimensioni in munero di bit utilizzabili per l'insieme.
119
120
121 La funzione richiede di specificare tre insiemi distinti di file descriptor;
122 il primo, \param{readfds}, verrà osservato per rilevare la disponibilità di
123 input in lettura, il secondo, \param{writefds} per verificare la possibilità
124 di scrivere ed il terzo, \param{exceptfds}, per verificare l'esistenza di
125 eccezioni. I corrispondenti valori dei \textit{file descriptor set} saranno
126 modificati di conseguenza per mostrare quale dei file descriptor ha cambiato
127 stato.
128
129
130
131
132
133 Come accennato l'interfaccia di \func{select} è una estensione aggiunta BSD, e
134 poi entrata a far parte di POSIX; allo stesso tempo System V aveva introdotto
135 una interfaccia alternativa, basata sulla funzione \func{poll}, il cui
136 prototipo è:
137 \begin{prototype}{sys/poll.h}
138   {int poll(struct pollfd *ufds, unsigned int nfds, int timeout)}
139
140 La funzione attente un cambiamento di stato per uno dei file descriptor
141 specificati da \param{ufds}.
142   
143 \bodydesc{La funzione restituisce il numero di file descriptor con attività in
144   caso di successo, o 0 se c'è stato un timeout; in caso di errore viene
145   restituito  -1 ed \var{errno} viene settata ai valori:
146
147 .}
148 \end{prototype}
149
150
151
152
153 \subsection{L'I/O asincrono}
154 \label{sec:file_asyncronous_io}
155
156 Una modalità alternativa all'uso dell'I/O non bloccante è quella di fare
157 ricorso all'I/O asincrono. Abbiamo accennato in \secref{sec:file_open} che è
158 possibile, attraverso l'uso del flag \macro{O\_ASYNC}, aprire un file in
159 modalità asincrona, così come è possibile settare questo flag attraverso l'uso
160 di \func{fcntl}.
161
162 In tal caso il sistema genera un segnale \macro{SIGIO} tutte le volte che sono
163 presenti dei dati in input su un file aperto in questa modalità.  Uno dei
164 problemi che si presentavano con le prime implementazioni di questa modalità
165 di I/O è che essa poteva essere usata in maniera semplice aprendo un solo file
166 per processo, dato che altrimenti si sarebbe dovuto provvedere ad effettuare
167 una serie di controlli su tutti i file aperti per distinguere a quale fosse
168 dovuto l'emissione del segnale.
169
170 Tutto questo adesso può essere evitato facendo ricorso alle informazioni
171 restituite al manipolatore del segnale attraverso la struttura
172 \var{siginfo\_t} (vedi \figref{fig:sig_siginfo_t}), il cui campo \var{si\_fd}
173 riporta il file descriptor che ha generato il segnale.
174
175
176
177 \subsection{File mappati in memoria}
178 \label{sec:file_memory_map}
179
180
181 \subsection{I/O multiplo}
182 \label{sec:file_multiple_io}
183
184
185
186 \section{Il file locking}
187 \label{sec:file_locking}
188
189 In \secref{sec:file_sharing} abbiamo preso in esame le mosalità in cui un
190 sistema unix-like gestisce la condivisione dei file da parte di processi
191 diversi. In quell'occasione si è visto come, con l'eccezione dei file aperti
192 in \textit{append mode}, quando più processi scrivono contemporaneamente sullo
193 stesso file non è possibile determinare la sequenza in cui essi opereranno.
194
195 Questo causa la possibilità di race condition\index{race condition}; in
196 generale le situazioni più comuni sono due: l'interazione fra un processo che
197 scrive e altri che leggono, in cui questi ultimi possono leggere informazioni
198 scritte solo in maniera parziale o incompleta; o quella in cui diversi
199 processi scrivono, mescolando in maniera imprevedebile il loro output sul
200 file.
201
202 In tutti questi casi il \textit{file locking} è la tecnica che permette di
203 evitare le race condition, attraverso una serie di funzioni che permettono di
204 bloccare l'accesso al file da parte di altri processi, così da evitare le
205 sovrapposizioni, e garantire la atomicità delle operazioni di scrittura.
206
207
208 \subsection{L'\textit{advisory locking}}
209 \label{sec:file_record_locking}
210
211 La prima modalità di file locking che è stata implementata nei sistemi
212 unix-like è quella che viene usualmente chiamata \textit{advisory locking}, in
213 quanto è il processo, e non il sistema, che si incarica di verificare se
214 esiste una condizione di blocco per l'accesso ai file.
215
216
217
218
219 \subsection{Il \textit{mandatory locking}}
220 \label{sec:file_mand_locking}
221
222 Il \textit{mandatory locking} è una opzione introdotta inizialmente in SVr4, 
223
224
225
226
227
228
229 %%% Local Variables: 
230 %%% mode: latex
231 %%% TeX-master: "gapil"
232 %%% End: