3 %% Copyright (C) 2000-2005 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
11 \chapter{I file: l'interfaccia standard Unix}
12 \label{cha:file_unix_interface}
15 Esamineremo in questo capitolo la prima delle due interfacce di programmazione
16 per i file, quella dei \textit{file descriptor}\index{file!descriptor},
17 nativa di Unix. Questa è l'interfaccia di basso livello provvista direttamente
18 dalle system call, che non prevede funzionalità evolute come la
19 bufferizzazione o funzioni di lettura o scrittura formattata, e sulla quale è
20 costruita anche l'interfaccia definita dallo standard ANSI C che affronteremo
21 al cap.~\ref{cha:files_std_interface}.
25 \section{L'architettura di base}
26 \label{sec:file_base_arch}
28 In questa sezione faremo una breve introduzione sull'architettura su cui è
29 basata dell'interfaccia dei \textit{file descriptor}, che, sia pure con
30 differenze nella realizzazione pratica, resta sostanzialmente la stessa in
31 tutte le implementazione di un sistema unix-like.
34 \subsection{L'architettura dei \textit{file descriptor}}
37 \index{file!descriptor|(}
39 Per poter accedere al contenuto di un file occorre
40 creare un canale di comunicazione con il kernel che renda possibile operare su
41 di esso (si ricordi quanto visto in sez.~\ref{sec:file_vfs_work}). Questo si
42 fa aprendo il file con la funzione \func{open} che provvederà a localizzare
43 l'inode\index{inode} del file e inizializzare i puntatori che rendono
44 disponibili le funzioni che il VFS mette a disposizione (riportate in
45 tab.~\ref{tab:file_file_operations}). Una volta terminate le operazioni, il
46 file dovrà essere chiuso, e questo chiuderà il canale di comunicazione
47 impedendo ogni ulteriore operazione.
49 All'interno di ogni processo i file aperti sono identificati da un intero non
50 negativo, chiamato appunto \textit{file descriptor}.
51 Quando un file viene aperto la funzione \func{open} restituisce questo numero,
52 tutte le ulteriori operazioni saranno compiute specificando questo stesso
53 valore come argomento alle varie funzioni dell'interfaccia.
55 Per capire come funziona il meccanismo occorre spiegare a grandi linee come il
56 kernel gestisce l'interazione fra processi e file. Il kernel mantiene sempre
57 un elenco dei processi attivi nella cosiddetta \itindex{process~table}
58 \textit{process table} ed un elenco dei file aperti nella \textit{file table}.
60 La \itindex{process~table} \textit{process table} è una tabella che contiene
61 una voce per ciascun processo attivo nel sistema. In Linux ciascuna voce è
62 costituita da una struttura di tipo \struct{task\_struct} nella quale sono
63 raccolte tutte le informazioni relative al processo; fra queste informazioni
64 c'è anche il puntatore ad una ulteriore struttura di tipo
65 \struct{files\_struct}, in cui sono contenute le informazioni relative ai file
66 che il processo ha aperto, ed in particolare:
68 \item i flag relativi ai file descriptor.
69 \item il numero di file aperti.
70 \item una tabella che contiene un puntatore alla relativa voce nella
71 \textit{file table} per ogni file aperto.
73 il \textit{file descriptor} in sostanza è l'intero positivo che indicizza
76 La \textit{file table} è una tabella che contiene una voce per ciascun file
77 che è stato aperto nel sistema. In Linux è costituita da strutture di tipo
78 \struct{file}; in ciascuna di esse sono tenute varie informazioni relative al
81 \item lo stato del file (nel campo \var{f\_flags}).
82 \item il valore della posizione corrente (l'\textit{offset}) nel file (nel
84 \item un puntatore all'inode\index{inode}\footnote{nel kernel 2.4.x si è in
85 realtà passati ad un puntatore ad una struttura \struct{dentry} che punta a
86 sua volta all'inode\index{inode} passando per la nuova struttura del VFS.}
88 %\item un puntatore alla tabella delle funzioni \footnote{la struttura
89 % \var{f\_op} descritta in sez.~\ref{sec:file_vfs_work}} che si possono usare
93 In fig.~\ref{fig:file_proc_file} si è riportato uno schema in cui è illustrata
94 questa architettura, ed in cui si sono evidenziate le interrelazioni fra le
95 varie strutture di dati sulla quale essa è basata.
96 Ritorneremo su questo schema più volte, dato che esso è fondamentale per
97 capire i dettagli del funzionamento dell'interfaccia dei \textit{file
99 \index{file!descriptor|)}
103 \includegraphics[width=13cm]{img/procfile}
104 \caption{Schema della architettura dell'accesso ai file attraverso
105 l'interfaccia dei \textit{file descriptor}.}
106 \label{fig:file_proc_file}
111 \subsection{I file standard}
112 \label{sec:file_std_descr}
114 Come accennato i \textit{file descriptor} non sono altro che un indice nella
115 tabella dei file aperti di ciascun processo; per questo motivo essi vengono
116 assegnati in successione tutte le volte che si apre un nuovo file (se non ne è
117 stato chiuso nessuno in precedenza).
119 In tutti i sistemi unix-like esiste una convenzione generale per cui ogni
120 processo viene lanciato dalla shell con almeno tre file aperti. Questi, per
121 quanto appena detto, avranno come \textit{file
122 descriptor}\index{file!descriptor} i valori 0, 1 e 2. Benché questa sia
123 soltanto una convenzione, essa è seguita dalla gran parte delle applicazioni,
124 e non aderirvi potrebbe portare a gravi problemi di interoperabilità.
126 Il primo file è sempre associato al cosiddetto \textit{standard input}; è cioè
127 il file da cui il processo si aspetta di ricevere i dati in ingresso. Il
128 secondo file è il cosiddetto \textit{standard output}, cioè quello su cui ci
129 si aspetta debbano essere inviati i dati in uscita. Il terzo è lo
130 \textit{standard error}, su cui viene inviata l'uscita relativa agli errori.
131 Nel caso della shell tutti questi file sono associati al terminale di
132 controllo, e corrispondono quindi alla lettura della tastiera per l'ingresso e
133 alla scrittura sul terminale per l'uscita. Lo standard POSIX.1 provvede, al
134 posto dei valori numerici, tre costanti simboliche, definite in
135 tab.~\ref{tab:file_std_files}.
140 \begin{tabular}[c]{|l|l|}
142 \textbf{Costante} & \textbf{Significato} \\
145 \const{STDIN\_FILENO} & \textit{file descriptor} dello \textit{standard
147 \const{STDOUT\_FILENO} & \textit{file descriptor} dello \textit{standard
149 \const{STDERR\_FILENO} & \textit{file descriptor} dello \textit{standard
153 \caption{Costanti definite in \file{unistd.h} per i file standard aperti
154 alla creazione di ogni processo.}
155 \label{tab:file_std_files}
158 In fig.~\ref{fig:file_proc_file} si è rappresentata una situazione diversa,
159 facendo riferimento ad un programma in cui lo \textit{standard input} è
160 associato ad un file mentre lo \textit{standard output} e lo \textit{standard
161 error} sono entrambi associati ad un altro file (e quindi utilizzano lo
162 stesso inode\index{inode}).
164 Nelle vecchie versioni di Unix (ed anche in Linux fino al kernel 2.0.x) il
165 numero di file aperti era anche soggetto ad un limite massimo dato dalle
166 dimensioni del vettore di puntatori con cui era realizzata la tabella dei file
167 descriptor dentro \struct{file\_struct}; questo limite intrinseco nei kernel
168 più recenti non sussiste più, dato che si è passati da un vettore ad una
169 lista, ma restano i limiti imposti dall'amministratore (vedi
170 sez.~\ref{sec:sys_limits}).
174 \section{Le funzioni base}
175 \label{sec:file_base_func}
177 L'interfaccia standard Unix per l'input/output sui file è basata su cinque
178 funzioni fondamentali: \func{open}, \func{read}, \func{write}, \func{lseek} e
179 \func{close}, usate rispettivamente per aprire, leggere, scrivere, spostarsi e
180 chiudere un file. La gran parte delle operazioni sui file si effettua
181 attraverso queste cinque funzioni, esse vengono chiamate anche funzioni di I/O
182 non bufferizzato dato che effettuano le operazioni di lettura e scrittura
183 usando direttamente le system call del kernel.
186 \subsection{La funzione \func{open}}
187 \label{sec:file_open}
189 La funzione \funcd{open} è la funzione fondamentale per accedere ai file, ed è
190 quella che crea l'associazione fra un \itindex{pathname}\textit{pathname} ed
191 un file descriptor, il suo prototipo è:
193 \headdecl{sys/types.h}
194 \headdecl{sys/stat.h}
196 \funcdecl{int open(const char *pathname, int flags)}
197 \funcdecl{int open(const char *pathname, int flags, mode\_t mode)}
198 Apre il file indicato da \param{pathname} nella modalità indicata da
199 \param{flags}, e, nel caso il file sia creato, con gli eventuali permessi
200 specificati da \param{mode}.
202 \bodydesc{La funzione ritorna il file descriptor in caso di successo e $-1$
203 in caso di errore. In questo caso la variabile \var{errno} assumerà uno
206 \item[\errcode{EEXIST}] \param{pathname} esiste e si è specificato
207 \const{O\_CREAT} e \const{O\_EXCL}.
208 \item[\errcode{EISDIR}] \param{pathname} indica una directory e si è tentato
209 l'accesso in scrittura.
210 \item[\errcode{ENOTDIR}] si è specificato \const{O\_DIRECTORY} e
211 \param{pathname} non è una directory.
212 \item[\errcode{ENXIO}] si sono impostati \const{O\_NOBLOCK} o
213 \const{O\_WRONLY} ed il file è una fifo che non viene letta da nessun
214 processo o \param{pathname} è un file di dispositivo ma il dispositivo è
216 \item[\errcode{ENODEV}] \param{pathname} si riferisce a un file di
217 dispositivo che non esiste.
218 \item[\errcode{ETXTBSY}] si è cercato di accedere in scrittura all'immagine
219 di un programma in esecuzione.
220 \item[\errcode{ELOOP}] si sono incontrati troppi link simbolici nel
221 risolvere il \textit{pathname} o si è indicato \const{O\_NOFOLLOW} e
222 \param{pathname} è un link simbolico.
224 ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOENT},
225 \errval{EROFS}, \errval{EFAULT}, \errval{ENOSPC}, \errval{ENOMEM},
226 \errval{EMFILE} e \errval{ENFILE}.}
230 La funzione apre il file usando il primo file descriptor libero, e crea
231 l'opportuna voce, cioè la struttura \struct{file}, nella \textit{file table}
232 del processo. Viene sempre restituito come valore di ritorno il file
233 descriptor con il valore più basso disponibile.
235 \footnotetext[2]{la pagina di manuale di \func{open} segnala che questa
236 opzione è difettosa su NFS, e che i programmi che la usano per stabilire un
237 \textsl{file di lock}\index{file!di lock} possono incorrere in una
238 \textit{race condition}\itindex{race~condition}. Si consiglia come
239 alternativa di usare un file con un nome univoco e la funzione \func{link}
240 per verificarne l'esistenza (vedi sez.~\ref{sec:ipc_file_lock}).}
242 \footnotetext[3]{acronimo di \textit{Denial of
243 Service}\itindex{Denial~of~Service~(DoS)}, si chiamano così attacchi
244 miranti ad impedire un servizio causando una qualche forma di carico
245 eccessivo per il sistema, che resta bloccato nelle risposte all'attacco.}
250 \begin{tabular}[c]{|l|p{12cm}|}
252 \textbf{Flag} & \textbf{Descrizione} \\
254 \hline % modalità di accesso al file
255 \const{O\_RDONLY} & Apre il file in sola lettura, le \acr{glibc}
256 definiscono anche \const{O\_READ} come sinonimo. \\
257 \const{O\_WRONLY} & Apre il file in sola scrittura, le \acr{glibc}
258 definiscono anche \const{O\_WRITE} come sinonimo. \\
259 \const{O\_RDWR} & Apre il file sia in lettura che in scrittura. \\
260 \hline % modalità di apertura del file
262 \const{O\_CREAT} & Se il file non esiste verrà creato, con le regole di
263 titolarità del file viste in
264 sez.~\ref{sec:file_ownership}. Con questa opzione
265 l'argomento \param{mode} deve essere specificato. \\
266 \const{O\_EXCL} & Usato in congiunzione con \const{O\_CREAT} fa sì che
267 la precedente esistenza del file diventi un
268 errore\protect\footnotemark\ che fa fallire
269 \func{open} con \errcode{EEXIST}. \\
270 \const{O\_NONBLOCK}& Apre il file in modalità non bloccante, e
271 comporta che \func{open} ritorni immediatamente anche
272 quando dovrebbe bloccarsi (l'opzione ha senso solo per
273 le fifo, vedi sez.~\ref{sec:ipc_named_pipe}). \\
274 \const{O\_NOCTTY} & Se \param{pathname} si riferisce ad un dispositivo di
275 terminale, questo non diventerà il terminale di
276 controllo, anche se il processo non ne ha ancora uno
277 (si veda sez.~\ref{sec:sess_ctrl_term}). \\
278 \const{O\_SHLOCK} & Apre il file con uno shared lock (vedi
279 sez.~\ref{sec:file_locking}). Specifica di BSD,
281 \const{O\_EXLOCK} & Apre il file con un lock esclusivo (vedi
282 sez.~\ref{sec:file_locking}). Specifica di BSD,
284 \const{O\_TRUNC} & Se usato su un file di dati aperto in scrittura,
285 ne tronca la lunghezza a zero; con un terminale o una
286 fifo viene ignorato, negli altri casi il
287 comportamento non è specificato. \\
288 \const{O\_NOFOLLOW}& Se \param{pathname} è un link simbolico la chiamata
289 fallisce. Questa è un'estensione BSD aggiunta in Linux
290 dal kernel 2.1.126. Nelle versioni precedenti i link
291 simbolici sono sempre seguiti, e questa opzione è
293 \const{O\_DIRECTORY}&Se \param{pathname} non è una directory la chiamata
294 fallisce. Questo flag è specifico di Linux ed è stato
295 introdotto con il kernel 2.1.126 per evitare dei
296 \itindex{Denial~of~Service~(DoS)}
297 \textit{DoS}\protect\footnotemark\ quando
298 \func{opendir} viene chiamata su una fifo o su un
299 device di unità a nastri, non deve essere utilizzato
300 al di fuori dell'implementazione di \func{opendir}. \\
301 \const{O\_LARGEFILE}&nel caso di sistemi a 32 bit che supportano file di
302 grandi dimensioni consente di aprire file le cui
303 dimensioni non possono essere rappresentate da numeri
306 \hline % modalità di operazione coi file
307 \const{O\_APPEND} & Il file viene aperto in append mode. Prima di ciascuna
308 scrittura la posizione corrente viene sempre impostata
309 alla fine del file. Con NFS si può avere una
310 corruzione del file se più di un processo scrive allo
311 stesso tempo.\footnotemark\\
312 \const{O\_NONBLOCK}& Il file viene aperto in modalità non bloccante per
313 le operazioni di I/O (che tratteremo in
314 sez.~\ref{sec:file_noblocking}): questo significa il
315 fallimento di \func{read} in assenza di dati da
316 leggere e quello di \func{write} in caso di
317 impossibilità di scrivere immediatamente. Questa
318 modalità ha senso solo per le fifo e per alcuni file
320 \const{O\_NDELAY} & In Linux\footnotemark\ è sinonimo di
321 \const{O\_NONBLOCK}.\\
322 \const{O\_ASYNC} & Apre il file per l'I/O in modalità asincrona (vedi
323 sez.~\ref{sec:file_asyncronous_io}). Quando è
324 impostato viene generato il segnale \const{SIGIO}
325 tutte le volte che sono disponibili dati in input
327 \const{O\_SYNC} & Apre il file per l'input/output sincrono: ogni
328 \func{write} bloccherà fino al completamento della
329 scrittura di tutti i dati sull'hardware
331 \const{O\_FSYNC} & sinonimo di \const{O\_SYNC}, usato da BSD. \\
332 \const{O\_DSYNC} & Variante di I/O sincrono definita da POSIX; presente
333 dal kernel 2.1.130 come sinonimo di
335 \const{O\_RSYNC} & Variante analoga alla precedente, trattata allo stesso
337 \const{O\_NOATIME} & Blocca l'aggiornamento dei tempi di accesso dei
338 file (vedi sez.~\ref{sec:file_file_times}). Per molti
339 filesystem questa funzionalità non è disponibile per
340 il singolo file ma come opzione generale da
341 specificare in fase di montaggio.\\
342 \const{O\_DIRECT} & Esegue l'I/O direttamente dai buffer in user space
343 in maniera sincrona, in modo da scavalcare i
344 meccanismi di caching del kernel. In genere questo
345 peggiora le prestazioni tranne quando le
346 applicazioni\footnotemark ottimizzano il proprio
347 caching. Per i kernel della serie 2.4 si deve
348 garantire che i buffer in user space siano allineati
349 alle dimensioni dei blocchi del filesystem; per il
350 kernel 2.6 basta che siano allineati a multipli di 512
354 \caption{Valori e significato dei vari bit del \textit{file status flag}.}
355 \label{tab:file_open_flags}
358 \footnotetext[4]{il problema è che NFS non supporta la scrittura in append, ed
359 il kernel deve simularla, ma questo comporta la possibilità di una race
360 condition, vedi sez.~\ref{sec:file_atomic}.}
362 \footnotetext[5]{l'opzione origina da SVr4, dove però causava il ritorno da
363 una \func{read} con un valore nullo e non con un errore, questo introduce
364 un'ambiguità, dato che come vedremo in sez.~\ref{sec:file_read} il ritorno di
365 zero da parte di \func{read} ha il significato di una end-of-file.}
367 \footnotetext[6]{l'opzione è stata introdotta dalla SGI in IRIX, e serve
368 sostanzialmente a permettere ad alcuni programmi (in genere database) la
369 gestione diretta della bufferizzazione dell'I/O in quanto essi sono in grado
370 di ottimizzarla al meglio per le loro prestazioni; l'opzione è presente
371 anche in FreeBSD, senza limiti di allineamento dei buffer. In Linux è stata
372 introdotta con il kernel 2.4.10, le versioni precedenti la ignorano.}
375 Questa caratteristica permette di prevedere qual è il valore del file
376 descriptor che si otterrà al ritorno di \func{open}, e viene talvolta usata da
377 alcune applicazioni per sostituire i file corrispondenti ai file standard
378 visti in sez.~\ref{sec:file_std_descr}: se ad esempio si chiude lo standard
379 input e si apre subito dopo un nuovo file questo diventerà il nuovo standard
380 input (avrà cioè il file descriptor 0).
382 Il nuovo file descriptor non è condiviso con nessun altro processo (torneremo
383 sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in
384 sez.~\ref{sec:file_sharing}) ed è impostato per restare aperto attraverso una
385 \func{exec} (come accennato in sez.~\ref{sec:proc_exec}); l'offset è impostato
388 L'argomento \param{mode} indica i permessi con cui il file viene creato; i
389 valori possibili sono gli stessi già visti in sez.~\ref{sec:file_perm_overview}
390 e possono essere specificati come OR binario delle costanti descritte in
391 tab.~\ref{tab:file_bit_perm}. Questi permessi sono filtrati dal valore di
392 \var{umask} (vedi sez.~\ref{sec:file_umask}) per il processo.
394 La funzione prevede diverse opzioni, che vengono specificate usando vari bit
395 dell'argomento \param{flags}. Alcuni di questi bit vanno anche a costituire
396 il flag di stato del file (o \textit{file status flag}), che è mantenuto nel
397 campo \var{f\_flags} della struttura \struct{file} (al solito si veda lo schema
398 di fig.~\ref{fig:file_proc_file}). Essi sono divisi in tre categorie
401 \item \textsl{i bit delle modalità di accesso}: specificano con quale modalità
402 si accederà al file: i valori possibili sono lettura, scrittura o
403 lettura/scrittura. Uno di questi bit deve essere sempre specificato quando
404 si apre un file. Vengono impostati alla chiamata da \func{open}, e possono
405 essere riletti con \func{fcntl} (fanno parte del \textit{file status flag}),
406 ma non possono essere modificati.
407 \item \textsl{i bit delle modalità di apertura}: permettono di specificare
408 alcune delle caratteristiche del comportamento di \func{open} quando viene
409 eseguita. Hanno effetto solo al momento della chiamata della funzione e non
410 sono memorizzati né possono essere riletti.
411 \item \textsl{i bit delle modalità di operazione}: permettono di specificare
412 alcune caratteristiche del comportamento delle future operazioni sul file
413 (come \func{read} o \func{write}). Anch'essi fan parte del \textit{file
414 status flag}. Il loro valore è impostato alla chiamata di \func{open}, ma
415 possono essere riletti e modificati (insieme alle caratteristiche operative
416 che controllano) con una \func{fcntl}.
419 In tab.~\ref{tab:file_open_flags} sono riportate, ordinate e divise fra loro
420 secondo le tre modalità appena elencate, le costanti mnemoniche associate a
421 ciascuno di questi bit. Dette costanti possono essere combinate fra loro con
422 un OR aritmetico per costruire il valore (in forma di maschera binaria)
423 dell'argomento \param{flags} da passare alla \func{open}. I due flag
424 \const{O\_NOFOLLOW} e \const{O\_DIRECTORY} sono estensioni specifiche di
425 Linux, e deve essere definita la macro \macro{\_GNU\_SOURCE} per poterli
428 Nelle prime versioni di Unix i valori di \param{flag} specificabili per
429 \func{open} erano solo quelli relativi alle modalità di accesso del file. Per
430 questo motivo per creare un nuovo file c'era una system call apposita,
431 \funcd{creat}, il cui prototipo è:
432 \begin{prototype}{fcntl.h}
433 {int creat(const char *pathname, mode\_t mode)}
434 Crea un nuovo file vuoto, con i permessi specificati da \param{mode}. È del
435 tutto equivalente a \code{open(filedes, O\_CREAT|O\_WRONLY|O\_TRUNC, mode)}.
437 \noindent adesso questa funzione resta solo per compatibilità con i vecchi
441 \subsection{La funzione \func{close}}
442 \label{sec:file_close}
444 La funzione \funcd{close} permette di chiudere un file, in questo modo il file
445 descriptor ritorna disponibile; il suo prototipo è:
446 \begin{prototype}{unistd.h}{int close(int fd)}
447 Chiude il descrittore \param{fd}.
449 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
450 errore, con \var{errno} che assume i valori:
452 \item[\errcode{EBADF}] \param{fd} non è un descrittore valido.
453 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
455 ed inoltre \errval{EIO}.}
458 La chiusura di un file rilascia ogni blocco (il \textit{file
459 locking}\index{file!locking} è trattato in sez.~\ref{sec:file_locking}) che
460 il processo poteva avere acquisito su di esso; se \param{fd} è l'ultimo
461 riferimento (di eventuali copie) ad un file aperto, tutte le risorse nella
462 file table vengono rilasciate. Infine se il file descriptor era l'ultimo
463 riferimento ad un file su disco quest'ultimo viene cancellato.
465 Si ricordi che quando un processo termina anche tutti i suoi file descriptor
466 vengono chiusi, molti programmi sfruttano questa caratteristica e non usano
467 esplicitamente \func{close}. In genere comunque chiudere un file senza
468 controllarne lo stato di uscita è errore; infatti molti filesystem
469 implementano la tecnica del \textit{write-behind}, per cui una \func{write}
470 può avere successo anche se i dati non sono stati scritti, un eventuale errore
471 di I/O allora può sfuggire, ma verrà riportato alla chiusura del file: per
472 questo motivo non effettuare il controllo può portare ad una perdita di dati
473 inavvertita.\footnote{in Linux questo comportamento è stato osservato con NFS
474 e le quote su disco.}
476 In ogni caso una \func{close} andata a buon fine non garantisce che i dati
477 siano stati effettivamente scritti su disco, perché il kernel può decidere di
478 ottimizzare l'accesso a disco ritardandone la scrittura. L'uso della funzione
479 \func{sync} (vedi sez.~\ref{sec:file_sync}) effettua esplicitamente il
480 \emph{flush} dei dati, ma anche in questo caso resta l'incertezza dovuta al
481 comportamento dell'hardware (che a sua volta può introdurre ottimizzazioni
482 dell'accesso al disco che ritardano la scrittura dei dati, da cui l'abitudine
483 di ripetere tre volte il comando prima di eseguire lo shutdown).
486 \subsection{La funzione \func{lseek}}
487 \label{sec:file_lseek}
489 Come già accennato in sez.~\ref{sec:file_fd} a ciascun file aperto è associata
490 una \textsl{posizione corrente nel file} (il cosiddetto \textit{file offset},
491 mantenuto nel campo \var{f\_pos} di \struct{file}) espressa da un numero intero
492 positivo come numero di byte dall'inizio del file. Tutte le operazioni di
493 lettura e scrittura avvengono a partire da questa posizione che viene
494 automaticamente spostata in avanti del numero di byte letti o scritti.
496 In genere (a meno di non avere richiesto la modalità \const{O\_APPEND}) questa
497 posizione viene impostata a zero all'apertura del file. È possibile impostarla
498 ad un valore qualsiasi con la funzione \funcd{lseek}, il cui prototipo è:
500 \headdecl{sys/types.h}
502 \funcdecl{off\_t lseek(int fd, off\_t offset, int whence)}
503 Imposta la posizione attuale nel file.
505 \bodydesc{La funzione ritorna il valore della posizione corrente in caso di
506 successo e $-1$ in caso di errore nel qual caso \var{errno} assumerà uno
509 \item[\errcode{ESPIPE}] \param{fd} è una pipe, un socket\index{socket} o una
511 \item[\errcode{EINVAL}] \param{whence} non è un valore valido.
513 ed inoltre \errval{EBADF}.}
516 La nuova posizione è impostata usando il valore specificato da \param{offset},
517 sommato al riferimento dato da \param{whence}; quest'ultimo può assumere i
518 seguenti valori\footnote{per compatibilità con alcune vecchie notazioni
519 questi valori possono essere rimpiazzati rispettivamente con 0, 1 e 2 o con
520 \const{L\_SET}, \const{L\_INCR} e \const{L\_XTND}.}:
521 \begin{basedescript}{\desclabelwidth{2.0cm}}
522 \item[\const{SEEK\_SET}] si fa riferimento all'inizio del file: il valore
523 (sempre positivo) di \param{offset} indica direttamente la nuova posizione
525 \item[\const{SEEK\_CUR}] si fa riferimento alla posizione corrente del file:
526 ad essa viene sommato \param{offset} (che può essere negativo e positivo)
527 per ottenere la nuova posizione corrente.
528 \item[\const{SEEK\_END}] si fa riferimento alla fine del file: alle dimensioni
529 del file viene sommato \param{offset} (che può essere negativo e positivo)
530 per ottenere la nuova posizione corrente.
533 Come accennato in sez.~\ref{sec:file_file_size} con \func{lseek} è possibile
534 impostare la posizione corrente anche oltre la fine del file, e alla
535 successiva scrittura il file sarà esteso. La chiamata non causa nessun accesso
536 al file, si limita a modificare la posizione corrente (cioè il valore
537 \var{f\_pos} in \param{file}, vedi fig.~\ref{fig:file_proc_file}). Dato che la
538 funzione ritorna la nuova posizione, usando il valore zero per \param{offset}
539 si può riottenere la posizione corrente nel file chiamando la funzione con
540 \code{lseek(fd, 0, SEEK\_CUR)}.
542 Si tenga presente inoltre che usare \const{SEEK\_END} non assicura affatto che
543 la successiva scrittura avvenga alla fine del file, infatti se questo è stato
544 aperto anche da un altro processo che vi ha scritto, la fine del file può
545 essersi spostata, ma noi scriveremo alla posizione impostata in precedenza
546 (questa è una potenziale sorgente di \itindex{race~condition}\textit{race
547 condition}, vedi sez.~\ref{sec:file_atomic}).
549 Non tutti i file supportano la capacità di eseguire una \func{lseek}, in
550 questo caso la funzione ritorna l'errore \errcode{EPIPE}. Questo, oltre che per
551 i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che non
552 supportano questa funzione, come ad esempio per i file di
553 terminale.\footnote{altri sistemi, usando \const{SEEK\_SET}, in questo caso
554 ritornano il numero di caratteri che vi sono stati scritti.} Lo standard
555 POSIX però non specifica niente in proposito. Infine alcuni file speciali, ad
556 esempio \file{/dev/null}, non causano un errore ma restituiscono un valore
560 \subsection{La funzione \func{read}}
561 \label{sec:file_read}
564 Una volta che un file è stato aperto (con il permesso in lettura) si possono
565 leggere i dati che contiene utilizzando la funzione \funcd{read}, il cui
567 \begin{prototype}{unistd.h}{ssize\_t read(int fd, void * buf, size\_t count)}
569 Cerca di leggere \param{count} byte dal file \param{fd} al buffer
572 \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e
573 $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
575 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale prima di
576 aver potuto leggere qualsiasi dato.
577 \item[\errcode{EAGAIN}] la funzione non aveva nessun dato da restituire e si
578 era aperto il file in modalità \const{O\_NONBLOCK}.
580 ed inoltre \errval{EBADF}, \errval{EIO}, \errval{EISDIR}, \errval{EBADF},
581 \errval{EINVAL} e \errval{EFAULT} ed eventuali altri errori dipendenti dalla
582 natura dell'oggetto connesso a \param{fd}.}
585 La funzione tenta di leggere \param{count} byte a partire dalla posizione
586 corrente nel file. Dopo la lettura la posizione sul file è spostata
587 automaticamente in avanti del numero di byte letti. Se \param{count} è zero la
588 funzione restituisce zero senza nessun altro risultato. Si deve sempre tener
589 presente che non è detto che la funzione \func{read} restituisca sempre il
590 numero di byte richiesto, ci sono infatti varie ragioni per cui la funzione
591 può restituire un numero di byte inferiore; questo è un comportamento normale,
592 e non un errore, che bisogna sempre tenere presente.
594 La prima e più ovvia di queste ragioni è che si è chiesto di leggere più byte
595 di quanto il file ne contenga. In questo caso il file viene letto fino alla
596 sua fine, e la funzione ritorna regolarmente il numero di byte letti
597 effettivamente. Raggiunta la fine del file, alla ripetizione di un'operazione
598 di lettura, otterremmo il ritorno immediato di \func{read} con uno zero. La
599 condizione di raggiungimento della fine del file non è un errore, e viene
600 segnalata appunto da un valore di ritorno di \func{read} nullo. Ripetere
601 ulteriormente la lettura non avrebbe nessun effetto se non quello di
602 continuare a ricevere zero come valore di ritorno.
604 Con i \textsl{file regolari} questa è l'unica situazione in cui si può avere
605 un numero di byte letti inferiore a quello richiesto, ma questo non è vero
606 quando si legge da un terminale, da una fifo o da una pipe. In tal caso
607 infatti, se non ci sono dati in ingresso, la \func{read} si blocca (a meno di
608 non aver selezionato la modalità non bloccante, vedi
609 sez.~\ref{sec:file_noblocking}) e ritorna solo quando ne arrivano; se il numero
610 di byte richiesti eccede quelli disponibili la funzione ritorna comunque, ma
611 con un numero di byte inferiore a quelli richiesti.
613 Lo stesso comportamento avviene caso di lettura dalla rete (cioè su un
614 socket\index{socket}, come vedremo in sez.~\ref{sec:sock_io_behav}), o per la
615 lettura da certi file di dispositivo, come le unità a nastro, che
616 restituiscono sempre i dati ad un singolo blocco alla volta, o come le linee
617 seriali, che restituiscono solo i dati ricevuti fino al momento della lettura.
619 Infine anche le due condizioni segnalate dagli errori \errcode{EINTR} ed
620 \errcode{EAGAIN} non sono propriamente degli errori. La prima si verifica
621 quando la \func{read} è bloccata in attesa di dati in ingresso e viene
622 interrotta da un segnale; in tal caso l'azione da intraprendere è quella di
623 rieseguire la funzione. Torneremo in dettaglio sull'argomento in
624 sez.~\ref{sec:sig_gen_beha}. La seconda si verifica quando il file è aperto
625 in modalità non bloccante (vedi sez.~\ref{sec:file_noblocking}) e non ci sono
626 dati in ingresso: la funzione allora ritorna immediatamente con un errore
627 \errcode{EAGAIN}\footnote{BSD usa per questo errore la costante
628 \errcode{EWOULDBLOCK}, in Linux, con le \acr{glibc}, questa è sinonima di
629 \errcode{EAGAIN}.} che indica soltanto che non essendoci al momento dati
630 disponibili occorre provare a ripetere la lettura in un secondo tempo.
632 La funzione \func{read} è una delle system call fondamentali, esistenti fin
633 dagli albori di Unix, ma nella seconda versione delle \textit{Single Unix
634 Specification}\footnote{questa funzione, e l'analoga \func{pwrite} sono
635 state aggiunte nel kernel 2.1.60, il supporto nelle \acr{glibc}, compresa
636 l'emulazione per i vecchi kernel che non hanno la system call, è stato
637 aggiunto con la versione 2.1, in versioni precedenti sia del kernel che
638 delle librerie la funzione non è disponibile.} (quello che viene chiamato
639 normalmente Unix98, vedi sez.~\ref{sec:intro_opengroup}) è stata introdotta la
640 definizione di un'altra funzione di lettura, \funcd{pread}, il cui prototipo è:
641 \begin{prototype}{unistd.h}
642 {ssize\_t pread(int fd, void * buf, size\_t count, off\_t offset)}
644 Cerca di leggere \param{count} byte dal file \param{fd}, a partire dalla
645 posizione \param{offset}, nel buffer \param{buf}.
647 \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e
648 $-1$ in caso di errore, nel qual caso \var{errno} assumerà i valori già
649 visti per \func{read} e \func{lseek}.}
652 La funzione prende esattamente gli stessi argomenti di \func{read} con lo
653 stesso significato, a cui si aggiunge l'argomento \func{offset} che indica una
654 posizione sul file. Indetico è il comportamento ed il valore di ritorno. La
655 funzione serve quando si vogliono leggere dati dal file senza modificare la
658 L'uso di \func{pread} è equivalente all'esecuzione di una \func{read} seguita
659 da una \func{lseek} che riporti al valore precedente la posizione corrente sul
660 file, ma permette di eseguire l'operazione atomicamente. Questo può essere
661 importante quando la posizione sul file viene condivisa da processi diversi
662 (vedi sez.~\ref{sec:file_sharing}). Il valore di
663 \param{offset} fa sempre riferimento all'inizio del file.
665 La funzione \func{pread} è disponibile anche in Linux, però diventa
666 accessibile solo attivando il supporto delle estensioni previste dalle
667 \textit{Single Unix Specification} con la definizione della macro:
669 #define _XOPEN_SOURCE 500
671 e si ricordi di definire questa macro prima dell'inclusione del file di
672 dichiarazioni \file{unistd.h}.
676 \subsection{La funzione \func{write}}
677 \label{sec:file_write}
679 Una volta che un file è stato aperto (con il permesso in scrittura) si può
680 scrivere su di esso utilizzando la funzione \funcd{write}, il cui prototipo è:
681 \begin{prototype}{unistd.h}{ssize\_t write(int fd, void * buf, size\_t count)}
683 Scrive \param{count} byte dal buffer \param{buf} sul file \param{fd}.
685 \bodydesc{La funzione ritorna il numero di byte scritti in caso di successo
686 e $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei
689 \item[\errcode{EINVAL}] \param{fd} è connesso ad un oggetto che non consente
691 \item[\errcode{EFBIG}] si è cercato di scrivere oltre la dimensione massima
692 consentita dal filesystem o il limite per le dimensioni dei file del
693 processo o su una posizione oltre il massimo consentito.
694 \item[\errcode{EPIPE}] \param{fd} è connesso ad una pipe il cui altro capo è
695 chiuso in lettura; in questo caso viene anche generato il segnale
696 \const{SIGPIPE}, se questo viene gestito (o bloccato o ignorato) la
697 funzione ritorna questo errore.
698 \item[\errcode{EINTR}] si è stati interrotti da un segnale prima di aver
699 potuto scrivere qualsiasi dato.
700 \item[\errcode{EAGAIN}] ci si sarebbe bloccati, ma il file era aperto in
701 modalità \const{O\_NONBLOCK}.
703 ed inoltre \errval{EBADF}, \errval{EIO}, \errval{EISDIR}, \errval{EBADF},
704 \errval{ENOSPC}, \errval{EINVAL} e \errval{EFAULT} ed eventuali altri errori
705 dipendenti dalla natura dell'oggetto connesso a \param{fd}.}
708 Come nel caso di \func{read} la funzione tenta di scrivere \param{count} byte
709 a partire dalla posizione corrente nel file e sposta automaticamente la
710 posizione in avanti del numero di byte scritti. Se il file è aperto in
711 modalità \const{O\_APPEND} i dati vengono sempre scritti alla fine del file.
712 Lo standard POSIX richiede che i dati scritti siano immediatamente disponibili
713 ad una \func{read} chiamata dopo che la \func{write} che li ha scritti è
714 ritornata; ma dati i meccanismi di caching non è detto che tutti i filesystem
715 supportino questa capacità.
717 Se \param{count} è zero la funzione restituisce zero senza fare nient'altro.
718 Per i file ordinari il numero di byte scritti è sempre uguale a quello
719 indicato da \param{count}, a meno di un errore. Negli altri casi si ha lo
720 stesso comportamento di \func{read}.
722 Anche per \func{write} lo standard Unix98 definisce un'analoga \funcd{pwrite}
723 per scrivere alla posizione indicata senza modificare la posizione corrente
724 nel file, il suo prototipo è:
725 \begin{prototype}{unistd.h}
726 {ssize\_t pwrite(int fd, void * buf, size\_t count, off\_t offset)}
728 Cerca di scrivere sul file \param{fd}, a partire dalla posizione
729 \param{offset}, \param{count} byte dal buffer \param{buf}.
731 \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e
732 $-1$ in caso di errore, nel qual caso \var{errno} assumerà i valori già
733 visti per \func{write} e \func{lseek}.}
735 \noindent e per essa valgono le stesse considerazioni fatte per \func{pread}.
738 \section{Caratteristiche avanzate}
739 \label{sec:file_adv_func}
741 In questa sezione approfondiremo alcune delle caratteristiche più sottili
742 della gestione file in un sistema unix-like, esaminando in dettaglio il
743 comportamento delle funzioni base, inoltre tratteremo le funzioni che
744 permettono di eseguire alcune operazioni avanzate con i file (il grosso
745 dell'argomento sarà comunque affrontato in cap.~\ref{cha:file_advanced}).
748 \subsection{La condivisione dei files}
749 \label{sec:file_sharing}
751 In sez.~\ref{sec:file_fd} abbiamo descritto brevemente l'architettura
752 dell'interfaccia con i file da parte di un processo, mostrando in
753 fig.~\ref{fig:file_proc_file} le principali strutture usate dal kernel;
754 esamineremo ora in dettaglio le conseguenze che questa architettura ha nei
755 confronti dell'accesso allo stesso file da parte di processi diversi.
759 \includegraphics[width=15cm]{img/filemultacc}
760 \caption{Schema dell'accesso allo stesso file da parte di due processi
762 \label{fig:file_mult_acc}
765 Il primo caso è quello in cui due processi diversi aprono lo stesso file
766 su disco; sulla base di quanto visto in sez.~\ref{sec:file_fd} avremo una
767 situazione come quella illustrata in fig.~\ref{fig:file_mult_acc}: ciascun
768 processo avrà una sua voce nella \textit{file table} referenziata da un
769 diverso file descriptor nella sua \struct{file\_struct}. Entrambe le voci
770 nella \textit{file table} faranno però riferimento allo stesso
771 inode\index{inode} su disco.
773 Questo significa che ciascun processo avrà la sua posizione corrente sul file,
774 la sua modalità di accesso e versioni proprie di tutte le proprietà che
775 vengono mantenute nella sua voce della \textit{file table}. Questo ha
776 conseguenze specifiche sugli effetti della possibile azione simultanea sullo
777 stesso file, in particolare occorre tenere presente che:
779 \item ciascun processo può scrivere indipendentemente; dopo ciascuna
780 \func{write} la posizione corrente sarà cambiata solo nel processo. Se la
781 scrittura eccede la dimensione corrente del file questo verrà esteso
782 automaticamente con l'aggiornamento del campo \var{i\_size}
783 nell'inode\index{inode}.
784 \item se un file è in modalità \const{O\_APPEND} tutte le volte che viene
785 effettuata una scrittura la posizione corrente viene prima impostata alla
786 dimensione corrente del file letta dall'inode\index{inode}. Dopo la
787 scrittura il file viene automaticamente esteso.
788 \item l'effetto di \func{lseek} è solo quello di cambiare il campo
789 \var{f\_pos} nella struttura \struct{file} della \textit{file table}, non
790 c'è nessuna operazione sul file su disco. Quando la si usa per porsi alla
791 fine del file la posizione viene impostata leggendo la dimensione corrente
792 dall'inode\index{inode}.
797 \includegraphics[width=15cm]{img/fileshar}
798 \caption{Schema dell'accesso ai file da parte di un processo figlio}
799 \label{fig:file_acc_child}
802 Il secondo caso è quello in cui due file descriptor di due processi diversi
803 puntino alla stessa voce nella \textit{file table}; questo è ad esempio il
804 caso dei file aperti che vengono ereditati dal processo figlio all'esecuzione
805 di una \func{fork} (si ricordi quanto detto in sez.~\ref{sec:proc_fork}). La
806 situazione è illustrata in fig.~\ref{fig:file_acc_child}; dato che il processo
807 figlio riceve una copia dello spazio di indirizzi del padre, riceverà anche
808 una copia di \struct{file\_struct} e relativa tabella dei file aperti.
810 In questo modo padre e figlio avranno gli stessi file descriptor che faranno
811 riferimento alla stessa voce nella \textit{file table}, condividendo così la
812 posizione corrente sul file. Questo ha le conseguenze descritte a suo tempo in
813 sez.~\ref{sec:proc_fork}: in caso di scrittura contemporanea la posizione
814 corrente nel file varierà per entrambi i processi (in quanto verrà modificato
815 \var{f\_pos} che è lo stesso per entrambi).
817 Si noti inoltre che anche i flag di stato del file (quelli impostati
818 dall'argomento \param{flag} di \func{open}) essendo tenuti nella voce della
819 \textit{file table}\footnote{per la precisione nel campo \var{f\_flags} di
820 \struct{file}.}, vengono in questo caso condivisi. Ai file però sono
821 associati anche altri flag, dei quali l'unico usato al momento è
822 \const{FD\_CLOEXEC}, detti \textit{file descriptor flags}. Questi ultimi sono
823 tenuti invece in \struct{file\_struct}, e perciò sono specifici di ciascun
824 processo e non vengono modificati dalle azioni degli altri anche in caso di
825 condivisione della stessa voce della \textit{file table}.
829 \subsection{Operazioni atomiche con i file}
830 \label{sec:file_atomic}
832 Come si è visto in un sistema unix-like è sempre possibile per più processi
833 accedere in contemporanea allo stesso file, e che le operazioni di lettura e
834 scrittura possono essere fatte da ogni processo in maniera autonoma in base
835 ad una posizione corrente nel file che è locale a ciascuno di essi.
837 Se dal punto di vista della lettura dei dati questo non comporta nessun
838 problema, quando si andrà a scrivere le operazioni potranno mescolarsi in
839 maniera imprevedibile. Il sistema però fornisce in alcuni casi la possibilità
840 di eseguire alcune operazioni di scrittura in maniera coordinata anche senza
841 utilizzare meccanismi di sincronizzazione più complessi (come il \textit{file
842 locking}\index{file!locking}, che esamineremo in
843 sez.~\ref{sec:file_locking}).
845 Un caso tipico di necessità di accesso condiviso in scrittura è quello in cui
846 vari processi devono scrivere alla fine di un file (ad esempio un file di
847 log). Come accennato in sez.~\ref{sec:file_lseek} impostare la posizione alla
848 fine del file e poi scrivere può condurre ad una
849 \itindex{race~condition}\textit{race condition}: infatti può succedere che un
850 secondo processo scriva alla fine del file fra la \func{lseek} e la
851 \func{write}; in questo caso, come abbiamo appena visto, il file sarà esteso,
852 ma il nostro primo processo avrà ancora la posizione corrente impostata con la
853 \func{lseek} che non corrisponde più alla fine del file, e la successiva
854 \func{write} sovrascriverà i dati del secondo processo.
856 Il problema è che usare due system call in successione non è un'operazione
857 atomica; il problema è stato risolto introducendo la modalità
858 \const{O\_APPEND}. In questo caso infatti, come abbiamo descritto in
859 precedenza, è il kernel che aggiorna automaticamente la posizione alla fine
860 del file prima di effettuare la scrittura, e poi estende il file. Tutto questo
861 avviene all'interno di una singola system call (la \func{write}) che non
862 essendo interrompibile da un altro processo costituisce un'operazione atomica.
864 Un altro caso tipico in cui è necessaria l'atomicità è quello in cui si vuole
865 creare un \textsl{file di lock}\index{file!di lock}, bloccandosi se il file
866 esiste. In questo caso la sequenza logica porterebbe a verificare prima
867 l'esistenza del file con una \func{stat} per poi crearlo con una \func{creat};
868 di nuovo avremmo la possibilità di una \textit{race
869 condition}\itindex{race~condition} da parte di un altro processo che crea lo
870 stesso file fra il controllo e la creazione.
872 Per questo motivo sono stati introdotti per \func{open} i due flag
873 \const{O\_CREAT} e \const{O\_EXCL}. In questo modo l'operazione di controllo
874 dell'esistenza del file (con relativa uscita dalla funzione con un errore) e
875 creazione in caso di assenza, diventa atomica essendo svolta tutta all'interno
876 di una singola system call (per i dettagli sull'uso di questa caratteristica
877 si veda sez.~\ref{sec:ipc_file_lock}).
880 \subsection{La funzioni \func{sync} e \func{fsync}}
881 \label{sec:file_sync}
883 Come accennato in sez.~\ref{sec:file_close} tutte le operazioni di scrittura
884 sono in genere bufferizzate dal kernel, che provvede ad effettuarle in maniera
885 asincrona (ad esempio accorpando gli accessi alla stessa zona del disco) in un
886 secondo tempo rispetto al momento della esecuzione della \func{write}.
888 Per questo motivo, quando è necessaria una sincronizzazione dei dati, il
889 sistema mette a disposizione delle funzioni che provvedono a forzare lo
890 scarico dei dati dai buffer del kernel.\footnote{come già accennato neanche
891 questo dà la garanzia assoluta che i dati siano integri dopo la chiamata,
892 l'hardware dei dischi è in genere dotato di un suo meccanismo interno di
893 ottimizzazione per l'accesso al disco che può ritardare ulteriormente la
894 scrittura effettiva.} La prima di queste funzioni è \funcd{sync} il cui
896 \begin{prototype}{unistd.h}{int sync(void)}
898 Sincronizza il buffer della cache dei file col disco.
900 \bodydesc{La funzione ritorna sempre zero.}
902 \noindent i vari standard prevedono che la funzione si limiti a far partire
903 le operazioni, ritornando immediatamente; in Linux (dal kernel 1.3.20) invece
904 la funzione aspetta la conclusione delle operazioni di sincronizzazione del
907 La funzione viene usata dal comando \cmd{sync} quando si vuole forzare
908 esplicitamente lo scarico dei dati su disco, o dal demone di sistema
909 \cmd{update} che esegue lo scarico dei dati ad intervalli di tempo fissi: il
910 valore tradizionale, usato da BSD, per l'update dei dati è ogni 30 secondi, ma
911 in Linux il valore utilizzato è di 5 secondi; con le nuove versioni\footnote{a
912 partire dal kernel 2.2.8} poi, è il kernel che si occupa direttamente di
913 tutto quanto attraverso il demone interno \cmd{bdflush}, il cui comportamento
914 può essere controllato attraverso il file \file{/proc/sys/vm/bdflush} (per il
915 significato dei valori si può leggere la documentazione allegata al kernel in
916 \file{Documentation/sysctl/vm.txt}).
918 Quando si vogliono scaricare soltanto i dati di un file (ad esempio essere
919 sicuri che i dati di un database sono stati registrati su disco) si possono
920 usare le due funzioni \funcd{fsync} e \funcd{fdatasync}, i cui prototipi sono:
923 \funcdecl{int fsync(int fd)}
924 Sincronizza dati e metadati del file \param{fd}
925 \funcdecl{int fdatasync(int fd)}
926 Sincronizza i dati del file \param{fd}.
928 \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
929 errore, nel qual caso \var{errno} assume i valori:
931 \item[\errcode{EINVAL}] \param{fd} è un file speciale che non supporta la
934 ed inoltre \errval{EBADF}, \errval{EROFS} e \errval{EIO}.}
937 Entrambe le funzioni forzano la sincronizzazione col disco di tutti i dati del
938 file specificato, ed attendono fino alla conclusione delle operazioni;
939 \func{fsync} forza anche la sincronizzazione dei metadati del file (che
940 riguardano sia le modifiche alle tabelle di allocazione dei settori, che gli
941 altri dati contenuti nell'inode\index{inode} che si leggono con \func{fstat},
942 come i tempi del file).
944 Si tenga presente che questo non comporta la sincronizzazione della
945 directory che contiene il file (e scrittura della relativa voce su
946 disco) che deve essere effettuata esplicitamente.\footnote{in realtà per
947 il filesystem \acr{ext2}, quando lo si monta con l'opzione \cmd{sync},
948 il kernel provvede anche alla sincronizzazione automatica delle voci
952 \subsection{La funzioni \func{dup} e \func{dup2}}
955 Abbiamo già visto in sez.~\ref{sec:file_sharing} come un processo figlio
956 condivida gli stessi file descriptor del padre; è possibile però ottenere un
957 comportamento analogo all'interno di uno stesso processo \textit{duplicando}
958 un file descriptor. Per far questo si usa la funzione \funcd{dup} il cui
960 \begin{prototype}{unistd.h}{int dup(int oldfd)}
961 Crea una copia del file descriptor \param{oldfd}.
963 \bodydesc{La funzione ritorna il nuovo file descriptor in caso di successo e
964 $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei
967 \item[\errcode{EBADF}] \param{oldfd} non è un file aperto.
968 \item[\errcode{EMFILE}] si è raggiunto il numero massimo consentito di file
973 La funzione ritorna, come \func{open}, il primo file descriptor libero. Il
974 file descriptor è una copia esatta del precedente ed entrambi possono essere
975 interscambiati nell'uso. Per capire meglio il funzionamento della funzione si
976 può fare riferimento a fig.~\ref{fig:file_dup}: l'effetto della funzione è
977 semplicemente quello di copiare il valore nella struttura
978 \struct{file\_struct}, cosicché anche il nuovo file descriptor fa riferimento
979 alla stessa voce nella \textit{file table}; per questo si dice che il nuovo
980 file descriptor è \textsl{duplicato}, da cui il nome della funzione.
983 \centering \includegraphics[width=15cm]{img/filedup}
984 \caption{Schema dell'accesso ai file duplicati}
988 Si noti che per quanto illustrato in fig.~\ref{fig:file_dup} i file descriptor
989 duplicati condivideranno eventuali lock, \textit{file status flag}, e
990 posizione corrente. Se ad esempio si esegue una \func{lseek} per modificare la
991 posizione su uno dei due file descriptor, essa risulterà modificata anche
992 sull'altro (dato che quello che viene modificato è lo stesso campo nella voce
993 della \textit{file table} a cui entrambi fanno riferimento). L'unica
994 differenza fra due file descriptor duplicati è che ciascuno avrà il suo
995 \textit{file descriptor flag}; a questo proposito va specificato che nel caso
996 di \func{dup} il flag di \textit{close-on-exec}\itindex{close-on-exec} (vedi
997 sez.~\ref{sec:proc_exec} e sez.~\ref{sec:file_fcntl}) viene sempre cancellato
1000 L'uso principale di questa funzione è per la redirezione dell'input e
1001 dell'output fra l'esecuzione di una \func{fork} e la successiva \func{exec};
1002 diventa così possibile associare un file (o una pipe) allo standard input o
1003 allo standard output (torneremo sull'argomento in sez.~\ref{sec:ipc_pipe_use},
1004 quando tratteremo le pipe). Per fare questo in genere occorre prima chiudere
1005 il file che si vuole sostituire, cosicché il suo file descriptor possa esser
1006 restituito alla chiamata di \func{dup}, come primo file descriptor
1009 Dato che questa è l'operazione più comune, è prevista una diversa versione
1010 della funzione, \funcd{dup2}, che permette di specificare esplicitamente
1011 qual è il valore di file descriptor che si vuole avere come duplicato; il suo
1013 \begin{prototype}{unistd.h}{int dup2(int oldfd, int newfd)}
1015 Rende \param{newfd} una copia del file descriptor \param{oldfd}.
1017 \bodydesc{La funzione ritorna il nuovo file descriptor in caso di successo e
1018 $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1020 \item[\errcode{EBADF}] \param{oldfd} non è un file aperto o \param{newfd} ha
1021 un valore fuori dall'intervallo consentito per i file descriptor.
1022 \item[\errcode{EMFILE}] si è raggiunto il numero massimo consentito di file
1026 \noindent e qualora il file descriptor \param{newfd} sia già aperto (come
1027 avviene ad esempio nel caso della duplicazione di uno dei file standard) esso
1028 sarà prima chiuso e poi duplicato (così che il file duplicato sarà connesso
1029 allo stesso valore per il file descriptor).
1031 La duplicazione dei file descriptor può essere effettuata anche usando la
1032 funzione di controllo dei file \func{fcntl} (che esamineremo in
1033 sez.~\ref{sec:file_fcntl}) con il parametro \const{F\_DUPFD}. L'operazione ha
1034 la sintassi \code{fcntl(oldfd, F\_DUPFD, newfd)} e se si usa 0 come valore per
1035 \param{newfd} diventa equivalente a \func{dup}.
1037 La sola differenza fra le due funzioni\footnote{a parte la sintassi ed i
1038 diversi codici di errore.} è che \func{dup2} chiude il file descriptor
1039 \param{newfd} se questo è già aperto, garantendo che la duplicazione sia
1040 effettuata esattamente su di esso, invece \func{fcntl} restituisce il primo
1041 file descriptor libero di valore uguale o maggiore di \param{newfd} (e se
1042 \param{newfd} è aperto la duplicazione avverrà su un altro file descriptor).
1045 \subsection{La funzione \func{fcntl}}
1046 \label{sec:file_fcntl}
1048 Oltre alle operazioni base esaminate in sez.~\ref{sec:file_base_func} esistono
1049 tutta una serie di operazioni ausiliarie che è possibile eseguire su un file
1050 descriptor, che non riguardano la normale lettura e scrittura di dati, ma la
1051 gestione sia delle loro proprietà, che di tutta una serie di ulteriori
1052 funzionalità che il kernel può mettere a disposizione.\footnote{ad esempio si
1053 gestiscono con questa funzione varie modalità di I/O asincrono (vedi
1054 sez.~\ref{sec:file_asyncronous_operation}) e il file
1055 locking\index{file!locking} (vedi sez.~\ref{sec:file_locking}).}
1057 Per queste operazioni di manipolazione e di controllo delle varie proprietà e
1058 caratteristiche di un file descriptor, viene usata la funzione \funcd{fcntl},
1063 \funcdecl{int fcntl(int fd, int cmd)}
1064 \funcdecl{int fcntl(int fd, int cmd, long arg)}
1065 \funcdecl{int fcntl(int fd, int cmd, struct flock * lock)}
1066 Esegue una delle possibili operazioni specificate da \param{cmd}
1067 sul file \param{fd}.
1069 \bodydesc{La funzione ha valori di ritorno diversi a seconda
1070 dell'operazione. In caso di errore il valore di ritorno è sempre $-1$ ed
1071 il codice dell'errore è restituito nella variabile \var{errno}; i codici
1072 possibili dipendono dal tipo di operazione, l'unico valido in generale è:
1074 \item[\errcode{EBADF}] \param{fd} non è un file aperto.
1079 Il primo argomento della funzione è sempre il numero di file descriptor
1080 \var{fd} su cui si vuole operare. Il comportamento di questa funzione, il
1081 numero e il tipo degli argomenti, il valore di ritorno e gli eventuali errori
1082 sono determinati dal valore dell'argomento \param{cmd} che in sostanza
1083 corrisponde all'esecuzione di un determinato \textsl{comando}; in
1084 sez.~\ref{sec:file_dup} abbiamo incontrato un esempio dell'uso di \func{fcntl}
1085 per la duplicazione dei file descriptor, una lista di tutti i possibili valori
1086 per \var{cmd} è riportata di seguito:
1087 \begin{basedescript}{\desclabelwidth{2.0cm}}
1088 \item[\const{F\_DUPFD}] trova il primo file descriptor disponibile di valore
1089 maggiore o uguale ad \param{arg} e ne fa una copia di \param{fd}. Ritorna il
1090 nuovo file descriptor in caso di successo e $-1$ in caso di errore. Gli
1091 errori possibili sono \errcode{EINVAL} se \param{arg} è negativo o maggiore
1092 del massimo consentito o \errcode{EMFILE} se il processo ha già raggiunto il
1093 massimo numero di descrittori consentito.
1094 \item[\const{F\_SETFD}] imposta il valore del \textit{file descriptor flag} al
1095 valore specificato con \param{arg}. Al momento l'unico bit usato è quello di
1096 \textit{close-on-exec}\itindex{close-on-exec}, identificato dalla costante
1097 \const{FD\_CLOEXEC}, che serve a richiedere che il file venga chiuso nella
1098 esecuzione di una \func{exec} (vedi sez.~\ref{sec:proc_exec}). Ritorna un
1099 valore nullo in caso di successo e $-1$ in caso di errore.
1100 \item[\const{F\_GETFD}] ritorna il valore del \textit{file descriptor flag} di
1101 \param{fd} o $-1$ in caso di errore; se \const{FD\_CLOEXEC} è impostato i
1102 file descriptor aperti vengono chiusi attraverso una \func{exec} altrimenti
1103 (il comportamento predefinito) restano aperti.
1104 \item[\const{F\_GETFL}] ritorna il valore del \textit{file status flag} in
1105 caso di successo o $-1$ in caso di errore; permette cioè di rileggere quei
1106 bit impostati da \func{open} all'apertura del file che vengono memorizzati
1107 (quelli riportati nella prima e terza sezione di
1108 tab.~\ref{tab:file_open_flags}).
1109 \item[\const{F\_SETFL}] imposta il \textit{file status flag} al valore
1110 specificato da \param{arg}, ritorna un valore nullo in caso di successo o
1111 $-1$ in caso di errore. Possono essere impostati solo i bit riportati nella
1112 terza sezione di tab.~\ref{tab:file_open_flags}.\footnote{la pagina di
1113 manuale riporta come impostabili solo \const{O\_APPEND},
1114 \const{O\_NONBLOCK} e \const{O\_ASYNC}.}
1115 \item[\const{F\_GETLK}] richiede un controllo sul file lock specificato da
1116 \param{lock}, sovrascrivendo la struttura da esso puntata con il risultato;
1117 ritorna un valore nullo in caso di successo o $-1$ in caso di errore. Questa
1118 funzionalità è trattata in dettaglio in sez.~\ref{sec:file_posix_lock}.
1119 \item[\const{F\_SETLK}] richiede o rilascia un file lock a seconda di quanto
1120 specificato nella struttura puntata da \param{lock}. Se il lock è tenuto da
1121 qualcun altro ritorna immediatamente restituendo $-1$ e imposta \var{errno} a
1122 \errcode{EACCES} o \errcode{EAGAIN}, in caso di successo ritorna un valore
1123 nullo. Questa funzionalità è trattata in dettaglio in
1124 sez.~\ref{sec:file_posix_lock}.
1125 \item[\const{F\_SETLKW}] identica a \const{F\_SETLK} eccetto per il fatto che
1126 la funzione non ritorna subito ma attende che il blocco sia rilasciato. Se
1127 l'attesa viene interrotta da un segnale la funzione restituisce $-1$ e
1128 imposta \var{errno} a \errcode{EINTR}, in caso di successo ritorna un valore
1129 nullo. Questa funzionalità è trattata in dettaglio in
1130 sez.~\ref{sec:file_posix_lock}.
1131 \item[\const{F\_GETOWN}] restituisce il \acr{pid} del processo o
1132 l'identificatore del \itindex{process~group} \textit{process
1133 group}\footnote{i \itindex{process~group} \textit{process group} sono
1134 (vedi sez.~\ref{sec:sess_proc_group}) raggruppamenti di processi usati nel
1135 controllo di sessione; a ciascuno di essi è associato un identificatore
1136 (un numero positivo analogo al \acr{pid}).} che è preposto alla ricezione
1137 dei segnali \const{SIGIO} e \const{SIGURG} per gli eventi associati al file
1138 descriptor \param{fd}. Nel caso di un \textit{process group} viene
1139 restituito un valore negativo il cui valore assoluto corrisponde
1140 all'identificatore del \itindex{process~group}\textit{process group}. In
1141 caso di errore viene restituito $-1$.
1142 \item[\const{F\_SETOWN}] imposta, con il valore dell'argomento \param{arg},
1143 l'identificatore del processo o del \itindex{process~group} \textit{process
1144 group} che riceverà i segnali \const{SIGIO} e \const{SIGURG} per gli
1145 eventi associati al file descriptor \param{fd}, ritorna un valore nullo in
1146 caso di successo o $-1$ in caso di errore. Come per \const{F\_GETOWN}, per
1147 impostare un \itindex{process~group} \textit{process group} si deve usare
1148 per \param{arg} un valore negativo, il cui valore assoluto corrisponde
1149 all'identificatore del \itindex{process~group} \textit{process group}.
1150 \item[\const{F\_GETSIG}] restituisce il valore del segnale inviato quando ci
1151 sono dati disponibili in ingresso su un file descriptor aperto ed impostato
1152 per l'I/O asincrono (si veda sez.~\ref{sec:file_asyncronous_io}). Il valore 0
1153 indica il valore predefinito (che è \const{SIGIO}), un valore diverso da
1154 zero indica il segnale richiesto, (che può essere anche lo stesso
1155 \const{SIGIO}). In caso di errore ritorna $-1$.
1156 \item[\const{F\_SETSIG}] imposta il segnale da inviare quando diventa
1157 possibile effettuare I/O sul file descriptor in caso di I/O asincrono,
1158 ritorna un valore nullo in caso di successo o $-1$ in caso di errore. Il
1159 valore zero indica di usare il segnale predefinito, \const{SIGIO}. Un altro
1160 valore diverso da zero (compreso lo stesso \const{SIGIO}) specifica il
1161 segnale voluto; l'uso di un valore diverso da zero permette inoltre, se si è
1162 installato il gestore del segnale come \var{sa\_sigaction} usando
1163 \const{SA\_SIGINFO}, (vedi sez.~\ref{sec:sig_sigaction}), di rendere
1164 disponibili al gestore informazioni ulteriori riguardo il file che ha
1165 generato il segnale attraverso i valori restituiti in \struct{siginfo\_t}
1166 (come vedremo in sez.~\ref{sec:file_asyncronous_io}).\footnote{i due comandi
1167 \const{F\_SETSIG} e \const{F\_GETSIG} sono una estensione specifica di
1169 \item[\const{F\_SETLEASE}] imposta o rimuove un \index{file!lease}
1170 \textit{file lease}\footnote{questa è una nuova funzionalità, specifica di
1171 Linux, e presente solo a partire dai kernel della serie 2.4.x, in cui il
1172 processo che detiene un \textit{lease} su un file riceve una notifica
1173 qualora un altro processo cerca di eseguire una \func{open} o una
1174 \func{truncate} su di esso.} sul file descriptor \var{fd} a seconda del
1175 valore del terzo argomento, che in questo caso è un \ctyp{int}, ritorna un
1176 valore nullo in caso di successo o $-1$ in caso di errore. Questa
1177 funzionalità avanzata è trattata in dettaglio in
1178 sez.~\ref{sec:file_asyncronous_lease}.
1179 \item[\const{F\_GETLEASE}] restituisce il tipo di \textit{file lease}
1180 \index{file!lease} che il processo detiene nei confronti del file descriptor
1181 \var{fd} o $-1$ in caso di errore. Con questo comando il terzo argomento può
1182 essere omesso. Questa funzionalità avanzata è trattata in dettaglio in
1183 sez.~\ref{sec:file_asyncronous_lease}.
1184 \item[\const{F\_NOTIFY}] attiva un meccanismo di notifica per cui viene
1185 riportata al processo chiamante, tramite il segnale \const{SIGIO} (o altro
1186 segnale specificato con \const{F\_SETSIG}) ogni modifica eseguita o
1187 direttamente sulla directory cui \var{fd} fa riferimento, o su uno dei file
1188 in essa contenuti; ritorna un valore nullo in caso di successo o $-1$ in caso
1189 di errore. Questa funzionalità avanzata, disponibile dai kernel della serie
1190 2.4.x, è trattata in dettaglio in sez.~\ref{sec:file_asyncronous_lease}.
1193 La maggior parte delle funzionalità di \func{fcntl} sono troppo avanzate per
1194 poter essere affrontate in tutti i loro aspetti a questo punto; saranno
1195 pertanto riprese più avanti quando affronteremo le problematiche ad esse
1196 relative. In particolare le tematiche relative all'I/O asincrono e ai vari
1197 meccanismi di notifica saranno trattate in maniera esaustiva in
1198 sez.~\ref{sec:file_asyncronous_access} mentre quelle relative al \textit{file
1199 locking}\index{file!locking} saranno esaminate in
1200 sez.~\ref{sec:file_locking}).
1202 Si tenga presente infine che quando si usa la funzione per determinare le
1203 modalità di accesso con cui è stato aperto il file (attraverso l'uso del
1204 comando \const{F\_GETFL}) è necessario estrarre i bit corrispondenti nel
1205 \textit{file status flag} che si è ottenuto. Infatti la definizione corrente
1206 di quest'ultimo non assegna bit separati alle tre diverse modalità
1207 \const{O\_RDONLY}, \const{O\_WRONLY} e \const{O\_RDWR}.\footnote{in Linux
1208 queste costanti sono poste rispettivamente ai valori 0, 1 e 2.} Per questo
1209 motivo il valore della modalità di accesso corrente si ottiene eseguendo un
1210 AND binario del valore di ritorno di \func{fcntl} con la maschera
1211 \const{O\_ACCMODE} (anch'essa definita in \file{fcntl.h}), che estrae i bit di
1212 accesso dal \textit{file status flag}.
1216 \subsection{La funzione \func{ioctl}}
1217 \label{sec:file_ioctl}
1219 Benché il concetto di \textit{everything is a file} si sia dimostratato molto
1220 valido anche per l'interazione con i dispositivi più vari, fornendo una
1221 interfaccia che permette di interagire con essi tramite le stesse funzioni
1222 usate per i normali file di dati, esisteranno sempre caratteristiche
1223 peculiari, specifiche dell'hardware e della funzionalità che ciascun
1224 dispositivo può provvedere, che non possono venire comprese in questa
1225 interfaccia astratta (un caso tipico è l'impostazione della velocità di una
1226 porta seriale, o le dimensioni di un framebuffer).
1228 Per questo motivo nell'architettura del sistema è stata prevista l'esistenza
1229 di una funzione apposita, \funcd{ioctl}, con cui poter compiere le operazioni
1230 specifiche di ogni dispositivo particolare, usando come riferimento il solito
1231 file descriptor. Il prototipo di questa funzione è:
1232 \begin{prototype}{sys/ioctl.h}{int ioctl(int fd, int request, ...)}
1233 Manipola il dispositivo sottostante, usando l'argomento \param{request} per
1234 specificare l'operazione richiesta ed il terzo argomento (usualmente di tipo
1235 \param{char * argp} o \param{int argp}) per il trasferimento
1236 dell'informazione necessaria.
1238 \bodydesc{La funzione nella maggior parte dei casi ritorna 0, alcune
1239 operazioni usano però il valore di ritorno per restituire informazioni. In
1240 caso di errore viene sempre restituito $-1$ ed \var{errno} assumerà uno dei
1243 \item[\errcode{ENOTTY}] il file \param{fd} non è associato con un device, o
1244 la richiesta non è applicabile all'oggetto a cui fa riferimento
1246 \item[\errcode{EINVAL}] gli argomenti \param{request} o \param{argp} non sono
1249 ed inoltre \errval{EBADF} e \errval{EFAULT}.}
1252 La funzione serve in sostanza per fare tutte quelle operazioni che non si
1253 adattano al design dell'architettura dei file e che non è possibile effettuare
1254 con le funzioni esaminate finora. Esse vengono selezionate attraverso il
1255 valore di \param{request} e gli eventuali risultati possono essere restituiti
1256 sia attraverso il valore di ritorno che attraverso il terzo argomento
1257 \param{argp}. Sono esempi delle operazioni gestite con una \func{ioctl}:
1259 \item il cambiamento dei font di un terminale.
1260 \item l'esecuzione di una traccia audio di un CDROM.
1261 \item i comandi di avanti veloce e riavvolgimento di un nastro.
1262 \item il comando di espulsione di un dispositivo rimovibile.
1263 \item l'impostazione della velocità trasmissione di una linea seriale.
1264 \item l'impostazione della frequenza e della durata dei suoni emessi dallo
1268 In generale ogni dispositivo ha un suo insieme di possibili diverse operazioni
1269 effettuabili attraverso \func{ioctl}, che sono definite nell'header file
1270 \file{sys/ioctl.h}, e devono essere usate solo sui dispositivi cui fanno
1271 riferimento. Infatti anche se in genere i valori di \param{request} sono
1272 opportunamente differenziati a seconda del dispositivo\footnote{il kernel usa
1273 un apposito \textit{magic number} per distinguere ciascun dispositivo nella
1274 definizione delle macro da usare per \param{request}, in modo da essere
1275 sicuri che essi siano sempre diversi, ed il loro uso per dispositivi diversi
1276 causi al più un errore. Si veda il capitolo quinto di \cite{LinDevDri} per
1277 una trattazione dettagliata dell'argomento.} così che la richiesta di
1278 operazioni relative ad altri dispositivi usualmente provoca il ritorno della
1279 funzione con una condizione di errore, in alcuni casi, relativi a valori
1280 assegnati prima che questa differenziazione diventasse pratica corrente, si
1281 potrebbero usare valori validi anche per il dispositivo corrente, con effetti
1282 imprevedibili o indesiderati.
1284 Data la assoluta specificità della funzione, il cui comportamento varia da
1285 dispositivo a dispositivo, non è possibile fare altro che dare una descrizione
1286 sommaria delle sue caratteristiche; torneremo ad esaminare in seguito quelle
1287 relative ad alcuni casi specifici (ad esempio la gestione dei terminali è
1288 effettuata attraverso \func{ioctl} in quasi tutte le implementazioni di Unix),
1289 qui riportiamo solo i valori di alcuni comandi che sono definiti per ogni
1291 \begin{basedescript}{\desclabelwidth{2.0cm}}
1292 \item[\const{FIOCLEX}] Imposta il flag di
1293 \textit{close-on-exec}\itindex{close-on-exec}.
1294 \item[\const{FIONCLEX}] Cancella il flag di
1295 \textit{close-on-exec}\itindex{close-on-exec}.
1296 \item[\const{FIOASYNC}] Abilita l'I/O asincrono.
1297 \item[\const{FIONBIO}] Abilita l'I/O in modalità non bloccante.
1299 relativi ad operazioni comunque eseguibili anche attraverso \func{fcntl}.
1301 % TODO estendere la lista delle ioctl
1304 %%% Local Variables:
1306 %%% TeX-master: "gapil"