fileunix.tex

   1 %% fileunix.tex
   2 %%
   3 %% Copyright (C) 2000-2005 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11 \chapter{I file: l'interfaccia standard Unix}
  12 \label{cha:file_unix_interface}
  13
  14
  15 Esamineremo in questo capitolo la prima delle due interfacce di programmazione
  16 per i file, quella dei \textit{file descriptor}\index{file!descriptor},
  17 nativa di Unix. Questa è l'interfaccia di basso livello provvista direttamente
  18 dalle system call, che non prevede funzionalità evolute come la
  19 bufferizzazione o funzioni di lettura o scrittura formattata, e sulla quale è
  20 costruita anche l'interfaccia definita dallo standard ANSI C che affronteremo
  21 al cap.~\ref{cha:files_std_interface}.
  22
  23
  24
  25 \section{L'architettura di base}
  26 \label{sec:file_base_arch}
  27
  28 In questa sezione faremo una breve introduzione sull'architettura su cui è
  29 basata dell'interfaccia dei \textit{file descriptor}, che, sia pure con
  30 differenze nella realizzazione pratica, resta sostanzialmente la stessa in
  31 tutte le implementazione di un sistema unix-like.
  32
  33
  34 \subsection{L'architettura dei \textit{file descriptor}}
  35 \label{sec:file_fd}
  36
  37 \index{file!descriptor|(}
  38
  39 Per poter accedere al contenuto di un file occorre
  40 creare un canale di comunicazione con il kernel che renda possibile operare su
  41 di esso (si ricordi quanto visto in sez.~\ref{sec:file_vfs_work}). Questo si
  42 fa aprendo il file con la funzione \func{open} che provvederà a localizzare
  43 l'inode\index{inode} del file e inizializzare i puntatori che rendono
  44 disponibili le funzioni che il VFS mette a disposizione (riportate in
  45 tab.~\ref{tab:file_file_operations}). Una volta terminate le operazioni, il
  46 file dovrà essere chiuso, e questo chiuderà il canale di comunicazione
  47 impedendo ogni ulteriore operazione.
  48
  49 All'interno di ogni processo i file aperti sono identificati da un intero non
  50 negativo, chiamato appunto \textit{file descriptor}.
  51 Quando un file viene aperto la funzione \func{open} restituisce questo numero,
  52 tutte le ulteriori operazioni saranno compiute specificando questo stesso
  53 valore come argomento alle varie funzioni dell'interfaccia.
  54
  55 Per capire come funziona il meccanismo occorre spiegare a grandi linee come il
  56 kernel gestisce l'interazione fra processi e file.  Il kernel mantiene sempre
  57 un elenco dei processi attivi nella cosiddetta \itindex{process~table}
  58 \textit{process table} ed un elenco dei file aperti nella \textit{file table}.
  59
  60 La \itindex{process~table} \textit{process table} è una tabella che contiene
  61 una voce per ciascun processo attivo nel sistema. In Linux ciascuna voce è
  62 costituita da una struttura di tipo \struct{task\_struct} nella quale sono
  63 raccolte tutte le informazioni relative al processo; fra queste informazioni
  64 c'è anche il puntatore ad una ulteriore struttura di tipo
  65 \struct{files\_struct}, in cui sono contenute le informazioni relative ai file
  66 che il processo ha aperto, ed in particolare:
  67 \begin{itemize*}
  68 \item i flag relativi ai file descriptor.
  69 \item il numero di file aperti.
  70 \item una tabella che contiene un puntatore alla relativa voce nella
  71   \textit{file table} per ogni file aperto.
  72 \end{itemize*}
  73 il \textit{file descriptor} in sostanza è l'intero positivo che indicizza
  74 quest'ultima tabella.
  75
  76 La \textit{file table} è una tabella che contiene una voce per ciascun file
  77 che è stato aperto nel sistema. In Linux è costituita da strutture di tipo
  78 \struct{file}; in ciascuna di esse sono tenute varie informazioni relative al
  79 file, fra cui:
  80 \begin{itemize*}
  81 \item lo stato del file (nel campo \var{f\_flags}).
  82 \item il valore della posizione corrente (l'\textit{offset}) nel file (nel
  83   campo \var{f\_pos}).
  84 \item un puntatore all'inode\index{inode}\footnote{nel kernel 2.4.x si è in
  85     realtà passati ad un puntatore ad una struttura \struct{dentry} che punta a
  86     sua volta all'inode\index{inode} passando per la nuova struttura del VFS.}
  87   del file.
  88 %\item un puntatore alla tabella delle funzioni \footnote{la struttura
  89 %    \var{f\_op} descritta in sez.~\ref{sec:file_vfs_work}} che si possono usare
  90 %  sul file.
  91 \end{itemize*}
  92
  93 In fig.~\ref{fig:file_proc_file} si è riportato uno schema in cui è illustrata
  94 questa architettura, ed in cui si sono evidenziate le interrelazioni fra le
  95 varie strutture di dati sulla quale essa è basata.
  96 Ritorneremo su questo schema più volte, dato che esso è fondamentale per
  97 capire i dettagli del funzionamento dell'interfaccia dei \textit{file
  98   descriptor}.
  99 \index{file!descriptor|)}
 100
 101 \begin{figure}[htb]
 102   \centering
 103   \includegraphics[width=13cm]{img/procfile}
 104   \caption{Schema della architettura dell'accesso ai file attraverso
 105   l'interfaccia dei \textit{file descriptor}.}
 106   \label{fig:file_proc_file}
 107 \end{figure}
 108
 109
 110
 111 \subsection{I file standard}
 112 \label{sec:file_std_descr}
 113
 114 Come accennato i \textit{file descriptor} non sono altro che un indice nella
 115 tabella dei file aperti di ciascun processo; per questo motivo essi vengono
 116 assegnati in successione tutte le volte che si apre un nuovo file (se non ne è
 117 stato chiuso nessuno in precedenza).
 118
 119 In tutti i sistemi unix-like esiste una convenzione generale per cui ogni
 120 processo viene lanciato dalla shell con almeno tre file aperti. Questi, per
 121 quanto appena detto, avranno come \textit{file
 122   descriptor}\index{file!descriptor} i valori 0, 1 e 2.  Benché questa sia
 123 soltanto una convenzione, essa è seguita dalla gran parte delle applicazioni,
 124 e non aderirvi potrebbe portare a gravi problemi di interoperabilità.
 125
 126 Il primo file è sempre associato al cosiddetto \textit{standard input}; è cioè
 127 il file da cui il processo si aspetta di ricevere i dati in ingresso. Il
 128 secondo file è il cosiddetto \textit{standard output}, cioè quello su cui ci
 129 si aspetta debbano essere inviati i dati in uscita. Il terzo è lo
 130 \textit{standard error}, su cui viene inviata l'uscita relativa agli errori.
 131 Nel caso della shell tutti questi file sono associati al terminale di
 132 controllo, e corrispondono quindi alla lettura della tastiera per l'ingresso e
 133 alla scrittura sul terminale per l'uscita.  Lo standard POSIX.1 provvede, al
 134 posto dei valori numerici, tre costanti simboliche, definite in
 135 tab.~\ref{tab:file_std_files}.
 136
 137 \begin{table}[htb]
 138   \centering
 139   \footnotesize
 140   \begin{tabular}[c]{|l|l|}
 141     \hline
 142     \textbf{Costante} & \textbf{Significato} \\
 143     \hline
 144     \hline
 145     \const{STDIN\_FILENO}  & \textit{file descriptor} dello \textit{standard
 146       input} \\
 147     \const{STDOUT\_FILENO} & \textit{file descriptor} dello \textit{standard
 148       output} \\
 149     \const{STDERR\_FILENO} & \textit{file descriptor} dello \textit{standard
 150       error}\\
 151     \hline
 152   \end{tabular}
 153   \caption{Costanti definite in \file{unistd.h} per i file standard aperti
 154     alla creazione di ogni processo.}
 155   \label{tab:file_std_files}
 156 \end{table}
 157
 158 In fig.~\ref{fig:file_proc_file} si è rappresentata una situazione diversa,
 159 facendo riferimento ad un programma in cui lo \textit{standard input} è
 160 associato ad un file mentre lo \textit{standard output} e lo \textit{standard
 161   error} sono entrambi associati ad un altro file (e quindi utilizzano lo
 162 stesso inode\index{inode}).
 163
 164 Nelle vecchie versioni di Unix (ed anche in Linux fino al kernel 2.0.x) il
 165 numero di file aperti era anche soggetto ad un limite massimo dato dalle
 166 dimensioni del vettore di puntatori con cui era realizzata la tabella dei file
 167 descriptor dentro \struct{file\_struct}; questo limite intrinseco nei kernel
 168 più recenti non sussiste più, dato che si è passati da un vettore ad una
 169 lista, ma restano i limiti imposti dall'amministratore (vedi
 170 sez.~\ref{sec:sys_limits}).
 171
 172
 173
 174 \section{Le funzioni base}
 175 \label{sec:file_base_func}
 176
 177 L'interfaccia standard Unix per l'input/output sui file è basata su cinque
 178 funzioni fondamentali: \func{open}, \func{read}, \func{write}, \func{lseek} e
 179 \func{close}, usate rispettivamente per aprire, leggere, scrivere, spostarsi e
 180 chiudere un file.  La gran parte delle operazioni sui file si effettua
 181 attraverso queste cinque funzioni, esse vengono chiamate anche funzioni di I/O
 182 non bufferizzato dato che effettuano le operazioni di lettura e scrittura
 183 usando direttamente le system call del kernel.
 184
 185
 186 \subsection{La funzione \func{open}}
 187 \label{sec:file_open}
 188
 189 La funzione \funcd{open} è la funzione fondamentale per accedere ai file, ed è
 190 quella che crea l'associazione fra un \itindex{pathname}\textit{pathname} ed
 191 un file descriptor, il suo prototipo è:
 192 \begin{functions}
 193   \headdecl{sys/types.h}
 194   \headdecl{sys/stat.h}
 195   \headdecl{fcntl.h}
 196   \funcdecl{int open(const char *pathname, int flags)}
 197   \funcdecl{int open(const char *pathname, int flags, mode\_t mode)}
 198   Apre il file indicato da \param{pathname} nella modalità indicata da
 199   \param{flags}, e, nel caso il file sia creato, con gli eventuali permessi
 200   specificati da \param{mode}.
 201
 202   \bodydesc{La funzione ritorna il file descriptor in caso di successo e $-1$
 203     in caso di errore. In questo caso la variabile \var{errno} assumerà uno
 204     dei valori:
 205   \begin{errlist}
 206   \item[\errcode{EEXIST}] \param{pathname} esiste e si è specificato
 207     \const{O\_CREAT} e \const{O\_EXCL}.
 208   \item[\errcode{EISDIR}] \param{pathname} indica una directory e si è tentato
 209     l'accesso in scrittura.
 210   \item[\errcode{ENOTDIR}] si è specificato \const{O\_DIRECTORY} e
 211     \param{pathname} non è una directory.
 212   \item[\errcode{ENXIO}] si sono impostati \const{O\_NOBLOCK} o
 213     \const{O\_WRONLY} ed il file è una fifo che non viene letta da nessun
 214     processo o \param{pathname} è un file di dispositivo ma il dispositivo è
 215     assente.
 216   \item[\errcode{ENODEV}] \param{pathname} si riferisce a un file di
 217     dispositivo che non esiste.
 218   \item[\errcode{ETXTBSY}] si è cercato di accedere in scrittura all'immagine
 219     di un programma in esecuzione.
 220   \item[\errcode{ELOOP}] si sono incontrati troppi link simbolici nel
 221     risolvere il \textit{pathname} o si è indicato \const{O\_NOFOLLOW} e
 222     \param{pathname} è un link simbolico.
 223   \end{errlist}
 224   ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOENT},
 225   \errval{EROFS}, \errval{EFAULT}, \errval{ENOSPC}, \errval{ENOMEM},
 226   \errval{EMFILE} e \errval{ENFILE}.}
 227 \end{functions}
 228
 229
 230 La funzione apre il file usando il primo file descriptor libero, e crea
 231 l'opportuna voce, cioè la struttura \struct{file}, nella \textit{file table}
 232 del processo.  Viene sempre restituito come valore di ritorno il file
 233 descriptor con il valore più basso disponibile.
 234
 235 \footnotetext[2]{la pagina di manuale di \func{open} segnala che questa
 236   opzione è difettosa su NFS, e che i programmi che la usano per stabilire un
 237   \textsl{file di lock}\index{file!di lock} possono incorrere in una
 238   \textit{race condition}\itindex{race~condition}.  Si consiglia come
 239   alternativa di usare un file con un nome univoco e la funzione \func{link}
 240   per verificarne l'esistenza (vedi sez.~\ref{sec:ipc_file_lock}).}
 241
 242 \footnotetext[3]{acronimo di \textit{Denial of
 243     Service}\itindex{Denial~of~Service~(DoS)}, si chiamano così attacchi
 244   miranti ad impedire un servizio causando una qualche forma di carico
 245   eccessivo per il sistema, che resta bloccato nelle risposte all'attacco.}
 246
 247 \begin{table}[!htb]
 248   \centering
 249   \footnotesize
 250   \begin{tabular}[c]{|l|p{12cm}|}
 251     \hline
 252     \textbf{Flag} & \textbf{Descrizione} \\
 253     \hline
 254     \hline % modalità di accesso al file
 255     \const{O\_RDONLY}  & Apre il file in sola lettura, le \acr{glibc}
 256                          definiscono anche \const{O\_READ} come sinonimo. \\
 257     \const{O\_WRONLY}  & Apre il file in sola scrittura, le \acr{glibc}
 258                          definiscono anche \const{O\_WRITE} come sinonimo. \\
 259     \const{O\_RDWR}    & Apre il file sia in lettura che in scrittura. \\
 260     \hline % modalità di apertura del file
 261     \hline
 262     \const{O\_CREAT}   & Se il file non esiste verrà creato, con le regole di
 263                          titolarità del file viste in
 264                          sez.~\ref{sec:file_ownership}. Con questa opzione
 265                          l'argomento \param{mode} deve essere specificato. \\
 266     \const{O\_EXCL}    & Usato in congiunzione con \const{O\_CREAT} fa sì che
 267                          la precedente esistenza del file diventi un
 268                          errore\protect\footnotemark\ che fa fallire
 269                          \func{open} con \errcode{EEXIST}. \\
 270     \const{O\_NONBLOCK}& Apre il file in modalità non bloccante, e
 271                          comporta che \func{open} ritorni immediatamente anche
 272                          quando dovrebbe bloccarsi (l'opzione ha senso solo per
 273                          le fifo, vedi sez.~\ref{sec:ipc_named_pipe}). \\
 274     \const{O\_NOCTTY}  & Se \param{pathname} si riferisce ad un dispositivo di
 275                          terminale, questo non diventerà il terminale di
 276                          controllo, anche se il processo non ne ha ancora uno
 277                          (si veda sez.~\ref{sec:sess_ctrl_term}). \\
 278     \const{O\_SHLOCK}  & Apre il file con uno shared lock (vedi
 279                          sez.~\ref{sec:file_locking}). Specifica di BSD,
 280                          assente in Linux. \\
 281     \const{O\_EXLOCK}  & Apre il file con un lock esclusivo (vedi
 282                          sez.~\ref{sec:file_locking}). Specifica di BSD,
 283                          assente in Linux.\\
 284     \const{O\_TRUNC}   & Se usato su un file di dati aperto in scrittura,
 285                          ne tronca la lunghezza a zero; con un terminale o una
 286                          fifo viene ignorato, negli altri casi il
 287                          comportamento non è specificato. \\
 288     \const{O\_NOFOLLOW}& Se \param{pathname} è un link simbolico la chiamata
 289                          fallisce. Questa è un'estensione BSD aggiunta in Linux
 290                          dal kernel 2.1.126. Nelle versioni precedenti i link
 291                          simbolici sono sempre seguiti, e questa opzione è
 292                          ignorata. \\
 293     \const{O\_DIRECTORY}&Se \param{pathname} non è una directory la chiamata
 294                          fallisce. Questo flag è specifico di Linux ed è stato
 295                          introdotto con il kernel 2.1.126 per evitare dei
 296                          \itindex{Denial~of~Service~(DoS)}
 297                          \textit{DoS}\protect\footnotemark\ quando
 298                          \func{opendir} viene chiamata su una fifo o su un
 299                          device di unità a nastri, non deve essere utilizzato
 300                          al di fuori dell'implementazione di \func{opendir}. \\
 301     \const{O\_LARGEFILE}&nel caso di sistemi a 32 bit che supportano file di
 302                          grandi dimensioni consente di aprire file le cui
 303                          dimensioni non possono essere rappresentate da numeri
 304                          a 31 bit. \\
 305     \hline
 306     \hline  % modalità di operazione coi file
 307     \const{O\_APPEND}  & Il file viene aperto in append mode. Prima di ciascuna
 308                          scrittura la posizione corrente viene sempre impostata
 309                          alla fine del file. Con NFS si può avere una
 310                          corruzione del file se più di un processo scrive allo
 311                          stesso tempo.\footnotemark\\
 312     \const{O\_NONBLOCK}& Il file viene aperto in modalità non bloccante per
 313                          le operazioni di I/O (che tratteremo in
 314                          sez.~\ref{sec:file_noblocking}): questo significa il
 315                          fallimento di \func{read} in assenza di dati da
 316                          leggere e quello di \func{write} in caso di
 317                          impossibilità di scrivere immediatamente. Questa
 318                          modalità ha senso solo per le fifo e per alcuni file
 319                          di dispositivo. \\
 320     \const{O\_NDELAY}  & In Linux\footnotemark\ è sinonimo di
 321                          \const{O\_NONBLOCK}.\\
 322     \const{O\_ASYNC}   & Apre il file per l'I/O in modalità asincrona (vedi
 323                          sez.~\ref{sec:file_asyncronous_io}). Quando è
 324                          impostato viene generato il segnale \const{SIGIO}
 325                          tutte le volte che sono disponibili dati in input
 326                          sul file. \\
 327     \const{O\_SYNC}    & Apre il file per l'input/output sincrono: ogni
 328                          \func{write} bloccherà fino al completamento della
 329                          scrittura di tutti i dati sull'hardware
 330                          sottostante.\\
 331     \const{O\_FSYNC}   & sinonimo di \const{O\_SYNC}, usato da BSD. \\
 332     \const{O\_DSYNC}   & Variante di I/O sincrono definita da POSIX; presente
 333                          dal kernel 2.1.130 come sinonimo di
 334                          \const{O\_SYNC}. \\
 335     \const{O\_RSYNC}   & Variante analoga alla precedente, trattata allo stesso
 336                          modo. \\
 337     \const{O\_NOATIME} & Blocca l'aggiornamento dei tempi di accesso dei
 338                          file (vedi sez.~\ref{sec:file_file_times}). Per molti
 339                          filesystem questa funzionalità non è disponibile per
 340                          il singolo file ma come opzione generale da
 341                          specificare in fase di montaggio.\\
 342     \const{O\_DIRECT}  & Esegue l'I/O direttamente dai buffer in user space
 343                          in maniera sincrona, in modo da scavalcare i
 344                          meccanismi di caching del kernel. In genere questo
 345                          peggiora le prestazioni tranne quando le
 346                          applicazioni\footnotemark ottimizzano il proprio
 347                          caching. Per i kernel della serie 2.4 si deve
 348                          garantire che i buffer in user space siano allineati
 349                          alle dimensioni dei blocchi del filesystem; per il
 350                          kernel 2.6 basta che siano allineati a multipli di 512
 351                          byte.\\
 352     \hline
 353   \end{tabular}
 354   \caption{Valori e significato dei vari bit del \textit{file status flag}.}
 355   \label{tab:file_open_flags}
 356 \end{table}
 357
 358 \footnotetext[4]{il problema è che NFS non supporta la scrittura in append, ed
 359   il kernel deve simularla, ma questo comporta la possibilità di una race
 360   condition, vedi sez.~\ref{sec:file_atomic}.}
 361
 362 \footnotetext[5]{l'opzione origina da SVr4, dove però causava il ritorno da
 363   una \func{read} con un valore nullo e non con un errore, questo introduce
 364   un'ambiguità, dato che come vedremo in sez.~\ref{sec:file_read} il ritorno di
 365   zero da parte di \func{read} ha il significato di una end-of-file.}
 366
 367 \footnotetext[6]{l'opzione è stata introdotta dalla SGI in IRIX, e serve
 368   sostanzialmente a permettere ad alcuni programmi (in genere database) la
 369   gestione diretta della bufferizzazione dell'I/O in quanto essi sono in grado
 370   di ottimizzarla al meglio per le loro prestazioni; l'opzione è presente
 371   anche in FreeBSD, senza limiti di allineamento dei buffer. In Linux è stata
 372   introdotta con il kernel 2.4.10, le versioni precedenti la ignorano.}
 373
 374
 375 Questa caratteristica permette di prevedere qual è il valore del file
 376 descriptor che si otterrà al ritorno di \func{open}, e viene talvolta usata da
 377 alcune applicazioni per sostituire i file corrispondenti ai file standard
 378 visti in sez.~\ref{sec:file_std_descr}: se ad esempio si chiude lo standard
 379 input e si apre subito dopo un nuovo file questo diventerà il nuovo standard
 380 input (avrà cioè il file descriptor 0).
 381
 382 Il nuovo file descriptor non è condiviso con nessun altro processo (torneremo
 383 sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in
 384 sez.~\ref{sec:file_sharing}) ed è impostato per restare aperto attraverso una
 385 \func{exec} (come accennato in sez.~\ref{sec:proc_exec}); l'offset è impostato
 386 all'inizio del file.
 387
 388 L'argomento \param{mode} indica i permessi con cui il file viene creato; i
 389 valori possibili sono gli stessi già visti in sez.~\ref{sec:file_perm_overview}
 390 e possono essere specificati come OR binario delle costanti descritte in
 391 tab.~\ref{tab:file_bit_perm}. Questi permessi sono filtrati dal valore di
 392 \var{umask} (vedi sez.~\ref{sec:file_umask}) per il processo.
 393
 394 La funzione prevede diverse opzioni, che vengono specificate usando vari bit
 395 dell'argomento \param{flags}.  Alcuni di questi bit vanno anche a costituire
 396 il flag di stato del file (o \textit{file status flag}), che è mantenuto nel
 397 campo \var{f\_flags} della struttura \struct{file} (al solito si veda lo schema
 398 di fig.~\ref{fig:file_proc_file}).  Essi sono divisi in tre categorie
 399 principali:
 400 \begin{itemize*}
 401 \item \textsl{i bit delle modalità di accesso}: specificano con quale modalità
 402   si accederà al file: i valori possibili sono lettura, scrittura o
 403   lettura/scrittura.  Uno di questi bit deve essere sempre specificato quando
 404   si apre un file.  Vengono impostati alla chiamata da \func{open}, e possono
 405   essere riletti con \func{fcntl} (fanno parte del \textit{file status flag}),
 406   ma non possono essere modificati.
 407 \item \textsl{i bit delle modalità di apertura}: permettono di specificare
 408   alcune delle caratteristiche del comportamento di \func{open} quando viene
 409   eseguita. Hanno effetto solo al momento della chiamata della funzione e non
 410   sono memorizzati né possono essere riletti.
 411 \item \textsl{i bit delle modalità di operazione}: permettono di specificare
 412   alcune caratteristiche del comportamento delle future operazioni sul file
 413   (come \func{read} o \func{write}). Anch'essi fan parte del \textit{file
 414     status flag}. Il loro valore è impostato alla chiamata di \func{open}, ma
 415   possono essere riletti e modificati (insieme alle caratteristiche operative
 416   che controllano) con una \func{fcntl}.
 417 \end{itemize*}
 418
 419 In tab.~\ref{tab:file_open_flags} sono riportate, ordinate e divise fra loro
 420 secondo le tre modalità appena elencate, le costanti mnemoniche associate a
 421 ciascuno di questi bit. Dette costanti possono essere combinate fra loro con
 422 un OR aritmetico per costruire il valore (in forma di maschera binaria)
 423 dell'argomento \param{flags} da passare alla \func{open}. I due flag
 424 \const{O\_NOFOLLOW} e \const{O\_DIRECTORY} sono estensioni specifiche di
 425 Linux, e deve essere definita la macro \macro{\_GNU\_SOURCE} per poterli
 426 usare.
 427
 428 Nelle prime versioni di Unix i valori di \param{flag} specificabili per
 429 \func{open} erano solo quelli relativi alle modalità di accesso del file.  Per
 430 questo motivo per creare un nuovo file c'era una system call apposita,
 431 \funcd{creat}, il cui prototipo è:
 432 \begin{prototype}{fcntl.h}
 433   {int creat(const char *pathname, mode\_t mode)}
 434   Crea un nuovo file vuoto, con i permessi specificati da \param{mode}. È del
 435   tutto equivalente a \code{open(filedes, O\_CREAT|O\_WRONLY|O\_TRUNC, mode)}.
 436 \end{prototype}
 437 \noindent adesso questa funzione resta solo per compatibilità con i vecchi
 438 programmi.
 439
 440
 441 \subsection{La funzione \func{close}}
 442 \label{sec:file_close}
 443
 444 La funzione \funcd{close} permette di chiudere un file, in questo modo il file
 445 descriptor ritorna disponibile; il suo prototipo è:
 446 \begin{prototype}{unistd.h}{int close(int fd)}
 447   Chiude il descrittore \param{fd}.
 448
 449   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
 450     errore, con \var{errno} che assume i valori:
 451   \begin{errlist}
 452     \item[\errcode{EBADF}]  \param{fd} non è un descrittore valido.
 453     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
 454   \end{errlist}
 455   ed inoltre \errval{EIO}.}
 456 \end{prototype}
 457
 458 La chiusura di un file rilascia ogni blocco (il \textit{file
 459   locking}\index{file!locking} è trattato in sez.~\ref{sec:file_locking}) che
 460 il processo poteva avere acquisito su di esso; se \param{fd} è l'ultimo
 461 riferimento (di eventuali copie) ad un file aperto, tutte le risorse nella
 462 file table vengono rilasciate. Infine se il file descriptor era l'ultimo
 463 riferimento ad un file su disco quest'ultimo viene cancellato.
 464
 465 Si ricordi che quando un processo termina anche tutti i suoi file descriptor
 466 vengono chiusi, molti programmi sfruttano questa caratteristica e non usano
 467 esplicitamente \func{close}. In genere comunque chiudere un file senza
 468 controllarne lo stato di uscita è errore; infatti molti filesystem
 469 implementano la tecnica del \textit{write-behind}, per cui una \func{write}
 470 può avere successo anche se i dati non sono stati scritti, un eventuale errore
 471 di I/O allora può sfuggire, ma verrà riportato alla chiusura del file: per
 472 questo motivo non effettuare il controllo può portare ad una perdita di dati
 473 inavvertita.\footnote{in Linux questo comportamento è stato osservato con NFS
 474   e le quote su disco.}
 475
 476 In ogni caso una \func{close} andata a buon fine non garantisce che i dati
 477 siano stati effettivamente scritti su disco, perché il kernel può decidere di
 478 ottimizzare l'accesso a disco ritardandone la scrittura. L'uso della funzione
 479 \func{sync} (vedi sez.~\ref{sec:file_sync}) effettua esplicitamente il
 480 \emph{flush} dei dati, ma anche in questo caso resta l'incertezza dovuta al
 481 comportamento dell'hardware (che a sua volta può introdurre ottimizzazioni
 482 dell'accesso al disco che ritardano la scrittura dei dati, da cui l'abitudine
 483 di ripetere tre volte il comando prima di eseguire lo shutdown).
 484
 485
 486 \subsection{La funzione \func{lseek}}
 487 \label{sec:file_lseek}
 488
 489 Come già accennato in sez.~\ref{sec:file_fd} a ciascun file aperto è associata
 490 una \textsl{posizione corrente nel file} (il cosiddetto \textit{file offset},
 491 mantenuto nel campo \var{f\_pos} di \struct{file}) espressa da un numero intero
 492 positivo come numero di byte dall'inizio del file. Tutte le operazioni di
 493 lettura e scrittura avvengono a partire da questa posizione che viene
 494 automaticamente spostata in avanti del numero di byte letti o scritti.
 495
 496 In genere (a meno di non avere richiesto la modalità \const{O\_APPEND}) questa
 497 posizione viene impostata a zero all'apertura del file. È possibile impostarla
 498 ad un valore qualsiasi con la funzione \funcd{lseek}, il cui prototipo è:
 499 \begin{functions}
 500   \headdecl{sys/types.h}
 501   \headdecl{unistd.h}
 502   \funcdecl{off\_t lseek(int fd, off\_t offset, int whence)}
 503   Imposta la posizione attuale nel file.
 504
 505   \bodydesc{La funzione ritorna il valore della posizione corrente in caso di
 506     successo e $-1$ in caso di errore nel qual caso \var{errno} assumerà uno
 507     dei valori:
 508   \begin{errlist}
 509   \item[\errcode{ESPIPE}] \param{fd} è una pipe, un socket\index{socket} o una
 510     fifo.
 511     \item[\errcode{EINVAL}] \param{whence} non è un valore valido.
 512   \end{errlist}
 513   ed inoltre \errval{EBADF}.}
 514 \end{functions}
 515
 516 La nuova posizione è impostata usando il valore specificato da \param{offset},
 517 sommato al riferimento dato da \param{whence}; quest'ultimo può assumere i
 518 seguenti valori\footnote{per compatibilità con alcune vecchie notazioni
 519   questi valori possono essere rimpiazzati rispettivamente con 0, 1 e 2 o con
 520   \const{L\_SET}, \const{L\_INCR} e \const{L\_XTND}.}:
 521 \begin{basedescript}{\desclabelwidth{2.0cm}}
 522 \item[\const{SEEK\_SET}] si fa riferimento all'inizio del file: il valore
 523   (sempre positivo) di \param{offset} indica direttamente la nuova posizione
 524   corrente.
 525 \item[\const{SEEK\_CUR}] si fa riferimento alla posizione corrente del file:
 526   ad essa viene sommato \param{offset} (che può essere negativo e positivo)
 527   per ottenere la nuova posizione corrente.
 528 \item[\const{SEEK\_END}] si fa riferimento alla fine del file: alle dimensioni
 529   del file viene sommato \param{offset} (che può essere negativo e positivo)
 530   per ottenere la nuova posizione corrente.
 531 \end{basedescript}
 532
 533 Come accennato in sez.~\ref{sec:file_file_size} con \func{lseek} è possibile
 534 impostare la posizione corrente anche oltre la fine del file, e alla
 535 successiva scrittura il file sarà esteso. La chiamata non causa nessun accesso
 536 al file, si limita a modificare la posizione corrente (cioè il valore
 537 \var{f\_pos} in \param{file}, vedi fig.~\ref{fig:file_proc_file}).  Dato che la
 538 funzione ritorna la nuova posizione, usando il valore zero per \param{offset}
 539 si può riottenere la posizione corrente nel file chiamando la funzione con
 540 \code{lseek(fd, 0, SEEK\_CUR)}.
 541
 542 Si tenga presente inoltre che usare \const{SEEK\_END} non assicura affatto che
 543 la successiva scrittura avvenga alla fine del file, infatti se questo è stato
 544 aperto anche da un altro processo che vi ha scritto, la fine del file può
 545 essersi spostata, ma noi scriveremo alla posizione impostata in precedenza
 546 (questa è una potenziale sorgente di \itindex{race~condition}\textit{race
 547   condition}, vedi sez.~\ref{sec:file_atomic}).
 548
 549 Non tutti i file supportano la capacità di eseguire una \func{lseek}, in
 550 questo caso la funzione ritorna l'errore \errcode{EPIPE}. Questo, oltre che per
 551 i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che non
 552 supportano questa funzione, come ad esempio per i file di
 553 terminale.\footnote{altri sistemi, usando \const{SEEK\_SET}, in questo caso
 554   ritornano il numero di caratteri che vi sono stati scritti.} Lo standard
 555 POSIX però non specifica niente in proposito. Infine alcuni file speciali, ad
 556 esempio \file{/dev/null}, non causano un errore ma restituiscono un valore
 557 indefinito.
 558
 559
 560 \subsection{La funzione \func{read}}
 561 \label{sec:file_read}
 562
 563
 564 Una volta che un file è stato aperto (con il permesso in lettura) si possono
 565 leggere i dati che contiene utilizzando la funzione \funcd{read}, il cui
 566 prototipo è:
 567 \begin{prototype}{unistd.h}{ssize\_t read(int fd, void * buf, size\_t count)}
 568
 569   Cerca di leggere \param{count} byte dal file \param{fd} al buffer
 570   \param{buf}.
 571
 572   \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e
 573     $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
 574   \begin{errlist}
 575   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale prima di
 576     aver potuto leggere qualsiasi dato.
 577   \item[\errcode{EAGAIN}] la funzione non aveva nessun dato da restituire e si
 578     era aperto il file in modalità \const{O\_NONBLOCK}.
 579   \end{errlist}
 580   ed inoltre \errval{EBADF}, \errval{EIO}, \errval{EISDIR}, \errval{EBADF},
 581   \errval{EINVAL} e \errval{EFAULT} ed eventuali altri errori dipendenti dalla
 582   natura dell'oggetto connesso a \param{fd}.}
 583 \end{prototype}
 584
 585 La funzione tenta di leggere \param{count} byte a partire dalla posizione
 586 corrente nel file. Dopo la lettura la posizione sul file è spostata
 587 automaticamente in avanti del numero di byte letti. Se \param{count} è zero la
 588 funzione restituisce zero senza nessun altro risultato.  Si deve sempre tener
 589 presente che non è detto che la funzione \func{read} restituisca sempre il
 590 numero di byte richiesto, ci sono infatti varie ragioni per cui la funzione
 591 può restituire un numero di byte inferiore; questo è un comportamento normale,
 592 e non un errore, che bisogna sempre tenere presente.
 593
 594 La prima e più ovvia di queste ragioni è che si è chiesto di leggere più byte
 595 di quanto il file ne contenga. In questo caso il file viene letto fino alla
 596 sua fine, e la funzione ritorna regolarmente il numero di byte letti
 597 effettivamente. Raggiunta la fine del file, alla ripetizione di un'operazione
 598 di lettura, otterremmo il ritorno immediato di \func{read} con uno zero.  La
 599 condizione di raggiungimento della fine del file non è un errore, e viene
 600 segnalata appunto da un valore di ritorno di \func{read} nullo. Ripetere
 601 ulteriormente la lettura non avrebbe nessun effetto se non quello di
 602 continuare a ricevere zero come valore di ritorno.
 603
 604 Con i \textsl{file regolari} questa è l'unica situazione in cui si può avere
 605 un numero di byte letti inferiore a quello richiesto, ma questo non è vero
 606 quando si legge da un terminale, da una fifo o da una pipe. In tal caso
 607 infatti, se non ci sono dati in ingresso, la \func{read} si blocca (a meno di
 608 non aver selezionato la modalità non bloccante, vedi
 609 sez.~\ref{sec:file_noblocking}) e ritorna solo quando ne arrivano; se il numero
 610 di byte richiesti eccede quelli disponibili la funzione ritorna comunque, ma
 611 con un numero di byte inferiore a quelli richiesti.
 612
 613 Lo stesso comportamento avviene caso di lettura dalla rete (cioè su un
 614 socket\index{socket}, come vedremo in sez.~\ref{sec:sock_io_behav}), o per la
 615 lettura da certi file di dispositivo, come le unità a nastro, che
 616 restituiscono sempre i dati ad un singolo blocco alla volta, o come le linee
 617 seriali, che restituiscono solo i dati ricevuti fino al momento della lettura.
 618
 619 Infine anche le due condizioni segnalate dagli errori \errcode{EINTR} ed
 620 \errcode{EAGAIN} non sono propriamente degli errori. La prima si verifica
 621 quando la \func{read} è bloccata in attesa di dati in ingresso e viene
 622 interrotta da un segnale; in tal caso l'azione da intraprendere è quella di
 623 rieseguire la funzione.  Torneremo in dettaglio sull'argomento in
 624 sez.~\ref{sec:sig_gen_beha}.  La seconda si verifica quando il file è aperto
 625 in modalità non bloccante (vedi sez.~\ref{sec:file_noblocking}) e non ci sono
 626 dati in ingresso: la funzione allora ritorna immediatamente con un errore
 627 \errcode{EAGAIN}\footnote{BSD usa per questo errore la costante
 628   \errcode{EWOULDBLOCK}, in Linux, con le \acr{glibc}, questa è sinonima di
 629   \errcode{EAGAIN}.} che indica soltanto che non essendoci al momento dati
 630 disponibili occorre provare a ripetere la lettura in un secondo tempo.
 631
 632 La funzione \func{read} è una delle system call fondamentali, esistenti fin
 633 dagli albori di Unix, ma nella seconda versione delle \textit{Single Unix
 634   Specification}\footnote{questa funzione, e l'analoga \func{pwrite} sono
 635   state aggiunte nel kernel 2.1.60, il supporto nelle \acr{glibc}, compresa
 636   l'emulazione per i vecchi kernel che non hanno la system call, è stato
 637   aggiunto con la versione 2.1, in versioni precedenti sia del kernel che
 638   delle librerie la funzione non è disponibile.} (quello che viene chiamato
 639 normalmente Unix98, vedi sez.~\ref{sec:intro_opengroup}) è stata introdotta la
 640 definizione di un'altra funzione di lettura, \funcd{pread}, il cui prototipo è:
 641 \begin{prototype}{unistd.h}
 642 {ssize\_t pread(int fd, void * buf, size\_t count, off\_t offset)}
 643
 644 Cerca di leggere \param{count} byte dal file \param{fd}, a partire dalla
 645 posizione \param{offset}, nel buffer \param{buf}.
 646
 647 \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e
 648   $-1$ in caso di errore, nel qual caso \var{errno} assumerà i valori già
 649   visti per \func{read} e \func{lseek}.}
 650 \end{prototype}
 651
 652 La funzione prende esattamente gli stessi argomenti di \func{read} con lo
 653 stesso significato, a cui si aggiunge l'argomento \func{offset} che indica una
 654 posizione sul file. Indetico è il comportamento ed il valore di ritorno. La
 655 funzione serve quando si vogliono leggere dati dal file senza modificare la
 656 posizione corrente.
 657
 658 L'uso di \func{pread} è equivalente all'esecuzione di una \func{read} seguita
 659 da una \func{lseek} che riporti al valore precedente la posizione corrente sul
 660 file, ma permette di eseguire l'operazione atomicamente. Questo può essere
 661 importante quando la posizione sul file viene condivisa da processi diversi
 662 (vedi sez.~\ref{sec:file_sharing}).  Il valore di
 663 \param{offset} fa sempre riferimento all'inizio del file.
 664
 665 La funzione \func{pread} è disponibile anche in Linux, però diventa
 666 accessibile solo attivando il supporto delle estensioni previste dalle
 667 \textit{Single Unix Specification} con la definizione della macro:
 668 \begin{verbatim}
 669 #define _XOPEN_SOURCE 500
 670 \end{verbatim}
 671 e si ricordi di definire questa macro prima dell'inclusione del file di
 672 dichiarazioni \file{unistd.h}.
 673
 674
 675
 676 \subsection{La funzione \func{write}}
 677 \label{sec:file_write}
 678
 679 Una volta che un file è stato aperto (con il permesso in scrittura) si può
 680 scrivere su di esso utilizzando la funzione \funcd{write}, il cui prototipo è:
 681 \begin{prototype}{unistd.h}{ssize\_t write(int fd, void * buf, size\_t count)}
 682
 683   Scrive \param{count} byte dal buffer \param{buf} sul file \param{fd}.
 684
 685   \bodydesc{La funzione ritorna il numero di byte scritti in caso di successo
 686     e $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei
 687     valori:
 688   \begin{errlist}
 689   \item[\errcode{EINVAL}] \param{fd} è connesso ad un oggetto che non consente
 690     la scrittura.
 691   \item[\errcode{EFBIG}] si è cercato di scrivere oltre la dimensione massima
 692     consentita dal filesystem o il limite per le dimensioni dei file del
 693     processo o su una posizione oltre il massimo consentito.
 694   \item[\errcode{EPIPE}] \param{fd} è connesso ad una pipe il cui altro capo è
 695     chiuso in lettura; in questo caso viene anche generato il segnale
 696     \const{SIGPIPE}, se questo viene gestito (o bloccato o ignorato) la
 697     funzione ritorna questo errore.
 698   \item[\errcode{EINTR}] si è stati interrotti da un segnale prima di aver
 699     potuto scrivere qualsiasi dato.
 700   \item[\errcode{EAGAIN}] ci si sarebbe bloccati, ma il file era aperto in
 701     modalità \const{O\_NONBLOCK}.
 702   \end{errlist}
 703   ed inoltre \errval{EBADF}, \errval{EIO}, \errval{EISDIR}, \errval{EBADF},
 704   \errval{ENOSPC}, \errval{EINVAL} e \errval{EFAULT} ed eventuali altri errori
 705   dipendenti dalla natura dell'oggetto connesso a \param{fd}.}
 706 \end{prototype}
 707
 708 Come nel caso di \func{read} la funzione tenta di scrivere \param{count} byte
 709 a partire dalla posizione corrente nel file e sposta automaticamente la
 710 posizione in avanti del numero di byte scritti. Se il file è aperto in
 711 modalità \const{O\_APPEND} i dati vengono sempre scritti alla fine del file.
 712 Lo standard POSIX richiede che i dati scritti siano immediatamente disponibili
 713 ad una \func{read} chiamata dopo che la \func{write} che li ha scritti è
 714 ritornata; ma dati i meccanismi di caching non è detto che tutti i filesystem
 715 supportino questa capacità.
 716
 717 Se \param{count} è zero la funzione restituisce zero senza fare nient'altro.
 718 Per i file ordinari il numero di byte scritti è sempre uguale a quello
 719 indicato da \param{count}, a meno di un errore. Negli altri casi si ha lo
 720 stesso comportamento di \func{read}.
 721
 722 Anche per \func{write} lo standard Unix98 definisce un'analoga \funcd{pwrite}
 723 per scrivere alla posizione indicata senza modificare la posizione corrente
 724 nel file, il suo prototipo è:
 725 \begin{prototype}{unistd.h}
 726 {ssize\_t pwrite(int fd, void * buf, size\_t count, off\_t offset)}
 727
 728 Cerca di scrivere sul file \param{fd}, a partire dalla posizione
 729 \param{offset}, \param{count} byte dal buffer \param{buf}.
 730
 731 \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e
 732   $-1$ in caso di errore, nel qual caso \var{errno} assumerà i valori già
 733   visti per \func{write} e \func{lseek}.}
 734 \end{prototype}
 735 \noindent e per essa valgono le stesse considerazioni fatte per \func{pread}.
 736
 737
 738 \section{Caratteristiche avanzate}
 739 \label{sec:file_adv_func}
 740
 741 In questa sezione approfondiremo alcune delle caratteristiche più sottili
 742 della gestione file in un sistema unix-like, esaminando in dettaglio il
 743 comportamento delle funzioni base, inoltre tratteremo le funzioni che
 744 permettono di eseguire alcune operazioni avanzate con i file (il grosso
 745 dell'argomento sarà comunque affrontato in cap.~\ref{cha:file_advanced}).
 746
 747
 748 \subsection{La condivisione dei files}
 749 \label{sec:file_sharing}
 750
 751 In sez.~\ref{sec:file_fd} abbiamo descritto brevemente l'architettura
 752 dell'interfaccia con i file da parte di un processo, mostrando in
 753 fig.~\ref{fig:file_proc_file} le principali strutture usate dal kernel;
 754 esamineremo ora in dettaglio le conseguenze che questa architettura ha nei
 755 confronti dell'accesso allo stesso file da parte di processi diversi.
 756
 757 \begin{figure}[htb]
 758   \centering
 759   \includegraphics[width=15cm]{img/filemultacc}
 760   \caption{Schema dell'accesso allo stesso file da parte di due processi
 761     diversi}
 762   \label{fig:file_mult_acc}
 763 \end{figure}
 764
 765 Il primo caso è quello in cui due processi diversi aprono lo stesso file
 766 su disco; sulla base di quanto visto in sez.~\ref{sec:file_fd} avremo una
 767 situazione come quella illustrata in fig.~\ref{fig:file_mult_acc}: ciascun
 768 processo avrà una sua voce nella \textit{file table} referenziata da un
 769 diverso file descriptor nella sua \struct{file\_struct}. Entrambe le voci
 770 nella \textit{file table} faranno però riferimento allo stesso
 771 inode\index{inode} su disco.
 772
 773 Questo significa che ciascun processo avrà la sua posizione corrente sul file,
 774 la sua modalità di accesso e versioni proprie di tutte le proprietà che
 775 vengono mantenute nella sua voce della \textit{file table}. Questo ha
 776 conseguenze specifiche sugli effetti della possibile azione simultanea sullo
 777 stesso file, in particolare occorre tenere presente che:
 778 \begin{itemize}
 779 \item ciascun processo può scrivere indipendentemente; dopo ciascuna
 780   \func{write} la posizione corrente sarà cambiata solo nel processo. Se la
 781   scrittura eccede la dimensione corrente del file questo verrà esteso
 782   automaticamente con l'aggiornamento del campo \var{i\_size}
 783   nell'inode\index{inode}.
 784 \item se un file è in modalità \const{O\_APPEND} tutte le volte che viene
 785   effettuata una scrittura la posizione corrente viene prima impostata alla
 786   dimensione corrente del file letta dall'inode\index{inode}. Dopo la
 787   scrittura il file viene automaticamente esteso.
 788 \item l'effetto di \func{lseek} è solo quello di cambiare il campo
 789   \var{f\_pos} nella struttura \struct{file} della \textit{file table}, non
 790   c'è nessuna operazione sul file su disco. Quando la si usa per porsi alla
 791   fine del file la posizione viene impostata leggendo la dimensione corrente
 792   dall'inode\index{inode}.
 793 \end{itemize}
 794
 795 \begin{figure}[htb]
 796   \centering
 797   \includegraphics[width=15cm]{img/fileshar}
 798   \caption{Schema dell'accesso ai file da parte di un processo figlio}
 799   \label{fig:file_acc_child}
 800 \end{figure}
 801
 802 Il secondo caso è quello in cui due file descriptor di due processi diversi
 803 puntino alla stessa voce nella \textit{file table}; questo è ad esempio il
 804 caso dei file aperti che vengono ereditati dal processo figlio all'esecuzione
 805 di una \func{fork} (si ricordi quanto detto in sez.~\ref{sec:proc_fork}). La
 806 situazione è illustrata in fig.~\ref{fig:file_acc_child}; dato che il processo
 807 figlio riceve una copia dello spazio di indirizzi del padre, riceverà anche
 808 una copia di \struct{file\_struct} e relativa tabella dei file aperti.
 809
 810 In questo modo padre e figlio avranno gli stessi file descriptor che faranno
 811 riferimento alla stessa voce nella \textit{file table}, condividendo così la
 812 posizione corrente sul file. Questo ha le conseguenze descritte a suo tempo in
 813 sez.~\ref{sec:proc_fork}: in caso di scrittura contemporanea la posizione
 814 corrente nel file varierà per entrambi i processi (in quanto verrà modificato
 815 \var{f\_pos} che è lo stesso per entrambi).
 816
 817 Si noti inoltre che anche i flag di stato del file (quelli impostati
 818 dall'argomento \param{flag} di \func{open}) essendo tenuti nella voce della
 819 \textit{file table}\footnote{per la precisione nel campo \var{f\_flags} di
 820   \struct{file}.}, vengono in questo caso condivisi. Ai file però sono
 821 associati anche altri flag, dei quali l'unico usato al momento è
 822 \const{FD\_CLOEXEC}, detti \textit{file descriptor flags}. Questi ultimi sono
 823 tenuti invece in \struct{file\_struct}, e perciò sono specifici di ciascun
 824 processo e non vengono modificati dalle azioni degli altri anche in caso di
 825 condivisione della stessa voce della \textit{file table}.
 826
 827
 828
 829 \subsection{Operazioni atomiche con i file}
 830 \label{sec:file_atomic}
 831
 832 Come si è visto in un sistema unix-like è sempre possibile per più processi
 833 accedere in contemporanea allo stesso file, e che le operazioni di lettura e
 834 scrittura possono essere fatte da ogni processo in maniera autonoma in base
 835 ad una posizione corrente nel file che è locale a ciascuno di essi.
 836
 837 Se dal punto di vista della lettura dei dati questo non comporta nessun
 838 problema, quando si andrà a scrivere le operazioni potranno mescolarsi in
 839 maniera imprevedibile.  Il sistema però fornisce in alcuni casi la possibilità
 840 di eseguire alcune operazioni di scrittura in maniera coordinata anche senza
 841 utilizzare meccanismi di sincronizzazione più complessi (come il \textit{file
 842   locking}\index{file!locking}, che esamineremo in
 843 sez.~\ref{sec:file_locking}).
 844
 845 Un caso tipico di necessità di accesso condiviso in scrittura è quello in cui
 846 vari processi devono scrivere alla fine di un file (ad esempio un file di
 847 log). Come accennato in sez.~\ref{sec:file_lseek} impostare la posizione alla
 848 fine del file e poi scrivere può condurre ad una
 849 \itindex{race~condition}\textit{race condition}: infatti può succedere che un
 850 secondo processo scriva alla fine del file fra la \func{lseek} e la
 851 \func{write}; in questo caso, come abbiamo appena visto, il file sarà esteso,
 852 ma il nostro primo processo avrà ancora la posizione corrente impostata con la
 853 \func{lseek} che non corrisponde più alla fine del file, e la successiva
 854 \func{write} sovrascriverà i dati del secondo processo.
 855
 856 Il problema è che usare due system call in successione non è un'operazione
 857 atomica; il problema è stato risolto introducendo la modalità
 858 \const{O\_APPEND}. In questo caso infatti, come abbiamo descritto in
 859 precedenza, è il kernel che aggiorna automaticamente la posizione alla fine
 860 del file prima di effettuare la scrittura, e poi estende il file. Tutto questo
 861 avviene all'interno di una singola system call (la \func{write}) che non
 862 essendo interrompibile da un altro processo costituisce un'operazione atomica.
 863
 864 Un altro caso tipico in cui è necessaria l'atomicità è quello in cui si vuole
 865 creare un \textsl{file di lock}\index{file!di lock}, bloccandosi se il file
 866 esiste. In questo caso la sequenza logica porterebbe a verificare prima
 867 l'esistenza del file con una \func{stat} per poi crearlo con una \func{creat};
 868 di nuovo avremmo la possibilità di una \textit{race
 869   condition}\itindex{race~condition} da parte di un altro processo che crea lo
 870 stesso file fra il controllo e la creazione.
 871
 872 Per questo motivo sono stati introdotti per \func{open} i due flag
 873 \const{O\_CREAT} e \const{O\_EXCL}. In questo modo l'operazione di controllo
 874 dell'esistenza del file (con relativa uscita dalla funzione con un errore) e
 875 creazione in caso di assenza, diventa atomica essendo svolta tutta all'interno
 876 di una singola system call (per i dettagli sull'uso di questa caratteristica
 877 si veda sez.~\ref{sec:ipc_file_lock}).
 878
 879
 880 \subsection{La funzioni \func{sync} e \func{fsync}}
 881 \label{sec:file_sync}
 882
 883 Come accennato in sez.~\ref{sec:file_close} tutte le operazioni di scrittura
 884 sono in genere bufferizzate dal kernel, che provvede ad effettuarle in maniera
 885 asincrona (ad esempio accorpando gli accessi alla stessa zona del disco) in un
 886 secondo tempo rispetto al momento della esecuzione della \func{write}.
 887
 888 Per questo motivo, quando è necessaria una sincronizzazione dei dati, il
 889 sistema mette a disposizione delle funzioni che provvedono a forzare lo
 890 scarico dei dati dai buffer del kernel.\footnote{come già accennato neanche
 891   questo dà la garanzia assoluta che i dati siano integri dopo la chiamata,
 892   l'hardware dei dischi è in genere dotato di un suo meccanismo interno di
 893   ottimizzazione per l'accesso al disco che può ritardare ulteriormente la
 894   scrittura effettiva.} La prima di queste funzioni è \funcd{sync} il cui
 895 prototipo è:
 896 \begin{prototype}{unistd.h}{int sync(void)}
 897
 898   Sincronizza il buffer della cache dei file col disco.
 899
 900   \bodydesc{La funzione ritorna sempre zero.}
 901 \end{prototype}
 902 \noindent  i vari standard prevedono che la funzione si limiti a far partire
 903 le operazioni, ritornando immediatamente; in Linux (dal kernel 1.3.20) invece
 904 la funzione aspetta la conclusione delle operazioni di sincronizzazione del
 905 kernel.
 906
 907 La funzione viene usata dal comando \cmd{sync} quando si vuole forzare
 908 esplicitamente lo scarico dei dati su disco, o dal demone di sistema
 909 \cmd{update} che esegue lo scarico dei dati ad intervalli di tempo fissi: il
 910 valore tradizionale, usato da BSD, per l'update dei dati è ogni 30 secondi, ma
 911 in Linux il valore utilizzato è di 5 secondi; con le nuove versioni\footnote{a
 912   partire dal kernel 2.2.8} poi, è il kernel che si occupa direttamente di
 913 tutto quanto attraverso il demone interno \cmd{bdflush}, il cui comportamento
 914 può essere controllato attraverso il file \file{/proc/sys/vm/bdflush} (per il
 915 significato dei valori si può leggere la documentazione allegata al kernel in
 916 \file{Documentation/sysctl/vm.txt}).
 917
 918 Quando si vogliono scaricare soltanto i dati di un file (ad esempio essere
 919 sicuri che i dati di un database sono stati registrati su disco) si possono
 920 usare le due funzioni \funcd{fsync} e \funcd{fdatasync}, i cui prototipi sono:
 921 \begin{functions}
 922   \headdecl{unistd.h}
 923   \funcdecl{int fsync(int fd)}
 924   Sincronizza dati e metadati del file \param{fd}
 925   \funcdecl{int fdatasync(int fd)}
 926   Sincronizza i dati del file \param{fd}.
 927
 928   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
 929     errore, nel qual caso \var{errno} assume i valori:
 930   \begin{errlist}
 931   \item[\errcode{EINVAL}] \param{fd} è un file speciale che non supporta la
 932     sincronizzazione.
 933   \end{errlist}
 934   ed inoltre \errval{EBADF}, \errval{EROFS} e \errval{EIO}.}
 935 \end{functions}
 936
 937 Entrambe le funzioni forzano la sincronizzazione col disco di tutti i dati del
 938 file specificato, ed attendono fino alla conclusione delle operazioni;
 939 \func{fsync} forza anche la sincronizzazione dei metadati del file (che
 940 riguardano sia le modifiche alle tabelle di allocazione dei settori, che gli
 941 altri dati contenuti nell'inode\index{inode} che si leggono con \func{fstat},
 942 come i tempi del file).
 943
 944 Si tenga presente che questo non comporta la sincronizzazione della
 945 directory che contiene il file (e scrittura della relativa voce su
 946 disco) che deve essere effettuata esplicitamente.\footnote{in realtà per
 947   il filesystem \acr{ext2}, quando lo si monta con l'opzione \cmd{sync},
 948   il kernel provvede anche alla sincronizzazione automatica delle voci
 949   delle directory.}
 950
 951
 952 \subsection{La funzioni \func{dup} e \func{dup2}}
 953 \label{sec:file_dup}
 954
 955 Abbiamo già visto in sez.~\ref{sec:file_sharing} come un processo figlio
 956 condivida gli stessi file descriptor del padre; è possibile però ottenere un
 957 comportamento analogo all'interno di uno stesso processo \textit{duplicando}
 958 un file descriptor. Per far questo si usa la funzione \funcd{dup} il cui
 959 prototipo è:
 960 \begin{prototype}{unistd.h}{int dup(int oldfd)}
 961   Crea una copia del file descriptor \param{oldfd}.
 962
 963   \bodydesc{La funzione ritorna il nuovo file descriptor in caso di successo e
 964     $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei
 965     valori:
 966   \begin{errlist}
 967   \item[\errcode{EBADF}] \param{oldfd} non è un file aperto.
 968   \item[\errcode{EMFILE}] si è raggiunto il numero massimo consentito di file
 969     descriptor aperti.
 970   \end{errlist}}
 971 \end{prototype}
 972
 973 La funzione ritorna, come \func{open}, il primo file descriptor libero. Il
 974 file descriptor è una copia esatta del precedente ed entrambi possono essere
 975 interscambiati nell'uso. Per capire meglio il funzionamento della funzione si
 976 può fare riferimento a fig.~\ref{fig:file_dup}: l'effetto della funzione è
 977 semplicemente quello di copiare il valore nella struttura
 978 \struct{file\_struct}, cosicché anche il nuovo file descriptor fa riferimento
 979 alla stessa voce nella \textit{file table}; per questo si dice che il nuovo
 980 file descriptor è \textsl{duplicato}, da cui il nome della funzione.
 981
 982 \begin{figure}[htb]
 983   \centering \includegraphics[width=15cm]{img/filedup}
 984   \caption{Schema dell'accesso ai file duplicati}
 985   \label{fig:file_dup}
 986 \end{figure}
 987
 988 Si noti che per quanto illustrato in fig.~\ref{fig:file_dup} i file descriptor
 989 duplicati condivideranno eventuali lock, \textit{file status flag}, e
 990 posizione corrente. Se ad esempio si esegue una \func{lseek} per modificare la
 991 posizione su uno dei due file descriptor, essa risulterà modificata anche
 992 sull'altro (dato che quello che viene modificato è lo stesso campo nella voce
 993 della \textit{file table} a cui entrambi fanno riferimento). L'unica
 994 differenza fra due file descriptor duplicati è che ciascuno avrà il suo
 995 \textit{file descriptor flag}; a questo proposito va specificato che nel caso
 996 di \func{dup} il flag di \textit{close-on-exec}\itindex{close-on-exec} (vedi
 997 sez.~\ref{sec:proc_exec} e sez.~\ref{sec:file_fcntl}) viene sempre cancellato
 998 nella copia.
 999
1000 L'uso principale di questa funzione è per la redirezione dell'input e
1001 dell'output fra l'esecuzione di una \func{fork} e la successiva \func{exec};
1002 diventa così possibile associare un file (o una pipe) allo standard input o
1003 allo standard output (torneremo sull'argomento in sez.~\ref{sec:ipc_pipe_use},
1004 quando tratteremo le pipe). Per fare questo in genere occorre prima chiudere
1005 il file che si vuole sostituire, cosicché il suo file descriptor possa esser
1006 restituito alla chiamata di \func{dup}, come primo file descriptor
1007 disponibile.
1008
1009 Dato che questa è l'operazione più comune, è prevista una diversa versione
1010 della funzione, \funcd{dup2}, che permette di specificare esplicitamente
1011 qual è il valore di file descriptor che si vuole avere come duplicato; il suo
1012 prototipo è:
1013 \begin{prototype}{unistd.h}{int dup2(int oldfd, int newfd)}
1014
1015   Rende \param{newfd} una copia del file descriptor \param{oldfd}.
1016
1017   \bodydesc{La funzione ritorna il nuovo file descriptor in caso di successo e
1018     $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1019   \begin{errlist}
1020   \item[\errcode{EBADF}] \param{oldfd} non è un file aperto o \param{newfd} ha
1021     un valore fuori dall'intervallo consentito per i file descriptor.
1022   \item[\errcode{EMFILE}] si è raggiunto il numero massimo consentito di file
1023     descriptor aperti.
1024   \end{errlist}}
1025 \end{prototype}
1026 \noindent e qualora il file descriptor \param{newfd} sia già aperto (come
1027 avviene ad esempio nel caso della duplicazione di uno dei file standard) esso
1028 sarà prima chiuso e poi duplicato (così che il file duplicato sarà connesso
1029 allo stesso valore per il file descriptor).
1030
1031 La duplicazione dei file descriptor può essere effettuata anche usando la
1032 funzione di controllo dei file \func{fcntl} (che esamineremo in
1033 sez.~\ref{sec:file_fcntl}) con il parametro \const{F\_DUPFD}.  L'operazione ha
1034 la sintassi \code{fcntl(oldfd, F\_DUPFD, newfd)} e se si usa 0 come valore per
1035 \param{newfd} diventa equivalente a \func{dup}.
1036
1037 La sola differenza fra le due funzioni\footnote{a parte la sintassi ed i
1038   diversi codici di errore.} è che \func{dup2} chiude il file descriptor
1039 \param{newfd} se questo è già aperto, garantendo che la duplicazione sia
1040 effettuata esattamente su di esso, invece \func{fcntl} restituisce il primo
1041 file descriptor libero di valore uguale o maggiore di \param{newfd} (e se
1042 \param{newfd} è aperto la duplicazione avverrà su un altro file descriptor).
1043
1044
1045 \subsection{La funzione \func{fcntl}}
1046 \label{sec:file_fcntl}
1047
1048 Oltre alle operazioni base esaminate in sez.~\ref{sec:file_base_func} esistono
1049 tutta una serie di operazioni ausiliarie che è possibile eseguire su un file
1050 descriptor, che non riguardano la normale lettura e scrittura di dati, ma la
1051 gestione sia delle loro proprietà, che di tutta una serie di ulteriori
1052 funzionalità che il kernel può mettere a disposizione.\footnote{ad esempio si
1053   gestiscono con questa funzione varie modalità di I/O asincrono (vedi
1054   sez.~\ref{sec:file_asyncronous_operation}) e il file
1055   locking\index{file!locking} (vedi sez.~\ref{sec:file_locking}).}
1056
1057 Per queste operazioni di manipolazione e di controllo delle varie proprietà e
1058 caratteristiche di un file descriptor, viene usata la funzione \funcd{fcntl},
1059 il cui prototipo è:
1060 \begin{functions}
1061   \headdecl{unistd.h}
1062   \headdecl{fcntl.h}
1063   \funcdecl{int fcntl(int fd, int cmd)}
1064   \funcdecl{int fcntl(int fd, int cmd, long arg)}
1065   \funcdecl{int fcntl(int fd, int cmd, struct flock * lock)}
1066   Esegue una delle possibili operazioni specificate da \param{cmd}
1067   sul file \param{fd}.
1068
1069   \bodydesc{La funzione ha valori di ritorno diversi a seconda
1070     dell'operazione. In caso di errore il valore di ritorno è sempre $-1$ ed
1071     il codice dell'errore è restituito nella variabile \var{errno}; i codici
1072     possibili dipendono dal tipo di operazione, l'unico valido in generale è:
1073   \begin{errlist}
1074   \item[\errcode{EBADF}] \param{fd} non è un file aperto.
1075   \end{errlist}}
1076 \end{functions}
1077
1078
1079 Il primo argomento della funzione è sempre il numero di file descriptor
1080 \var{fd} su cui si vuole operare. Il comportamento di questa funzione, il
1081 numero e il tipo degli argomenti, il valore di ritorno e gli eventuali errori
1082 sono determinati dal valore dell'argomento \param{cmd} che in sostanza
1083 corrisponde all'esecuzione di un determinato \textsl{comando}; in
1084 sez.~\ref{sec:file_dup} abbiamo incontrato un esempio dell'uso di \func{fcntl}
1085 per la duplicazione dei file descriptor, una lista di tutti i possibili valori
1086 per \var{cmd} è riportata di seguito:
1087 \begin{basedescript}{\desclabelwidth{2.0cm}}
1088 \item[\const{F\_DUPFD}] trova il primo file descriptor disponibile di valore
1089   maggiore o uguale ad \param{arg} e ne fa una copia di \param{fd}. Ritorna il
1090   nuovo file descriptor in caso di successo e $-1$ in caso di errore. Gli
1091   errori possibili sono \errcode{EINVAL} se \param{arg} è negativo o maggiore
1092   del massimo consentito o \errcode{EMFILE} se il processo ha già raggiunto il
1093   massimo numero di descrittori consentito.
1094 \item[\const{F\_SETFD}] imposta il valore del \textit{file descriptor flag} al
1095   valore specificato con \param{arg}. Al momento l'unico bit usato è quello di
1096   \textit{close-on-exec}\itindex{close-on-exec}, identificato dalla costante
1097   \const{FD\_CLOEXEC}, che serve a richiedere che il file venga chiuso nella
1098   esecuzione di una \func{exec} (vedi sez.~\ref{sec:proc_exec}).  Ritorna un
1099   valore nullo in caso di successo e $-1$ in caso di errore.
1100 \item[\const{F\_GETFD}] ritorna il valore del \textit{file descriptor flag} di
1101   \param{fd} o $-1$ in caso di errore; se \const{FD\_CLOEXEC} è impostato i
1102   file descriptor aperti vengono chiusi attraverso una \func{exec} altrimenti
1103   (il comportamento predefinito) restano aperti.
1104 \item[\const{F\_GETFL}] ritorna il valore del \textit{file status flag} in
1105   caso di successo o $-1$ in caso di errore; permette cioè di rileggere quei
1106   bit impostati da \func{open} all'apertura del file che vengono memorizzati
1107   (quelli riportati nella prima e terza sezione di
1108   tab.~\ref{tab:file_open_flags}).
1109 \item[\const{F\_SETFL}] imposta il \textit{file status flag} al valore
1110   specificato da \param{arg}, ritorna un valore nullo in caso di successo o
1111   $-1$ in caso di errore. Possono essere impostati solo i bit riportati nella
1112   terza sezione di tab.~\ref{tab:file_open_flags}.\footnote{la pagina di
1113     manuale riporta come impostabili solo \const{O\_APPEND},
1114     \const{O\_NONBLOCK} e \const{O\_ASYNC}.}
1115 \item[\const{F\_GETLK}] richiede un controllo sul file lock specificato da
1116   \param{lock}, sovrascrivendo la struttura da esso puntata con il risultato;
1117   ritorna un valore nullo in caso di successo o $-1$ in caso di errore.  Questa
1118   funzionalità è trattata in dettaglio in sez.~\ref{sec:file_posix_lock}.
1119 \item[\const{F\_SETLK}] richiede o rilascia un file lock a seconda di quanto
1120   specificato nella struttura puntata da \param{lock}. Se il lock è tenuto da
1121   qualcun altro ritorna immediatamente restituendo $-1$ e imposta \var{errno} a
1122   \errcode{EACCES} o \errcode{EAGAIN}, in caso di successo ritorna un valore
1123   nullo. Questa funzionalità è trattata in dettaglio in
1124   sez.~\ref{sec:file_posix_lock}.
1125 \item[\const{F\_SETLKW}] identica a \const{F\_SETLK} eccetto per il fatto che
1126   la funzione non ritorna subito ma attende che il blocco sia rilasciato. Se
1127   l'attesa viene interrotta da un segnale la funzione restituisce $-1$ e
1128   imposta \var{errno} a \errcode{EINTR}, in caso di successo ritorna un valore
1129   nullo.  Questa funzionalità è trattata in dettaglio in
1130   sez.~\ref{sec:file_posix_lock}.
1131 \item[\const{F\_GETOWN}] restituisce il \acr{pid} del processo o
1132   l'identificatore del \itindex{process~group} \textit{process
1133     group}\footnote{i \itindex{process~group} \textit{process group} sono
1134     (vedi sez.~\ref{sec:sess_proc_group}) raggruppamenti di processi usati nel
1135     controllo di sessione; a ciascuno di essi è associato un identificatore
1136     (un numero positivo analogo al \acr{pid}).}  che è preposto alla ricezione
1137   dei segnali \const{SIGIO} e \const{SIGURG} per gli eventi associati al file
1138   descriptor \param{fd}. Nel caso di un \textit{process group} viene
1139   restituito un valore negativo il cui valore assoluto corrisponde
1140   all'identificatore del \itindex{process~group}\textit{process group}.  In
1141   caso di errore viene restituito $-1$.
1142 \item[\const{F\_SETOWN}] imposta, con il valore dell'argomento \param{arg},
1143   l'identificatore del processo o del \itindex{process~group} \textit{process
1144     group} che riceverà i segnali \const{SIGIO} e \const{SIGURG} per gli
1145   eventi associati al file descriptor \param{fd}, ritorna un valore nullo in
1146   caso di successo o $-1$ in caso di errore.  Come per \const{F\_GETOWN}, per
1147   impostare un \itindex{process~group} \textit{process group} si deve usare
1148   per \param{arg} un valore negativo, il cui valore assoluto corrisponde
1149   all'identificatore del \itindex{process~group} \textit{process group}.
1150 \item[\const{F\_GETSIG}] restituisce il valore del segnale inviato quando ci
1151   sono dati disponibili in ingresso su un file descriptor aperto ed impostato
1152   per l'I/O asincrono (si veda sez.~\ref{sec:file_asyncronous_io}). Il valore 0
1153   indica il valore predefinito (che è \const{SIGIO}), un valore diverso da
1154   zero indica il segnale richiesto, (che può essere anche lo stesso
1155   \const{SIGIO}). In caso di errore ritorna $-1$.
1156 \item[\const{F\_SETSIG}] imposta il segnale da inviare quando diventa
1157   possibile effettuare I/O sul file descriptor in caso di I/O asincrono,
1158   ritorna un valore nullo in caso di successo o $-1$ in caso di errore. Il
1159   valore zero indica di usare il segnale predefinito, \const{SIGIO}. Un altro
1160   valore diverso da zero (compreso lo stesso \const{SIGIO}) specifica il
1161   segnale voluto; l'uso di un valore diverso da zero permette inoltre, se si è
1162   installato il gestore del segnale come \var{sa\_sigaction} usando
1163   \const{SA\_SIGINFO}, (vedi sez.~\ref{sec:sig_sigaction}), di rendere
1164   disponibili al gestore informazioni ulteriori riguardo il file che ha
1165   generato il segnale attraverso i valori restituiti in \struct{siginfo\_t}
1166   (come vedremo in sez.~\ref{sec:file_asyncronous_io}).\footnote{i due comandi
1167     \const{F\_SETSIG} e \const{F\_GETSIG} sono una estensione specifica di
1168     Linux.}
1169 \item[\const{F\_SETLEASE}] imposta o rimuove un \index{file!lease}
1170   \textit{file lease}\footnote{questa è una nuova funzionalità, specifica di
1171     Linux, e presente solo a partire dai kernel della serie 2.4.x, in cui il
1172     processo che detiene un \textit{lease} su un file riceve una notifica
1173     qualora un altro processo cerca di eseguire una \func{open} o una
1174     \func{truncate} su di esso.} sul file descriptor \var{fd} a seconda del
1175   valore del terzo argomento, che in questo caso è un \ctyp{int}, ritorna un
1176   valore nullo in caso di successo o $-1$ in caso di errore. Questa
1177   funzionalità avanzata è trattata in dettaglio in
1178   sez.~\ref{sec:file_asyncronous_lease}.
1179 \item[\const{F\_GETLEASE}] restituisce il tipo di \textit{file lease}
1180   \index{file!lease} che il processo detiene nei confronti del file descriptor
1181   \var{fd} o $-1$ in caso di errore. Con questo comando il terzo argomento può
1182   essere omesso. Questa funzionalità avanzata è trattata in dettaglio in
1183   sez.~\ref{sec:file_asyncronous_lease}.
1184 \item[\const{F\_NOTIFY}] attiva un meccanismo di notifica per cui viene
1185   riportata al processo chiamante, tramite il segnale \const{SIGIO} (o altro
1186   segnale specificato con \const{F\_SETSIG}) ogni modifica eseguita o
1187   direttamente sulla directory cui \var{fd} fa riferimento, o su uno dei file
1188   in essa contenuti; ritorna un valore nullo in caso di successo o $-1$ in caso
1189   di errore. Questa funzionalità avanzata, disponibile dai kernel della serie
1190   2.4.x, è trattata in dettaglio in sez.~\ref{sec:file_asyncronous_lease}.
1191 \end{basedescript}
1192
1193 La maggior parte delle funzionalità di \func{fcntl} sono troppo avanzate per
1194 poter essere affrontate in tutti i loro aspetti a questo punto; saranno
1195 pertanto riprese più avanti quando affronteremo le problematiche ad esse
1196 relative. In particolare le tematiche relative all'I/O asincrono e ai vari
1197 meccanismi di notifica saranno trattate in maniera esaustiva in
1198 sez.~\ref{sec:file_asyncronous_access} mentre quelle relative al \textit{file
1199   locking}\index{file!locking} saranno esaminate in
1200 sez.~\ref{sec:file_locking}).
1201
1202 Si tenga presente infine che quando si usa la funzione per determinare le
1203 modalità di accesso con cui è stato aperto il file (attraverso l'uso del
1204 comando \const{F\_GETFL}) è necessario estrarre i bit corrispondenti nel
1205 \textit{file status flag} che si è ottenuto.  Infatti la definizione corrente
1206 di quest'ultimo non assegna bit separati alle tre diverse modalità
1207 \const{O\_RDONLY}, \const{O\_WRONLY} e \const{O\_RDWR}.\footnote{in Linux
1208   queste costanti sono poste rispettivamente ai valori 0, 1 e 2.} Per questo
1209 motivo il valore della modalità di accesso corrente si ottiene eseguendo un
1210 AND binario del valore di ritorno di \func{fcntl} con la maschera
1211 \const{O\_ACCMODE} (anch'essa definita in \file{fcntl.h}), che estrae i bit di
1212 accesso dal \textit{file status flag}.
1213
1214
1215
1216 \subsection{La funzione \func{ioctl}}
1217 \label{sec:file_ioctl}
1218
1219 Benché il concetto di \textit{everything is a file} si sia dimostratato molto
1220 valido anche per l'interazione con i dispositivi più vari, fornendo una
1221 interfaccia che permette di interagire con essi tramite le stesse funzioni
1222 usate per i normali file di dati, esisteranno sempre caratteristiche
1223 peculiari, specifiche dell'hardware e della funzionalità che ciascun
1224 dispositivo può provvedere, che non possono venire comprese in questa
1225 interfaccia astratta (un caso tipico è l'impostazione della velocità di una
1226 porta seriale, o le dimensioni di un framebuffer).
1227
1228 Per questo motivo nell'architettura del sistema è stata prevista l'esistenza
1229 di una funzione apposita, \funcd{ioctl}, con cui poter compiere le operazioni
1230 specifiche di ogni dispositivo particolare, usando come riferimento il solito
1231 file descriptor.  Il prototipo di questa funzione è:
1232 \begin{prototype}{sys/ioctl.h}{int ioctl(int fd, int request, ...)}
1233   Manipola il dispositivo sottostante, usando l'argomento \param{request} per
1234   specificare l'operazione richiesta ed il terzo argomento (usualmente di tipo
1235   \param{char * argp} o \param{int argp}) per il trasferimento
1236   dell'informazione necessaria.
1237
1238   \bodydesc{La funzione nella maggior parte dei casi ritorna 0, alcune
1239     operazioni usano però il valore di ritorno per restituire informazioni. In
1240     caso di errore viene sempre restituito $-1$ ed \var{errno} assumerà uno dei
1241     valori:
1242   \begin{errlist}
1243   \item[\errcode{ENOTTY}] il file \param{fd} non è associato con un device, o
1244     la richiesta non è applicabile all'oggetto a cui fa riferimento
1245     \param{fd}.
1246   \item[\errcode{EINVAL}] gli argomenti \param{request} o \param{argp} non sono
1247     validi.
1248   \end{errlist}
1249   ed inoltre \errval{EBADF} e \errval{EFAULT}.}
1250 \end{prototype}
1251
1252 La funzione serve in sostanza per fare tutte quelle operazioni che non si
1253 adattano al design dell'architettura dei file e che non è possibile effettuare
1254 con le funzioni esaminate finora. Esse vengono selezionate attraverso il
1255 valore di \param{request} e gli eventuali risultati possono essere restituiti
1256 sia attraverso il valore di ritorno che attraverso il terzo argomento
1257 \param{argp}. Sono esempi delle operazioni gestite con una \func{ioctl}:
1258 \begin{itemize*}
1259 \item il cambiamento dei font di un terminale.
1260 \item l'esecuzione di una traccia audio di un CDROM.
1261 \item i comandi di avanti veloce e riavvolgimento di un nastro.
1262 \item il comando di espulsione di un dispositivo rimovibile.
1263 \item l'impostazione della velocità trasmissione di una linea seriale.
1264 \item l'impostazione della frequenza e della durata dei suoni emessi dallo
1265   speaker.
1266 \end{itemize*}
1267
1268 In generale ogni dispositivo ha un suo insieme di possibili diverse operazioni
1269 effettuabili attraverso \func{ioctl}, che sono definite nell'header file
1270 \file{sys/ioctl.h}, e devono essere usate solo sui dispositivi cui fanno
1271 riferimento. Infatti anche se in genere i valori di \param{request} sono
1272 opportunamente differenziati a seconda del dispositivo\footnote{il kernel usa
1273   un apposito \textit{magic number} per distinguere ciascun dispositivo nella
1274   definizione delle macro da usare per \param{request}, in modo da essere
1275   sicuri che essi siano sempre diversi, ed il loro uso per dispositivi diversi
1276   causi al più un errore.  Si veda il capitolo quinto di \cite{LinDevDri} per
1277   una trattazione dettagliata dell'argomento.} così che la richiesta di
1278 operazioni relative ad altri dispositivi usualmente provoca il ritorno della
1279 funzione con una condizione di errore, in alcuni casi, relativi a valori
1280 assegnati prima che questa differenziazione diventasse pratica corrente, si
1281 potrebbero usare valori validi anche per il dispositivo corrente, con effetti
1282 imprevedibili o indesiderati.
1283
1284 Data la assoluta specificità della funzione, il cui comportamento varia da
1285 dispositivo a dispositivo, non è possibile fare altro che dare una descrizione
1286 sommaria delle sue caratteristiche; torneremo ad esaminare in seguito quelle
1287 relative ad alcuni casi specifici (ad esempio la gestione dei terminali è
1288 effettuata attraverso \func{ioctl} in quasi tutte le implementazioni di Unix),
1289 qui riportiamo solo i valori di alcuni comandi che sono definiti per ogni
1290 file:
1291 \begin{basedescript}{\desclabelwidth{2.0cm}}
1292 \item[\const{FIOCLEX}] Imposta il flag di
1293   \textit{close-on-exec}\itindex{close-on-exec}.
1294 \item[\const{FIONCLEX}] Cancella il flag di
1295   \textit{close-on-exec}\itindex{close-on-exec}.
1296 \item[\const{FIOASYNC}] Abilita l'I/O asincrono.
1297 \item[\const{FIONBIO}] Abilita l'I/O in modalità non bloccante.
1298 \end{basedescript}
1299 relativi ad operazioni comunque eseguibili anche attraverso \func{fcntl}.
1300
1301 % TODO estendere la lista delle ioctl
1302
1303
1304 %%% Local Variables:
1305 %%% mode: latex
1306 %%% TeX-master: "gapil"
1307 %%% End: