X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=fileunix.tex;h=10630c54c30d50d2cf21f94230a3506ab6b6585c;hp=aa851175ee59559893424114d62c7ed4e935c079;hb=193d612d40c5f81f5559ea6e11e70f6b6e51fb39;hpb=a93a0bac951085a52c4b33c42a607fc81f6868d2 diff --git a/fileunix.tex b/fileunix.tex index aa85117..5de72aa 100644 --- a/fileunix.tex +++ b/fileunix.tex @@ -1,56 +1,1735 @@ -\chapter{I files: l'interfaccia I/O di unix} +%% fileunix.tex +%% +%% Copyright (C) 2000-2011 Simone Piccardi. Permission is granted to +%% copy, distribute and/or modify this document under the terms of the GNU Free +%% Documentation License, Version 1.1 or any later version published by the +%% Free Software Foundation; with the Invariant Sections being "Un preambolo", +%% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the +%% license is included in the section entitled "GNU Free Documentation +%% License". +%% + +\chapter{I file: l'interfaccia standard Unix} \label{cha:file_unix_interface} +Esamineremo in questo capitolo la prima delle due interfacce di programmazione +per i file, quella dei \index{file!descriptor} \textit{file descriptor}, +nativa di Unix. Questa è l'interfaccia di basso livello provvista direttamente +dalle system call, che non prevede funzionalità evolute come la +bufferizzazione o funzioni di lettura o scrittura formattata, e sulla quale è +costruita anche l'interfaccia definita dallo standard ANSI C che affronteremo +al cap.~\ref{cha:files_std_interface}. + + + +\section{L'architettura di base} +\label{sec:file_base_arch} + +In questa sezione faremo una breve introduzione sull'architettura su cui è +basata dell'interfaccia dei \textit{file descriptor}, che, sia pure con +differenze nella realizzazione pratica, resta sostanzialmente la stessa in +tutte le implementazione di un sistema unix-like. + + +\subsection{L'architettura dei \textit{file descriptor}} +\label{sec:file_fd} + +\index{file!descriptor|(} + +Per poter accedere al contenuto di un file occorre creare un canale di +comunicazione con il kernel che renda possibile operare su di esso (si ricordi +quanto visto in sez.~\ref{sec:file_vfs_work}). Questo si fa aprendo il file +con la funzione \func{open} che provvederà a localizzare \index{inode} l'inode +del file e inizializzare i puntatori che rendono disponibili le funzioni che +il VFS mette a disposizione (riportate in +tab.~\ref{tab:file_file_operations}). Una volta terminate le operazioni, il +file dovrà essere chiuso, e questo chiuderà il canale di comunicazione +impedendo ogni ulteriore operazione. + +All'interno di ogni processo i file aperti sono identificati da un intero non +negativo, chiamato appunto \textit{file descriptor}. +Quando un file viene aperto la funzione \func{open} restituisce questo numero, +tutte le ulteriori operazioni saranno compiute specificando questo stesso +valore come argomento alle varie funzioni dell'interfaccia. + +Per capire come funziona il meccanismo occorre spiegare a grandi linee come il +kernel gestisce l'interazione fra processi e file. Il kernel mantiene sempre +un elenco dei processi attivi nella cosiddetta \itindex{process~table} +\textit{process table} ed un elenco dei file aperti nella +\itindex{file~table} \textit{file table}. + +La \itindex{process~table} \textit{process table} è una tabella che contiene +una voce per ciascun processo attivo nel sistema. In Linux ciascuna voce è +costituita da una struttura di tipo \struct{task\_struct} nella quale sono +raccolte tutte le informazioni relative al processo; fra queste informazioni +c'è anche il puntatore ad una ulteriore struttura di tipo +\struct{files\_struct}, in cui sono contenute le informazioni relative ai file +che il processo ha aperto, ed in particolare: +\begin{itemize*} +\item i flag relativi ai file descriptor. +\item il numero di file aperti. +\item una tabella che contiene un puntatore alla relativa voce nella + \itindex{file~table} \textit{file table} per ogni file aperto. +\end{itemize*} +il \textit{file descriptor} in sostanza è l'intero positivo che indicizza +quest'ultima tabella. + +La \itindex{file~table} \textit{file table} è una tabella che contiene una +voce per ciascun file che è stato aperto nel sistema. In Linux è costituita da +strutture di tipo \struct{file}; in ciascuna di esse sono tenute varie +informazioni relative al file, fra cui: +\begin{itemize*} +\item lo stato del file (nel campo \var{f\_flags}). +\item il valore della posizione corrente (l'\textit{offset}) nel file (nel + campo \var{f\_pos}). +\item un puntatore \index{inode} all'inode\footnote{nel kernel 2.4.x si è in + realtà passati ad un puntatore ad una struttura \struct{dentry} che punta + a sua volta \index{inode} all'inode passando per la nuova struttura del + VFS.} del file. +%\item un puntatore alla tabella delle funzioni \footnote{la struttura +% \var{f\_op} descritta in sez.~\ref{sec:file_vfs_work}} che si possono usare +% sul file. +\end{itemize*} + +In fig.~\ref{fig:file_proc_file} si è riportato uno schema in cui è illustrata +questa architettura, ed in cui si sono evidenziate le interrelazioni fra le +varie strutture di dati sulla quale essa è basata. +Ritorneremo su questo schema più volte, dato che esso è fondamentale per +capire i dettagli del funzionamento dell'interfaccia dei \textit{file + descriptor}. + +\index{file!descriptor|)} + +\begin{figure}[htb] + \centering + \includegraphics[width=13cm]{img/procfile} + \caption{Schema della architettura dell'accesso ai file attraverso + l'interfaccia dei \textit{file descriptor}.} + \label{fig:file_proc_file} +\end{figure} + + + +\subsection{I file standard} +\label{sec:file_std_descr} + +Come accennato i \textit{file descriptor} non sono altro che un indice nella +tabella dei file aperti di ciascun processo; per questo motivo essi vengono +assegnati in successione tutte le volte che si apre un nuovo file (se non ne è +stato chiuso nessuno in precedenza). + +In tutti i sistemi unix-like esiste una convenzione generale per cui ogni +processo viene lanciato dalla shell con almeno tre file aperti. Questi, per +quanto appena detto, avranno come \index{file!descriptor} \textit{file + descriptor} i valori 0, 1 e 2. Benché questa sia soltanto una convenzione, +essa è seguita dalla gran parte delle applicazioni, e non aderirvi potrebbe +portare a gravi problemi di interoperabilità. + +Il primo file è sempre associato al cosiddetto \textit{standard input}; è cioè +il file da cui il processo si aspetta di ricevere i dati in ingresso. Il +secondo file è il cosiddetto \textit{standard output}, cioè quello su cui ci +si aspetta debbano essere inviati i dati in uscita. Il terzo è lo +\textit{standard error}, su cui viene inviata l'uscita relativa agli errori. +Nel caso della shell tutti questi file sono associati al terminale di +controllo, e corrispondono quindi alla lettura della tastiera per l'ingresso e +alla scrittura sul terminale per l'uscita. Lo standard POSIX.1 provvede, al +posto dei valori numerici, tre costanti simboliche, definite in +tab.~\ref{tab:file_std_files}. + +\begin{table}[htb] + \centering + \footnotesize + \begin{tabular}[c]{|l|l|} + \hline + \textbf{Costante} & \textbf{Significato} \\ + \hline + \hline + \const{STDIN\_FILENO} & \textit{file descriptor} dello \textit{standard + input} \\ + \const{STDOUT\_FILENO} & \textit{file descriptor} dello \textit{standard + output} \\ + \const{STDERR\_FILENO} & \textit{file descriptor} dello \textit{standard + error}\\ + \hline + \end{tabular} + \caption{Costanti definite in \file{unistd.h} per i file standard aperti + alla creazione di ogni processo.} + \label{tab:file_std_files} +\end{table} + +In fig.~\ref{fig:file_proc_file} si è rappresentata una situazione diversa, +facendo riferimento ad un programma in cui lo \textit{standard input} è +associato ad un file mentre lo \textit{standard output} e lo \textit{standard + error} sono entrambi associati ad un altro file (e quindi utilizzano lo +stesso \index{inode} inode). + +Nelle vecchie versioni di Unix (ed anche in Linux fino al kernel 2.0.x) il +numero di file aperti era anche soggetto ad un limite massimo dato dalle +dimensioni del vettore di puntatori con cui era realizzata la tabella dei file +descriptor dentro \struct{file\_struct}; questo limite intrinseco nei kernel +più recenti non sussiste più, dato che si è passati da un vettore ad una +lista, ma restano i limiti imposti dall'amministratore (vedi +sez.~\ref{sec:sys_limits}). -\section{I file descriptors} -\label{sec:fileunix_fd} \section{Le funzioni base} -\label{sec:fileunix_base_func} +\label{sec:file_base_func} + +L'interfaccia standard Unix per l'input/output sui file è basata su cinque +funzioni fondamentali: \func{open}, \func{read}, \func{write}, \func{lseek} e +\func{close}, usate rispettivamente per aprire, leggere, scrivere, spostarsi e +chiudere un file. La gran parte delle operazioni sui file si effettua +attraverso queste cinque funzioni, esse vengono chiamate anche funzioni di I/O +non bufferizzato dato che effettuano le operazioni di lettura e scrittura +usando direttamente le system call del kernel. + + +\subsection{La funzione \func{open}} +\label{sec:file_open} + +La funzione \funcd{open} è la funzione fondamentale per accedere ai file, ed è +quella che crea l'associazione fra un \itindex{pathname} \textit{pathname} ed +un \index{file!descriptor} file descriptor, il suo prototipo è: +\begin{functions} + \headdecl{sys/types.h} + \headdecl{sys/stat.h} + \headdecl{fcntl.h} + \funcdecl{int open(const char *pathname, int flags)} + \funcdecl{int open(const char *pathname, int flags, mode\_t mode)} + Apre il file indicato da \param{pathname} nella modalità indicata da + \param{flags}, e, nel caso il file sia creato, con gli eventuali permessi + specificati da \param{mode}. + + \bodydesc{La funzione ritorna il file descriptor in caso di successo e $-1$ + in caso di errore. In questo caso la variabile \var{errno} assumerà uno + dei valori: + \begin{errlist} + \item[\errcode{EEXIST}] \param{pathname} esiste e si è specificato + \const{O\_CREAT} e \const{O\_EXCL}. + \item[\errcode{EISDIR}] \param{pathname} indica una directory e si è tentato + l'accesso in scrittura. + \item[\errcode{ENOTDIR}] si è specificato \const{O\_DIRECTORY} e + \param{pathname} non è una directory. + \item[\errcode{ENXIO}] si sono impostati \const{O\_NOBLOCK} o + \const{O\_WRONLY} ed il file è una fifo che non viene letta da nessun + processo o \param{pathname} è un file di dispositivo ma il dispositivo è + assente. + \item[\errcode{ENODEV}] \param{pathname} si riferisce a un file di + dispositivo che non esiste. + \item[\errcode{ETXTBSY}] si è cercato di accedere in scrittura all'immagine + di un programma in esecuzione. + \item[\errcode{ELOOP}] si sono incontrati troppi link simbolici nel + risolvere il \textit{pathname} o si è indicato \const{O\_NOFOLLOW} e + \param{pathname} è un link simbolico. + \end{errlist} + ed inoltre \errval{EACCES}, \errval{ENAMETOOLONG}, \errval{ENOENT}, + \errval{EROFS}, \errval{EFAULT}, \errval{ENOSPC}, \errval{ENOMEM}, + \errval{EMFILE} e \errval{ENFILE}.} +\end{functions} + + +La funzione apre il file usando il primo file descriptor libero, e crea +l'opportuna voce, cioè la struttura \struct{file}, nella \itindex{file~table} +\textit{file table} del processo. Viene sempre restituito come valore di +ritorno il file descriptor con il valore più basso disponibile. + +\footnotetext[2]{la pagina di manuale di \func{open} segnala che questa + opzione è difettosa su NFS, e che i programmi che la usano per stabilire un + \index{file!di lock} \textsl{file di lock} possono incorrere in una + \itindex{race~condition} \textit{race condition}. Si consiglia come + alternativa di usare un file con un nome univoco e la funzione \func{link} + per verificarne l'esistenza (vedi sez.~\ref{sec:ipc_file_lock}).} + +\begin{table}[!htb] + \centering + \footnotesize + \begin{tabular}[c]{|l|p{13cm}|} + \hline + \textbf{Flag} & \textbf{Descrizione} \\ + \hline + \hline % modalità di accesso al file + \const{O\_RDONLY} & Apre il file in sola lettura, le \acr{glibc} + definiscono anche \const{O\_READ} come sinonimo. \\ + \const{O\_WRONLY} & Apre il file in sola scrittura, le \acr{glibc} + definiscono anche \const{O\_WRITE} come sinonimo. \\ + \const{O\_RDWR} & Apre il file sia in lettura che in scrittura. \\ + \hline % modalità di apertura del file + \hline + \const{O\_CREAT} & Se il file non esiste verrà creato, con le regole di + titolarità del file viste in + sez.~\ref{sec:file_ownership_management}. Con questa + opzione l'argomento \param{mode} deve essere + specificato.\\ + \const{O\_EXCL} & Usato in congiunzione con \const{O\_CREAT} fa sì che + la precedente esistenza del file diventi un + errore\protect\footnotemark\ che fa fallire + \func{open} con \errcode{EEXIST}.\\ + \const{O\_NONBLOCK}& Apre il file in modalità non bloccante, e + comporta che \func{open} ritorni immediatamente anche + quando dovrebbe bloccarsi (l'opzione ha senso solo per + le fifo, vedi sez.~\ref{sec:ipc_named_pipe}).\\ + \const{O\_NOCTTY} & Se \param{pathname} si riferisce ad un dispositivo di + terminale, questo non diventerà il terminale di + controllo, anche se il processo non ne ha ancora uno + (si veda sez.~\ref{sec:sess_ctrl_term}).\\ + \const{O\_SHLOCK} & Apre il file con uno shared lock (vedi + sez.~\ref{sec:file_locking}). Specifica di BSD, + assente in Linux.\\ + \const{O\_EXLOCK} & Apre il file con un lock esclusivo (vedi + sez.~\ref{sec:file_locking}). Specifica di BSD, + assente in Linux.\\ + \const{O\_TRUNC} & Se usato su un file di dati aperto in scrittura, + ne tronca la lunghezza a zero; con un terminale o una + fifo viene ignorato, negli altri casi il + comportamento non è specificato.\\ + \const{O\_NOFOLLOW}& Se \param{pathname} è un link simbolico la chiamata + fallisce. Questa è un'estensione BSD aggiunta in Linux + dal kernel 2.1.126. Nelle versioni precedenti i link + simbolici sono sempre seguiti, e questa opzione è + ignorata.\\ + \const{O\_DIRECTORY}&Se \param{pathname} non è una directory la chiamata + fallisce. Questo flag è specifico di Linux ed è stato + introdotto con il kernel 2.1.126 per evitare dei + \itindex{Denial~of~Service~(DoS)} + \textit{DoS}\protect\footnotemark\ quando + \func{opendir} viene chiamata su una fifo o su un + dispositivo associato ad una unità a nastri, non deve + dispositivo a nastri; non deve essere utilizzato + al di fuori dell'implementazione di \func{opendir}.\\ + \const{O\_LARGEFILE}&Nel caso di sistemi a 32 bit che supportano file di + grandi dimensioni consente di aprire file le cui + dimensioni non possono essere rappresentate da numeri + a 31 bit.\\ + \hline + \hline % modalità di operazione coi file + \const{O\_APPEND} & Il file viene aperto in \itindex{append~mode} + \textit{append mode}. Prima di ciascuna + scrittura la posizione corrente viene sempre impostata + alla fine del file. Con NFS si può avere una + corruzione del file se più di un processo scrive allo + stesso tempo.\footnotemark\\ + \const{O\_NONBLOCK}& Il file viene aperto in modalità non bloccante per + le operazioni di I/O (che tratteremo in + sez.~\ref{sec:file_noblocking}): questo significa il + fallimento di \func{read} in assenza di dati da + leggere e quello di \func{write} in caso di + impossibilità di scrivere immediatamente. Questa + modalità ha senso solo per le fifo e per alcuni file + di dispositivo.\\ + \const{O\_NDELAY} & In Linux\footnotemark\ è sinonimo di + \const{O\_NONBLOCK}.\\ + \const{O\_ASYNC} & Apre il file per l'I/O in modalità asincrona (vedi + sez.~\ref{sec:file_asyncronous_io}). Quando è + impostato viene generato il segnale \const{SIGIO} + tutte le volte che sono disponibili dati in input + sul file.\\ + \const{O\_SYNC} & Apre il file per l'input/output sincrono: ogni + \func{write} bloccherà fino al completamento della + scrittura di tutti i dati sull'hardware + sottostante.\\ + \const{O\_FSYNC} & Sinonimo di \const{O\_SYNC}, usato da BSD.\\ + \const{O\_DSYNC} & Variante di I/O sincrono definita da POSIX; presente + dal kernel 2.1.130 come sinonimo di + \const{O\_SYNC}.\\ + \const{O\_RSYNC} & Variante analoga alla precedente, trattata allo stesso + modo.\\ + \const{O\_NOATIME} & Blocca l'aggiornamento dei tempi di accesso dei + file (vedi sez.~\ref{sec:file_file_times}). Per molti + filesystem questa funzionalità non è disponibile per + il singolo file ma come opzione generale da + specificare in fase di montaggio.\\ + \const{O\_DIRECT} & Esegue l'I/O direttamente dai buffer in user space + in maniera sincrona, in modo da scavalcare i + meccanismi di caching del kernel. In genere questo + peggiora le prestazioni tranne quando le + applicazioni\footnotemark ottimizzano il proprio + caching. Per i kernel della serie 2.4 si deve + garantire che i buffer in user space siano allineati + alle dimensioni dei blocchi del filesystem; per il + kernel 2.6 basta che siano allineati a multipli di 512 + byte.\\ + \const{O\_CLOEXEC} & Attiva la modalità di \itindex{close-on-exec} + \textit{close-on-exec} (vedi + sez.~\ref{sec:file_sharing} e + \ref{sec:file_fcntl}).\footnotemark\\ + \hline + \end{tabular} + \caption{Valori e significato dei vari bit del \textit{file status flag}.} + \label{tab:file_open_flags} +\end{table} + +\footnotetext[3]{acronimo di \itindex{Denial~of~Service~(DoS)} \textit{Denial + of Service}, si chiamano così attacchi miranti ad impedire un servizio + causando una qualche forma di carico eccessivo per il sistema, che resta + bloccato nelle risposte all'attacco.} + +\footnotetext[4]{il problema è che NFS non supporta la scrittura in + \itindex{append~mode} \textit{append}, ed il kernel deve simularla, ma + questo comporta la possibilità di una \itindex{race~condition} \textit{race + condition}, vedi sez.~\ref{sec:file_atomic}.} + +\footnotetext[5]{l'opzione origina da SVr4, dove però causava il ritorno da + una \func{read} con un valore nullo e non con un errore, questo introduce + un'ambiguità, dato che come vedremo in sez.~\ref{sec:file_read} il ritorno di + zero da parte di \func{read} ha il significato di una \textit{end-of-file}.} + +\footnotetext[6]{l'opzione è stata introdotta dalla SGI in IRIX, e serve + sostanzialmente a permettere ad alcuni programmi (in genere database) la + gestione diretta della bufferizzazione dell'I/O in quanto essi sono in grado + di ottimizzarla al meglio per le loro prestazioni; l'opzione è presente + anche in FreeBSD, senza limiti di allineamento dei buffer. In Linux è stata + introdotta con il kernel 2.4.10, le versioni precedenti la ignorano.} + +\footnotetext[7]{introdotto con il kernel 2.6.23, per evitare una + \itindex{race~condition} \textit{race condition} che si può verificare con i + \itindex{thread} \textit{thread}, fra l'apertura del file e l'impostazione + della suddetta modalità con \func{fcntl}.} + +%TODO trattare le differenze fra O_DSYNC, O_SYNC e O_RSYNC introdotte nella +% nello sviluppo del kernel 2.6.33, vedi http://lwn.net/Articles/350219/ + +Questa caratteristica permette di prevedere qual è il valore del file +descriptor che si otterrà al ritorno di \func{open}, e viene talvolta usata da +alcune applicazioni per sostituire i file corrispondenti ai file standard +visti in sez.~\ref{sec:file_std_descr}: se ad esempio si chiude lo standard +input e si apre subito dopo un nuovo file questo diventerà il nuovo standard +input (avrà cioè il file descriptor 0). + +Il nuovo file descriptor non è condiviso con nessun altro processo (torneremo +sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in +sez.~\ref{sec:file_sharing}) ed è impostato per restare aperto attraverso una +\func{exec} (come accennato in sez.~\ref{sec:proc_exec}); l'offset è impostato +all'inizio del file. + +L'argomento \param{mode} indica i permessi con cui il file viene creato; i +valori possibili sono gli stessi già visti in +sez.~\ref{sec:file_perm_overview} e possono essere specificati come OR binario +delle costanti descritte in tab.~\ref{tab:file_bit_perm}. Questi permessi sono +filtrati dal valore di \itindex{umask} \textit{umask} (vedi +sez.~\ref{sec:file_perm_management}) per il processo. + +La funzione prevede diverse opzioni, che vengono specificate usando vari bit +dell'argomento \param{flags}. Alcuni di questi bit vanno anche a costituire +il flag di stato del file (o \textit{file status flag}), che è mantenuto nel +campo \var{f\_flags} della struttura \struct{file} (al solito si veda lo schema +di fig.~\ref{fig:file_proc_file}). Essi sono divisi in tre categorie +principali: +\begin{itemize*} +\item \textsl{i bit delle modalità di accesso}: specificano con quale modalità + si accederà al file: i valori possibili sono lettura, scrittura o + lettura/scrittura. Uno di questi bit deve essere sempre specificato quando + si apre un file. Vengono impostati alla chiamata da \func{open}, e possono + essere riletti con \func{fcntl} (fanno parte del \textit{file status flag}), + ma non possono essere modificati. +\item \textsl{i bit delle modalità di apertura}: permettono di specificare + alcune delle caratteristiche del comportamento di \func{open} quando viene + eseguita. Hanno effetto solo al momento della chiamata della funzione e non + sono memorizzati né possono essere riletti. +\item \textsl{i bit delle modalità di operazione}: permettono di specificare + alcune caratteristiche del comportamento delle future operazioni sul file + (come \func{read} o \func{write}). Anch'essi fan parte del \textit{file + status flag}. Il loro valore è impostato alla chiamata di \func{open}, ma + possono essere riletti e modificati (insieme alle caratteristiche operative + che controllano) con una \func{fcntl}. +\end{itemize*} + +In tab.~\ref{tab:file_open_flags} sono riportate, ordinate e divise fra loro +secondo le tre modalità appena elencate, le costanti mnemoniche associate a +ciascuno di questi bit. Dette costanti possono essere combinate fra loro con +un OR aritmetico per costruire il valore (in forma di maschera binaria) +dell'argomento \param{flags} da passare alla \func{open}. I due flag +\const{O\_NOFOLLOW} e \const{O\_DIRECTORY} sono estensioni specifiche di +Linux, e deve essere definita la macro \macro{\_GNU\_SOURCE} per poterli +usare. + +Nelle prime versioni di Unix i valori di \param{flag} specificabili per +\func{open} erano solo quelli relativi alle modalità di accesso del file. Per +questo motivo per creare un nuovo file c'era una system call apposita, +\funcd{creat}, il cui prototipo è: +\begin{prototype}{fcntl.h} + {int creat(const char *pathname, mode\_t mode)} + Crea un nuovo file vuoto, con i permessi specificati da \param{mode}. È del + tutto equivalente a \code{open(filedes, O\_CREAT|O\_WRONLY|O\_TRUNC, mode)}. +\end{prototype} +\noindent adesso questa funzione resta solo per compatibilità con i vecchi +programmi. + + +\subsection{La funzione \func{close}} +\label{sec:file_close} + +La funzione \funcd{close} permette di chiudere un file, in questo modo il file +descriptor ritorna disponibile; il suo prototipo è: +\begin{prototype}{unistd.h}{int close(int fd)} + Chiude il descrittore \param{fd}. + + \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di + errore, con \var{errno} che assume i valori: + \begin{errlist} + \item[\errcode{EBADF}] \param{fd} non è un descrittore valido. + \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale. + \end{errlist} + ed inoltre \errval{EIO}.} +\end{prototype} + +La chiusura di un file rilascia ogni blocco (il \textit{file locking} +\index{file!locking} è trattato in sez.~\ref{sec:file_locking}) che il +processo poteva avere acquisito su di esso; se \param{fd} è l'ultimo +riferimento (di eventuali copie) ad un file aperto, tutte le risorse nella +\itindex{file~table} \textit{file table} vengono rilasciate. Infine se il file +descriptor era l'ultimo riferimento ad un file su disco quest'ultimo viene +cancellato. + +Si ricordi che quando un processo termina anche tutti i suoi file descriptor +vengono chiusi, molti programmi sfruttano questa caratteristica e non usano +esplicitamente \func{close}. In genere comunque chiudere un file senza +controllarne lo stato di uscita è errore; infatti molti filesystem +implementano la tecnica del \textit{write-behind}, per cui una \func{write} +può avere successo anche se i dati non sono stati scritti, un eventuale errore +di I/O allora può sfuggire, ma verrà riportato alla chiusura del file: per +questo motivo non effettuare il controllo può portare ad una perdita di dati +inavvertita.\footnote{in Linux questo comportamento è stato osservato con NFS + e le quote su disco.} + +In ogni caso una \func{close} andata a buon fine non garantisce che i dati +siano stati effettivamente scritti su disco, perché il kernel può decidere di +ottimizzare l'accesso a disco ritardandone la scrittura. L'uso della funzione +\func{sync} (vedi sez.~\ref{sec:file_sync}) effettua esplicitamente il +\emph{flush} dei dati, ma anche in questo caso resta l'incertezza dovuta al +comportamento dell'hardware (che a sua volta può introdurre ottimizzazioni +dell'accesso al disco che ritardano la scrittura dei dati, da cui l'abitudine +di ripetere tre volte il comando prima di eseguire lo shutdown). + + +\subsection{La funzione \func{lseek}} +\label{sec:file_lseek} + +Come già accennato in sez.~\ref{sec:file_fd} a ciascun file aperto è associata +una \textsl{posizione corrente nel file} (il cosiddetto \textit{file offset}, +mantenuto nel campo \var{f\_pos} di \struct{file}) espressa da un numero intero +positivo come numero di byte dall'inizio del file. Tutte le operazioni di +lettura e scrittura avvengono a partire da questa posizione che viene +automaticamente spostata in avanti del numero di byte letti o scritti. + +In genere (a meno di non avere richiesto la modalità \itindex{append~mode} +\const{O\_APPEND}) questa posizione viene impostata a zero all'apertura del +file. È possibile impostarla ad un valore qualsiasi con la funzione +\funcd{lseek}, il cui prototipo è: +\begin{functions} + \headdecl{sys/types.h} + \headdecl{unistd.h} + \funcdecl{off\_t lseek(int fd, off\_t offset, int whence)} + Imposta la posizione attuale nel file. + + \bodydesc{La funzione ritorna il valore della posizione corrente in caso di + successo e $-1$ in caso di errore nel qual caso \var{errno} assumerà uno + dei valori: + \begin{errlist} + \item[\errcode{ESPIPE}] \param{fd} è una pipe, un socket o una fifo. + \item[\errcode{EINVAL}] \param{whence} non è un valore valido. + \item[\errcode{EOVERFLOW}] \param{offset} non può essere rappresentato nel + tipo \type{off\_t}. + \end{errlist} + ed inoltre \errval{EBADF}.} +\end{functions} + +La nuova posizione è impostata usando il valore specificato da \param{offset}, +sommato al riferimento dato da \param{whence}; quest'ultimo può assumere i +seguenti valori\footnote{per compatibilità con alcune vecchie notazioni + questi valori possono essere rimpiazzati rispettivamente con 0, 1 e 2 o con + \const{L\_SET}, \const{L\_INCR} e \const{L\_XTND}.}: +\begin{basedescript}{\desclabelwidth{2.0cm}} +\item[\const{SEEK\_SET}] si fa riferimento all'inizio del file: il valore + (sempre positivo) di \param{offset} indica direttamente la nuova posizione + corrente. +\item[\const{SEEK\_CUR}] si fa riferimento alla posizione corrente del file: + ad essa viene sommato \param{offset} (che può essere negativo e positivo) + per ottenere la nuova posizione corrente. +\item[\const{SEEK\_END}] si fa riferimento alla fine del file: alle dimensioni + del file viene sommato \param{offset} (che può essere negativo e positivo) + per ottenere la nuova posizione corrente. +\end{basedescript} + +Si tenga presente che la chiamata a \func{lseek} non causa nessun accesso al +file, si limita a modificare la posizione corrente (cioè il valore +\var{f\_pos} in \param{file}, vedi fig.~\ref{fig:file_proc_file}). Dato che +la funzione ritorna la nuova posizione, usando il valore zero +per \param{offset} si può riottenere la posizione corrente nel file chiamando +la funzione con \code{lseek(fd, 0, SEEK\_CUR)}. + +Si tenga presente inoltre che usare \const{SEEK\_END} non assicura affatto che +la successiva scrittura avvenga alla fine del file, infatti se questo è stato +aperto anche da un altro processo che vi ha scritto, la fine del file può +essersi spostata, ma noi scriveremo alla posizione impostata in precedenza +(questa è una potenziale sorgente di \itindex{race~condition} \textit{race + condition}, vedi sez.~\ref{sec:file_atomic}). + +Non tutti i file supportano la capacità di eseguire una \func{lseek}, in +questo caso la funzione ritorna l'errore \errcode{ESPIPE}. Questo, oltre che +per i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che +non supportano questa funzione, come ad esempio per i file di +terminale.\footnote{altri sistemi, usando \const{SEEK\_SET}, in questo caso + ritornano il numero di caratteri che vi sono stati scritti.} Lo standard +POSIX però non specifica niente in proposito. Inoltre alcuni file speciali, ad +esempio \file{/dev/null}, non causano un errore ma restituiscono un valore +indefinito. + +\itindbeg{sparse~file} + +Infine si tenga presente che, come accennato in sez.~\ref{sec:file_file_size}, +con \func{lseek} è possibile impostare una posizione anche oltre la corrente +fine del file; ed in tal caso alla successiva scrittura il file sarà esteso a +partire da detta posizione. In questo caso si ha quella che viene chiamata la +creazione di un \index{file!\textit{hole}} \textsl{buco} nel file, accade cioè +che nonostante la dimensione del file sia cresciuta in seguito alla scrittura +effettuata, lo spazio vuoto fra la precedente fine del file ed la nuova parte +scritta dopo lo spostamento, non corrisponda ad una allocazione effettiva di +spazio su disco, che sarebbe inutile dato che quella zona è effettivamente +vuota. + +Questa è una delle caratteristiche spcifiche della gestione dei file di un +sistema unix-like, ed in questo caso si ha appunto quello che in gergo si +chiama un \index{file!\textit{hole}} \textit{hole} nel file e si dice che il +file in questione è uno \textit{sparse file}. In sostanza, se si ricorda la +struttura di un filesystem illustrata in fig.~\ref{fig:file_filesys_detail}, +quello che accade è che nell'\textit{inode} del file viene segnata +l'allocazione di un blocco di dati a partire dalla nuova posizione, ma non +viene allocato nulla per le posizioni intermedie; in caso di lettura +sequenziale del contenuto del file il kernel si accorgerà della presenza del +buco, e restituirà degli zeri come contenuto di quella parte del file. + +Questa funzionalità comporta una delle caratteristiche della gestione dei file +su Unix che spesso genera più confusione in chi non la conosce, per cui +sommando le dimensioni dei file si può ottenere, se si hanno molti +\textit{sparse file}, un totale anche maggiore della capacità del proprio +disco e comunque maggiore della dimensione che riporta un comando come +\cmd{du}, che calcola lo spazio disco occupato in base al numero dei blocchi +effettivamente allocati per il file. + +Questo avviene proprio perché in un sistema unix-like la dimensione di un file +è una caratteristica del tutto indipendente dalla quantità di spazio disco +effettivamente allocato, e viene registrata sull'\textit{inode} come le altre +proprietà del file. La dimensione viene aggiornata automaticamente quando si +estende un file scrivendoci, e viene riportata dal campo \var{st\_size} di una +struttura \struct{stat} quando si effettua chiamata ad una delle funzioni +\texttt{*stat} viste in sez.~\ref{sec:file_stat}. + +Questo comporta che in generale, fintanto che lo si è scritto sequenzialmente, +la dimensione di un file sarà più o meno corrispondente alla quantità di +spazio disco da esso occupato, ma esistono dei casi, come questo in cui ci si +sposta in una posizione oltre la fine corrente del file, o come quello +accennato in in sez.~\ref{sec:file_file_size} in cui si estende la dimensione +di un file con una \func{truncate}, in cui in sostanza di modifica il valore +della dimensione di \var{st\_size} senza allocare spazio su disco. Questo +consente di creare inizialmente file di dimensioni anche molto grandi, senza +dover occupare da subito dello spazio disco che in realtà sarebbe +inutilizzato. + +\itindend{sparse~file} + + +\subsection{Le funzioni \func{read} e \func{pread}} +\label{sec:file_read} + +Una volta che un file è stato aperto (con il permesso in lettura) si possono +leggere i dati che contiene utilizzando la funzione \funcd{read}, il cui +prototipo è: +\begin{prototype}{unistd.h}{ssize\_t read(int fd, void * buf, size\_t count)} + + Cerca di leggere \param{count} byte dal file \param{fd} al buffer + \param{buf}. + + \bodydesc{La funzione ritorna il numero di byte letti in caso di successo e + $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale prima di + aver potuto leggere qualsiasi dato. + \item[\errcode{EAGAIN}] la funzione non aveva nessun dato da restituire e si + era aperto il file in modalità \const{O\_NONBLOCK}. + \end{errlist} + ed inoltre \errval{EBADF}, \errval{EIO}, \errval{EISDIR}, \errval{EBADF}, + \errval{EINVAL} e \errval{EFAULT} ed eventuali altri errori dipendenti dalla + natura dell'oggetto connesso a \param{fd}.} +\end{prototype} + +La funzione tenta di leggere \param{count} byte a partire dalla posizione +corrente nel file. Dopo la lettura la posizione sul file è spostata +automaticamente in avanti del numero di byte letti. Se \param{count} è zero la +funzione restituisce zero senza nessun altro risultato. Si deve sempre tener +presente che non è detto che la funzione \func{read} restituisca sempre il +numero di byte richiesto, ci sono infatti varie ragioni per cui la funzione +può restituire un numero di byte inferiore; questo è un comportamento normale, +e non un errore, che bisogna sempre tenere presente. + +La prima e più ovvia di queste ragioni è che si è chiesto di leggere più byte +di quanto il file ne contenga. In questo caso il file viene letto fino alla +sua fine, e la funzione ritorna regolarmente il numero di byte letti +effettivamente. Raggiunta la fine del file, alla ripetizione di un'operazione +di lettura, otterremmo il ritorno immediato di \func{read} con uno zero. La +condizione di raggiungimento della fine del file non è un errore, e viene +segnalata appunto da un valore di ritorno di \func{read} nullo. Ripetere +ulteriormente la lettura non avrebbe nessun effetto se non quello di +continuare a ricevere zero come valore di ritorno. + +Con i \textsl{file regolari} questa è l'unica situazione in cui si può avere +un numero di byte letti inferiore a quello richiesto, ma questo non è vero +quando si legge da un terminale, da una fifo o da una pipe. In tal caso +infatti, se non ci sono dati in ingresso, la \func{read} si blocca (a meno di +non aver selezionato la modalità non bloccante, vedi +sez.~\ref{sec:file_noblocking}) e ritorna solo quando ne arrivano; se il numero +di byte richiesti eccede quelli disponibili la funzione ritorna comunque, ma +con un numero di byte inferiore a quelli richiesti. + +Lo stesso comportamento avviene caso di lettura dalla rete (cioè su un socket, +come vedremo in sez.~\ref{sec:sock_io_behav}), o per la lettura da certi file +di dispositivo, come le unità a nastro, che restituiscono sempre i dati ad un +singolo blocco alla volta, o come le linee seriali, che restituiscono solo i +dati ricevuti fino al momento della lettura. + +Infine anche le due condizioni segnalate dagli errori \errcode{EINTR} ed +\errcode{EAGAIN} non sono propriamente degli errori. La prima si verifica +quando la \func{read} è bloccata in attesa di dati in ingresso e viene +interrotta da un segnale; in tal caso l'azione da intraprendere è quella di +rieseguire la funzione. Torneremo in dettaglio sull'argomento in +sez.~\ref{sec:sig_gen_beha}. La seconda si verifica quando il file è aperto +in modalità non bloccante (vedi sez.~\ref{sec:file_noblocking}) e non ci sono +dati in ingresso: la funzione allora ritorna immediatamente con un errore +\errcode{EAGAIN}\footnote{in BSD si usa per questo errore la costante + \errcode{EWOULDBLOCK}, in Linux, con le \acr{glibc}, questa è sinonima di + \errcode{EAGAIN}.} che indica soltanto che non essendoci al momento dati +disponibili occorre provare a ripetere la lettura in un secondo tempo. + +La funzione \func{read} è una delle system call fondamentali, esistenti fin +dagli albori di Unix, ma nella seconda versione delle \textit{Single Unix + Specification}\footnote{questa funzione, e l'analoga \func{pwrite} sono + state aggiunte nel kernel 2.1.60, il supporto nelle \acr{glibc}, compresa + l'emulazione per i vecchi kernel che non hanno la system call, è stato + aggiunto con la versione 2.1, in versioni precedenti sia del kernel che + delle librerie la funzione non è disponibile.} (quello che viene chiamato +normalmente Unix98, vedi sez.~\ref{sec:intro_xopen}) è stata introdotta la +definizione di un'altra funzione di lettura, \funcd{pread}, il cui prototipo è: +\begin{prototype}{unistd.h} +{ssize\_t pread(int fd, void * buf, size\_t count, off\_t offset)} + +Cerca di leggere \param{count} byte dal file \param{fd}, a partire dalla +posizione \param{offset}, nel buffer \param{buf}. + +\bodydesc{La funzione ritorna il numero di byte letti in caso di successo e + $-1$ in caso di errore, nel qual caso \var{errno} assumerà i valori già + visti per \func{read} e \func{lseek}.} +\end{prototype} + +La funzione prende esattamente gli stessi argomenti di \func{read} con lo +stesso significato, a cui si aggiunge l'argomento \func{offset} che indica una +posizione sul file. Identico è il comportamento ed il valore di ritorno. La +funzione serve quando si vogliono leggere dati dal file senza modificare la +posizione corrente. + +L'uso di \func{pread} è equivalente all'esecuzione di una \func{read} seguita +da una \func{lseek} che riporti al valore precedente la posizione corrente sul +file, ma permette di eseguire l'operazione atomicamente. Questo può essere +importante quando la posizione sul file viene condivisa da processi diversi +(vedi sez.~\ref{sec:file_sharing}). Il valore di +\param{offset} fa sempre riferimento all'inizio del file. + +La funzione \func{pread} è disponibile anche in Linux, però diventa +accessibile solo attivando il supporto delle estensioni previste dalle +\textit{Single Unix Specification} con la definizione della macro: +\begin{verbatim} +#define _XOPEN_SOURCE 500 +\end{verbatim} +e si ricordi di definire questa macro prima dell'inclusione del file di +dichiarazioni \file{unistd.h}. + + + +\subsection{Le funzioni \func{write} e \func{pwrite}} +\label{sec:file_write} + +Una volta che un file è stato aperto (con il permesso in scrittura) si può +scrivere su di esso utilizzando la funzione \funcd{write}, il cui prototipo è: +\begin{prototype}{unistd.h}{ssize\_t write(int fd, void * buf, size\_t count)} + + Scrive \param{count} byte dal buffer \param{buf} sul file \param{fd}. + + \bodydesc{La funzione ritorna il numero di byte scritti in caso di successo + e $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei + valori: + \begin{errlist} + \item[\errcode{EINVAL}] \param{fd} è connesso ad un oggetto che non consente + la scrittura. + \item[\errcode{EFBIG}] si è cercato di scrivere oltre la dimensione massima + consentita dal filesystem o il limite per le dimensioni dei file del + processo o su una posizione oltre il massimo consentito. + \item[\errcode{EPIPE}] \param{fd} è connesso ad una pipe il cui altro capo è + chiuso in lettura; in questo caso viene anche generato il segnale + \const{SIGPIPE}, se questo viene gestito (o bloccato o ignorato) la + funzione ritorna questo errore. + \item[\errcode{EINTR}] si è stati interrotti da un segnale prima di aver + potuto scrivere qualsiasi dato. + \item[\errcode{EAGAIN}] ci si sarebbe bloccati, ma il file era aperto in + modalità \const{O\_NONBLOCK}. + \end{errlist} + ed inoltre \errval{EBADF}, \errval{EIO}, \errval{EISDIR}, \errval{EBADF}, + \errval{ENOSPC}, \errval{EINVAL} e \errval{EFAULT} ed eventuali altri errori + dipendenti dalla natura dell'oggetto connesso a \param{fd}.} +\end{prototype} + +Come nel caso di \func{read} la funzione tenta di scrivere \param{count} byte +a partire dalla posizione corrente nel file e sposta automaticamente la +posizione in avanti del numero di byte scritti. Se il file è aperto in +modalità \itindex{append~mode} \const{O\_APPEND} i dati vengono sempre scritti +alla fine del file. Lo standard POSIX richiede che i dati scritti siano +immediatamente disponibili ad una \func{read} chiamata dopo che la +\func{write} che li ha scritti è ritornata; ma dati i meccanismi di caching +non è detto che tutti i filesystem supportino questa capacità. + +Se \param{count} è zero la funzione restituisce zero senza fare nient'altro. +Per i file ordinari il numero di byte scritti è sempre uguale a quello +indicato da \param{count}, a meno di un errore. Negli altri casi si ha lo +stesso comportamento di \func{read}. + +Anche per \func{write} lo standard Unix98 definisce un'analoga \funcd{pwrite} +per scrivere alla posizione indicata senza modificare la posizione corrente +nel file, il suo prototipo è: +\begin{prototype}{unistd.h} +{ssize\_t pwrite(int fd, void * buf, size\_t count, off\_t offset)} + +Cerca di scrivere sul file \param{fd}, a partire dalla posizione +\param{offset}, \param{count} byte dal buffer \param{buf}. + +\bodydesc{La funzione ritorna il numero di byte letti in caso di successo e + $-1$ in caso di errore, nel qual caso \var{errno} assumerà i valori già + visti per \func{write} e \func{lseek}.} +\end{prototype} +\noindent e per essa valgono le stesse considerazioni fatte per \func{pread}. + + +\section{Caratteristiche avanzate} +\label{sec:file_adv_func} + +In questa sezione approfondiremo alcune delle caratteristiche più sottili +della gestione file in un sistema unix-like, esaminando in dettaglio il +comportamento delle funzioni base, inoltre tratteremo le funzioni che +permettono di eseguire alcune operazioni avanzate con i file (il grosso +dell'argomento sarà comunque affrontato in cap.~\ref{cha:file_advanced}). + + +\subsection{La condivisione dei files} +\label{sec:file_sharing} + +In sez.~\ref{sec:file_fd} abbiamo descritto brevemente l'architettura +dell'interfaccia con i file da parte di un processo, mostrando in +fig.~\ref{fig:file_proc_file} le principali strutture usate dal kernel; +esamineremo ora in dettaglio le conseguenze che questa architettura ha nei +confronti dell'accesso allo stesso file da parte di processi diversi. + +\begin{figure}[htb] + \centering + \includegraphics[width=15cm]{img/filemultacc} + \caption{Schema dell'accesso allo stesso file da parte di due processi + diversi} + \label{fig:file_mult_acc} +\end{figure} + +Il primo caso è quello in cui due processi diversi aprono lo stesso file su +disco; sulla base di quanto visto in sez.~\ref{sec:file_fd} avremo una +situazione come quella illustrata in fig.~\ref{fig:file_mult_acc}: ciascun +processo avrà una sua voce nella \textit{file table} referenziata da un +diverso file descriptor nella sua \struct{file\_struct}. Entrambe le voci +nella \itindex{file~table} \textit{file table} faranno però riferimento allo +stesso \index{inode} inode su disco. + +Questo significa che ciascun processo avrà la sua posizione corrente sul file, +la sua modalità di accesso e versioni proprie di tutte le proprietà che +vengono mantenute nella sua voce della \itindex{file~table} \textit{file + table}. Questo ha conseguenze specifiche sugli effetti della possibile +azione simultanea sullo stesso file, in particolare occorre tenere presente +che: +\begin{itemize} +\item ciascun processo può scrivere indipendentemente; dopo ciascuna + \func{write} la posizione corrente sarà cambiata solo nel processo. Se la + scrittura eccede la dimensione corrente del file questo verrà esteso + automaticamente con l'aggiornamento del campo \var{i\_size} \index{inode} + nell'inode. +\item se un file è in modalità \itindex{append~mode} \const{O\_APPEND} tutte + le volte che viene effettuata una scrittura la posizione corrente viene + prima impostata alla dimensione corrente del file letta \index{inode} + dall'inode. Dopo la scrittura il file viene automaticamente esteso. +\item l'effetto di \func{lseek} è solo quello di cambiare il campo + \var{f\_pos} nella struttura \struct{file} della \itindex{file~table} + \textit{file table}, non c'è nessuna operazione sul file su disco. Quando la + si usa per porsi alla fine del file la posizione viene impostata leggendo la + dimensione corrente \index{inode} dall'inode. +\end{itemize} + +\begin{figure}[htb] + \centering + \includegraphics[width=15cm]{img/fileshar} + \caption{Schema dell'accesso ai file da parte di un processo figlio} + \label{fig:file_acc_child} +\end{figure} + +Il secondo caso è quello in cui due file descriptor di due processi diversi +puntino alla stessa voce nella \itindex{file~table} \textit{file table}; +questo è ad esempio il caso dei file aperti che vengono ereditati dal processo +figlio all'esecuzione di una \func{fork} (si ricordi quanto detto in +sez.~\ref{sec:proc_fork}). La situazione è illustrata in +fig.~\ref{fig:file_acc_child}; dato che il processo figlio riceve una copia +dello spazio di indirizzi del padre, riceverà anche una copia di +\struct{file\_struct} e relativa tabella dei file aperti. + +In questo modo padre e figlio avranno gli stessi file descriptor che faranno +riferimento alla stessa voce nella \textit{file table}, condividendo così la +posizione corrente sul file. Questo ha le conseguenze descritte a suo tempo in +sez.~\ref{sec:proc_fork}: in caso di scrittura contemporanea la posizione +corrente nel file varierà per entrambi i processi (in quanto verrà modificato +\var{f\_pos} che è lo stesso per entrambi). + +Si noti inoltre che anche i flag di stato del file (quelli impostati +dall'argomento \param{flag} di \func{open}) essendo tenuti nella voce della +\textit{file table}\footnote{per la precisione nel campo \var{f\_flags} di + \struct{file}.}, vengono in questo caso condivisi. Ai file però sono +associati anche altri flag, dei quali l'unico usato al momento è +\const{FD\_CLOEXEC}, detti \textit{file descriptor flags}. Questi ultimi sono +tenuti invece in \struct{file\_struct}, e perciò sono specifici di ciascun +processo e non vengono modificati dalle azioni degli altri anche in caso di +condivisione della stessa voce della \textit{file table}. + + + +\subsection{Operazioni atomiche con i file} +\label{sec:file_atomic} + +Come si è visto in un sistema unix-like è sempre possibile per più processi +accedere in contemporanea allo stesso file, e che le operazioni di lettura e +scrittura possono essere fatte da ogni processo in maniera autonoma in base +ad una posizione corrente nel file che è locale a ciascuno di essi. + +Se dal punto di vista della lettura dei dati questo non comporta nessun +problema, quando si andrà a scrivere le operazioni potranno mescolarsi in +maniera imprevedibile. Il sistema però fornisce in alcuni casi la possibilità +di eseguire alcune operazioni di scrittura in maniera coordinata anche senza +utilizzare meccanismi di sincronizzazione più complessi (come il +\index{file!locking} \textit{file locking}, che esamineremo in +sez.~\ref{sec:file_locking}). + +Un caso tipico di necessità di accesso condiviso in scrittura è quello in cui +vari processi devono scrivere alla fine di un file (ad esempio un file di +log). Come accennato in sez.~\ref{sec:file_lseek} impostare la posizione alla +fine del file e poi scrivere può condurre ad una \itindex{race~condition} +\textit{race condition}: infatti può succedere che un secondo processo scriva +alla fine del file fra la \func{lseek} e la \func{write}; in questo caso, come +abbiamo appena visto, il file sarà esteso, ma il nostro primo processo avrà +ancora la posizione corrente impostata con la \func{lseek} che non corrisponde +più alla fine del file, e la successiva \func{write} sovrascriverà i dati del +secondo processo. + +Il problema è che usare due system call in successione non è un'operazione +atomica; il problema è stato risolto introducendo la modalità +\itindex{append~mode} \const{O\_APPEND}. In questo caso infatti, come abbiamo +descritto in precedenza, è il kernel che aggiorna automaticamente la posizione +alla fine del file prima di effettuare la scrittura, e poi estende il file. +Tutto questo avviene all'interno di una singola system call (la \func{write}) +che non essendo interrompibile da un altro processo costituisce un'operazione +atomica. + +Un altro caso tipico in cui è necessaria l'atomicità è quello in cui si vuole +creare un \textsl{file di lock} \index{file!di lock}, bloccandosi se il file +esiste. In questo caso la sequenza logica porterebbe a verificare prima +l'esistenza del file con una \func{stat} per poi crearlo con una \func{creat}; +di nuovo avremmo la possibilità di una \itindex{race~condition} \textit{race + condition} da parte di un altro processo che crea lo stesso file fra il +controllo e la creazione. + +Per questo motivo sono stati introdotti per \func{open} i due flag +\const{O\_CREAT} e \const{O\_EXCL}. In questo modo l'operazione di controllo +dell'esistenza del file (con relativa uscita dalla funzione con un errore) e +creazione in caso di assenza, diventa atomica essendo svolta tutta all'interno +di una singola system call (per i dettagli sull'uso di questa caratteristica +si veda sez.~\ref{sec:ipc_file_lock}). + + +\subsection{Le funzioni \func{sync} e \func{fsync}} +\label{sec:file_sync} + +% TODO, aggiungere syncfs, introdotta con il 2.6.39 + +Come accennato in sez.~\ref{sec:file_close} tutte le operazioni di scrittura +sono in genere bufferizzate dal kernel, che provvede ad effettuarle in maniera +asincrona (ad esempio accorpando gli accessi alla stessa zona del disco) in un +secondo tempo rispetto al momento della esecuzione della \func{write}. + +Per questo motivo, quando è necessaria una sincronizzazione dei dati, il +sistema mette a disposizione delle funzioni che provvedono a forzare lo +scarico dei dati dai buffer del kernel.\footnote{come già accennato neanche + questo dà la garanzia assoluta che i dati siano integri dopo la chiamata, + l'hardware dei dischi è in genere dotato di un suo meccanismo interno di + ottimizzazione per l'accesso al disco che può ritardare ulteriormente la + scrittura effettiva.} La prima di queste funzioni è \funcd{sync} il cui +prototipo è: +\begin{prototype}{unistd.h}{int sync(void)} + + Sincronizza il buffer della cache dei file col disco. + + \bodydesc{La funzione ritorna sempre zero.} +\end{prototype} +\noindent i vari standard prevedono che la funzione si limiti a far partire +le operazioni, ritornando immediatamente; in Linux (dal kernel 1.3.20) invece +la funzione aspetta la conclusione delle operazioni di sincronizzazione del +kernel. + +La funzione viene usata dal comando \cmd{sync} quando si vuole forzare +esplicitamente lo scarico dei dati su disco, o dal demone di sistema +\cmd{update} che esegue lo scarico dei dati ad intervalli di tempo fissi: il +valore tradizionale, usato da BSD, per l'update dei dati è ogni 30 secondi, ma +in Linux il valore utilizzato è di 5 secondi; con le nuove versioni\footnote{a + partire dal kernel 2.2.8} poi, è il kernel che si occupa direttamente di +tutto quanto attraverso il demone interno \cmd{bdflush}, il cui comportamento +può essere controllato attraverso il file \procfile{/proc/sys/vm/bdflush} (per +il significato dei valori si può leggere la documentazione allegata al kernel +in \file{Documentation/sysctl/vm.txt}). + +Quando si vogliono scaricare soltanto i dati di un file (ad esempio essere +sicuri che i dati di un database sono stati registrati su disco) si possono +usare le due funzioni \funcd{fsync} e \funcd{fdatasync}, i cui prototipi sono: +\begin{functions} + \headdecl{unistd.h} + \funcdecl{int fsync(int fd)} + Sincronizza dati e meta-dati del file \param{fd} + \funcdecl{int fdatasync(int fd)} + Sincronizza i dati del file \param{fd}. + + \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di + errore, nel qual caso \var{errno} assume i valori: + \begin{errlist} + \item[\errcode{EINVAL}] \param{fd} è un file speciale che non supporta la + sincronizzazione. + \end{errlist} + ed inoltre \errval{EBADF}, \errval{EROFS} e \errval{EIO}.} +\end{functions} + +Entrambe le funzioni forzano la sincronizzazione col disco di tutti i dati del +file specificato, ed attendono fino alla conclusione delle operazioni; +\func{fsync} forza anche la sincronizzazione dei meta-dati del file (che +riguardano sia le modifiche alle tabelle di allocazione dei settori, che gli +altri dati contenuti \index{inode} nell'inode che si leggono con \func{fstat}, +come i tempi del file). + +Si tenga presente che questo non comporta la sincronizzazione della +directory che contiene il file (e scrittura della relativa voce su +disco) che deve essere effettuata esplicitamente.\footnote{in realtà per + il filesystem \acr{ext2}, quando lo si monta con l'opzione \cmd{sync}, + il kernel provvede anche alla sincronizzazione automatica delle voci + delle directory.} + + +\subsection{Le funzioni \func{dup} e \func{dup2}} +\label{sec:file_dup} + +Abbiamo già visto in sez.~\ref{sec:file_sharing} come un processo figlio +condivida gli stessi file descriptor del padre; è possibile però ottenere un +comportamento analogo all'interno di uno stesso processo \textit{duplicando} +un file descriptor. Per far questo si usa la funzione \funcd{dup} il cui +prototipo è: +\begin{prototype}{unistd.h}{int dup(int oldfd)} + Crea una copia del file descriptor \param{oldfd}. + + \bodydesc{La funzione ritorna il nuovo file descriptor in caso di successo e + $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei + valori: + \begin{errlist} + \item[\errcode{EBADF}] \param{oldfd} non è un file aperto. + \item[\errcode{EMFILE}] si è raggiunto il numero massimo consentito di file + descriptor aperti. + \end{errlist}} +\end{prototype} + +La funzione ritorna, come \func{open}, il primo file descriptor libero. Il +file descriptor è una copia esatta del precedente ed entrambi possono essere +interscambiati nell'uso. Per capire meglio il funzionamento della funzione si +può fare riferimento a fig.~\ref{fig:file_dup}: l'effetto della funzione è +semplicemente quello di copiare il valore nella struttura +\struct{file\_struct}, cosicché anche il nuovo file descriptor fa riferimento +alla stessa voce nella \textit{file table}; per questo si dice che il nuovo +file descriptor è \textsl{duplicato}, da cui il nome della funzione. + +\begin{figure}[htb] + \centering \includegraphics[width=14cm]{img/filedup} + \caption{Schema dell'accesso ai file duplicati} + \label{fig:file_dup} +\end{figure} + +Si noti che per quanto illustrato in fig.~\ref{fig:file_dup} i file descriptor +duplicati condivideranno eventuali lock, \textit{file status flag}, e +posizione corrente. Se ad esempio si esegue una \func{lseek} per modificare la +posizione su uno dei due file descriptor, essa risulterà modificata anche +sull'altro (dato che quello che viene modificato è lo stesso campo nella voce +della \textit{file table} a cui entrambi fanno riferimento). L'unica +differenza fra due file descriptor duplicati è che ciascuno avrà il suo +\textit{file descriptor flag}; a questo proposito va specificato che nel caso +di \func{dup} il flag di \textit{close-on-exec} \itindex{close-on-exec} (vedi +sez.~\ref{sec:proc_exec} e sez.~\ref{sec:file_fcntl}) viene sempre cancellato +nella copia. + +L'uso principale di questa funzione è per la redirezione dell'input e +dell'output fra l'esecuzione di una \func{fork} e la successiva \func{exec}; +diventa così possibile associare un file (o una pipe) allo standard input o +allo standard output (torneremo sull'argomento in sez.~\ref{sec:ipc_pipe_use}, +quando tratteremo le pipe). Per fare questo in genere occorre prima chiudere +il file che si vuole sostituire, cosicché il suo file descriptor possa esser +restituito alla chiamata di \func{dup}, come primo file descriptor +disponibile. + +Dato che questa è l'operazione più comune, è prevista una diversa versione +della funzione, \funcd{dup2}, che permette di specificare esplicitamente +qual è il valore di file descriptor che si vuole avere come duplicato; il suo +prototipo è: +\begin{prototype}{unistd.h}{int dup2(int oldfd, int newfd)} + + Rende \param{newfd} una copia del file descriptor \param{oldfd}. + + \bodydesc{La funzione ritorna il nuovo file descriptor in caso di successo e + $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EBADF}] \param{oldfd} non è un file aperto o \param{newfd} ha + un valore fuori dall'intervallo consentito per i file descriptor. + \item[\errcode{EMFILE}] si è raggiunto il numero massimo consentito di file + descriptor aperti. + \end{errlist}} +\end{prototype} +\noindent e qualora il file descriptor \param{newfd} sia già aperto (come +avviene ad esempio nel caso della duplicazione di uno dei file standard) esso +sarà prima chiuso e poi duplicato (così che il file duplicato sarà connesso +allo stesso valore per il file descriptor). + +La duplicazione dei file descriptor può essere effettuata anche usando la +funzione di controllo dei file \func{fcntl} (che esamineremo in +sez.~\ref{sec:file_fcntl}) con il parametro \const{F\_DUPFD}. L'operazione ha +la sintassi \code{fcntl(oldfd, F\_DUPFD, newfd)} e se si usa 0 come valore per +\param{newfd} diventa equivalente a \func{dup}. + +La sola differenza fra le due funzioni\footnote{a parte la sintassi ed i + diversi codici di errore.} è che \func{dup2} chiude il file descriptor +\param{newfd} se questo è già aperto, garantendo che la duplicazione sia +effettuata esattamente su di esso, invece \func{fcntl} restituisce il primo +file descriptor libero di valore uguale o maggiore di \param{newfd} (e se +\param{newfd} è aperto la duplicazione avverrà su un altro file descriptor). + + + +\subsection{Le funzioni \func{openat}, \func{mkdirat} e affini} +\label{sec:file_openat} + +Un problema che si pone con l'uso della funzione \func{open}, così come per +molte altre funzioni che accettano come argomenti dei pathname relativi, è +che, quando un pathname relativo non fa riferimento alla directory di lavoro +corrente, è possibile che alcuni dei suoi componenti vengano modificati in +parallelo alla chiamata a \func{open}, e questo lascia aperta la possibilità +di una \itindex{race~condition} \textit{race condition}. + +Inoltre come già accennato, la directory di lavoro corrente è una proprietà +del singolo processo; questo significa che quando si lavora con i +\itindex{thread} \textit{thread} essa sarà la stessa per tutti, ma esistono +molti casi in cui sarebbe invece utile che ogni singolo \itindex{thread} +\textit{thread} avesse la sua directory di lavoro. + +Per risolvere questi problemi, riprendendo una interfaccia già presente in +Solaris, a fianco delle normali funzioni che operano sui file (come +\func{open}, \func{mkdir}, ecc.) sono state introdotte delle ulteriori +funzioni, contraddistinte dal suffisso \texttt{at}, che permettono l'apertura +di un file (o le rispettive altre operazioni) usando un pathname relativo ad +una directory specificata.\footnote{l'introduzione è avvenuta su proposta + dello sviluppatore principale delle \acr{glibc} Urlich Drepper; le + corrispondenti system call sono state inserite nel kernel ufficiale a + partire dalla versione 2.6.16, in precedenza era disponibile una emulazione + che, sia pure con prestazioni inferiori, funzionava facendo ricorso all'uso + del filesystem \textit{proc} con l'apertura del file attraverso il + riferimento a pathname del tipo di + \texttt{/proc/self/fd/dirfd/relative\_path}.} Benché queste funzioni non +siano presenti negli standard tradizionali esse sono state adottate da vari +Unix\footnote{oltre a Linux e Solaris sono presenti in vari BSD.} fino ad +essere incluse nella recente revisione (la POSIX.1-2008) dello standard +POSIX.1; con le \acr{glibc} per l'accesso a queste funzioni è necessario +definire la macro \macro{\_ATFILE\_SOURCE}. + +L'uso di queste funzioni prevede una apertura iniziale della directory che +sarà la base della risoluzione dei pathname relativi che verranno usati in +seguito, dopo di che si dovrà passare il relativo file descriptor alle varie +funzioni che useranno quella directory come punto di partenza per la +risoluzione.\footnote{in questo modo, anche quando si lavora con i + \itindex{thread} \textit{thread}, si può mantenere una directory di lavoro + diversa per ciascuno di essi.} + +Questo metodo, oltre a risolvere i problemi di \itindex{race~condition} +\textit{race condition}, consente anche di ottenere aumenti di prestazioni +significativi quando si devono eseguire molte operazioni su sezioni +dell'albero dei file che prevedono delle gerarchie di sottodirectory molto +profonde; infatti in questo caso basta eseguire la risoluzione del pathname +della directory di partenza una sola volta (nell'apertura iniziale) e non +tutte le volte che si deve accedere a ciascun file che essa contiene. + +La sintassi generale di queste nuove funzioni è che esse prevedono come primo +argomento il file descriptor della directory da usare come base, mentre gli +argomenti successivi restano identici a quelli della corrispondente funzione +ordinaria; ad esempio nel caso di \funcd{openat} avremo che essa è definita +come: +\begin{functions} + \headdecl{fcntl.h} + \funcdecl{int openat(int dirfd, const char *pathname, int flags)} + \funcdecl{int openat(int dirfd, const char *pathname, int flags, mode\_t + mode))} + + Apre un file usando come directory di lavoro corrente \param{dirfd}. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{open}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +Il comportamento delle nuove funzioni è del tutto analogo a quello delle +corrispettive classiche, con la sola eccezione del fatto che se fra i loro +argomenti si utilizza un pathname relativo questo sarà risolto rispetto alla +directory indicata da \param{dirfd}; qualora invece si usi un pathname +assoluto \param{dirfd} verrà semplicemente ignorato. Infine se per +\param{dirfd} si usa il valore speciale \const{AT\_FDCWD},\footnote{questa, + come le altre costanti \texttt{AT\_*}, è definita in \texttt{fcntl.h}, + pertanto se la si vuole usare occorrerà includere comunque questo file, + anche per le funzioni che non sono definite in esso.} la risoluzione sarà +effettuata rispetto alla directory di lavoro corrente del processo. + +Così come il comportamento, anche i valori di ritorno e le condizioni di +errore delle nuove funzioni sono gli stessi delle funzioni classiche, agli +errori si aggiungono però quelli dovuti a valori errati per \param{dirfd}; in +particolare si avrà un errore di \errcode{EBADF} se esso non è un file +descriptor valido, ed un errore di \errcode{ENOTDIR} se esso non fa riferimento +ad una directory.\footnote{tranne il caso in cui si sia specificato un + pathname assoluto, nel qual caso, come detto, il valore di \param{dirfd} + sarà completamente ignorato.} + +In tab.~\ref{tab:file_atfunc_corr} si sono riportate le funzioni introdotte +con questa nuova interfaccia, con a fianco la corrispondente funzione +classica.\footnote{in realtà, come visto in sez.~\ref{sec:file_temp_file}, le + funzioni \func{utimes} e \func{lutimes} non sono propriamente le + corrispondenti di \func{utimensat}, dato che questa ha una maggiore + precisione nella indicazione dei tempi dei file.} La gran parte di queste +seguono la convenzione appena vista per \func{openat}, in cui agli argomenti +della corrispondente funzione classica viene anteposto +l'argomento \param{dirfd}.\footnote{non staremo pertanto a riportarle una per + una.} Per una parte di queste, indicate dal contenuto della omonima colonna +di tab.~\ref{tab:file_atfunc_corr}, oltre al nuovo argomento iniziale, è +prevista anche l'aggiunta di un ulteriore argomento finale, \param{flags}. + +\begin{table}[htb] + \centering + \footnotesize + \begin{tabular}[c]{|l|c|l|} + \hline + \textbf{Funzione} &\textbf{Flags} &\textbf{Corrispondente} \\ + \hline + \hline + \func{faccessat} &$\bullet$&\func{access} \\ + \func{fchmodat} &$\bullet$&\func{chmod} \\ + \func{fchownat} &$\bullet$&\func{chown},\func{lchown}\\ + \func{fstatat} &$\bullet$&\func{stat},\func{lstat} \\ + \func{utimensat} &$\bullet$&\func{utimes},\func{lutimes}\\ + \func{linkat} &$\bullet$\footnotemark&\func{link} \\ + \func{mkdirat} & -- &\func{mkdir} \\ + \func{mknodat} & -- &\func{mknod} \\ + \func{openat} & -- &\func{open} \\ + \func{readlinkat}& -- &\func{readlink}\\ + \func{renameat} & -- &\func{rename} \\ + \func{symlinkat} & -- &\func{symlink} \\ + \func{unlinkat} &$\bullet$&\func{unlink},\func{rmdir} \\ + \func{mkfifoat} & -- &\func{mkfifo} \\ + \hline + \end{tabular} + \caption{Corrispondenze fra le nuove funzioni ``\textit{at}'' e le + corrispettive funzioni classiche.} + \label{tab:file_atfunc_corr} +\end{table} + +\footnotetext{in questo caso l'argomento \param{flags} è disponibile ed + utilizzabile solo a partire dal kernel 2.6.18.} + +Per tutte le funzioni che lo prevedono, a parte \func{unlinkat} e +\funcd{faccessat}, l'ulteriore argomento è stato introdotto solo per fornire +un meccanismo con cui modificarne il comportamento nel caso si stia operando +su un link simbolico, così da poter scegliere se far agire la funzione +direttamente sullo stesso o sul file da esso referenziato. Dato che in certi +casi esso può fornire ulteriori indicazioni per modificare il comportamento +delle funzioni, \param{flags} deve comunque essere passato come maschera +binaria, ed impostato usando i valori delle appropriate costanti +\texttt{AT\_*}, definite in \texttt{fcntl.h}. + +Come esempio di questo secondo tipo di funzioni possiamo considerare +\funcd{fchownat}, che può essere usata per sostituire sia \func{chown} +che \func{lchown}; il suo prototipo è: +\begin{functions} + \headdecl{unistd.h} \headdecl{fcntl.h} + + \funcdecl{int fchownat(int dirfd, const char *pathname, uid\_t owner, gid\_t + group, int flags)} + + .Modifica la proprietà di un file. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{chown}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{EINVAL}] \param{flags} non ha un valore valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +In questo caso il valore di \param{flags} stabilisce il comportamento della +funzione quando la si applica ad un link simbolico, e l'unico valore +utilizzabile è \const{AT\_SYMLINK\_NOFOLLOW}\footnote{in \texttt{fcntl.h} è + definito anche \const{AT\_SYMLINK\_FOLLOW}, che richiede di dereferenziare i + link simbolici, essendo questo però il comportamento adottato per un valore + nullo di \param{flags} questo valore non viene mai usato.} che se impostato +indica alla funzione di non eseguire la dereferenziazione di un eventuale link +simbolico, facendo comportare \func{fchownat} come \func{lchown} invece che +come \func{chown}. + +Come accennato fra tutte quelle marcate in tab.~\ref{tab:file_atfunc_corr} +solo due funzioni possono usare l'argomento \param{flags} con valori diversi +da \const{AT\_SYMLINK\_NOFOLLOW}, la prima di queste è \funcd{faccessat}, ed +il suo prototipo è: +\begin{functions} + \headdecl{unistd.h} + \funcdecl{int faccessat(int dirfd, const char *path, int mode, int flags)} + + Controlla i permessi di accesso. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{access}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{EINVAL}] \param{flags} non ha un valore valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +La funzione esegue lo stesso controllo di accesso effettuabile con +\func{access}, ma si può utilizzare l'argomento \param{flags} per modificarne +il comportamento rispetto a quello ordinario di \func{access}. In questo caso +esso può essere specificato come maschera binaria di due valori: +\begin{basedescript}{\desclabelwidth{3.0cm}} +\item[\const{AT\_EACCESS}] se impostato \funcd{faccessat} esegue il controllo + dei permessi usando l'\textsl{user-ID effettivo} invece di quello reale (il + comportamento di default, che riprende quello di \func{access}). +\item[\const{AT\_SYMLINK\_NOFOLLOW}] se impostato \funcd{faccessat} non esegue + la dereferenziazione dei link simbolici, effettuando il controllo dei + permessi direttamente sugli stessi. +\end{basedescript} + +La seconda eccezione è \func{unlinkat}, in questo caso l'ulteriore +argomento \param{flags} viene utilizzato perché tramite esso la funzione possa +comportarsi sia come analogo di \func{unlink} che di \func{rmdir}; il suo +prototipo è: +\begin{functions} + \headdecl{fcntl.h} + \funcdecl{int unlinkat(int dirfd, const char *pathname, int flags)} + + Rimuove una voce da una directory. + + \bodydesc{la funzione restituisce gli stessi valori e gli stessi codici di + errore di \func{unlink} o di \func{rmdir} a seconda del valore di + \param{flags}, ed in più: + \begin{errlist} + \item[\errcode{EBADF}] \param{dirfd} non è un file descriptor valido. + \item[\errcode{EINVAL}] \param{flags} non ha un valore valido. + \item[\errcode{ENOTDIR}] \param{pathname} è un pathname relativo, ma + \param{dirfd} fa riferimento ad un file. + \end{errlist}} +\end{functions} + +Di default il comportamento di \func{unlinkat} è equivalente a quello che +avrebbe \func{unlink} applicata a \param{pathname}, fallendo in tutti i casi +in cui questo è una directory, se però si imposta \param{flags} al valore di +\const{AT\_REMOVEDIR},\footnote{anche se \param{flags} è una maschera binaria, + essendo questo l'unico flag disponibile per questa funzione, lo si può + assegnare direttamente.} essa si comporterà come \func{rmdir}, in tal +caso \param{pathname} deve essere una directory, che sarà rimossa qualora +risulti vuota. + + +\subsection{La funzione \func{fcntl}} +\label{sec:file_fcntl} + +Oltre alle operazioni base esaminate in sez.~\ref{sec:file_base_func} esistono +tutta una serie di operazioni ausiliarie che è possibile eseguire su un file +descriptor, che non riguardano la normale lettura e scrittura di dati, ma la +gestione sia delle loro proprietà, che di tutta una serie di ulteriori +funzionalità che il kernel può mettere a disposizione.\footnote{ad esempio si + gestiscono con questa funzione varie modalità di I/O asincrono (vedi + sez.~\ref{sec:file_asyncronous_operation}) e il \index{file!locking} + \textit{file locking} (vedi sez.~\ref{sec:file_locking}).} + +Per queste operazioni di manipolazione e di controllo delle varie proprietà e +caratteristiche di un file descriptor, viene usata la funzione \funcd{fcntl}, +il cui prototipo è: +\begin{functions} + \headdecl{unistd.h} + \headdecl{fcntl.h} + \funcdecl{int fcntl(int fd, int cmd)} + \funcdecl{int fcntl(int fd, int cmd, long arg)} + \funcdecl{int fcntl(int fd, int cmd, struct flock * lock)} + Esegue una delle possibili operazioni specificate da \param{cmd} + sul file \param{fd}. + + \bodydesc{La funzione ha valori di ritorno diversi a seconda + dell'operazione. In caso di errore il valore di ritorno è sempre $-1$ ed + il codice dell'errore è restituito nella variabile \var{errno}; i codici + possibili dipendono dal tipo di operazione, l'unico valido in generale è: + \begin{errlist} + \item[\errcode{EBADF}] \param{fd} non è un file aperto. + \end{errlist}} +\end{functions} + + +Il primo argomento della funzione è sempre il numero di file descriptor +\var{fd} su cui si vuole operare. Il comportamento di questa funzione, il +numero e il tipo degli argomenti, il valore di ritorno e gli eventuali errori +sono determinati dal valore dell'argomento \param{cmd} che in sostanza +corrisponde all'esecuzione di un determinato \textsl{comando}; in +sez.~\ref{sec:file_dup} abbiamo incontrato un esempio dell'uso di \func{fcntl} +per la duplicazione dei file descriptor, una lista di tutti i possibili valori +per \var{cmd} è riportata di seguito: +\begin{basedescript}{\desclabelwidth{2.0cm}} +\item[\const{F\_DUPFD}] trova il primo file descriptor disponibile di valore + maggiore o uguale ad \param{arg} e ne fa una copia di \param{fd}. Ritorna il + nuovo file descriptor in caso di successo e $-1$ in caso di errore. Gli + errori possibili sono \errcode{EINVAL} se \param{arg} è negativo o maggiore + del massimo consentito o \errcode{EMFILE} se il processo ha già raggiunto il + massimo numero di descrittori consentito. +\item[\const{F\_SETFD}] imposta il valore del \textit{file descriptor flag} al + valore specificato con \param{arg}. Al momento l'unico bit usato è quello di + \itindex{close-on-exec} \textit{close-on-exec}, identificato dalla costante + \const{FD\_CLOEXEC}, che serve a richiedere che il file venga chiuso nella + esecuzione di una \func{exec} (vedi sez.~\ref{sec:proc_exec}). Ritorna un + valore nullo in caso di successo e $-1$ in caso di errore. +\item[\const{F\_GETFD}] ritorna il valore del \textit{file descriptor flag} di + \param{fd} o $-1$ in caso di errore; se \const{FD\_CLOEXEC} è impostato i + file descriptor aperti vengono chiusi attraverso una \func{exec} altrimenti + (il comportamento predefinito) restano aperti. +\item[\const{F\_GETFL}] ritorna il valore del \textit{file status flag} in + caso di successo o $-1$ in caso di errore; permette cioè di rileggere quei + bit impostati da \func{open} all'apertura del file che vengono memorizzati + (quelli riportati nella prima e terza sezione di + tab.~\ref{tab:file_open_flags}). +\item[\const{F\_SETFL}] imposta il \textit{file status flag} al valore + specificato da \param{arg}, ritorna un valore nullo in caso di successo o + $-1$ in caso di errore. Possono essere impostati solo i bit riportati nella + terza sezione di tab.~\ref{tab:file_open_flags}.\footnote{la pagina di + manuale riporta come impostabili solo \const{O\_APPEND}, + \const{O\_NONBLOCK} e \const{O\_ASYNC}.} +\item[\const{F\_GETLK}] richiede un controllo sul file lock specificato da + \param{lock}, sovrascrivendo la struttura da esso puntata con il risultato; + ritorna un valore nullo in caso di successo o $-1$ in caso di errore. Questa + funzionalità è trattata in dettaglio in sez.~\ref{sec:file_posix_lock}. +\item[\const{F\_SETLK}] richiede o rilascia un file lock a seconda di quanto + specificato nella struttura puntata da \param{lock}. Se il lock è tenuto da + qualcun altro ritorna immediatamente restituendo $-1$ e imposta \var{errno} a + \errcode{EACCES} o \errcode{EAGAIN}, in caso di successo ritorna un valore + nullo. Questa funzionalità è trattata in dettaglio in + sez.~\ref{sec:file_posix_lock}. +\item[\const{F\_SETLKW}] identica a \const{F\_SETLK} eccetto per il fatto che + la funzione non ritorna subito ma attende che il blocco sia rilasciato. Se + l'attesa viene interrotta da un segnale la funzione restituisce $-1$ e + imposta \var{errno} a \errcode{EINTR}, in caso di successo ritorna un valore + nullo. Questa funzionalità è trattata in dettaglio in + sez.~\ref{sec:file_posix_lock}. +\item[\const{F\_GETOWN}] restituisce il \acr{pid} del processo o + l'identificatore del \itindex{process~group} \textit{process + group}\footnote{i \itindex{process~group} \textit{process group} sono + (vedi sez.~\ref{sec:sess_proc_group}) raggruppamenti di processi usati nel + controllo di sessione; a ciascuno di essi è associato un identificatore + (un numero positivo analogo al \acr{pid}).} che è preposto alla ricezione + dei segnali \const{SIGIO}\footnote{o qualunque altro segnale alternativo + impostato con \const{F\_FSETSIG}.} per gli eventi associati al file + descriptor \param{fd}\footnote{il segnale viene usato sia per il + \textit{Signal Drive I/O}, che tratteremo in + sez.~\ref{sec:file_asyncronous_operation}, e dai vari meccanismi di + notifica asincrona, che tratteremo in + sez.~\ref{sec:file_asyncronous_lease}.} e \const{SIGURG} per la notifica + dei dati urgenti di un socket.\footnote{vedi + sez.~\ref{sec:TCP_urgent_data}.} Nel caso di un \textit{process group} + viene restituito un valore negativo il cui valore assoluto corrisponde + all'identificatore del \itindex{process~group} \textit{process group}. In + caso di errore viene restituito $-1$. +\item[\const{F\_SETOWN}] imposta, con il valore dell'argomento \param{arg}, + l'identificatore del processo o del \itindex{process~group} \textit{process + group} che riceverà i segnali \const{SIGIO} e \const{SIGURG} per gli + eventi associati al file descriptor \param{fd}, ritorna un valore nullo in + caso di successo o $-1$ in caso di errore. Come per \const{F\_GETOWN}, per + impostare un \itindex{process~group} \textit{process group} si deve usare + per \param{arg} un valore negativo, il cui valore assoluto corrisponde + all'identificatore del \itindex{process~group} \textit{process group}. +\item[\const{F\_GETSIG}] restituisce il valore del segnale inviato quando ci + sono dati disponibili in ingresso su un file descriptor aperto ed impostato + per l'I/O asincrono (si veda sez.~\ref{sec:file_asyncronous_io}). Il valore 0 + indica il valore predefinito (che è \const{SIGIO}), un valore diverso da + zero indica il segnale richiesto, (che può essere anche lo stesso + \const{SIGIO}). In caso di errore ritorna $-1$. +\item[\const{F\_SETSIG}] imposta il segnale da inviare quando diventa + possibile effettuare I/O sul file descriptor in caso di I/O asincrono, + ritorna un valore nullo in caso di successo o $-1$ in caso di errore. Il + valore zero indica di usare il segnale predefinito, \const{SIGIO}. Un altro + valore diverso da zero (compreso lo stesso \const{SIGIO}) specifica il + segnale voluto; l'uso di un valore diverso da zero permette inoltre, se si è + installato il gestore del segnale come \var{sa\_sigaction} usando + \const{SA\_SIGINFO}, (vedi sez.~\ref{sec:sig_sigaction}), di rendere + disponibili al gestore informazioni ulteriori riguardo il file che ha + generato il segnale attraverso i valori restituiti in \struct{siginfo\_t} + (come vedremo in sez.~\ref{sec:file_asyncronous_io}).\footnote{i due comandi + \const{F\_SETSIG} e \const{F\_GETSIG} sono una estensione specifica di + Linux.} +\item[\const{F\_SETLEASE}] imposta o rimuove un \index{file!lease} + \textit{file lease}\footnote{questa è una nuova funzionalità, specifica di + Linux, e presente solo a partire dai kernel della serie 2.4.x, in cui il + processo che detiene un \textit{lease} su un file riceve una notifica + qualora un altro processo cerca di eseguire una \func{open} o una + \func{truncate} su di esso.} sul file descriptor \var{fd} a seconda del + valore del terzo argomento, che in questo caso è un \ctyp{int}, ritorna un + valore nullo in caso di successo o $-1$ in caso di errore. Questa + funzionalità avanzata è trattata in dettaglio in + sez.~\ref{sec:file_asyncronous_lease}. +\item[\const{F\_GETLEASE}] restituisce il tipo di \index{file!lease} + \textit{file lease} che il processo detiene nei confronti del file + descriptor \var{fd} o $-1$ in caso di errore. Con questo comando il terzo + argomento può essere omesso. Questa funzionalità avanzata è trattata in + dettaglio in sez.~\ref{sec:file_asyncronous_lease}. +\item[\const{F\_NOTIFY}] attiva un meccanismo di notifica per cui viene + riportata al processo chiamante, tramite il segnale \const{SIGIO} (o altro + segnale specificato con \const{F\_SETSIG}) ogni modifica eseguita o + direttamente sulla directory cui \var{fd} fa riferimento, o su uno dei file + in essa contenuti; ritorna un valore nullo in caso di successo o $-1$ in caso + di errore. Questa funzionalità avanzata, disponibile dai kernel della serie + 2.4.x, è trattata in dettaglio in sez.~\ref{sec:file_asyncronous_lease}. +\end{basedescript} + +La maggior parte delle funzionalità di \func{fcntl} sono troppo avanzate per +poter essere affrontate in tutti i loro aspetti a questo punto; saranno +pertanto riprese più avanti quando affronteremo le problematiche ad esse +relative. In particolare le tematiche relative all'I/O asincrono e ai vari +meccanismi di notifica saranno trattate in maniera esaustiva in +sez.~\ref{sec:file_asyncronous_access} mentre quelle relative al +\index{file!locking} \textit{file locking} saranno esaminate in +sez.~\ref{sec:file_locking}). L'uso di questa funzione con i socket verrà +trattato in sez.~\ref{sec:sock_ctrl_func}. + +Si tenga presente infine che quando si usa la funzione per determinare le +modalità di accesso con cui è stato aperto il file (attraverso l'uso del +comando \const{F\_GETFL}) è necessario estrarre i bit corrispondenti nel +\textit{file status flag} che si è ottenuto. Infatti la definizione corrente +di quest'ultimo non assegna bit separati alle tre diverse modalità +\const{O\_RDONLY}, \const{O\_WRONLY} e \const{O\_RDWR}.\footnote{in Linux + queste costanti sono poste rispettivamente ai valori 0, 1 e 2.} Per questo +motivo il valore della modalità di accesso corrente si ottiene eseguendo un +AND binario del valore di ritorno di \func{fcntl} con la maschera +\const{O\_ACCMODE} (anch'essa definita in \file{fcntl.h}), che estrae i bit di +accesso dal \textit{file status flag}. -L'interfaccia standard unix per l'input/output sui file è su cinque funzioni -\texttt{open}, \texttt{read}, \texttt{write}, \texttt{lseek}, \texttt{close} -\subsection{La funzione \texttt{open}} -\label{sec:fileunix_open} +\subsection{La funzione \func{ioctl}} +\label{sec:file_ioctl} -\subsection{La funzione \texttt{creat}} -\label{sec:fileunix_creat} +Benché il concetto di \textit{everything is a file} si sia dimostrato molto +valido anche per l'interazione con i dispositivi più vari, fornendo una +interfaccia che permette di interagire con essi tramite le stesse funzioni +usate per i normali file di dati, esisteranno sempre caratteristiche +peculiari, specifiche dell'hardware e della funzionalità che ciascun +dispositivo può provvedere, che non possono venire comprese in questa +interfaccia astratta (un caso tipico è l'impostazione della velocità di una +porta seriale, o le dimensioni di un framebuffer). -\subsection{La funzione \texttt{close}} -\label{sec:fileunix_close} +Per questo motivo nell'architettura del sistema è stata prevista l'esistenza +di una funzione apposita, \funcd{ioctl}, con cui poter compiere le operazioni +specifiche di ogni dispositivo particolare, usando come riferimento il solito +file descriptor. Il prototipo di questa funzione è: +\begin{prototype}{sys/ioctl.h}{int ioctl(int fd, int request, ...)} -\subsection{La funzione \texttt{lseek}} -\label{sec:fileunix_lseek} + Esegue l'operazione di controllo specificata da \param{request} sul file + descriptor \param{fd}. + + \bodydesc{La funzione nella maggior parte dei casi ritorna 0, alcune + operazioni usano però il valore di ritorno per restituire informazioni. In + caso di errore viene sempre restituito $-1$ ed \var{errno} assumerà uno dei + valori: + \begin{errlist} + \item[\errcode{ENOTTY}] il file \param{fd} non è associato con un + dispositivo, o la richiesta non è applicabile all'oggetto a cui fa + riferimento \param{fd}. + \item[\errcode{EINVAL}] gli argomenti \param{request} o \param{argp} non sono + validi. + \end{errlist} + ed inoltre \errval{EBADF} e \errval{EFAULT}.} +\end{prototype} -\subsection{La funzione \texttt{read}} -\label{sec:fileunix_read} +La funzione serve in sostanza come meccanismo generico per fare tutte quelle +operazioni che non rientrano nell'interfaccia ordinaria della gestione dei +file e che non è possibile effettuare con le funzioni esaminate finora. La +funzione richiede che si passi come primo argomento un file descriptor +regolarmente aperto, e l'operazione da compiere viene selezionata attraverso +il valore dell'argomento \param{request}. Il terzo argomento dipende +dall'operazione prescelta; tradizionalmente è specificato come \code{char * + argp}, da intendersi come puntatore ad un area di memoria +generica,\footnote{all'epoca della creazione di questa funzione infatti ancora + non era stato introdotto il tipo \ctyp{void}.} ma per certe operazioni può +essere omesso, e per altre è un semplice intero. -\subsection{La funzione \texttt{write}} -\label{sec:fileunix_write} +Normalmente la funzione ritorna zero in caso di successo e $-1$ in caso di +errore, ma per alcune operazione il valore di ritorno, che nel caso viene +impostato ad un valore positivo, può essere utilizzato come parametro di +uscita. È più comune comunque restituire i risultati all'indirizzo puntato dal +terzo argomento. -\section{La condivisione dei files} -\label{sec:fileunix_sharing} +Data la genericità dell'interfaccia non è possibile classificare in maniera +sistematica le operazioni che si possono gestire con \func{ioctl}, un breve +elenco di alcuni esempi di esse è il seguente: +\begin{itemize*} +\item il cambiamento dei font di un terminale. +\item l'esecuzione di una traccia audio di un CDROM. +\item i comandi di avanti veloce e riavvolgimento di un nastro. +\item il comando di espulsione di un dispositivo rimovibile. +\item l'impostazione della velocità trasmissione di una linea seriale. +\item l'impostazione della frequenza e della durata dei suoni emessi dallo + speaker. +\item l'impostazione degli attributi dei file su un filesystem + ext2.\footnote{i comandi \texttt{lsattr} e \texttt{chattr} fanno questo con + delle \func{ioctl} dedicate, usabili solo su questo filesystem e derivati + successivi (come ext3).} +\end{itemize*} +In generale ogni dispositivo ha un suo insieme di operazioni specifiche +effettuabili attraverso \func{ioctl}, tutte queste sono definite nell'header +file \file{sys/ioctl.h}, e devono essere usate solo sui dispositivi cui fanno +riferimento. Infatti anche se in genere i valori di \param{request} sono +opportunamente differenziati a seconda del dispositivo\footnote{il kernel usa + un apposito \textit{magic number} per distinguere ciascun dispositivo nella + definizione delle macro da usare per \param{request}, in modo da essere + sicuri che essi siano sempre diversi, ed il loro uso per dispositivi diversi + causi al più un errore. Si veda il capitolo quinto di \cite{LinDevDri} per + una trattazione dettagliata dell'argomento.} così che la richiesta di +operazioni relative ad altri dispositivi usualmente provoca il ritorno della +funzione con una condizione di errore, in alcuni casi, relativi a valori +assegnati prima che questa differenziazione diventasse pratica corrente, si +potrebbero usare valori validi anche per il dispositivo corrente, con effetti +imprevedibili o indesiderati. -\subsection{Operazioni atomiche} -\label{sec:fileunix_atomic} +Data la assoluta specificità della funzione, il cui comportamento varia da +dispositivo a dispositivo, non è possibile fare altro che dare una descrizione +sommaria delle sue caratteristiche; torneremo ad esaminare in +seguito\footnote{per l'uso di \func{ioctl} con i socket si veda + sez.~\ref{sec:sock_ctrl_func}.} quelle relative ad alcuni casi specifici (ad +esempio la gestione dei terminali è effettuata attraverso \func{ioctl} in +quasi tutte le implementazioni di Unix), qui riportiamo solo l'elenco delle +operazioni che sono predefinite per qualunque file,\footnote{in particolare + queste operazioni sono definite nel kernel a livello generale, e vengono + sempre interpretate per prime, per cui, come illustrato in \cite{LinDevDri}, + eventuali operazioni specifiche che usino lo stesso valore verrebbero + ignorate.} caratterizzate dal prefisso \texttt{FIO}: +\begin{basedescript}{\desclabelwidth{2.0cm}} +\item[\const{FIOCLEX}] imposta il flag di \itindex{close-on-exec} + \textit{close-on-exec} sul file, in questo caso, essendo usata come + operazione logica, \func{ioctl} non richiede un terzo argomento, il cui + eventuale valore viene ignorato. +\item[\const{FIONCLEX}] cancella il flag di \itindex{close-on-exec} + \textit{close-on-exec} sul file, in questo caso, essendo usata come + operazione logica, \func{ioctl} non richiede un terzo argomento, il cui + eventuale valore viene ignorato. +\item[\const{FIOASYNC}] abilita o disabilita la modalità di I/O asincrono sul + file (vedi sez.~\ref{sec:file_asyncronous_operation}); il terzo argomento + deve essere un puntatore ad un intero (cioè di tipo \texttt{const int *}) + che contiene un valore logico (un valore nullo disabilita, un valore non + nullo abilita). +\item[\const{FIONBIO}] abilita o disabilita sul file l'I/O in modalità non + bloccante; il terzo argomento deve essere un puntatore ad un intero (cioè di + tipo \texttt{const int *}) che contiene un valore logico (un valore nullo + disabilita, un valore non nullo abilita). +\item[\const{FIOSETOWN}] imposta il processo che riceverà i segnali + \const{SIGURG} e \const{SIGIO} generati sul file; il terzo argomento deve + essere un puntatore ad un intero (cioè di tipo \texttt{const int *}) il cui + valore specifica il PID del processo. +\item[\const{FIOGETOWN}] legge il processo che riceverà i segnali + \const{SIGURG} e \const{SIGIO} generati sul file; il terzo argomento deve + essere un puntatore ad un intero (cioè di tipo \texttt{int *}) su cui sarà + scritto il PID del processo. +\item[\const{FIONREAD}] legge il numero di byte disponibili in lettura sul + file descriptor;\footnote{questa operazione è disponibile solo su alcuni + file descriptor, in particolare sui socket (vedi + sez.~\ref{sec:sock_ioctl_IP}) o sui file descriptor di \textit{epoll} + (vedi sez.~\ref{sec:file_epoll}).} il terzo argomento deve essere un + puntatore ad un intero (cioè di tipo \texttt{int *}) su cui sarà restituito + il valore. +\item[\const{FIOQSIZE}] restituisce la dimensione corrente di un file o di una + directory, mentre se applicata ad un dispositivo fallisce con un errore di + \errcode{ENOTTY}; il terzo argomento deve essere un puntatore ad un intero + (cioè di tipo \texttt{int *}) su cui sarà restituito il valore. +\end{basedescript} -\section{Funzioni avanzate} -\label{sec:fileunix_adv_func} +% TODO aggiungere FIBMAP e FIEMAP, vedi http://lwn.net/Articles/260832 -\subsection{La funzioni \texttt{dup} e \texttt{dup2}} -\label{sec:fileunix_dup} -\subsection{La funzione \texttt{fcntl}} -\label{sec:fileunix_fcntl} +Si noti però come la gran parte di queste operazioni specifiche dei file (per +essere precisi le prime sei dell'elenco) siano effettuabili in maniera +generica anche tramite l'uso di \func{fcntl}. Le due funzioni infatti sono +molto simili e la presenza di questa sovrapposizione è principalmente dovuta +al fatto che alle origini di Unix i progettisti considerarono che era +necessario trattare diversamente rispetto alle operazione di controllo delle +modalità di I/O file e dispositivi usando \func{fcntl} per i primi e +\func{ioctl} per i secondi;\footnote{all'epoca tra l'altro i dispositivi che + usavano \func{ioctl} erano sostanzialmente solo i terminali, il che spiega + l'uso comune di \errcode{ENOTTY} come codice di errore.} oggi non è più così +ma le due funzioni sono rimaste. -\subsection{La funzione \texttt{fcntl}} -\label{sec:fileunix_ioctl} +% TODO trovare qualche posto per la eventuale documentazione delle seguenti +% (bassa/bassissima priorità) +% EXT4_IOC_MOVE_EXT (dal 2.6.31) +% LocalWords: descriptor system call cap like kernel sez l'inode inode VFS tab +% LocalWords: process table struct files flags pos all'inode dentry fig shell +% LocalWords: error POSIX STDIN FILENO STDOUT STDERR unistd read write lseek +% LocalWords: close pathname sys fcntl int const char errno EEXIST CREAT EXCL +% LocalWords: EISDIR ENOTDIR ENXIO NOBLOCK WRONLY fifo ENODEV ETXTBSY ELOOP of +% LocalWords: NOFOLLOW EACCES ENAMETOOLONG ENOENT EROFS EFAULT ENOSPC ENOMEM +% LocalWords: EMFILE ENFILE NFS lock race condition Denial Service DoS RDONLY +% LocalWords: glibc RDWR NONBLOCK NOCTTY SHLOCK shared BSD EXLOCK TRUNC device +% LocalWords: opendir LARGEFILE APPEND append NDELAY ASYNC l'I SIGIO SYNC SVr +% LocalWords: DSYNC RSYNC filesystem DIRECT caching SGI IRIX dell'I FreeBSD fd +% LocalWords: fork exec umask SOURCE creat filedes EBADF EINTR EIO locking off +% LocalWords: behind sync flush shutdown whence ESPIPE socket EINVAL INCR XTND +% LocalWords: SEEK CUR EPIPE ssize void buf size count EAGAIN EWOULDBLOCK log +% LocalWords: Specification pwrite pread EFBIG SIGPIPE nell'inode dall'inode +% LocalWords: CLOEXEC stat fsync cache update l'update bdflush Documentation +% LocalWords: fdatasync fstat ext dup oldfd newfd DUPFD cmd long arg flock pid +% LocalWords: SETFD GETFD GETFL SETFL GETLK SETLK SETLKW GETOWN group SIGURG +% LocalWords: SETOWN GETSIG SETSIG sigaction SIGINFO siginfo SETLEASE lease is +% LocalWords: truncate GETLEASE NOTIFY AND ACCMODE ioctl everything argp all'I +% LocalWords: framebuffer request ENOTTY CDROM nell'header magic number openat +% LocalWords: FIOCLEX FIONCLEX FIOASYNC FIONBIO NOATIME redirezione FIOSETOWN +% LocalWords: FIOGETOWN FIONREAD mkdirat thread Solaris mkdir at Urlich proc +% LocalWords: Drepper path dirfd faccessat unlinkat access fchmodat chmod Di +% LocalWords: fchownat chown fstatat futimesat utimes linkat mknodat mknod uid +% LocalWords: readlinkat readlink renameat rename symlinkat symlink unlink gid +% LocalWords: mkfifoat mkfifo FDCWD EACCESS dereferenziazione rmdir REMOVEDIR +% LocalWords: epoll lsattr chattr FIOQSIZE ATFILE lutimes utimensat lchown +% LocalWords: lstat owner FOLLOW +%%% Local Variables: +%%% mode: latex +%%% TeX-master: "gapil" +%%% End: