Esamineremo in questo capitolo la prima delle due interfacce di programmazione
-per i file, quella dei \index{file!descriptor} \textit{file descriptor},
+per i file, quella dei \itindex{file~descriptor} \textit{file descriptor},
nativa di Unix. Questa è l'interfaccia di basso livello provvista direttamente
dalle system call, che non prevede funzionalità evolute come la
bufferizzazione o funzioni di lettura o scrittura formattata, e sulla quale è
\subsection{L'architettura dei \textit{file descriptor}}
\label{sec:file_fd}
-\index{file!descriptor|(}
+\itindbeg{file~descriptor}
Per poter accedere al contenuto di un file occorre creare un canale di
comunicazione con il kernel che renda possibile operare su di esso (si ricordi
quanto visto in sez.~\ref{sec:file_vfs_work}). Questo si fa aprendo il file
-con la funzione \func{open} che provvederà a localizzare \index{inode} l'inode
+con la funzione \func{open} che provvederà a localizzare \itindex{inode} l'inode
del file e inizializzare i puntatori che rendono disponibili le funzioni che
il VFS mette a disposizione (riportate in
tab.~\ref{tab:file_file_operations}). Una volta terminate le operazioni, il
La \itindex{process~table} \textit{process table} è una tabella che contiene
una voce per ciascun processo attivo nel sistema. In Linux ciascuna voce è
-costituita da una struttura di tipo \struct{task\_struct} nella quale sono
+costituita da una struttura di tipo \kstruct{task\_struct} nella quale sono
raccolte tutte le informazioni relative al processo; fra queste informazioni
c'è anche il puntatore ad una ulteriore struttura di tipo
-\struct{files\_struct}, in cui sono contenute le informazioni relative ai file
-che il processo ha aperto, ed in particolare:
+\kstruct{files\_struct}, in cui sono contenute le informazioni relative ai
+file che il processo ha aperto, ed in particolare:
\begin{itemize*}
\item i flag relativi ai file descriptor.
\item il numero di file aperti.
\item lo stato del file (nel campo \var{f\_flags}).
\item il valore della posizione corrente (l'\textit{offset}) nel file (nel
campo \var{f\_pos}).
-\item un puntatore \index{inode} all'inode\footnote{nel kernel 2.4.x si è in
+\item un puntatore \itindex{inode} all'inode\footnote{nel kernel 2.4.x si è in
realtà passati ad un puntatore ad una struttura \struct{dentry} che punta
- a sua volta \index{inode} all'inode passando per la nuova struttura del
+ a sua volta \itindex{inode} all'inode passando per la nuova struttura del
VFS.} del file.
%\item un puntatore alla tabella delle funzioni \footnote{la struttura
% \var{f\_op} descritta in sez.~\ref{sec:file_vfs_work}} che si possono usare
capire i dettagli del funzionamento dell'interfaccia dei \textit{file
descriptor}.
-\index{file!descriptor|)}
-
-\begin{figure}[htb]
+\begin{figure}[!htb]
\centering
\includegraphics[width=13cm]{img/procfile}
\caption{Schema della architettura dell'accesso ai file attraverso
\label{fig:file_proc_file}
\end{figure}
+\itindend{file~descriptor}
\subsection{I file standard}
In tutti i sistemi unix-like esiste una convenzione generale per cui ogni
processo viene lanciato dalla shell con almeno tre file aperti. Questi, per
-quanto appena detto, avranno come \index{file!descriptor} \textit{file
+quanto appena detto, avranno come \itindex{file~descriptor} \textit{file
descriptor} i valori 0, 1 e 2. Benché questa sia soltanto una convenzione,
essa è seguita dalla gran parte delle applicazioni, e non aderirvi potrebbe
portare a gravi problemi di interoperabilità.
\footnotesize
\begin{tabular}[c]{|l|l|}
\hline
- \textbf{Costante} & \textbf{Significato} \\
+ \textbf{File} & \textbf{Significato} \\
\hline
\hline
\const{STDIN\_FILENO} & \textit{file descriptor} dello \textit{standard
facendo riferimento ad un programma in cui lo \textit{standard input} è
associato ad un file mentre lo \textit{standard output} e lo \textit{standard
error} sono entrambi associati ad un altro file (e quindi utilizzano lo
-stesso \index{inode} inode).
+stesso \itindex{inode} inode).
Nelle vecchie versioni di Unix (ed anche in Linux fino al kernel 2.0.x) il
numero di file aperti era anche soggetto ad un limite massimo dato dalle
dimensioni del vettore di puntatori con cui era realizzata la tabella dei file
-descriptor dentro \struct{file\_struct}; questo limite intrinseco nei kernel
+descriptor dentro \kstruct{files\_struct}; questo limite intrinseco nei kernel
più recenti non sussiste più, dato che si è passati da un vettore ad una
lista, ma restano i limiti imposti dall'amministratore (vedi
sez.~\ref{sec:sys_limits}).
La funzione \funcd{open} è la funzione fondamentale per accedere ai file, ed è
quella che crea l'associazione fra un \itindex{pathname} \textit{pathname} ed
-un \index{file!descriptor} file descriptor, il suo prototipo è:
+un \itindex{file~descriptor} file descriptor, il suo prototipo è:
\begin{functions}
\headdecl{sys/types.h}
\headdecl{sys/stat.h}
\const{O\_NONBLOCK}.\\
\const{O\_ASYNC} & Apre il file per l'I/O in modalità asincrona (vedi
sez.~\ref{sec:file_asyncronous_io}). Quando è
- impostato viene generato il segnale \const{SIGIO}
+ impostato viene generato il segnale \signal{SIGIO}
tutte le volte che sono disponibili dati in input
sul file.\\
\const{O\_SYNC} & Apre il file per l'input/output sincrono: ogni
\end{prototype}
La chiusura di un file rilascia ogni blocco (il \textit{file locking}
-\index{file!locking} è trattato in sez.~\ref{sec:file_locking}) che il
+\itindex{file~locking} è trattato in sez.~\ref{sec:file_locking}) che il
processo poteva avere acquisito su di esso; se \param{fd} è l'ultimo
riferimento (di eventuali copie) ad un file aperto, tutte le risorse nella
\itindex{file~table} \textit{file table} vengono rilasciate. Infine se il file
per ottenere la nuova posizione corrente.
\end{basedescript}
+% TODO, trattare, SEEK_HOLE e SEEK_DATA, inclusi nel kernel 3.1, vedi
+% http://lwn.net/Articles/439623/
+
+
Si tenga presente che la chiamata a \func{lseek} non causa nessun accesso al
file, si limita a modificare la posizione corrente (cioè il valore
\var{f\_pos} in \param{file}, vedi fig.~\ref{fig:file_proc_file}). Dato che
processo o su una posizione oltre il massimo consentito.
\item[\errcode{EPIPE}] \param{fd} è connesso ad una pipe il cui altro capo è
chiuso in lettura; in questo caso viene anche generato il segnale
- \const{SIGPIPE}, se questo viene gestito (o bloccato o ignorato) la
+ \signal{SIGPIPE}, se questo viene gestito (o bloccato o ignorato) la
funzione ritorna questo errore.
\item[\errcode{EINTR}] si è stati interrotti da un segnale prima di aver
potuto scrivere qualsiasi dato.
esamineremo ora in dettaglio le conseguenze che questa architettura ha nei
confronti dell'accesso allo stesso file da parte di processi diversi.
-\begin{figure}[htb]
+\begin{figure}[!htb]
\centering
\includegraphics[width=15cm]{img/filemultacc}
\caption{Schema dell'accesso allo stesso file da parte di due processi
processo avrà una sua voce nella \textit{file table} referenziata da un
diverso file descriptor nella sua \struct{file\_struct}. Entrambe le voci
nella \itindex{file~table} \textit{file table} faranno però riferimento allo
-stesso \index{inode} inode su disco.
+stesso \itindex{inode} inode su disco.
Questo significa che ciascun processo avrà la sua posizione corrente sul file,
la sua modalità di accesso e versioni proprie di tutte le proprietà che
\item ciascun processo può scrivere indipendentemente; dopo ciascuna
\func{write} la posizione corrente sarà cambiata solo nel processo. Se la
scrittura eccede la dimensione corrente del file questo verrà esteso
- automaticamente con l'aggiornamento del campo \var{i\_size} \index{inode}
+ automaticamente con l'aggiornamento del campo \var{i\_size} \itindex{inode}
nell'inode.
\item se un file è in modalità \itindex{append~mode} \const{O\_APPEND} tutte
le volte che viene effettuata una scrittura la posizione corrente viene
- prima impostata alla dimensione corrente del file letta \index{inode}
+ prima impostata alla dimensione corrente del file letta \itindex{inode}
dall'inode. Dopo la scrittura il file viene automaticamente esteso.
\item l'effetto di \func{lseek} è solo quello di cambiare il campo
\var{f\_pos} nella struttura \struct{file} della \itindex{file~table}
\textit{file table}, non c'è nessuna operazione sul file su disco. Quando la
si usa per porsi alla fine del file la posizione viene impostata leggendo la
- dimensione corrente \index{inode} dall'inode.
+ dimensione corrente \itindex{inode} dall'inode.
\end{itemize}
-\begin{figure}[htb]
+\begin{figure}[!htb]
\centering
\includegraphics[width=15cm]{img/fileshar}
\caption{Schema dell'accesso ai file da parte di un processo figlio}
maniera imprevedibile. Il sistema però fornisce in alcuni casi la possibilità
di eseguire alcune operazioni di scrittura in maniera coordinata anche senza
utilizzare meccanismi di sincronizzazione più complessi (come il
-\index{file!locking} \textit{file locking}, che esamineremo in
+\itindex{file~locking} \textit{file locking}, che esamineremo in
sez.~\ref{sec:file_locking}).
Un caso tipico di necessità di accesso condiviso in scrittura è quello in cui
in Linux il valore utilizzato è di 5 secondi; con le nuove versioni\footnote{a
partire dal kernel 2.2.8} poi, è il kernel che si occupa direttamente di
tutto quanto attraverso il demone interno \cmd{bdflush}, il cui comportamento
-può essere controllato attraverso il file \procfile{/proc/sys/vm/bdflush} (per
+può essere controllato attraverso il file \sysctlfile{vm/bdflush} (per
il significato dei valori si può leggere la documentazione allegata al kernel
in \file{Documentation/sysctl/vm.txt}).
file specificato, ed attendono fino alla conclusione delle operazioni;
\func{fsync} forza anche la sincronizzazione dei meta-dati del file (che
riguardano sia le modifiche alle tabelle di allocazione dei settori, che gli
-altri dati contenuti \index{inode} nell'inode che si leggono con \func{fstat},
+altri dati contenuti \itindex{inode} nell'inode che si leggono con \func{fstat},
come i tempi del file).
Si tenga presente che questo non comporta la sincronizzazione della
alla stessa voce nella \textit{file table}; per questo si dice che il nuovo
file descriptor è \textsl{duplicato}, da cui il nome della funzione.
-\begin{figure}[htb]
+\begin{figure}[!htb]
\centering \includegraphics[width=14cm]{img/filedup}
\caption{Schema dell'accesso ai file duplicati}
\label{fig:file_dup}
Per risolvere questi problemi, riprendendo una interfaccia già presente in
Solaris, a fianco delle normali funzioni che operano sui file (come
\func{open}, \func{mkdir}, ecc.) sono state introdotte delle ulteriori
-funzioni, contraddistinte dal suffisso \texttt{at}, che permettono l'apertura
-di un file (o le rispettive altre operazioni) usando un pathname relativo ad
-una directory specificata.\footnote{l'introduzione è avvenuta su proposta
- dello sviluppatore principale delle \acr{glibc} Urlich Drepper; le
- corrispondenti system call sono state inserite nel kernel ufficiale a
- partire dalla versione 2.6.16, in precedenza era disponibile una emulazione
- che, sia pure con prestazioni inferiori, funzionava facendo ricorso all'uso
- del filesystem \textit{proc} con l'apertura del file attraverso il
- riferimento a pathname del tipo di
+funzioni, dette anche funzioni ``\textit{at}'' in quanto contraddistinte dal
+suffisso \texttt{at}, che permettono l'apertura di un file (o le rispettive
+altre operazioni) usando un pathname relativo ad una directory
+specificata.\footnote{l'introduzione è avvenuta su proposta dello sviluppatore
+ principale delle \acr{glibc} Urlich Drepper; le corrispondenti system call
+ sono state inserite nel kernel ufficiale a partire dalla versione 2.6.16, in
+ precedenza era disponibile una emulazione che, sia pure con prestazioni
+ inferiori, funzionava facendo ricorso all'uso del filesystem \textit{proc}
+ con l'apertura del file attraverso il riferimento a pathname del tipo di
\texttt{/proc/self/fd/dirfd/relative\_path}.} Benché queste funzioni non
siano presenti negli standard tradizionali esse sono state adottate da vari
Unix\footnote{oltre a Linux e Solaris sono presenti in vari BSD.} fino ad
esso può essere specificato come maschera binaria di due valori:
\begin{basedescript}{\desclabelwidth{3.0cm}}
\item[\const{AT\_EACCESS}] se impostato \funcd{faccessat} esegue il controllo
- dei permessi usando l'\textsl{user-ID effettivo} invece di quello reale (il
+ dei permessi usando l'\acr{uid} effettivo invece di quello reale (il
comportamento di default, che riprende quello di \func{access}).
\item[\const{AT\_SYMLINK\_NOFOLLOW}] se impostato \funcd{faccessat} non esegue
la dereferenziazione dei link simbolici, effettuando il controllo dei
gestione sia delle loro proprietà, che di tutta una serie di ulteriori
funzionalità che il kernel può mettere a disposizione.\footnote{ad esempio si
gestiscono con questa funzione varie modalità di I/O asincrono (vedi
- sez.~\ref{sec:file_asyncronous_operation}) e il \index{file!locking}
+ sez.~\ref{sec:file_asyncronous_operation}) e il \itindex{file~locking}
\textit{file locking} (vedi sez.~\ref{sec:file_locking}).}
Per queste operazioni di manipolazione e di controllo delle varie proprietà e
(vedi sez.~\ref{sec:sess_proc_group}) raggruppamenti di processi usati nel
controllo di sessione; a ciascuno di essi è associato un identificatore
(un numero positivo analogo al \acr{pid}).} che è preposto alla ricezione
- dei segnali \const{SIGIO}\footnote{o qualunque altro segnale alternativo
+ dei segnali \signal{SIGIO}\footnote{o qualunque altro segnale alternativo
impostato con \const{F\_FSETSIG}.} per gli eventi associati al file
descriptor \param{fd}\footnote{il segnale viene usato sia per il
\textit{Signal Drive I/O}, che tratteremo in
sez.~\ref{sec:file_asyncronous_operation}, e dai vari meccanismi di
notifica asincrona, che tratteremo in
- sez.~\ref{sec:file_asyncronous_lease}.} e \const{SIGURG} per la notifica
+ sez.~\ref{sec:file_asyncronous_lease}.} e \signal{SIGURG} per la notifica
dei dati urgenti di un socket.\footnote{vedi
sez.~\ref{sec:TCP_urgent_data}.} Nel caso di un \textit{process group}
viene restituito un valore negativo il cui valore assoluto corrisponde
caso di errore viene restituito $-1$.
\item[\const{F\_SETOWN}] imposta, con il valore dell'argomento \param{arg},
l'identificatore del processo o del \itindex{process~group} \textit{process
- group} che riceverà i segnali \const{SIGIO} e \const{SIGURG} per gli
+ group} che riceverà i segnali \signal{SIGIO} e \signal{SIGURG} per gli
eventi associati al file descriptor \param{fd}, ritorna un valore nullo in
caso di successo o $-1$ in caso di errore. Come per \const{F\_GETOWN}, per
impostare un \itindex{process~group} \textit{process group} si deve usare
\item[\const{F\_GETSIG}] restituisce il valore del segnale inviato quando ci
sono dati disponibili in ingresso su un file descriptor aperto ed impostato
per l'I/O asincrono (si veda sez.~\ref{sec:file_asyncronous_io}). Il valore 0
- indica il valore predefinito (che è \const{SIGIO}), un valore diverso da
+ indica il valore predefinito (che è \signal{SIGIO}), un valore diverso da
zero indica il segnale richiesto, (che può essere anche lo stesso
- \const{SIGIO}). In caso di errore ritorna $-1$.
+ \signal{SIGIO}). In caso di errore ritorna $-1$.
\item[\const{F\_SETSIG}] imposta il segnale da inviare quando diventa
possibile effettuare I/O sul file descriptor in caso di I/O asincrono,
ritorna un valore nullo in caso di successo o $-1$ in caso di errore. Il
- valore zero indica di usare il segnale predefinito, \const{SIGIO}. Un altro
- valore diverso da zero (compreso lo stesso \const{SIGIO}) specifica il
+ valore zero indica di usare il segnale predefinito, \signal{SIGIO}. Un altro
+ valore diverso da zero (compreso lo stesso \signal{SIGIO}) specifica il
segnale voluto; l'uso di un valore diverso da zero permette inoltre, se si è
installato il gestore del segnale come \var{sa\_sigaction} usando
\const{SA\_SIGINFO}, (vedi sez.~\ref{sec:sig_sigaction}), di rendere
(come vedremo in sez.~\ref{sec:file_asyncronous_io}).\footnote{i due comandi
\const{F\_SETSIG} e \const{F\_GETSIG} sono una estensione specifica di
Linux.}
-\item[\const{F\_SETLEASE}] imposta o rimuove un \index{file!lease}
+\item[\const{F\_SETLEASE}] imposta o rimuove un \itindex{file~lease}
\textit{file lease}\footnote{questa è una nuova funzionalità, specifica di
Linux, e presente solo a partire dai kernel della serie 2.4.x, in cui il
processo che detiene un \textit{lease} su un file riceve una notifica
valore nullo in caso di successo o $-1$ in caso di errore. Questa
funzionalità avanzata è trattata in dettaglio in
sez.~\ref{sec:file_asyncronous_lease}.
-\item[\const{F\_GETLEASE}] restituisce il tipo di \index{file!lease}
+\item[\const{F\_GETLEASE}] restituisce il tipo di \itindex{file~lease}
\textit{file lease} che il processo detiene nei confronti del file
descriptor \var{fd} o $-1$ in caso di errore. Con questo comando il terzo
argomento può essere omesso. Questa funzionalità avanzata è trattata in
dettaglio in sez.~\ref{sec:file_asyncronous_lease}.
\item[\const{F\_NOTIFY}] attiva un meccanismo di notifica per cui viene
- riportata al processo chiamante, tramite il segnale \const{SIGIO} (o altro
+ riportata al processo chiamante, tramite il segnale \signal{SIGIO} (o altro
segnale specificato con \const{F\_SETSIG}) ogni modifica eseguita o
direttamente sulla directory cui \var{fd} fa riferimento, o su uno dei file
in essa contenuti; ritorna un valore nullo in caso di successo o $-1$ in caso
relative. In particolare le tematiche relative all'I/O asincrono e ai vari
meccanismi di notifica saranno trattate in maniera esaustiva in
sez.~\ref{sec:file_asyncronous_access} mentre quelle relative al
-\index{file!locking} \textit{file locking} saranno esaminate in
+\itindex{file~locking} \textit{file locking} saranno esaminate in
sez.~\ref{sec:file_locking}). L'uso di questa funzione con i socket verrà
trattato in sez.~\ref{sec:sock_ctrl_func}.
tipo \texttt{const int *}) che contiene un valore logico (un valore nullo
disabilita, un valore non nullo abilita).
\item[\const{FIOSETOWN}] imposta il processo che riceverà i segnali
- \const{SIGURG} e \const{SIGIO} generati sul file; il terzo argomento deve
+ \signal{SIGURG} e \signal{SIGIO} generati sul file; il terzo argomento deve
essere un puntatore ad un intero (cioè di tipo \texttt{const int *}) il cui
valore specifica il PID del processo.
\item[\const{FIOGETOWN}] legge il processo che riceverà i segnali
- \const{SIGURG} e \const{SIGIO} generati sul file; il terzo argomento deve
+ \signal{SIGURG} e \signal{SIGIO} generati sul file; il terzo argomento deve
essere un puntatore ad un intero (cioè di tipo \texttt{int *}) su cui sarà
scritto il PID del processo.
\item[\const{FIONREAD}] legge il numero di byte disponibili in lettura sul
% TODO aggiungere FIBMAP e FIEMAP, vedi http://lwn.net/Articles/260832
-
Si noti però come la gran parte di queste operazioni specifiche dei file (per
essere precisi le prime sei dell'elenco) siano effettuabili in maniera
generica anche tramite l'uso di \func{fcntl}. Le due funzioni infatti sono