X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=fileadv.tex;h=8b979cb3780e0ebae471a271497d36bc3d67db62;hp=647822a1fb9385156a2e17e297ff6748e408944b;hb=beece18eba2dcc2a9b915dab61277df8685a3da6;hpb=4e1da5b259a86278710be32441de7b88b9287ec1 diff --git a/fileadv.tex b/fileadv.tex index 647822a..8b979cb 100644 --- a/fileadv.tex +++ b/fileadv.tex @@ -1,6 +1,6 @@ %% fileadv.tex %% -%% Copyright (C) 2000-2011 Simone Piccardi. Permission is granted to +%% Copyright (C) 2000-2014 Simone Piccardi. Permission is granted to %% copy, distribute and/or modify this document under the terms of the GNU Free %% Documentation License, Version 1.1 or any later version published by the %% Free Software Foundation; with the Invariant Sections being "Un preambolo", @@ -24,14 +24,14 @@ controllo più dettagliato delle modalità di I/O. \section{Il \textit{file locking}} \label{sec:file_locking} -\index{file!locking|(} +\itindbeg{file~locking} -In sez.~\ref{sec:file_sharing} abbiamo preso in esame le modalità in cui un -sistema unix-like gestisce la condivisione dei file da parte di processi -diversi. In quell'occasione si è visto come, con l'eccezione dei file aperti -in \itindex{append~mode} \textit{append mode}, quando più processi scrivono -contemporaneamente sullo stesso file non è possibile determinare la sequenza -in cui essi opereranno. +In sez.~\ref{sec:file_shared_access} abbiamo preso in esame le modalità in cui +un sistema unix-like gestisce l'accesso concorrente ai file da parte di +processi diversi. In quell'occasione si è visto come, con l'eccezione dei file +aperti in \itindex{append~mode} \textit{append mode}, quando più processi +scrivono contemporaneamente sullo stesso file non è possibile determinare la +sequenza in cui essi opereranno. Questo causa la possibilità di una \itindex{race~condition} \textit{race condition}; in generale le situazioni più comuni sono due: l'interazione fra @@ -223,16 +223,16 @@ fondamentale da capire è che un \textit{file lock}, qualunque sia l'interfaccia che si usa, anche se richiesto attraverso un file descriptor, agisce sempre su di un file; perciò le informazioni relative agli eventuali \textit{file lock} sono mantenute dal kernel a livello di -inode\index{inode},\footnote{in particolare, come accennato in +inode\itindex{inode},\footnote{in particolare, come accennato in fig.~\ref{fig:file_flock_struct}, i \textit{file lock} sono mantenuti in una \itindex{linked~list} \textit{linked list} di strutture - \struct{file\_lock}. La lista è referenziata dall'indirizzo di partenza - mantenuto dal campo \var{i\_flock} della struttura \struct{inode} (per le - definizioni esatte si faccia riferimento al file \file{fs.h} nei sorgenti - del kernel). Un bit del campo \var{fl\_flags} di specifica se si tratta di - un lock in semantica BSD (\const{FL\_FLOCK}) o POSIX (\const{FL\_POSIX}).} -dato che questo è l'unico riferimento in comune che possono avere due processi -diversi che aprono lo stesso file. + \kstruct{file\_lock}. La lista è referenziata dall'indirizzo di partenza + mantenuto dal campo \var{i\_flock} della struttura \kstruct{inode} (per le + definizioni esatte si faccia riferimento al file \file{include/linux/fs.h} + nei sorgenti del kernel). Un bit del campo \var{fl\_flags} di specifica se + si tratta di un lock in semantica BSD (\const{FL\_FLOCK}) o POSIX + (\const{FL\_POSIX}).} dato che questo è l'unico riferimento in comune che +possono avere due processi diversi che aprono lo stesso file. \begin{figure}[!htb] \centering @@ -244,14 +244,14 @@ diversi che aprono lo stesso file. La richiesta di un \textit{file lock} prevede una scansione della lista per determinare se l'acquisizione è possibile, ed in caso positivo l'aggiunta di -un nuovo elemento.\footnote{cioè una nuova struttura \struct{file\_lock}.} +un nuovo elemento.\footnote{cioè una nuova struttura \kstruct{file\_lock}.} Nel caso dei blocchi creati con \func{flock} la semantica della funzione prevede che sia \func{dup} che \func{fork} non creino ulteriori istanze di un \textit{file lock} quanto piuttosto degli ulteriori riferimenti allo stesso. Questo viene realizzato dal kernel secondo lo schema di fig.~\ref{fig:file_flock_struct}, associando ad ogni nuovo \textit{file lock} un puntatore\footnote{il puntatore è mantenuto nel campo \var{fl\_file} di - \struct{file\_lock}, e viene utilizzato solo per i \textit{file lock} creati + \kstruct{file\_lock}, e viene utilizzato solo per i \textit{file lock} creati con la semantica BSD.} alla voce nella \itindex{file~table} \textit{file table} da cui si è richiesto il blocco, che così ne identifica il titolare. @@ -260,8 +260,8 @@ Questa struttura prevede che, quando si richiede la rimozione di un file descriptor che fa riferimento ad una voce nella \itindex{file~table} \textit{file table} corrispondente a quella registrata nel blocco. Allora se ricordiamo quanto visto in sez.~\ref{sec:file_dup} e -sez.~\ref{sec:file_sharing}, e cioè che i file descriptor duplicati e quelli -ereditati in un processo figlio puntano sempre alla stessa voce nella +sez.~\ref{sec:file_shared_access}, e cioè che i file descriptor duplicati e +quelli ereditati in un processo figlio puntano sempre alla stessa voce nella \itindex{file~table} \textit{file table}, si può capire immediatamente quali sono le conseguenze nei confronti delle funzioni \func{dup} e \func{fork}. @@ -296,8 +296,8 @@ descriptor, il \textit{file lock} non viene rilasciato. La seconda interfaccia per l'\textit{advisory locking} disponibile in Linux è quella standardizzata da POSIX, basata sulla funzione \func{fcntl}. Abbiamo già trattato questa funzione nelle sue molteplici possibilità di utilizzo in -sez.~\ref{sec:file_fcntl}. Quando la si impiega per il \textit{file locking} -essa viene usata solo secondo il seguente prototipo: +sez.~\ref{sec:file_fcntl_ioctl}. Quando la si impiega per il \textit{file + locking} essa viene usata solo secondo il seguente prototipo: \begin{prototype}{fcntl.h}{int fcntl(int fd, int cmd, struct flock *lock)} Applica o rimuove un \textit{file lock} sul file \param{fd}. @@ -385,13 +385,14 @@ riportate in tab.~\ref{tab:file_flock_type}, che permettono di richiedere rispettivamente uno \textit{shared lock}, un \textit{esclusive lock}, e la rimozione di un blocco precedentemente acquisito. Infine il campo \var{l\_pid} viene usato solo in caso di lettura, quando si chiama \func{fcntl} con -\const{F\_GETLK}, e riporta il \acr{pid} del processo che detiene il +\const{F\_GETLK}, e riporta il \ids{PID} del processo che detiene il \textit{file lock}. Oltre a quanto richiesto tramite i campi di \struct{flock}, l'operazione effettivamente svolta dalla funzione è stabilita dal valore dall'argomento -\param{cmd} che, come già riportato in sez.~\ref{sec:file_fcntl}, specifica -l'azione da compiere; i valori relativi al \textit{file locking} sono tre: +\param{cmd} che, come già riportato in sez.~\ref{sec:file_fcntl_ioctl}, +specifica l'azione da compiere; i valori relativi al \textit{file locking} +sono tre: \begin{basedescript}{\desclabelwidth{2.0cm}} \item[\const{F\_GETLK}] verifica se il \textit{file lock} specificato dalla struttura puntata da \param{lock} può essere acquisito: in caso negativo @@ -460,16 +461,16 @@ sez.~\ref{sec:file_flock}) esaminiamo più in dettaglio come viene gestito dal kernel. Lo schema delle strutture utilizzate è riportato in fig.~\ref{fig:file_posix_lock}; come si vede esso è molto simile all'analogo di fig.~\ref{fig:file_flock_struct}:\footnote{in questo caso nella figura si - sono evidenziati solo i campi di \struct{file\_lock} significativi per la + sono evidenziati solo i campi di \kstruct{file\_lock} significativi per la semantica POSIX, in particolare adesso ciascuna struttura contiene, oltre al - \acr{pid} del processo in \var{fl\_pid}, la sezione di file che viene + \ids{PID} del processo in \var{fl\_pid}, la sezione di file che viene bloccata grazie ai campi \var{fl\_start} e \var{fl\_end}. La struttura è comunque la stessa, solo che in questo caso nel campo \var{fl\_flags} è impostato il bit \const{FL\_POSIX} ed il campo \var{fl\_file} non viene - usato.} il blocco è sempre associato \index{inode} all'inode, solo che in + usato.} il blocco è sempre associato \itindex{inode} all'inode, solo che in questo caso la titolarità non viene identificata con il riferimento ad una voce nella \itindex{file~table} \textit{file table}, ma con il valore del -\acr{pid} del processo. +\ids{PID} del processo. \begin{figure}[!htb] \centering \includegraphics[width=12cm]{img/file_posix_lock} @@ -481,26 +482,26 @@ voce nella \itindex{file~table} \textit{file table}, ma con il valore del Quando si richiede un \textit{file lock} il kernel effettua una scansione di tutti i blocchi presenti sul file\footnote{scandisce cioè la \itindex{linked~list} \textit{linked list} delle strutture - \struct{file\_lock}, scartando automaticamente quelle per cui + \kstruct{file\_lock}, scartando automaticamente quelle per cui \var{fl\_flags} non è \const{FL\_POSIX}, così che le due interfacce restano ben separate.} per verificare se la regione richiesta non si sovrappone ad una già bloccata, in caso affermativo decide in base al tipo di blocco, in caso negativo il nuovo blocco viene comunque acquisito ed aggiunto alla lista. Nel caso di rimozione invece questa viene effettuata controllando che il -\acr{pid} del processo richiedente corrisponda a quello contenuto nel blocco. +\ids{PID} del processo richiedente corrisponda a quello contenuto nel blocco. Questa diversa modalità ha delle conseguenze precise riguardo il comportamento dei \textit{file lock} POSIX. La prima conseguenza è che un \textit{file lock} POSIX non viene mai ereditato attraverso una \func{fork}, dato che il processo -figlio avrà un \acr{pid} diverso, mentre passa indenne attraverso una -\func{exec} in quanto il \acr{pid} resta lo stesso. Questo comporta che, al +figlio avrà un \ids{PID} diverso, mentre passa indenne attraverso una +\func{exec} in quanto il \ids{PID} resta lo stesso. Questo comporta che, al contrario di quanto avveniva con la semantica BSD, quando un processo termina tutti i \textit{file lock} da esso detenuti vengono immediatamente rilasciati. La seconda conseguenza è che qualunque file descriptor che faccia riferimento allo stesso file (che sia stato ottenuto con una \func{dup} o con una \func{open} in questo caso non fa differenza) può essere usato per rimuovere -un blocco, dato che quello che conta è solo il \acr{pid} del processo. Da +un blocco, dato che quello che conta è solo il \ids{PID} del processo. Da questo deriva una ulteriore sottile differenza di comportamento: dato che alla chiusura di un file i blocchi ad esso associati vengono rimossi, nella semantica POSIX basterà chiudere un file descriptor qualunque per cancellare @@ -508,11 +509,11 @@ tutti i blocchi relativi al file cui esso faceva riferimento, anche se questi fossero stati creati usando altri file descriptor che restano aperti. Dato che il controllo sull'accesso ai blocchi viene eseguito sulla base del -\acr{pid} del processo, possiamo anche prendere in considerazione un altro +\ids{PID} del processo, possiamo anche prendere in considerazione un altro degli aspetti meno chiari di questa interfaccia e cioè cosa succede quando si richiedono dei blocchi su regioni che si sovrappongono fra loro all'interno stesso processo. Siccome il controllo, come nel caso della rimozione, si basa -solo sul \acr{pid} del processo che chiama la funzione, queste richieste +solo sul \ids{PID} del processo che chiama la funzione, queste richieste avranno sempre successo. Nel caso della semantica BSD, essendo i lock relativi a tutto un file e non @@ -799,7 +800,7 @@ affatto equivalente a \func{flock}). \subsection{Il \textit{mandatory locking}} \label{sec:file_mand_locking} -\itindbeg{mandatory~locking|(} +\itindbeg{mandatory~locking} Il \textit{mandatory locking} è una opzione introdotta inizialmente in SVr4, per introdurre un \textit{file locking} che, come dice il nome, fosse @@ -811,7 +812,7 @@ opportune verifiche nei processi, questo verrebbe comunque rispettato. Per poter utilizzare il \textit{mandatory locking} è stato introdotto un utilizzo particolare del bit \itindex{sgid~bit} \acr{sgid}. Se si ricorda quanto esposto in sez.~\ref{sec:file_special_perm}), esso viene di norma -utilizzato per cambiare il group-ID effettivo con cui viene eseguito un +utilizzato per cambiare il \ids{GID} effettivo con cui viene eseguito un programma, ed è pertanto sempre associato alla presenza del permesso di esecuzione per il gruppo. Impostando questo bit su un file senza permesso di esecuzione in un sistema che supporta il \textit{mandatory locking}, fa sì che @@ -835,7 +836,7 @@ bloccare completamente un server NFS richiedendo una lettura su un file su cui è attivo un blocco. Per questo motivo l'abilitazione del \textit{mandatory locking} è di norma disabilitata, e deve essere attivata filesystem per filesystem in fase di montaggio (specificando l'apposita opzione di -\func{mount} riportata in tab.~\ref{tab:sys_mount_flags}, o con l'opzione +\func{mount} riportata in sez.~\ref{sec:filesystem_mounting}), o con l'opzione \code{-o mand} per il comando omonimo). Si tenga presente inoltre che il \textit{mandatory locking} funziona solo @@ -890,9 +891,9 @@ soltanto quando si chiama \func{mmap} con l'opzione \const{MAP\_SHARED} (nel qual caso la funzione fallisce con il solito \errcode{EAGAIN}) che comporta la possibilità di modificare il file. -\index{file!locking|)} +\itindend{file~locking} -\itindend{mandatory~locking|(} +\itindend{mandatory~locking} \section{L'\textit{I/O multiplexing}} @@ -901,7 +902,7 @@ possibilità di modificare il file. Uno dei problemi che si presentano quando si deve operare contemporaneamente su molti file usando le funzioni illustrate in -cap.~\ref{cha:file_unix_interface} e cap.~\ref{cha:files_std_interface} è che +sez.~\ref{sec:file_unix_interface} e sez.~\ref{sec:files_std_interface} è che si può essere bloccati nelle operazioni su un file mentre un altro potrebbe essere disponibile. L'\textit{I/O multiplexing} nasce risposta a questo problema. In questa sezione forniremo una introduzione a questa problematica @@ -913,13 +914,13 @@ I/O. \label{sec:file_noblocking} Abbiamo visto in sez.~\ref{sec:sig_gen_beha}, affrontando la suddivisione fra -\textit{fast} e \textit{slow} system call,\index{system~call~lente} che in -certi casi le funzioni di I/O possono bloccarsi indefinitamente.\footnote{si - ricordi però che questo può accadere solo per le pipe, i socket ed alcuni - file di dispositivo\index{file!di~dispositivo}; sui file normali le funzioni - di lettura e scrittura ritornano sempre subito.} Ad esempio le operazioni -di lettura possono bloccarsi quando non ci sono dati disponibili sul -descrittore su cui si sta operando. +\textit{fast} e \textit{slow} \textit{system call},\index{system~call~lente} +che in certi casi le funzioni di I/O possono bloccarsi +indefinitamente.\footnote{si ricordi però che questo può accadere solo per le + pipe, i socket ed alcuni file di dispositivo\index{file!di~dispositivo}; sui + file normali le funzioni di lettura e scrittura ritornano sempre subito.} +Ad esempio le operazioni di lettura possono bloccarsi quando non ci sono dati +disponibili sul descrittore su cui si sta operando. Questo comportamento causa uno dei problemi più comuni che ci si trova ad affrontare nelle operazioni di I/O, che si verifica quando si deve operare con @@ -934,18 +935,18 @@ nel peggiore dei casi (quando la conclusione della operazione bloccata dipende da quanto si otterrebbe dal file descriptor ``\textsl{disponibile}'') si potrebbe addirittura arrivare ad un \itindex{deadlock} \textit{deadlock}. -Abbiamo già accennato in sez.~\ref{sec:file_open} che è possibile prevenire -questo tipo di comportamento delle funzioni di I/O aprendo un file in -\textsl{modalità non-bloccante}, attraverso l'uso del flag \const{O\_NONBLOCK} -nella chiamata di \func{open}. In questo caso le funzioni di input/output -eseguite sul file che si sarebbero bloccate, ritornano immediatamente, -restituendo l'errore \errcode{EAGAIN}. L'utilizzo di questa modalità di I/O -permette di risolvere il problema controllando a turno i vari file descriptor, -in un ciclo in cui si ripete l'accesso fintanto che esso non viene garantito. -Ovviamente questa tecnica, detta \itindex{polling} \textit{polling}, è -estremamente inefficiente: si tiene costantemente impiegata la CPU solo per -eseguire in continuazione delle system call che nella gran parte dei casi -falliranno. +Abbiamo già accennato in sez.~\ref{sec:file_open_close} che è possibile +prevenire questo tipo di comportamento delle funzioni di I/O aprendo un file +in \textsl{modalità non-bloccante}, attraverso l'uso del flag +\const{O\_NONBLOCK} nella chiamata di \func{open}. In questo caso le funzioni +di input/output eseguite sul file che si sarebbero bloccate, ritornano +immediatamente, restituendo l'errore \errcode{EAGAIN}. L'utilizzo di questa +modalità di I/O permette di risolvere il problema controllando a turno i vari +file descriptor, in un ciclo in cui si ripete l'accesso fintanto che esso non +viene garantito. Ovviamente questa tecnica, detta \itindex{polling} +\textit{polling}, è estremamente inefficiente: si tiene costantemente +impiegata la CPU solo per eseguire in continuazione delle \textit{system call} +che nella gran parte dei casi falliranno. Per superare questo problema è stato introdotto il concetto di \textit{I/O multiplexing}, una nuova modalità di operazioni che consente di tenere sotto @@ -1033,7 +1034,7 @@ al limite per il numero massimo di file aperti\footnote{ad esempio in Linux, quando, come nelle versioni più recenti del kernel, questo limite è stato rimosso, esso indica le dimensioni massime dei numeri usati nei \textit{file descriptor set}.\footnote{il suo valore, secondo lo standard POSIX - 1003.1-2001, è definito in \file{sys/select.h}, ed è pari a 1024.} + 1003.1-2001, è definito in \headfile{sys/select.h}, ed è pari a 1024.} Si tenga presente che i \textit{file descriptor set} devono sempre essere inizializzati con \macro{FD\_ZERO}; passare a \func{select} un valore non @@ -1127,12 +1128,12 @@ Lo standard POSIX è rimasto a lungo senza primitive per l'\textit{I/O multiplexing}, introdotto solo con le ultime revisioni dello standard (POSIX 1003.1g-2000 e POSIX 1003.1-2001). La scelta è stata quella di seguire l'interfaccia creata da BSD, ma prevede che tutte le funzioni ad esso relative -vengano dichiarate nell'header \file{sys/select.h}, che sostituisce i +vengano dichiarate nell'header \headfile{sys/select.h}, che sostituisce i precedenti, ed inoltre aggiunge a \func{select} una nuova funzione \funcd{pselect},\footnote{il supporto per lo standard POSIX 1003.1-2001, ed - l'header \file{sys/select.h}, compaiono in Linux a partire dalle \acr{glibc} - 2.1. Le \acr{libc4} e \acr{libc5} non contengono questo header, le - \acr{glibc} 2.0 contengono una definizione sbagliata di \func{psignal}, + l'header \headfile{sys/select.h}, compaiono in Linux a partire dalle + \acr{glibc} 2.1. Le \acr{libc4} e \acr{libc5} non contengono questo header, + le \acr{glibc} 2.0 contengono una definizione sbagliata di \func{psignal}, senza l'argomento \param{sigmask}, la definizione corretta è presente dalle \acr{glibc} 2.1-2.2.1 se si è definito \macro{\_GNU\_SOURCE} e nelle \acr{glibc} 2.2.2-2.2.4 se si è definito \macro{\_XOPEN\_SOURCE} con valore @@ -1160,12 +1161,13 @@ precedenti, ed inoltre aggiunge a \func{select} una nuova funzione La funzione è sostanzialmente identica a \func{select}, solo che usa una struttura \struct{timespec} (vedi fig.~\ref{fig:sys_timespec_struct}) per indicare con maggiore precisione il timeout e non ne aggiorna il valore in -caso di interruzione.\footnote{in realtà la system call di Linux aggiorna il - valore al tempo rimanente, ma la funzione fornita dalle \acr{glibc} modifica - questo comportamento passando alla system call una variabile locale, in modo - da mantenere l'aderenza allo standard POSIX che richiede che il valore di - \param{timeout} non sia modificato.} Inoltre prende un argomento aggiuntivo -\param{sigmask} che è il puntatore ad una maschera di segnali (si veda +caso di interruzione.\footnote{in realtà la \textit{system call} di Linux + aggiorna il valore al tempo rimanente, ma la funzione fornita dalle + \acr{glibc} modifica questo comportamento passando alla \textit{system call} + una variabile locale, in modo da mantenere l'aderenza allo standard POSIX + che richiede che il valore di \param{timeout} non sia modificato.} Inoltre +prende un argomento aggiuntivo \param{sigmask} che è il puntatore ad una +\index{maschera~dei~segnali} maschera di segnali (si veda sez.~\ref{sec:sig_sigmask}). La maschera corrente viene sostituita da questa immediatamente prima di eseguire l'attesa, e ripristinata al ritorno della funzione. @@ -1173,13 +1175,14 @@ funzione. L'uso di \param{sigmask} è stato introdotto allo scopo di prevenire possibili \textit{race condition} \itindex{race~condition} quando ci si deve porre in attesa sia di un segnale che di dati. La tecnica classica è quella di -utilizzare il gestore per impostare una variabile globale e controllare questa -nel corpo principale del programma; abbiamo visto in -sez.~\ref{sec:sig_example} come questo lasci spazio a possibili race -condition, per cui diventa essenziale utilizzare \func{sigprocmask} per -disabilitare la ricezione del segnale prima di eseguire il controllo e -riabilitarlo dopo l'esecuzione delle relative operazioni, onde evitare -l'arrivo di un segnale immediatamente dopo il controllo, che andrebbe perso. +utilizzare il gestore per impostare una \index{variabili!globali} variabile +globale e controllare questa nel corpo principale del programma; abbiamo visto +in sez.~\ref{sec:sig_example} come questo lasci spazio a possibili +\itindex{race~condition} \textit{race condition}, per cui diventa essenziale +utilizzare \func{sigprocmask} per disabilitare la ricezione del segnale prima +di eseguire il controllo e riabilitarlo dopo l'esecuzione delle relative +operazioni, onde evitare l'arrivo di un segnale immediatamente dopo il +controllo, che andrebbe perso. Nel nostro caso il problema si pone quando oltre al segnale si devono tenere sotto controllo anche dei file descriptor con \func{select}, in questo caso si @@ -1194,18 +1197,19 @@ interrotta, e la ricezione del segnale non sarà rilevata. Per questo è stata introdotta \func{pselect} che attraverso l'argomento \param{sigmask} permette di riabilitare la ricezione il segnale contestualmente all'esecuzione della funzione,\footnote{in Linux però, fino al - kernel 2.6.16, non era presente la relativa system call, e la funzione era - implementata nelle \acr{glibc} attraverso \func{select} (vedi \texttt{man - select\_tut}) per cui la possibilità di \itindex{race~condition} - \textit{race condition} permaneva; in tale situazione si può ricorrere ad una - soluzione alternativa, chiamata \itindex{self-pipe trick} \textit{self-pipe - trick}, che consiste nell'aprire una pipe (vedi sez.~\ref{sec:ipc_pipes}) - ed usare \func{select} sul capo in lettura della stessa; si può indicare - l'arrivo di un segnale scrivendo sul capo in scrittura all'interno del - gestore dello stesso; in questo modo anche se il segnale va perso prima - della chiamata di \func{select} questa lo riconoscerà comunque dalla - presenza di dati sulla pipe.} ribloccandolo non appena essa ritorna, così -che il precedente codice potrebbe essere riscritto nel seguente modo: + kernel 2.6.16, non era presente la relativa \textit{system call}, e la + funzione era implementata nelle \acr{glibc} attraverso \func{select} (vedi + \texttt{man select\_tut}) per cui la possibilità di \itindex{race~condition} + \textit{race condition} permaneva; in tale situazione si può ricorrere ad + una soluzione alternativa, chiamata \itindex{self-pipe trick} + \textit{self-pipe trick}, che consiste nell'aprire una pipe (vedi + sez.~\ref{sec:ipc_pipes}) ed usare \func{select} sul capo in lettura della + stessa; si può indicare l'arrivo di un segnale scrivendo sul capo in + scrittura all'interno del gestore dello stesso; in questo modo anche se il + segnale va perso prima della chiamata di \func{select} questa lo riconoscerà + comunque dalla presenza di dati sulla pipe.} ribloccandolo non appena essa +ritorna, così che il precedente codice potrebbe essere riscritto nel seguente +modo: \includecodesnip{listati/pselect_norace.c} in questo caso utilizzando \var{oldmask} durante l'esecuzione di \func{pselect} la ricezione del segnale sarà abilitata, ed in caso di @@ -1235,7 +1239,7 @@ cui prototipo è: degli insiemi. \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale. \item[\errcode{EINVAL}] il valore di \param{nfds} eccede il limite - \macro{RLIMIT\_NOFILE}. + \const{RLIMIT\_NOFILE}. \end{errlist} ed inoltre \errval{EFAULT} e \errval{ENOMEM}.} \end{prototype} @@ -1338,7 +1342,7 @@ normali e prioritari, vale a dire \const{POLLRDNORM}, \const{POLLWRNORM}, in stile SysV (in particolare le ultime due non vengono usate su Linux), e sono utilizzabili soltanto qualora si sia definita la macro \macro{\_XOPEN\_SOURCE}.\footnote{e ci si ricordi di farlo sempre in testa al - file, definirla soltanto prima di includere \file{sys/poll.h} non è + file, definirla soltanto prima di includere \headfile{sys/poll.h} non è sufficiente.} In caso di successo funzione ritorna restituendo il numero di file (un valore @@ -1394,17 +1398,18 @@ prototipo è: degli insiemi. \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale. \item[\errcode{EINVAL}] il valore di \param{nfds} eccede il limite - \macro{RLIMIT\_NOFILE}. + \const{RLIMIT\_NOFILE}. \end{errlist} ed inoltre \errval{EFAULT} e \errval{ENOMEM}.} \end{prototype} La funzione ha lo stesso comportamento di \func{poll}, solo che si può -specificare, con l'argomento \param{sigmask}, il puntatore ad una maschera di -segnali; questa sarà la maschera utilizzata per tutto il tempo che la funzione -resterà in attesa, all'uscita viene ripristinata la maschera originale. L'uso -di questa funzione è cioè equivalente, come illustrato nella pagina di -manuale, all'esecuzione atomica del seguente codice: +specificare, con l'argomento \param{sigmask}, il puntatore ad una +\index{maschera~dei~segnali} maschera di segnali; questa sarà la maschera +utilizzata per tutto il tempo che la funzione resterà in attesa, all'uscita +viene ripristinata la maschera originale. L'uso di questa funzione è cioè +equivalente, come illustrato nella pagina di manuale, all'esecuzione atomica +del seguente codice: \includecodesnip{listati/ppoll_means.c} Eccetto per \param{timeout}, che come per \func{pselect} deve essere un @@ -1520,7 +1525,7 @@ sono: nel sistema. \item[\errcode{EMFILE}] si è raggiunto il limite sul numero massimo di istanze di \textit{epoll} per utente stabilito da - \procfile{/proc/sys/fs/epoll/max\_user\_instances}. + \sysctlfile{fs/epoll/max\_user\_instances}. \item[\errcode{ENOMEM}] non c'è sufficiente memoria nel kernel per creare l'istanza. \end{errlist} @@ -1546,7 +1551,7 @@ maschera binaria in fase di creazione del file descriptor. Al momento l'unico valore legale per \param{flags} (a parte lo zero) è \const{EPOLL\_CLOEXEC}, che consente di impostare in maniera atomica sul file descriptor il flag di \itindex{close-on-exec} \textit{close-on-exec} (si veda il significato di -\const{O\_CLOEXEC} in tab.~\ref{tab:file_open_flags}), senza che sia +\const{O\_CLOEXEC} in sez.~\ref{sec:file_open_close}), senza che sia necessaria una successiva chiamata a \func{fcntl}. Una volta ottenuto un file descriptor per \textit{epoll} il passo successivo è @@ -1575,7 +1580,7 @@ controllare, per questo si deve usare la seconda funzione dell'interfaccia, \item[\errcode{EPERM}] il file \param{fd} non supporta \textit{epoll}. \item[\errcode{ENOSPC}] si è raggiunto il limite massimo di registrazioni per utente di file descriptor da osservare imposto da - \procfile{/proc/sys/fs/epoll/max\_user\_watches}. + \sysctlfile{fs/epoll/max\_user\_watches}. \end{errlist} } \end{prototype} @@ -1611,6 +1616,9 @@ delle operazioni cui fanno riferimento. \label{tab:epoll_ctl_operation} \end{table} +% aggiunta EPOLL_CTL_DISABLE con il kernel 3.7, vedi +% http://lwn.net/Articles/520012/ e http://lwn.net/Articles/520198/ + La funzione prende sempre come primo argomento un file descriptor di \textit{epoll}, \param{epfd}, che deve essere stato ottenuto in precedenza con una chiamata a \func{epoll\_create}. L'argomento \param{fd} indica invece il @@ -1650,7 +1658,7 @@ definizione è riportata in fig.~\ref{fig:epoll_event}. Il primo campo, \var{events}, è una maschera binaria in cui ciascun bit corrisponde o ad un tipo di evento, o una modalità di notifica; detto campo deve essere specificato come OR aritmetico delle costanti riportate in -tab.~\ref{tab:epoll_events}. Il secondo campo, \var{data}, è una \ctyp{union} +tab.~\ref{tab:epoll_events}. Il secondo campo, \var{data}, è una \direct{union} che serve a identificare il file descriptor a cui si intende fare riferimento, ed in astratto può contenere un valore qualsiasi (specificabile in diverse forme) che ne permetta una indicazione univoca. Il modo più comune di usarlo @@ -1706,6 +1714,9 @@ identificazione del file descriptor. \footnotetext[48]{questa modalità è disponibile solo a partire dal kernel 2.6.2.} +% TODO aggiunto EPOLLWAKEUP con il 3.5 + + Le modalità di utilizzo di \textit{epoll} prevedono che si definisca qual'è l'insieme dei file descriptor da tenere sotto controllo tramite un certo \textit{epoll descriptor} \param{epfd} attraverso una serie di chiamate a @@ -1713,12 +1724,14 @@ l'insieme dei file descriptor da tenere sotto controllo tramite un certo chiamate devono essere ripetute per ciascun file descriptor, incorrendo in una perdita di prestazioni qualora il numero di file descriptor sia molto grande; per questo è stato proposto di introdurre come estensione una - funzione \func{epoll\_ctlv} che consenta di effettuare con una sola chiamata + funzione \code{epoll\_ctlv} che consenta di effettuare con una sola chiamata le impostazioni per un blocco di file descriptor.} L'uso di \const{EPOLL\_CTL\_MOD} consente in seguito di modificare le modalità di osservazione di un file descriptor che sia già stato aggiunto alla lista di osservazione. +% TODO verificare se prima o poi epoll_ctlv verrà introdotta + Le impostazioni di default prevedono che la notifica degli eventi richiesti sia effettuata in modalità \textit{level triggered}, a meno che sul file descriptor non si sia impostata la modalità \textit{edge triggered}, @@ -1824,12 +1837,12 @@ Come già per \func{select} e \func{poll} anche per l'interfaccia di \textit{epoll} si pone il problema di gestire l'attesa di segnali e di dati contemporaneamente per le osservazioni fatte in sez.~\ref{sec:file_select}, per fare questo di nuovo è necessaria una variante della funzione di attesa -che consenta di reimpostare all'uscita una maschera di segnali, analoga alle -estensioni \func{pselect} e \func{ppoll} che abbiamo visto in precedenza per -\func{select} e \func{poll}; in questo caso la funzione si chiama -\funcd{epoll\_pwait}\footnote{la funziona è stata introdotta a partire dal - kernel 2.6.19, ed è come tutta l'interfaccia di \textit{epoll}, specifica di - Linux.} ed il suo prototipo è: +che consenta di reimpostare all'uscita una \index{maschera~dei~segnali} +maschera di segnali, analoga alle estensioni \func{pselect} e \func{ppoll} che +abbiamo visto in precedenza per \func{select} e \func{poll}; in questo caso la +funzione si chiama \funcd{epoll\_pwait}\footnote{la funziona è stata + introdotta a partire dal kernel 2.6.19, ed è come tutta l'interfaccia di + \textit{epoll}, specifica di Linux.} ed il suo prototipo è: \begin{prototype}{sys/epoll.h} {int epoll\_pwait(int epfd, struct epoll\_event * events, int maxevents, int timeout, const sigset\_t *sigmask)} @@ -1844,10 +1857,10 @@ estensioni \func{pselect} e \func{ppoll} che abbiamo visto in precedenza per \end{prototype} La funzione è del tutto analoga \funcd{epoll\_wait}, soltanto che alla sua -uscita viene ripristinata la maschera di segnali originale, sostituita durante -l'esecuzione da quella impostata con l'argomento \param{sigmask}; in sostanza -la chiamata a questa funzione è equivalente al seguente codice, eseguito però -in maniera atomica: +uscita viene ripristinata la \index{maschera~dei~segnali} maschera di segnali +originale, sostituita durante l'esecuzione da quella impostata con +l'argomento \param{sigmask}; in sostanza la chiamata a questa funzione è +equivalente al seguente codice, eseguito però in maniera atomica: \includecodesnip{listati/epoll_pwait_means.c} Si tenga presente che come le precedenti funzioni di \textit{I/O multiplexing} @@ -1892,8 +1905,8 @@ interruzioni delle funzioni di attesa sincrone, ed evitare possibili \itindex{race~condition} \textit{race conditions}.\footnote{in sostanza se non fossero per i segnali non ci sarebbe da doversi preoccupare, fintanto che si effettuano operazioni all'interno di un processo, della non atomicità delle - \index{system~call~lente} system call lente che vengono interrotte e devono - essere riavviate.} + \index{system~call~lente} \textit{system call} lente che vengono interrotte + e devono essere riavviate.} Abbiamo visto però in sez.~\ref{sec:sig_real_time} che insieme ai segnali \textit{real-time} sono state introdotte anche delle interfacce di gestione @@ -1932,11 +1945,11 @@ descriptor è \funcd{signalfd},\footnote{in realtà quella riportata è versioni diverse della \textit{system call}; una prima versione, \func{signalfd}, introdotta nel kernel 2.6.22 e disponibile con le \acr{glibc} 2.8 che non supporta l'argomento \texttt{flags}, ed una seconda - versione, \func{signalfd4}, introdotta con il kernel 2.6.27 e che è quella + versione, \funcm{signalfd4}, introdotta con il kernel 2.6.27 e che è quella che viene sempre usata a partire dalle \acr{glibc} 2.9, che prende un argomento aggiuntivo \code{size\_t sizemask} che indica la dimensione della - maschera dei segnali, il cui valore viene impostato automaticamente dalle - \acr{glibc}.} il cui prototipo è: + \index{maschera~dei~segnali} maschera dei segnali, il cui valore viene + impostato automaticamente dalle \acr{glibc}.} il cui prototipo è: \begin{prototype}{sys/signalfd.h} {int signalfd(int fd, const sigset\_t *mask, int flags)} @@ -1971,13 +1984,13 @@ con \param{fd}, in caso di errore invece verrà restituito $-1$. L'elenco dei segnali che si vogliono gestire con \func{signalfd} deve essere specificato tramite l'argomento \param{mask}. Questo deve essere passato come -puntatore ad una maschera di segnali creata con l'uso delle apposite macro già -illustrate in sez.~\ref{sec:sig_sigset}. La maschera deve indicare su quali -segnali si intende operare con \func{signalfd}; l'elenco può essere modificato -con una successiva chiamata a \func{signalfd}. Dato che \const{SIGKILL} e -\const{SIGSTOP} non possono essere intercettati (e non prevedono neanche la -possibilità di un gestore) un loro inserimento nella maschera verrà ignorato -senza generare errori. +puntatore ad una \index{maschera~dei~segnali} maschera di segnali creata con +l'uso delle apposite macro già illustrate in sez.~\ref{sec:sig_sigset}. La +maschera deve indicare su quali segnali si intende operare con +\func{signalfd}; l'elenco può essere modificato con una successiva chiamata a +\func{signalfd}. Dato che \signal{SIGKILL} e \signal{SIGSTOP} non possono +essere intercettati (e non prevedono neanche la possibilità di un gestore) un +loro inserimento nella maschera verrà ignorato senza generare errori. L'argomento \param{flags} consente di impostare direttamente in fase di creazione due flag per il file descriptor analoghi a quelli che si possono @@ -2133,15 +2146,15 @@ fifo. Il primo passo (\texttt{\small 19--20}) è la crezione di un file descriptor \texttt{epfd} di \itindex{epoll} \textit{epoll} con \func{epoll\_create} che è quello che useremo per il controllo degli altri. É poi necessario -disabilitare la ricezione dei segnali (nel caso \const{SIGINT}, -\const{SIGQUIT} e \const{SIGTERM}) per i quali si vuole la notifica tramite -file descriptor. Per questo prima li si inseriscono (\texttt{\small 22--25}) in -una maschera di segnali \texttt{sigmask} che useremo con (\texttt{\small 26}) -\func{sigprocmask} per disabilitarli. Con la stessa maschera si potrà per -passare all'uso (\texttt{\small 28--29}) di \func{signalfd} per abilitare la -notifica sul file descriptor \var{sigfd}. Questo poi (\texttt{\small 30--33}) -dovrà essere aggiunto con \func{epoll\_ctl} all'elenco di file descriptor -controllati con \texttt{epfd}. +disabilitare la ricezione dei segnali (nel caso \signal{SIGINT}, +\signal{SIGQUIT} e \signal{SIGTERM}) per i quali si vuole la notifica tramite +file descriptor. Per questo prima li si inseriscono (\texttt{\small 22--25}) +in una \index{maschera~dei~segnali} maschera di segnali \texttt{sigmask} che +useremo con (\texttt{\small 26}) \func{sigprocmask} per disabilitarli. Con la +stessa maschera si potrà per passare all'uso (\texttt{\small 28--29}) di +\func{signalfd} per abilitare la notifica sul file descriptor +\var{sigfd}. Questo poi (\texttt{\small 30--33}) dovrà essere aggiunto con +\func{epoll\_ctl} all'elenco di file descriptor controllati con \texttt{epfd}. Occorrerà infine (\texttt{\small 35--38}) creare la \textit{named fifo} se questa non esiste ed aprirla per la lettura (\texttt{\small 39--40}); una @@ -2163,7 +2176,7 @@ segnali. Una volta completata l'inizializzazione verrà eseguito indefinitamente il ciclo principale del programma (\texttt{\small 2--45}) che si è riportato in fig.~\ref{fig:fiforeporter_code_body}, fintanto che questo non riceva un -segnale di \texttt{SIGINT} (ad esempio con la pressione di \texttt{C-c}). Il +segnale di \signal{SIGINT} (ad esempio con la pressione di \texttt{C-c}). Il ciclo prevede che si attenda (\texttt{\small 2--3}) la presenza di un file descriptor pronto in lettura con \func{epoll\_wait},\footnote{si ricordi che entrambi i file descriptor \var{fifofd} e \var{sigfd} sono stati posti in @@ -2188,7 +2201,7 @@ Il primo condizionale (\texttt{\small 6--24}) è relativo al caso che si sia ricevuto un segnale e che il file descriptor pronto corrisponda (\texttt{\small 6}) a \var{sigfd}. Dato che in generale si possono ricevere anche notifiche relativi a più di un singolo segnale, si è scelto di leggere -una struttura \const{signalfd\_siginfo} alla volta, eseguendo la lettura +una struttura \struct{signalfd\_siginfo} alla volta, eseguendo la lettura all'interno di un ciclo (\texttt{\small 8--24}) che prosegue fintanto che vi siano dati da leggere. @@ -2204,13 +2217,13 @@ ritorno della funzione \func{read} è negativo, uscendo dal programma In presenza di dati invece il programma proseguirà l'esecuzione stampando (\texttt{\small 19--20}) il nome del segnale ottenuto all'interno della -struttura \const{signalfd\_siginfo} letta in \var{siginf}\footnote{per la +struttura \struct{signalfd\_siginfo} letta in \var{siginf}\footnote{per la stampa si è usato il vettore \var{sig\_names} a ciascun elemento del quale corrisponde il nome del segnale avente il numero corrispondente, la cui definizione si è omessa dal codice di fig.~\ref{fig:fiforeporter_code_init} per brevità.} ed il \textit{pid} del processo da cui lo ha ricevuto; inoltre (\texttt{\small 21--24}) si controllerà anche se il segnale ricevuto è -\var{SIGINT}, che si è preso come segnale da utilizzare per la terminazione +\signal{SIGINT}, che si è preso come segnale da utilizzare per la terminazione del programma, che verrà eseguita dopo aver rimosso il file della \textit{name fifo}. @@ -2455,7 +2468,7 @@ ottenute leggendo in maniera ordinaria il file descriptor con una \func{read}, \section{L'accesso \textsl{asincrono} ai file} -\label{sec:file_asyncronous_access} +\label{sec:file_asyncronous_operation} Benché l'\textit{I/O multiplexing} sia stata la prima, e sia tutt'ora una fra le più diffuse modalità di gestire l'I/O in situazioni complesse in cui si @@ -2471,31 +2484,31 @@ operazioni di I/O volute. \subsection{Il \textit{Signal driven I/O}} -\label{sec:file_asyncronous_operation} +\label{sec:signal_driven_io} \itindbeg{signal~driven~I/O} -Abbiamo accennato in sez.~\ref{sec:file_open} che è possibile, attraverso -l'uso del flag \const{O\_ASYNC},\footnote{l'uso del flag di \const{O\_ASYNC} e - dei comandi \const{F\_SETOWN} e \const{F\_GETOWN} per \func{fcntl} è - specifico di Linux e BSD.} aprire un file in modalità asincrona, così come è -possibile attivare in un secondo tempo questa modalità impostando questo flag -attraverso l'uso di \func{fcntl} con il comando \const{F\_SETFL} (vedi -sez.~\ref{sec:file_fcntl}). In realtà parlare di apertura in modalità -asincrona non significa che le operazioni di lettura o scrittura del file -vengono eseguite in modo asincrono (tratteremo questo, che è ciò che più -propriamente viene chiamato \textsl{I/O asincrono}, in +Abbiamo accennato in sez.~\ref{sec:file_open_close} che è definito un flag +\const{O\_ASYNC}, che consentirebbe di aprire un file in modalità asincrona, +anche se in realtà è opportuno attivare in un secondo tempo questa modalità +impostando questo flag attraverso l'uso di \func{fcntl} con il comando +\const{F\_SETFL} (vedi sez.~\ref{sec:file_fcntl_ioctl}).\footnote{l'uso del + flag di \const{O\_ASYNC} e dei comandi \const{F\_SETOWN} e \const{F\_GETOWN} + per \func{fcntl} è specifico di Linux e BSD.} In realtà parlare di apertura +in modalità asincrona non significa che le operazioni di lettura o scrittura +del file vengono eseguite in modo asincrono (tratteremo questo, che è ciò che +più propriamente viene chiamato \textsl{I/O asincrono}, in sez.~\ref{sec:file_asyncronous_io}), quanto dell'attivazione un meccanismo di notifica asincrona delle variazione dello stato del file descriptor aperto in -questo modo. +questo modo. Quello che succede è che per tutti i file posti in questa modalità\footnote{si tenga presente però che essa non è utilizzabile con i file ordinari ma solo con socket, file di terminale o pseudo terminale, ed anche, a partire dal kernel 2.6, anche per fifo e pipe.} il sistema genera un apposito segnale, -\const{SIGIO}, tutte le volte che diventa possibile leggere o scrivere dal +\signal{SIGIO}, tutte le volte che diventa possibile leggere o scrivere dal file descriptor che si è posto in questa modalità. Inoltre è possibile, come -illustrato in sez.~\ref{sec:file_fcntl}, selezionare con il comando +illustrato in sez.~\ref{sec:file_fcntl_ioctl}, selezionare con il comando \const{F\_SETOWN} di \func{fcntl} quale processo o quale gruppo di processi dovrà ricevere il segnale. In questo modo diventa possibile effettuare le operazioni di I/O in risposta alla ricezione del segnale, e non ci sarà più la @@ -2535,7 +2548,7 @@ sez.~\ref{sec:sig_sigaction}). Per far questo però occorre utilizzare le funzionalità dei segnali real-time (vedi sez.~\ref{sec:sig_real_time}) impostando esplicitamente con il comando \const{F\_SETSIG} di \func{fcntl} un segnale real-time da inviare in caso di -I/O asincrono (il segnale predefinito è \const{SIGIO}). In questo caso il +I/O asincrono (il segnale predefinito è \signal{SIGIO}). In questo caso il gestore, tutte le volte che riceverà \const{SI\_SIGIO} come valore del campo \var{si\_code}\footnote{il valore resta \const{SI\_SIGIO} qualunque sia il segnale che si è associato all'I/O, ed indica appunto che il segnale è stato @@ -2553,14 +2566,14 @@ la coda. Se infatti si eccedono le dimensioni di quest'ultima, il kernel, non potendo più assicurare il comportamento corretto per un segnale real-time, invierà al -suo posto un solo \const{SIGIO}, su cui si saranno accumulati tutti i segnali +suo posto un solo \signal{SIGIO}, su cui si saranno accumulati tutti i segnali in eccesso, e si dovrà allora determinare con un ciclo quali sono i file diventati attivi. L'unico modo per essere sicuri che questo non avvenga è di impostare la lunghezza della coda dei segnali real-time ad una dimensione identica al valore massimo del numero di file descriptor utilizzabili.\footnote{vale a dire impostare il contenuto di - \procfile{/proc/sys/kernel/rtsig-max} allo stesso valore del contenuto di - \procfile{/proc/sys/fs/file-max}.} + \sysctlfile{kernel/rtsig-max} allo stesso valore del contenuto di + \sysctlfile{fs/file-max}.} % TODO fare esempio che usa O_ASYNC @@ -2581,7 +2594,7 @@ classico non prevedeva alcun meccanismo per cui un processo possa essere \textsl{notificato} di eventuali modifiche avvenute su un file. Questo è il motivo per cui i demoni devono essere \textsl{avvisati} in qualche modo\footnote{in genere questo vien fatto inviandogli un segnale di - \const{SIGHUP} che, per una convenzione adottata dalla gran parte di detti + \signal{SIGHUP} che, per una convenzione adottata dalla gran parte di detti programmi, causa la rilettura della configurazione.} se il loro file di configurazione è stato modificato, perché possano rileggerlo e riconoscere le modifiche. @@ -2609,10 +2622,10 @@ standardizzate, che sono disponibili soltanto su Linux (anche se altri kernel supportano meccanismi simili). Alcune di esse sono realizzate, e solo a partire dalla versione 2.4 del kernel, attraverso l'uso di alcuni \textsl{comandi} aggiuntivi per la funzione \func{fcntl} (vedi -sez.~\ref{sec:file_fcntl}), che divengono disponibili soltanto se si è -definita la macro \macro{\_GNU\_SOURCE} prima di includere \file{fcntl.h}. +sez.~\ref{sec:file_fcntl_ioctl}), che divengono disponibili soltanto se si è +definita la macro \macro{\_GNU\_SOURCE} prima di includere \headfile{fcntl.h}. -\index{file!lease|(} +\itindbeg{file~lease} La prima di queste funzionalità è quella del cosiddetto \textit{file lease}; questo è un meccanismo che consente ad un processo, detto \textit{lease @@ -2622,9 +2635,9 @@ questo è un meccanismo che consente ad un processo, detto \textit{lease \textit{lease}. La notifica avviene in maniera analoga a come illustrato in precedenza per l'uso di \const{O\_ASYNC}: di default viene inviato al \textit{lease holder} -il segnale \const{SIGIO}, ma questo segnale può essere modificato usando il +il segnale \signal{SIGIO}, ma questo segnale può essere modificato usando il comando \const{F\_SETSIG} di \func{fcntl}.\footnote{anche in questo caso si - può rispecificare lo stesso \const{SIGIO}.} Se si è fatto questo\footnote{è + può rispecificare lo stesso \signal{SIGIO}.} Se si è fatto questo\footnote{è in genere è opportuno farlo, come in precedenza, per utilizzare segnali real-time.} e si è installato il gestore del segnale con \const{SA\_SIGINFO} si riceverà nel campo \var{si\_fd} della struttura \struct{siginfo\_t} il @@ -2638,13 +2651,14 @@ un altro processo esegue l'apertura del file in scrittura o usa il file viene aperto in lettura; in quest'ultimo caso però il \textit{lease} può essere ottenuto solo se nessun altro processo ha aperto lo stesso file. -Come accennato in sez.~\ref{sec:file_fcntl} il comando di \func{fcntl} che -consente di acquisire un \textit{file lease} è \const{F\_SETLEASE}, che viene -utilizzato anche per rilasciarlo. In tal caso il file descriptor \param{fd} -passato a \func{fcntl} servirà come riferimento per il file su cui si vuole -operare, mentre per indicare il tipo di operazione (acquisizione o rilascio) -occorrerà specificare come valore dell'argomento \param{arg} di \func{fcntl} -uno dei tre valori di tab.~\ref{tab:file_lease_fctnl}. +Come accennato in sez.~\ref{sec:file_fcntl_ioctl} il comando di \func{fcntl} +che consente di acquisire un \textit{file lease} è \const{F\_SETLEASE}, che +viene utilizzato anche per rilasciarlo. In tal caso il file +descriptor \param{fd} passato a \func{fcntl} servirà come riferimento per il +file su cui si vuole operare, mentre per indicare il tipo di operazione +(acquisizione o rilascio) occorrerà specificare come valore +dell'argomento \param{arg} di \func{fcntl} uno dei tre valori di +tab.~\ref{tab:file_lease_fctnl}. \begin{table}[htb] \centering @@ -2676,7 +2690,7 @@ Si tenga presente che un processo può mantenere solo un tipo di \textit{lease} su un file, e che un \textit{lease} può essere ottenuto solo su file di dati (pipe e dispositivi sono quindi esclusi). Inoltre un processo non privilegiato può ottenere un \textit{lease} soltanto per un file appartenente ad un -\acr{uid} corrispondente a quello del processo. Soltanto un processo con +\ids{UID} corrispondente a quello del processo. Soltanto un processo con privilegi di amministratore (cioè con la \itindex{capabilities} capability \const{CAP\_LEASE}, vedi sez.~\ref{sec:proc_capabilities}) può acquisire \textit{lease} su qualunque file. @@ -2710,7 +2724,7 @@ operazione di lettura, declassando il \textit{lease} a lettura con Se il \textit{lease holder} non provvede a rilasciare il \textit{lease} entro il numero di secondi specificato dal parametro di sistema mantenuto in -\procfile{/proc/sys/fs/lease-break-time} sarà il kernel stesso a rimuoverlo (o +\sysctlfile{fs/lease-break-time} sarà il kernel stesso a rimuoverlo (o declassarlo) automaticamente.\footnote{questa è una misura di sicurezza per evitare che un processo blocchi indefinitamente l'accesso ad un file acquisendo un \textit{lease}.} Una volta che un \textit{lease} è stato @@ -2737,14 +2751,14 @@ un'altra interfaccia,\footnote{si ricordi che anche questa è una interfaccia stata definita la macro \macro{\_GNU\_SOURCE}.} chiamata \textit{dnotify}, che consente di richiedere una notifica quando una directory, o uno qualunque dei file in essa contenuti, viene modificato. Come per i \textit{file lease} -la notifica avviene di default attraverso il segnale \const{SIGIO}, ma se ne +la notifica avviene di default attraverso il segnale \signal{SIGIO}, ma se ne può utilizzare un altro.\footnote{e di nuovo, per le ragioni già esposte in precedenza, è opportuno che si utilizzino dei segnali real-time.} Inoltre, come in precedenza, si potrà ottenere nel gestore del segnale il file descriptor che è stato modificato tramite il contenuto della struttura \struct{siginfo\_t}. -\index{file!lease|)} +\itindend{file~lease} \begin{table}[htb] \centering @@ -2856,7 +2870,7 @@ effettuate le operazioni di notifica;\footnote{per evitare abusi delle risorse di sistema è previsto che un utente possa utilizzare un numero limitato di istanze di \textit{inotify}; il valore di default del limite è di 128, ma questo valore può essere cambiato con \func{sysctl} o usando il file - \procfile{/proc/sys/fs/inotify/max\_user\_instances}.} si tratta di un file + \sysctlfile{fs/inotify/max\_user\_instances}.} si tratta di un file descriptor speciale che non è associato a nessun file su disco, e che viene utilizzato solo per notificare gli eventi che sono stati posti in osservazione. Dato che questo file descriptor non è associato a nessun file o @@ -2870,16 +2884,15 @@ Inoltre trattandosi di un file descriptor a tutti gli effetti, esso potrà essere utilizzato come argomento per le funzioni \func{select} e \func{poll} e con l'interfaccia di \textit{epoll};\footnote{ed a partire dal kernel 2.6.25 è stato introdotto anche il supporto per il \itindex{signal~driven~I/O} - \texttt{signal-driven I/O} trattato in - sez.~\ref{sec:file_asyncronous_operation}.} siccome gli eventi vengono -notificati come dati disponibili in lettura, dette funzioni ritorneranno tutte -le volte che si avrà un evento di notifica. Così, invece di dover utilizzare i -segnali,\footnote{considerati una pessima scelta dal punto di vista - dell'interfaccia utente.} si potrà gestire l'osservazione degli eventi con -una qualunque delle modalità di \textit{I/O multiplexing} illustrate in -sez.~\ref{sec:file_multiplexing}. Qualora si voglia cessare l'osservazione, -sarà sufficiente chiudere il file descriptor e tutte le risorse allocate -saranno automaticamente rilasciate. + \texttt{signal-driven I/O} trattato in sez.~\ref{sec:signal_driven_io}.} +siccome gli eventi vengono notificati come dati disponibili in lettura, dette +funzioni ritorneranno tutte le volte che si avrà un evento di notifica. Così, +invece di dover utilizzare i segnali,\footnote{considerati una pessima scelta + dal punto di vista dell'interfaccia utente.} si potrà gestire l'osservazione +degli eventi con una qualunque delle modalità di \textit{I/O multiplexing} +illustrate in sez.~\ref{sec:file_multiplexing}. Qualora si voglia cessare +l'osservazione, sarà sufficiente chiudere il file descriptor e tutte le +risorse allocate saranno automaticamente rilasciate. Infine l'interfaccia di \textit{inotify} consente di mettere sotto osservazione, oltre che una directory, anche singoli file. Una volta creata @@ -2896,7 +2909,7 @@ osservazione l'interfaccia fornisce due funzioni, la prima di queste è \bodydesc{La funzione restituisce un valore positivo in caso di successo, o $-1$ in caso di errore, nel qual caso \var{errno} assumerà uno dei valori: \begin{errlist} - \item[\errcode{EACCESS}] non si ha accesso in lettura al file indicato. + \item[\errcode{EACCES}] non si ha accesso in lettura al file indicato. \item[\errcode{EINVAL}] \param{mask} non contiene eventi legali o \param{fd} non è un file descriptor di \textit{inotify}. \item[\errcode{ENOSPC}] si è raggiunto il numero massimo di voci di @@ -2917,7 +2930,7 @@ modalità della stessa. L'operazione può essere ripetuta per tutti i file e le directory che si vogliono tenere sotto osservazione,\footnote{anche in questo caso c'è un limite massimo che di default è pari a 8192, ed anche questo valore può essere cambiato con \func{sysctl} o usando il file - \procfile{/proc/sys/fs/inotify/max\_user\_watches}.} e si utilizzerà sempre + \sysctlfile{fs/inotify/max\_user\_watches}.} e si utilizzerà sempre un solo file descriptor. Il tipo di evento che si vuole osservare deve essere specificato @@ -3102,11 +3115,11 @@ permette di ottenere con \func{ioctl}, come per i file descriptor associati ai socket (si veda sez.~\ref{sec:sock_ioctl_IP}) il numero di byte disponibili in lettura sul file descriptor, utilizzando su di esso l'operazione \const{FIONREAD}.\footnote{questa è una delle operazioni speciali per i file - (vedi sez.~\ref{sec:file_ioctl}), che è disponibile solo per i socket e per - i file descriptor creati con \func{inotify\_init}.} Si può così utilizzare -questa operazione, oltre che per predisporre una operazione di lettura con un -buffer di dimensioni adeguate, anche per ottenere rapidamente il numero di -file che sono cambiati. + (vedi sez.~\ref{sec:file_fcntl_ioctl}), che è disponibile solo per i socket + e per i file descriptor creati con \func{inotify\_init}.} Si può così +utilizzare questa operazione, oltre che per predisporre una operazione di +lettura con un buffer di dimensioni adeguate, anche per ottenere rapidamente +il numero di file che sono cambiati. Una volta effettuata la lettura con \func{read} a ciascun evento sarà associata una struttura \struct{inotify\_event} contenente i rispettivi dati. @@ -3151,7 +3164,7 @@ aggiuntivi\footnote{questi compaiono solo nel campo \var{mask} di \end{table} \footnotetext{la coda di notifica ha una dimensione massima specificata dal - parametro di sistema \procfile{/proc/sys/fs/inotify/max\_queued\_events} che + parametro di sistema \sysctlfile{fs/inotify/max\_queued\_events} che indica il numero massimo di eventi che possono essere mantenuti sulla stessa; quando detto valore viene ecceduto gli ulteriori eventi vengono scartati, ma viene comunque generato un evento di tipo @@ -3166,15 +3179,15 @@ così all'applicazione di collegare la corrispondente coppia di eventi Infine due campi \var{name} e \var{len} sono utilizzati soltanto quando l'evento è relativo ad un file presente in una directory posta sotto osservazione, in tal caso essi contengono rispettivamente il nome del file -(come pathname relativo alla directory osservata) e la relativa dimensione in -byte. Il campo \var{name} viene sempre restituito come stringa terminata da -NUL, con uno o più zeri di terminazione, a seconda di eventuali necessità di -allineamento del risultato, ed il valore di \var{len} corrisponde al totale -della dimensione di \var{name}, zeri aggiuntivi compresi. La stringa con il -nome del file viene restituita nella lettura subito dopo la struttura -\struct{inotify\_event}; questo significa che le dimensioni di ciascun evento -di \textit{inotify} saranno pari a \code{sizeof(\struct{inotify\_event}) + - len}. +(come \itindsub{pathname}{relativo} \textit{pathname} relativo alla directory +osservata) e la relativa dimensione in byte. Il campo \var{name} viene sempre +restituito come stringa terminata da NUL, con uno o più zeri di terminazione, +a seconda di eventuali necessità di allineamento del risultato, ed il valore +di \var{len} corrisponde al totale della dimensione di \var{name}, zeri +aggiuntivi compresi. La stringa con il nome del file viene restituita nella +lettura subito dopo la struttura \struct{inotify\_event}; questo significa che +le dimensioni di ciascun evento di \textit{inotify} saranno pari a +\code{sizeof(\struct{inotify\_event}) + len}. Vediamo allora un esempio dell'uso dell'interfaccia di \textit{inotify} con un semplice programma che permette di mettere sotto osservazione uno o più file e @@ -3226,8 +3239,8 @@ approssimativamente 512 eventi.\footnote{si ricordi che la quantità di dati del nome del file restituito insieme a \struct{inotify\_event}.} In caso di errore di lettura (\texttt{\small 35--40}) il programma esce con un messaggio di errore (\texttt{\small 37--39}), a meno che non si tratti di una -interruzione della system call, nel qual caso (\texttt{\small 36}) si ripete la -lettura. +interruzione della \textit{system call}, nel qual caso (\texttt{\small 36}) si +ripete la lettura. Se la lettura è andata a buon fine invece si esegue un ciclo (\texttt{\small 43--52}) per leggere tutti gli eventi restituiti, al solito si inizializza @@ -3311,7 +3324,9 @@ raggruppati in un solo evento. \subsection{L'interfaccia POSIX per l'I/O asincrono} \label{sec:file_asyncronous_io} -% vedere anche http://davmac.org/davpage/linux/async-io.html +% vedere anche http://davmac.org/davpage/linux/async-io.html e +% http://www.ibm.com/developerworks/linux/library/l-async/ + Una modalità alternativa all'uso dell'\textit{I/O multiplexing} per gestione dell'I/O simultaneo su molti file è costituita dal cosiddetto \textsl{I/O @@ -3323,12 +3338,12 @@ effettuare in contemporanea le operazioni di calcolo e quelle di I/O. Benché la modalità di apertura asincrona di un file possa risultare utile in varie occasioni (in particolar modo con i socket e gli altri file per i quali -le funzioni di I/O sono \index{system~call~lente} system call lente), essa è -comunque limitata alla notifica della disponibilità del file descriptor per le -operazioni di I/O, e non ad uno svolgimento asincrono delle medesime. Lo -standard POSIX.1b definisce una interfaccia apposita per l'I/O asincrono vero -e proprio, che prevede un insieme di funzioni dedicate per la lettura e la -scrittura dei file, completamente separate rispetto a quelle usate +le funzioni di I/O sono \index{system~call~lente} \textit{system call} lente), +essa è comunque limitata alla notifica della disponibilità del file descriptor +per le operazioni di I/O, e non ad uno svolgimento asincrono delle medesime. +Lo standard POSIX.1b definisce una interfaccia apposita per l'I/O asincrono +vero e proprio, che prevede un insieme di funzioni dedicate per la lettura e +la scrittura dei file, completamente separate rispetto a quelle usate normalmente. In generale questa interfaccia è completamente astratta e può essere @@ -3344,7 +3359,7 @@ Lo standard prevede che tutte le operazioni di I/O asincrono siano controllate attraverso l'uso di una apposita struttura \struct{aiocb} (il cui nome sta per \textit{asyncronous I/O control block}), che viene passata come argomento a tutte le funzioni dell'interfaccia. La sua definizione, come effettuata in -\file{aio.h}, è riportata in fig.~\ref{fig:file_aiocb}. Nello steso file è +\headfile{aio.h}, è riportata in fig.~\ref{fig:file_aiocb}. Nello steso file è definita la macro \macro{\_POSIX\_ASYNCHRONOUS\_IO}, che dichiara la disponibilità dell'interfaccia per l'I/O asincrono. @@ -3422,18 +3437,19 @@ richiesta, o in caso di errore. Non è detto che gli errori \errcode{EBADF} ed potrebbero anche emergere nelle fasi successive delle operazioni. Lettura e scrittura avvengono alla posizione indicata da \var{aio\_offset}, a meno che il file non sia stato aperto in \itindex{append~mode} \textit{append mode} -(vedi sez.~\ref{sec:file_open}), nel qual caso le scritture vengono effettuate -comunque alla fine de file, nell'ordine delle chiamate a \func{aio\_write}. +(vedi sez.~\ref{sec:file_open_close}), nel qual caso le scritture vengono +effettuate comunque alla fine de file, nell'ordine delle chiamate a +\func{aio\_write}. Si tenga inoltre presente che deallocare la memoria indirizzata da \param{aiocbp} o modificarne i valori prima della conclusione di una operazione può dar luogo a risultati impredicibili, perché l'accesso ai vari campi per eseguire l'operazione può avvenire in un momento qualsiasi dopo la richiesta. Questo comporta che non si devono usare per \param{aiocbp} -variabili automatiche e che non si deve riutilizzare la stessa struttura per -un'altra operazione fintanto che la precedente non sia stata ultimata. In -generale per ogni operazione si deve utilizzare una diversa struttura -\struct{aiocb}. +\index{variabili!automatiche} variabili automatiche e che non si deve +riutilizzare la stessa struttura per un'altra operazione fintanto che la +precedente non sia stata ultimata. In generale per ogni operazione si deve +utilizzare una diversa struttura \struct{aiocb}. Dato che si opera in modalità asincrona, il successo di \func{aio\_read} o \func{aio\_write} non implica che le operazioni siano state effettivamente @@ -3459,8 +3475,8 @@ verificatosi, ed esegue la corrispondente impostazione di \var{errno}. Il codice può essere sia \errcode{EINVAL} ed \errcode{EBADF}, dovuti ad un valore errato per \param{aiocbp}, che uno degli errori possibili durante l'esecuzione dell'operazione di I/O richiesta, nel qual caso saranno restituiti, a seconda -del caso, i codici di errore delle system call \func{read}, \func{write} e -\func{fsync}. +del caso, i codici di errore delle \textit{system call} \func{read}, +\func{write} e \func{fsync}. Una volta che si sia certi che le operazioni siano state concluse (cioè dopo che una chiamata ad \func{aio\_error} non ha restituito @@ -3484,10 +3500,10 @@ l'operazione cui \param{aiocbp} fa riferimento si è completata. Una chiamata precedente il completamento delle operazioni darebbe risultati indeterminati. La funzione restituisce il valore di ritorno relativo all'operazione eseguita, -così come ricavato dalla sottostante system call (il numero di byte letti, -scritti o il valore di ritorno di \func{fsync}). É importante chiamare sempre -questa funzione, altrimenti le risorse disponibili per le operazioni di I/O -asincrono non verrebbero liberate, rischiando di arrivare ad un loro +così come ricavato dalla sottostante \textit{system call} (il numero di byte +letti, scritti o il valore di ritorno di \func{fsync}). É importante chiamare +sempre questa funzione, altrimenti le risorse disponibili per le operazioni di +I/O asincrono non verrebbero liberate, rischiando di arrivare ad un loro esaurimento. Oltre alle operazioni di lettura e scrittura l'interfaccia POSIX.1b mette a @@ -3545,7 +3561,7 @@ codice di errore, ed il suo codice di ritorno sarà -1, inoltre il meccanismo di notifica non verrà invocato. Se si specifica una operazione relativa ad un altro file descriptor il risultato è indeterminato. In caso di successo, i possibili valori di ritorno per \func{aio\_cancel} (anch'essi definiti in -\file{aio.h}) sono tre: +\headfile{aio.h}) sono tre: \begin{basedescript}{\desclabelwidth{3.0cm}} \item[\const{AIO\_ALLDONE}] indica che le operazioni di cui si è richiesta la cancellazione sono state già completate, @@ -3650,9 +3666,10 @@ per il campo \var{aio\_sigevent} di \struct{aiocb}. Oltre alle precedenti modalità di \textit{I/O multiplexing} e \textsl{I/O asincrono}, esistono altre funzioni che implementano delle modalità di accesso ai file più evolute rispetto alle normali funzioni di lettura e -scrittura che abbiamo esaminato in sez.~\ref{sec:file_base_func}. In questa -sezione allora prenderemo in esame le interfacce per l'\textsl{I/O mappato in - memoria}, per l'\textsl{I/O vettorizzato} e altre funzioni di I/O avanzato. +scrittura che abbiamo esaminato in sez.~\ref{sec:file_unix_interface}. In +questa sezione allora prenderemo in esame le interfacce per l'\textsl{I/O + mappato in memoria}, per l'\textsl{I/O vettorizzato} e altre funzioni di I/O +avanzato. \subsection{File mappati in memoria} @@ -3660,7 +3677,7 @@ sezione allora prenderemo in esame le interfacce per l'\textsl{I/O mappato in \itindbeg{memory~mapping} Una modalità alternativa di I/O, che usa una interfaccia completamente diversa -rispetto a quella classica vista in cap.~\ref{cha:file_unix_interface}, è il +rispetto a quella classica vista in sez.~\ref{sec:file_unix_interface}, è il cosiddetto \textit{memory-mapped I/O}, che, attraverso il meccanismo della \textsl{paginazione} \index{paginazione} usato dalla memoria virtuale (vedi sez.~\ref{sec:proc_mem_gen}), permette di \textsl{mappare} il contenuto di un @@ -3785,7 +3802,7 @@ Il valore dell'argomento \param{prot} indica la protezione\footnote{come pagine di memoria reale, ed le modalità di accesso (lettura, esecuzione, scrittura); una loro violazione causa quella una \itindex{segment~violation} \textit{segment violation}, e la relativa emissione del segnale - \const{SIGSEGV}.} da applicare al segmento di memoria e deve essere + \signal{SIGSEGV}.} da applicare al segmento di memoria e deve essere specificato come maschera binaria ottenuta dall'OR di uno o più dei valori riportati in tab.~\ref{tab:file_mmap_prot}; il valore specificato deve essere compatibile con la modalità di accesso con cui si è aperto il file. @@ -3841,7 +3858,7 @@ tab.~\ref{tab:file_mmap_flag}. modifiche fatte alla regione mappata, in questo caso dopo una scrittura, se non c'è più memoria disponibile, si ha l'emissione di - un \const{SIGSEGV}.\\ + un \signal{SIGSEGV}.\\ \const{MAP\_LOCKED} & Se impostato impedisce lo swapping delle pagine mappate.\\ \const{MAP\_GROWSDOWN} & Usato per gli \itindex{stack} \textit{stack}. @@ -3865,6 +3882,10 @@ tab.~\ref{tab:file_mmap_flag}. % \const{MAP\_DONTEXPAND}& Non consente una successiva espansione dell'area % mappata con \func{mremap}, proposto ma pare non % implementato.\\ +% \const{MAP\_HUGETLB}& da trattare.\\ +% TODO trattare MAP_HUGETLB introdotto con il kernel 2.6.32, e modifiche +% introdotte con il 3.8 per le dimensioni variabili delle huge pages + \hline \end{tabular} \caption{Valori possibili dell'argomento \param{flag} di \func{mmap}.} @@ -3888,7 +3909,7 @@ piuttosto complessi, essi si possono comprendere solo tenendo presente che tutto quanto è comunque basato sul meccanismo della \index{memoria~virtuale} memoria virtuale. Questo comporta allora una serie di conseguenze. La più ovvia è che se si cerca di scrivere su una zona mappata in sola lettura si -avrà l'emissione di un segnale di violazione di accesso (\const{SIGSEGV}), +avrà l'emissione di un segnale di violazione di accesso (\signal{SIGSEGV}), dato che i permessi sul segmento di memoria relativo non consentono questo tipo di accesso. @@ -3915,7 +3936,7 @@ verrà il file sarà mappato su un segmento di memoria che si estende fino al bordo della pagina successiva. In questo caso è possibile accedere a quella zona di memoria che eccede le -dimensioni specificate da \param{length}, senza ottenere un \const{SIGSEGV} +dimensioni specificate da \param{length}, senza ottenere un \signal{SIGSEGV} poiché essa è presente nello spazio di indirizzi del processo, anche se non è mappata sul file. Il comportamento del sistema è quello di restituire un valore nullo per quanto viene letto, e di non riportare su file quanto viene @@ -3929,8 +3950,8 @@ quella della mappatura in memoria. In questa situazione, per la sezione di pagina parzialmente coperta dal contenuto del file, vale esattamente quanto visto in precedenza; invece per la parte che eccede, fino alle dimensioni date da \param{length}, l'accesso non -sarà più possibile, ma il segnale emesso non sarà \const{SIGSEGV}, ma -\const{SIGBUS}, come illustrato in fig.~\ref{fig:file_mmap_exceed}. +sarà più possibile, ma il segnale emesso non sarà \signal{SIGSEGV}, ma +\signal{SIGBUS}, come illustrato in fig.~\ref{fig:file_mmap_exceed}. Non tutti i file possono venire mappati in memoria, dato che, come illustrato in fig.~\ref{fig:file_mmap_layout}, la mappatura introduce una corrispondenza @@ -3972,12 +3993,12 @@ consentita la scrittura sul file (cioè per un file mappato con o in corrispondenza di una eventuale \func{msync}. Dato per i file mappati in memoria le operazioni di I/O sono gestite -direttamente dalla \index{memoria~virtuale}memoria virtuale, occorre essere +direttamente dalla \index{memoria~virtuale} memoria virtuale, occorre essere consapevoli delle interazioni che possono esserci con operazioni effettuate -con l'interfaccia standard dei file di cap.~\ref{cha:file_unix_interface}. Il -problema è che una volta che si è mappato un file, le operazioni di lettura e -scrittura saranno eseguite sulla memoria, e riportate su disco in maniera -autonoma dal sistema della memoria virtuale. +con l'interfaccia dei file di sez.~\ref{sec:file_unix_interface}. Il problema +è che una volta che si è mappato un file, le operazioni di lettura e scrittura +saranno eseguite sulla memoria, e riportate su disco in maniera autonoma dal +sistema della memoria virtuale. Pertanto se si modifica un file con l'interfaccia standard queste modifiche potranno essere visibili o meno a seconda del momento in cui la memoria @@ -4098,7 +4119,7 @@ virtuale. Questa funzione è \funcd{mprotect} ed il suo prototipo è: \begin{errlist} \item[\errcode{EINVAL}] il valore di \param{addr} non è valido o non è un multiplo di \const{PAGE\_SIZE}. - \item[\errcode{EACCESS}] l'operazione non è consentita, ad esempio si è + \item[\errcode{EACCES}] l'operazione non è consentita, ad esempio si è cercato di marcare con \const{PROT\_WRITE} un segmento di memoria cui si ha solo accesso in lettura. % \item[\errcode{ENOMEM}] non è stato possibile allocare le risorse @@ -4158,7 +4179,7 @@ dimensione che si vuole ottenere. Infine l'argomento \param{flags} è una maschera binaria per i flag che controllano il comportamento della funzione. Il solo valore utilizzato è \const{MREMAP\_MAYMOVE}\footnote{per poter utilizzare questa costante occorre aver definito \macro{\_GNU\_SOURCE} prima - di includere \file{sys/mman.h}.} che consente di eseguire l'espansione + di includere \headfile{sys/mman.h}.} che consente di eseguire l'espansione anche quando non è possibile utilizzare il precedente indirizzo. Per questo motivo, se si è usato questo flag, la funzione può restituire un indirizzo della nuova zona di memoria che non è detto coincida con \param{old\_address}. @@ -4208,7 +4229,7 @@ unix-like. Diventa così possibile utilizzare una sola mappatura iniziale\footnote{e quindi una sola \textit{virtual memory area} nella \itindex{page~table} \textit{page table} del processo.} e poi rimappare a piacere all'interno di questa i dati del file. Ciò è possibile grazie ad una -nuova system call, \funcd{remap\_file\_pages}, il cui prototipo è: +nuova \textit{system call}, \funcd{remap\_file\_pages}, il cui prototipo è: \begin{functions} \headdecl{sys/mman.h} @@ -4423,13 +4444,13 @@ l'operazione sia facilmente eseguibile attraverso una serie multipla di chiamate a \func{read} e \func{write}, ci sono casi in cui si vuole poter contare sulla atomicità delle operazioni. -Per questo motivo fino da BSD 4.2 vennero introdotte delle nuove system call -che permettessero di effettuare con una sola chiamata una serie di letture o -scritture su una serie di buffer, con quello che viene normalmente chiamato -\textsl{I/O vettorizzato}. Queste funzioni sono \funcd{readv} e -\funcd{writev},\footnote{in Linux le due funzioni sono riprese da BSD4.4, esse - sono previste anche dallo standard POSIX.1-2001.} ed i relativi prototipi -sono: +Per questo motivo fino da BSD 4.2 vennero introdotte delle nuove +\textit{system call} che permettessero di effettuare con una sola chiamata una +serie di letture o scritture su una serie di buffer, con quello che viene +normalmente chiamato \textsl{I/O vettorizzato}. Queste funzioni sono +\funcd{readv} e \funcd{writev},\footnote{in Linux le due funzioni sono riprese + da BSD4.4, esse sono previste anche dallo standard POSIX.1-2001.} ed i +relativi prototipi sono: \begin{functions} \headdecl{sys/uio.h} @@ -4487,23 +4508,23 @@ La standardizzazione delle due funzioni all'interno della revisione POSIX.1-2001 prevede anche che sia possibile avere un limite al numero di elementi del vettore \param{vector}. Qualora questo sussista, esso deve essere indicato dal valore dalla costante \const{IOV\_MAX}, definita come le altre -costanti analoghe (vedi sez.~\ref{sec:sys_limits}) in \file{limits.h}; lo +costanti analoghe (vedi sez.~\ref{sec:sys_limits}) in \headfile{limits.h}; lo stesso valore deve essere ottenibile in esecuzione tramite la funzione \func{sysconf} richiedendo l'argomento \const{\_SC\_IOV\_MAX} (vedi -sez.~\ref{sec:sys_sysconf}). +sez.~\ref{sec:sys_limits}). Nel caso di Linux il limite di sistema è di 1024, però se si usano le -\acr{glibc} queste forniscono un \textit{wrapper} per le system call che si -accorge se una operazione supererà il precedente limite, in tal caso i dati -verranno letti o scritti con le usuali \func{read} e \func{write} usando un -buffer di dimensioni sufficienti appositamente allocato e sufficiente a +\acr{glibc} queste forniscono un \textit{wrapper} per le \textit{system call} +che si accorge se una operazione supererà il precedente limite, in tal caso i +dati verranno letti o scritti con le usuali \func{read} e \func{write} usando +un buffer di dimensioni sufficienti appositamente allocato e sufficiente a contenere tutti i dati indicati da \param{vector}. L'operazione avrà successo ma si perderà l'atomicità del trasferimento da e verso la destinazione finale. Si tenga presente infine che queste funzioni operano sui file con l'interfaccia dei file descriptor, e non è consigliabile mescolarle con l'interfaccia classica dei \textit{file stream} di -cap.~\ref{cha:files_std_interface}; a causa delle bufferizzazioni interne di +sez.~\ref{sec:files_std_interface}; a causa delle bufferizzazioni interne di quest'ultima infatti si potrebbero avere risultati indefiniti e non corrispondenti a quanto aspettato. @@ -4513,7 +4534,7 @@ maniera atomica a partire da un certa posizione sul file. Per questo motivo a partire dal kernel 2.6.30 sono state introdotte anche per l'\textsl{I/O vettorizzato} le analoghe delle funzioni \func{pread} e \func{pwrite} (vedi sez.~\ref{sec:file_read} e \ref{sec:file_write}); le due funzioni sono -\funcd{preadv} e \func{pwritev} ed i rispettivi prototipi sono:\footnote{le +\funcd{preadv} e \funcd{pwritev} ed i rispettivi prototipi sono:\footnote{le due funzioni sono analoghe alle omonime presenti in BSD; le \textit{system call} usate da Linux (introdotte a partire dalla versione 2.6.30) utilizzano degli argomenti diversi per problemi collegati al formato a 64 @@ -4537,7 +4558,7 @@ sez.~\ref{sec:file_read} e \ref{sec:file_write}); le due funzioni sono per \var{errno} anche i valori: \begin{errlist} \item[\errcode{EOVERFLOW}] \param{offset} ha un valore che non può essere - usato come \ctyp{off\_t}. + usato come \type{off\_t}. \item[\errcode{ESPIPE}] \param{fd} è associato ad un socket o una pipe. \end{errlist} } @@ -4653,8 +4674,7 @@ significativi delle prestazioni rispetto all'uso in sequenza di \func{read} e che anzi in certi casi si potevano avere anche dei peggioramenti. Questo ha portato, per i kernel della serie 2.6,\footnote{per alcune motivazioni di questa scelta si può fare riferimento a quanto illustrato da Linus Torvalds - in \href{http://www.cs.helsinki.fi/linux/linux-kernel/2001-03/0200.html} - {\textsf{http://www.cs.helsinki.fi/linux/linux-kernel/2001-03/0200.html}}.} + in \url{http://www.cs.helsinki.fi/linux/linux-kernel/2001-03/0200.html}.} alla decisione di consentire l'uso della funzione soltanto quando il file da cui si legge supporta le operazioni di \textit{memory mapping} (vale a dire non è un socket) e quello su cui si scrive è un socket; in tutti gli altri @@ -4677,34 +4697,34 @@ semplicemente un ``\textsl{dimezzamento}'' di \func{sendfile}.\footnote{nel senso che un trasferimento di dati fra due file con \func{sendfile} non sarebbe altro che la lettura degli stessi su un buffer seguita dalla relativa scrittura, cosa che in questo caso si dovrebbe eseguire con due - chiamate a \func{splice}.} In realtà le due system call sono profondamente -diverse nel loro meccanismo di funzionamento;\footnote{questo fino al kernel - 2.6.23, dove \func{sendfile} è stata reimplementata in termini di - \func{splice}, pur mantenendo disponibile la stessa interfaccia verso l'user - space.} \func{sendfile} infatti, come accennato, non necessita di avere a -disposizione un buffer interno, perché esegue un trasferimento diretto di -dati; questo la rende in generale più efficiente, ma anche limitata nelle sue -applicazioni, dato che questo tipo di trasferimento è possibile solo in casi -specifici.\footnote{e nel caso di Linux questi sono anche solo quelli in cui - essa può essere effettivamente utilizzata.} + chiamate a \func{splice}.} In realtà le due \textit{system call} sono +profondamente diverse nel loro meccanismo di funzionamento;\footnote{questo + fino al kernel 2.6.23, dove \func{sendfile} è stata reimplementata in + termini di \func{splice}, pur mantenendo disponibile la stessa interfaccia + verso l'user space.} \func{sendfile} infatti, come accennato, non necessita +di avere a disposizione un buffer interno, perché esegue un trasferimento +diretto di dati; questo la rende in generale più efficiente, ma anche limitata +nelle sue applicazioni, dato che questo tipo di trasferimento è possibile solo +in casi specifici.\footnote{e nel caso di Linux questi sono anche solo quelli + in cui essa può essere effettivamente utilizzata.} Il concetto che sta dietro a \func{splice} invece è diverso,\footnote{in realtà la proposta originale di Larry Mc Voy non differisce poi tanto negli scopi da \func{sendfile}, quello che rende \func{splice} davvero diversa è stata la reinterpretazione che ne è stata fatta nell'implementazione su Linux realizzata da Jens Anxboe, concetti che sono esposti sinteticamente - dallo stesso Linus Torvalds in \href{http://kerneltrap.org/node/6505} - {\textsf{http://kerneltrap.org/node/6505}}.} si tratta semplicemente di una -funzione che consente di fare in maniera del tutto generica delle operazioni -di trasferimento di dati fra un file e un buffer gestito interamente in kernel -space. In questo caso il cuore della funzione (e delle affini \func{vmsplice} -e \func{tee}, che tratteremo più avanti) è appunto l'uso di un buffer in -kernel space, e questo è anche quello che ne ha semplificato l'adozione, -perché l'infrastruttura per la gestione di un tale buffer è presente fin dagli -albori di Unix per la realizzazione delle \textit{pipe} (vedi -sez.~\ref{sec:ipc_unix}). Dal punto di vista concettuale allora \func{splice} -non è altro che una diversa interfaccia (rispetto alle \textit{pipe}) con cui -utilizzare in user space l'oggetto ``\textsl{buffer in kernel space}''. + dallo stesso Linus Torvalds in \url{http://kerneltrap.org/node/6505}.} si +tratta semplicemente di una funzione che consente di fare in maniera del tutto +generica delle operazioni di trasferimento di dati fra un file e un buffer +gestito interamente in kernel space. In questo caso il cuore della funzione (e +delle affini \func{vmsplice} e \func{tee}, che tratteremo più avanti) è +appunto l'uso di un buffer in kernel space, e questo è anche quello che ne ha +semplificato l'adozione, perché l'infrastruttura per la gestione di un tale +buffer è presente fin dagli albori di Unix per la realizzazione delle +\textit{pipe} (vedi sez.~\ref{sec:ipc_unix}). Dal punto di vista concettuale +allora \func{splice} non è altro che una diversa interfaccia (rispetto alle +\textit{pipe}) con cui utilizzare in user space l'oggetto ``\textsl{buffer in + kernel space}''. Così se per una \textit{pipe} o una \textit{fifo} il buffer viene utilizzato come area di memoria (vedi fig.~\ref{fig:ipc_pipe_singular}) dove appoggiare i @@ -4737,7 +4757,7 @@ definito la macro \macro{\_GNU\_SOURCE},\footnote{si ricordi che questa \func{splice}, oppure nessuno dei file descriptor è una pipe, oppure si è dato un valore a \param{off\_in} o \param{off\_out} ma il corrispondente file è un dispositivo che non supporta la funzione - \func{seek}. + \func{lseek}. \item[\errcode{ENOMEM}] non c'è memoria sufficiente per l'operazione richiesta. \item[\errcode{ESPIPE}] o \param{off\_in} o \param{off\_out} non sono @@ -5026,7 +5046,7 @@ La funzione copia \param{len} byte del contenuto di una \textit{pipe} su di un'altra; \param{fd\_in} deve essere il capo in lettura della \textit{pipe} sorgente e \param{fd\_out} il capo in scrittura della \textit{pipe} destinazione; a differenza di quanto avviene con \func{read} i dati letti con -\func{tee} da \func{fd\_in} non vengono \textsl{consumati} e restano +\func{tee} da \param{fd\_in} non vengono \textsl{consumati} e restano disponibili sulla \textit{pipe} per una successiva lettura (di nuovo per il comportamento delle \textit{pipe} si veda sez.~\ref{sec:ipc_unix}). Al momento\footnote{quello della stesura di questo paragrafo, avvenuta il Gennaio @@ -5085,16 +5105,16 @@ fig.~\ref{fig:splice_example}). Infine una nota finale riguardo \func{splice}, \func{vmsplice} e \func{tee}: occorre sottolineare che benché finora si sia parlato di trasferimenti o copie -di dati in realtà nella implementazione di queste system call non è affatto -detto che i dati vengono effettivamente spostati o copiati, il kernel infatti -realizza le \textit{pipe} come un insieme di puntatori\footnote{per essere - precisi si tratta di un semplice buffer circolare, un buon articolo sul tema - si trova su \href{http://lwn.net/Articles/118750/} - {\textsf{http://lwn.net/Articles/118750/}}.} alle pagine di memoria interna -che contengono i dati, per questo una volta che i dati sono presenti nella -memoria del kernel tutto quello che viene fatto è creare i suddetti puntatori -ed aumentare il numero di referenze; questo significa che anche con \func{tee} -non viene mai copiato nessun byte, vengono semplicemente copiati i puntatori. +di dati in realtà nella implementazione di queste \textit{system call} non è +affatto detto che i dati vengono effettivamente spostati o copiati, il kernel +infatti realizza le \textit{pipe} come un insieme di puntatori\footnote{per + essere precisi si tratta di un semplice buffer circolare, un buon articolo + sul tema si trova su \url{http://lwn.net/Articles/118750/}.} alle pagine di +memoria interna che contengono i dati, per questo una volta che i dati sono +presenti nella memoria del kernel tutto quello che viene fatto è creare i +suddetti puntatori ed aumentare il numero di referenze; questo significa che +anche con \func{tee} non viene mai copiato nessun byte, vengono semplicemente +copiati i puntatori. % TODO?? dal 2.6.25 splice ha ottenuto il supporto per la ricezione su rete @@ -5174,7 +5194,7 @@ nelle operazioni successive. Il concetto di \func{readahead} viene generalizzato nello standard POSIX.1-2001 dalla funzione \func{posix\_fadvise},\footnote{anche se - l'argomento \param{len} è stato modificato da \ctyp{size\_t} a \ctyp{off\_t} + l'argomento \param{len} è stato modificato da \type{size\_t} a \type{off\_t} nella revisione POSIX.1-2003 TC5.} che consente di ``\textsl{avvisare}'' il kernel sulle modalità con cui si intende accedere nel futuro ad una certa porzione di un file,\footnote{la funzione però è stata introdotta su Linux @@ -5356,7 +5376,7 @@ Trattandosi di una funzione di servizio, ed ovviamente disponibile esclusivamente su Linux, inizialmente \funcd{fallocate} non era stata definita come funzione di libreria,\footnote{pertanto poteva essere invocata soltanto in maniera indiretta con l'ausilio di \func{syscall}, vedi - sez.~\ref{sec:intro_syscall}, come \code{long fallocate(int fd, int mode, + sez.~\ref{sec:proc_syscall}, come \code{long fallocate(int fd, int mode, loff\_t offset, loff\_t len)}.} ma a partire dalle \acr{glibc} 2.10 è stato fornito un supporto esplicito; il suo prototipo è: \begin{functions} @@ -5405,15 +5425,11 @@ livello di kernel. % vedi http://lwn.net/Articles/226710/ e http://lwn.net/Articles/240571/ % http://kernelnewbies.org/Linux_2_6_23 - - - - % TODO non so dove trattarli, ma dal 2.6.39 ci sono i file handle, vedi % http://lwn.net/Articles/432757/ -% LocalWords: dell'I locking multiplexing cap dell' sez system call socket BSD +% LocalWords: dell'I locking multiplexing cap sez system call socket BSD % LocalWords: descriptor client deadlock NONBLOCK EAGAIN polling select kernel % LocalWords: pselect like sys unistd int fd readfds writefds exceptfds struct % LocalWords: timeval errno EBADF EINTR EINVAL ENOMEM sleep tab signal void of @@ -5441,7 +5457,7 @@ livello di kernel. % LocalWords: ENFILE lenght segment violation SIGSEGV FIXED msync munmap copy % LocalWords: DoS Denial Service EXECUTABLE NORESERVE LOCKED swapping stack fs % LocalWords: GROWSDOWN ANON POPULATE prefaulting SIGBUS fifo VME fork old SFD -% LocalWords: exec atime ctime mtime mprotect addr EACCESS mremap address new +% LocalWords: exec atime ctime mtime mprotect addr mremap address new % LocalWords: long MAYMOVE realloc VMA virtual Ingo Molnar remap pages pgoff % LocalWords: dall' fault cache linker prelink advisory discrectionary lock fl % LocalWords: flock shared exclusive operation dup inode linked NFS cmd ENOLCK