X-Git-Url: https://gapil.gnulinux.it/gitweb/?a=blobdiff_plain;f=fileadv.tex;h=a4ca6e28ae80d4cd30656cb521cd36fa588be2c8;hb=7d039accae81b30524e7a01f0b3d24ae79ddbaf1;hp=b35d14c1e4a5be77613082b59797b32fe8793ee4;hpb=ffb12837c5ed8ccc095bc9c88349cd19b5e6b472;p=gapil.git diff --git a/fileadv.tex b/fileadv.tex index b35d14c..a4ca6e2 100644 --- a/fileadv.tex +++ b/fileadv.tex @@ -26,12 +26,12 @@ controllo più dettagliato delle modalità di I/O. \itindbeg{file~locking} -In sez.~\ref{sec:file_sharing} abbiamo preso in esame le modalità in cui un -sistema unix-like gestisce la condivisione dei file da parte di processi -diversi. In quell'occasione si è visto come, con l'eccezione dei file aperti -in \itindex{append~mode} \textit{append mode}, quando più processi scrivono -contemporaneamente sullo stesso file non è possibile determinare la sequenza -in cui essi opereranno. +In sez.~\ref{sec:file_shared_access} abbiamo preso in esame le modalità in cui +un sistema unix-like gestisce l'accesso concorrente ai file da parte di +processi diversi. In quell'occasione si è visto come, con l'eccezione dei file +aperti in \itindex{append~mode} \textit{append mode}, quando più processi +scrivono contemporaneamente sullo stesso file non è possibile determinare la +sequenza in cui essi opereranno. Questo causa la possibilità di una \itindex{race~condition} \textit{race condition}; in generale le situazioni più comuni sono due: l'interazione fra @@ -244,14 +244,14 @@ possono avere due processi diversi che aprono lo stesso file. La richiesta di un \textit{file lock} prevede una scansione della lista per determinare se l'acquisizione è possibile, ed in caso positivo l'aggiunta di -un nuovo elemento.\footnote{cioè una nuova struttura \struct{file\_lock}.} +un nuovo elemento.\footnote{cioè una nuova struttura \kstruct{file\_lock}.} Nel caso dei blocchi creati con \func{flock} la semantica della funzione prevede che sia \func{dup} che \func{fork} non creino ulteriori istanze di un \textit{file lock} quanto piuttosto degli ulteriori riferimenti allo stesso. Questo viene realizzato dal kernel secondo lo schema di fig.~\ref{fig:file_flock_struct}, associando ad ogni nuovo \textit{file lock} un puntatore\footnote{il puntatore è mantenuto nel campo \var{fl\_file} di - \struct{file\_lock}, e viene utilizzato solo per i \textit{file lock} creati + \kstruct{file\_lock}, e viene utilizzato solo per i \textit{file lock} creati con la semantica BSD.} alla voce nella \itindex{file~table} \textit{file table} da cui si è richiesto il blocco, che così ne identifica il titolare. @@ -260,8 +260,8 @@ Questa struttura prevede che, quando si richiede la rimozione di un file descriptor che fa riferimento ad una voce nella \itindex{file~table} \textit{file table} corrispondente a quella registrata nel blocco. Allora se ricordiamo quanto visto in sez.~\ref{sec:file_dup} e -sez.~\ref{sec:file_sharing}, e cioè che i file descriptor duplicati e quelli -ereditati in un processo figlio puntano sempre alla stessa voce nella +sez.~\ref{sec:file_shared_access}, e cioè che i file descriptor duplicati e +quelli ereditati in un processo figlio puntano sempre alla stessa voce nella \itindex{file~table} \textit{file table}, si può capire immediatamente quali sono le conseguenze nei confronti delle funzioni \func{dup} e \func{fork}. @@ -460,7 +460,7 @@ sez.~\ref{sec:file_flock}) esaminiamo più in dettaglio come viene gestito dal kernel. Lo schema delle strutture utilizzate è riportato in fig.~\ref{fig:file_posix_lock}; come si vede esso è molto simile all'analogo di fig.~\ref{fig:file_flock_struct}:\footnote{in questo caso nella figura si - sono evidenziati solo i campi di \struct{file\_lock} significativi per la + sono evidenziati solo i campi di \kstruct{file\_lock} significativi per la semantica POSIX, in particolare adesso ciascuna struttura contiene, oltre al \ids{PID} del processo in \var{fl\_pid}, la sezione di file che viene bloccata grazie ai campi \var{fl\_start} e \var{fl\_end}. La struttura è @@ -481,7 +481,7 @@ voce nella \itindex{file~table} \textit{file table}, ma con il valore del Quando si richiede un \textit{file lock} il kernel effettua una scansione di tutti i blocchi presenti sul file\footnote{scandisce cioè la \itindex{linked~list} \textit{linked list} delle strutture - \struct{file\_lock}, scartando automaticamente quelle per cui + \kstruct{file\_lock}, scartando automaticamente quelle per cui \var{fl\_flags} non è \const{FL\_POSIX}, così che le due interfacce restano ben separate.} per verificare se la regione richiesta non si sovrappone ad una già bloccata, in caso affermativo decide in base al tipo di blocco, in @@ -835,7 +835,7 @@ bloccare completamente un server NFS richiedendo una lettura su un file su cui è attivo un blocco. Per questo motivo l'abilitazione del \textit{mandatory locking} è di norma disabilitata, e deve essere attivata filesystem per filesystem in fase di montaggio (specificando l'apposita opzione di -\func{mount} riportata in sez.~\ref{sec:sys_file_config}), o con l'opzione +\func{mount} riportata in sez.~\ref{sec:filesystem_mounting}), o con l'opzione \code{-o mand} per il comando omonimo). Si tenga presente inoltre che il \textit{mandatory locking} funziona solo @@ -901,7 +901,7 @@ possibilità di modificare il file. Uno dei problemi che si presentano quando si deve operare contemporaneamente su molti file usando le funzioni illustrate in -cap.~\ref{cha:file_unix_interface} e cap.~\ref{cha:files_std_interface} è che +sez.~\ref{sec:file_unix_interface} e sez.~\ref{sec:files_std_interface} è che si può essere bloccati nelle operazioni su un file mentre un altro potrebbe essere disponibile. L'\textit{I/O multiplexing} nasce risposta a questo problema. In questa sezione forniremo una introduzione a questa problematica @@ -934,18 +934,18 @@ nel peggiore dei casi (quando la conclusione della operazione bloccata dipende da quanto si otterrebbe dal file descriptor ``\textsl{disponibile}'') si potrebbe addirittura arrivare ad un \itindex{deadlock} \textit{deadlock}. -Abbiamo già accennato in sez.~\ref{sec:file_open} che è possibile prevenire -questo tipo di comportamento delle funzioni di I/O aprendo un file in -\textsl{modalità non-bloccante}, attraverso l'uso del flag \const{O\_NONBLOCK} -nella chiamata di \func{open}. In questo caso le funzioni di input/output -eseguite sul file che si sarebbero bloccate, ritornano immediatamente, -restituendo l'errore \errcode{EAGAIN}. L'utilizzo di questa modalità di I/O -permette di risolvere il problema controllando a turno i vari file descriptor, -in un ciclo in cui si ripete l'accesso fintanto che esso non viene garantito. -Ovviamente questa tecnica, detta \itindex{polling} \textit{polling}, è -estremamente inefficiente: si tiene costantemente impiegata la CPU solo per -eseguire in continuazione delle system call che nella gran parte dei casi -falliranno. +Abbiamo già accennato in sez.~\ref{sec:file_open_close} che è possibile +prevenire questo tipo di comportamento delle funzioni di I/O aprendo un file +in \textsl{modalità non-bloccante}, attraverso l'uso del flag +\const{O\_NONBLOCK} nella chiamata di \func{open}. In questo caso le funzioni +di input/output eseguite sul file che si sarebbero bloccate, ritornano +immediatamente, restituendo l'errore \errcode{EAGAIN}. L'utilizzo di questa +modalità di I/O permette di risolvere il problema controllando a turno i vari +file descriptor, in un ciclo in cui si ripete l'accesso fintanto che esso non +viene garantito. Ovviamente questa tecnica, detta \itindex{polling} +\textit{polling}, è estremamente inefficiente: si tiene costantemente +impiegata la CPU solo per eseguire in continuazione delle system call che +nella gran parte dei casi falliranno. Per superare questo problema è stato introdotto il concetto di \textit{I/O multiplexing}, una nuova modalità di operazioni che consente di tenere sotto @@ -1547,7 +1547,7 @@ maschera binaria in fase di creazione del file descriptor. Al momento l'unico valore legale per \param{flags} (a parte lo zero) è \const{EPOLL\_CLOEXEC}, che consente di impostare in maniera atomica sul file descriptor il flag di \itindex{close-on-exec} \textit{close-on-exec} (si veda il significato di -\const{O\_CLOEXEC} in tab.~\ref{tab:file_open_flags}), senza che sia +\const{O\_CLOEXEC} in sez.~\ref{sec:file_open_close}), senza che sia necessaria una successiva chiamata a \func{fcntl}. Una volta ottenuto un file descriptor per \textit{epoll} il passo successivo è @@ -1714,12 +1714,14 @@ l'insieme dei file descriptor da tenere sotto controllo tramite un certo chiamate devono essere ripetute per ciascun file descriptor, incorrendo in una perdita di prestazioni qualora il numero di file descriptor sia molto grande; per questo è stato proposto di introdurre come estensione una - funzione \func{epoll\_ctlv} che consenta di effettuare con una sola chiamata + funzione \code{epoll\_ctlv} che consenta di effettuare con una sola chiamata le impostazioni per un blocco di file descriptor.} L'uso di \const{EPOLL\_CTL\_MOD} consente in seguito di modificare le modalità di osservazione di un file descriptor che sia già stato aggiunto alla lista di osservazione. +% TODO verificare se prima o poi epoll_ctlv verrà introdotta + Le impostazioni di default prevedono che la notifica degli eventi richiesti sia effettuata in modalità \textit{level triggered}, a meno che sul file descriptor non si sia impostata la modalità \textit{edge triggered}, @@ -1933,7 +1935,7 @@ descriptor è \funcd{signalfd},\footnote{in realtà quella riportata è versioni diverse della \textit{system call}; una prima versione, \func{signalfd}, introdotta nel kernel 2.6.22 e disponibile con le \acr{glibc} 2.8 che non supporta l'argomento \texttt{flags}, ed una seconda - versione, \func{signalfd4}, introdotta con il kernel 2.6.27 e che è quella + versione, \funcm{signalfd4}, introdotta con il kernel 2.6.27 e che è quella che viene sempre usata a partire dalle \acr{glibc} 2.9, che prende un argomento aggiuntivo \code{size\_t sizemask} che indica la dimensione della maschera dei segnali, il cui valore viene impostato automaticamente dalle @@ -2205,7 +2207,7 @@ ritorno della funzione \func{read} è negativo, uscendo dal programma In presenza di dati invece il programma proseguirà l'esecuzione stampando (\texttt{\small 19--20}) il nome del segnale ottenuto all'interno della -struttura \const{signalfd\_siginfo} letta in \var{siginf}\footnote{per la +struttura \struct{signalfd\_siginfo} letta in \var{siginf}\footnote{per la stampa si è usato il vettore \var{sig\_names} a ciascun elemento del quale corrisponde il nome del segnale avente il numero corrispondente, la cui definizione si è omessa dal codice di fig.~\ref{fig:fiforeporter_code_init} @@ -2476,19 +2478,19 @@ operazioni di I/O volute. \itindbeg{signal~driven~I/O} -Abbiamo accennato in sez.~\ref{sec:file_open} che è possibile, attraverso -l'uso del flag \const{O\_ASYNC},\footnote{l'uso del flag di \const{O\_ASYNC} e - dei comandi \const{F\_SETOWN} e \const{F\_GETOWN} per \func{fcntl} è - specifico di Linux e BSD.} aprire un file in modalità asincrona, così come è -possibile attivare in un secondo tempo questa modalità impostando questo flag -attraverso l'uso di \func{fcntl} con il comando \const{F\_SETFL} (vedi -sez.~\ref{sec:file_fcntl}). In realtà parlare di apertura in modalità -asincrona non significa che le operazioni di lettura o scrittura del file -vengono eseguite in modo asincrono (tratteremo questo, che è ciò che più +Abbiamo accennato in sez.~\ref{sec:file_open_close} che è definito un flag +\const{O\_ASYNC}, che consentirebbe di aprire un file in modalità asincrona, +anche se in realtà è opportuno attivare in un secondo tempo questa modalità +impostando questo flag attraverso l'uso di \func{fcntl} con il comando +\const{F\_SETFL} (vedi sez.~\ref{sec:file_fcntl}).\footnote{l'uso del flag di + \const{O\_ASYNC} e dei comandi \const{F\_SETOWN} e \const{F\_GETOWN} per + \func{fcntl} è specifico di Linux e BSD.} In realtà parlare di apertura in +modalità asincrona non significa che le operazioni di lettura o scrittura del +file vengono eseguite in modo asincrono (tratteremo questo, che è ciò che più propriamente viene chiamato \textsl{I/O asincrono}, in sez.~\ref{sec:file_asyncronous_io}), quanto dell'attivazione un meccanismo di notifica asincrona delle variazione dello stato del file descriptor aperto in -questo modo. +questo modo. Quello che succede è che per tutti i file posti in questa modalità\footnote{si tenga presente però che essa non è utilizzabile con i file ordinari ma solo @@ -3167,15 +3169,15 @@ così all'applicazione di collegare la corrispondente coppia di eventi Infine due campi \var{name} e \var{len} sono utilizzati soltanto quando l'evento è relativo ad un file presente in una directory posta sotto osservazione, in tal caso essi contengono rispettivamente il nome del file -(come pathname relativo alla directory osservata) e la relativa dimensione in -byte. Il campo \var{name} viene sempre restituito come stringa terminata da -NUL, con uno o più zeri di terminazione, a seconda di eventuali necessità di -allineamento del risultato, ed il valore di \var{len} corrisponde al totale -della dimensione di \var{name}, zeri aggiuntivi compresi. La stringa con il -nome del file viene restituita nella lettura subito dopo la struttura -\struct{inotify\_event}; questo significa che le dimensioni di ciascun evento -di \textit{inotify} saranno pari a \code{sizeof(\struct{inotify\_event}) + - len}. +(come \itindsub{pathname}{relativo} \textit{pathname} relativo alla directory +osservata) e la relativa dimensione in byte. Il campo \var{name} viene sempre +restituito come stringa terminata da NUL, con uno o più zeri di terminazione, +a seconda di eventuali necessità di allineamento del risultato, ed il valore +di \var{len} corrisponde al totale della dimensione di \var{name}, zeri +aggiuntivi compresi. La stringa con il nome del file viene restituita nella +lettura subito dopo la struttura \struct{inotify\_event}; questo significa che +le dimensioni di ciascun evento di \textit{inotify} saranno pari a +\code{sizeof(\struct{inotify\_event}) + len}. Vediamo allora un esempio dell'uso dell'interfaccia di \textit{inotify} con un semplice programma che permette di mettere sotto osservazione uno o più file e @@ -3312,7 +3314,9 @@ raggruppati in un solo evento. \subsection{L'interfaccia POSIX per l'I/O asincrono} \label{sec:file_asyncronous_io} -% vedere anche http://davmac.org/davpage/linux/async-io.html +% vedere anche http://davmac.org/davpage/linux/async-io.html e +% http://www.ibm.com/developerworks/linux/library/l-async/ + Una modalità alternativa all'uso dell'\textit{I/O multiplexing} per gestione dell'I/O simultaneo su molti file è costituita dal cosiddetto \textsl{I/O @@ -3423,8 +3427,9 @@ richiesta, o in caso di errore. Non è detto che gli errori \errcode{EBADF} ed potrebbero anche emergere nelle fasi successive delle operazioni. Lettura e scrittura avvengono alla posizione indicata da \var{aio\_offset}, a meno che il file non sia stato aperto in \itindex{append~mode} \textit{append mode} -(vedi sez.~\ref{sec:file_open}), nel qual caso le scritture vengono effettuate -comunque alla fine de file, nell'ordine delle chiamate a \func{aio\_write}. +(vedi sez.~\ref{sec:file_open_close}), nel qual caso le scritture vengono +effettuate comunque alla fine de file, nell'ordine delle chiamate a +\func{aio\_write}. Si tenga inoltre presente che deallocare la memoria indirizzata da \param{aiocbp} o modificarne i valori prima della conclusione di una @@ -3651,9 +3656,10 @@ per il campo \var{aio\_sigevent} di \struct{aiocb}. Oltre alle precedenti modalità di \textit{I/O multiplexing} e \textsl{I/O asincrono}, esistono altre funzioni che implementano delle modalità di accesso ai file più evolute rispetto alle normali funzioni di lettura e -scrittura che abbiamo esaminato in sez.~\ref{sec:file_base_func}. In questa -sezione allora prenderemo in esame le interfacce per l'\textsl{I/O mappato in - memoria}, per l'\textsl{I/O vettorizzato} e altre funzioni di I/O avanzato. +scrittura che abbiamo esaminato in sez.~\ref{sec:file_unix_interface}. In +questa sezione allora prenderemo in esame le interfacce per l'\textsl{I/O + mappato in memoria}, per l'\textsl{I/O vettorizzato} e altre funzioni di I/O +avanzato. \subsection{File mappati in memoria} @@ -3661,7 +3667,7 @@ sezione allora prenderemo in esame le interfacce per l'\textsl{I/O mappato in \itindbeg{memory~mapping} Una modalità alternativa di I/O, che usa una interfaccia completamente diversa -rispetto a quella classica vista in cap.~\ref{cha:file_unix_interface}, è il +rispetto a quella classica vista in sez.~\ref{sec:file_unix_interface}, è il cosiddetto \textit{memory-mapped I/O}, che, attraverso il meccanismo della \textsl{paginazione} \index{paginazione} usato dalla memoria virtuale (vedi sez.~\ref{sec:proc_mem_gen}), permette di \textsl{mappare} il contenuto di un @@ -3973,12 +3979,12 @@ consentita la scrittura sul file (cioè per un file mappato con o in corrispondenza di una eventuale \func{msync}. Dato per i file mappati in memoria le operazioni di I/O sono gestite -direttamente dalla \index{memoria~virtuale}memoria virtuale, occorre essere +direttamente dalla \index{memoria~virtuale} memoria virtuale, occorre essere consapevoli delle interazioni che possono esserci con operazioni effettuate -con l'interfaccia standard dei file di cap.~\ref{cha:file_unix_interface}. Il -problema è che una volta che si è mappato un file, le operazioni di lettura e -scrittura saranno eseguite sulla memoria, e riportate su disco in maniera -autonoma dal sistema della memoria virtuale. +con l'interfaccia dei file di sez.~\ref{sec:file_unix_interface}. Il problema +è che una volta che si è mappato un file, le operazioni di lettura e scrittura +saranno eseguite sulla memoria, e riportate su disco in maniera autonoma dal +sistema della memoria virtuale. Pertanto se si modifica un file con l'interfaccia standard queste modifiche potranno essere visibili o meno a seconda del momento in cui la memoria @@ -4504,7 +4510,7 @@ ma si perderà l'atomicità del trasferimento da e verso la destinazione finale. Si tenga presente infine che queste funzioni operano sui file con l'interfaccia dei file descriptor, e non è consigliabile mescolarle con l'interfaccia classica dei \textit{file stream} di -cap.~\ref{cha:files_std_interface}; a causa delle bufferizzazioni interne di +sez.~\ref{sec:files_std_interface}; a causa delle bufferizzazioni interne di quest'ultima infatti si potrebbero avere risultati indefiniti e non corrispondenti a quanto aspettato. @@ -4514,7 +4520,7 @@ maniera atomica a partire da un certa posizione sul file. Per questo motivo a partire dal kernel 2.6.30 sono state introdotte anche per l'\textsl{I/O vettorizzato} le analoghe delle funzioni \func{pread} e \func{pwrite} (vedi sez.~\ref{sec:file_read} e \ref{sec:file_write}); le due funzioni sono -\funcd{preadv} e \func{pwritev} ed i rispettivi prototipi sono:\footnote{le +\funcd{preadv} e \funcd{pwritev} ed i rispettivi prototipi sono:\footnote{le due funzioni sono analoghe alle omonime presenti in BSD; le \textit{system call} usate da Linux (introdotte a partire dalla versione 2.6.30) utilizzano degli argomenti diversi per problemi collegati al formato a 64 @@ -4737,7 +4743,7 @@ definito la macro \macro{\_GNU\_SOURCE},\footnote{si ricordi che questa \func{splice}, oppure nessuno dei file descriptor è una pipe, oppure si è dato un valore a \param{off\_in} o \param{off\_out} ma il corrispondente file è un dispositivo che non supporta la funzione - \func{seek}. + \func{lseek}. \item[\errcode{ENOMEM}] non c'è memoria sufficiente per l'operazione richiesta. \item[\errcode{ESPIPE}] o \param{off\_in} o \param{off\_out} non sono @@ -5026,7 +5032,7 @@ La funzione copia \param{len} byte del contenuto di una \textit{pipe} su di un'altra; \param{fd\_in} deve essere il capo in lettura della \textit{pipe} sorgente e \param{fd\_out} il capo in scrittura della \textit{pipe} destinazione; a differenza di quanto avviene con \func{read} i dati letti con -\func{tee} da \func{fd\_in} non vengono \textsl{consumati} e restano +\func{tee} da \param{fd\_in} non vengono \textsl{consumati} e restano disponibili sulla \textit{pipe} per una successiva lettura (di nuovo per il comportamento delle \textit{pipe} si veda sez.~\ref{sec:ipc_unix}). Al momento\footnote{quello della stesura di questo paragrafo, avvenuta il Gennaio @@ -5405,10 +5411,6 @@ livello di kernel. % vedi http://lwn.net/Articles/226710/ e http://lwn.net/Articles/240571/ % http://kernelnewbies.org/Linux_2_6_23 - - - - % TODO non so dove trattarli, ma dal 2.6.39 ci sono i file handle, vedi % http://lwn.net/Articles/432757/