Trattati gli sparse file e gli hole dei file, e aggiunte varie correzioni

[gapil.git] / fileadv.tex
diff --git a/fileadv.tex b/fileadv.tex

index 97249198be36d745d604947117032ff1c642b114..5a6a3c2371ccd160ee2e583b8ff9cf42768fb89a 100644 (file)
--- a/fileadv.tex
+++ b/fileadv.tex
@@ -4315,17 +4315,17 @@ anche se un valore nullo avrebbe dato gli stessi risultati, l'uso di questi
  flag, che si ricordi servono solo a dare suggerimenti al kernel, permette in
  genere di migliorare le prestazioni.
  
  flag, che si ricordi servono solo a dare suggerimenti al kernel, permette in
  genere di migliorare le prestazioni.
  
-Come accennato con l'introduzione di \func{splice} sono state realizzate altre
-due system call, \func{vmsplice} e \func{tee}, che utilizzano la stessa
-infrastruttura e si basano sullo stesso concetto di manipolazione e
+Come accennato con l'introduzione di \func{splice} sono state realizzate anche
+altre due \textit{system call}, \func{vmsplice} e \func{tee}, che utilizzano
+la stessa infrastruttura e si basano sullo stesso concetto di manipolazione e
  trasferimento di dati attraverso un buffer in kernel space; benché queste non
  attengono strettamente ad operazioni di trasferimento dati fra file
  trasferimento di dati attraverso un buffer in kernel space; benché queste non
  attengono strettamente ad operazioni di trasferimento dati fra file
-descriptor, le tratteremo qui.
+descriptor, le tratteremo qui, essendo strettamente correlate fra loro.
  
  La prima funzione, \funcd{vmsplice}, è la più simile a \func{splice} e come
  
  La prima funzione, \funcd{vmsplice}, è la più simile a \func{splice} e come
-indica il suo nome consente di trasferire i dati dalla memoria di un processo
-(ad esempio per un file mappato in memoria) verso una \textit{pipe}, il suo
-prototipo è:
+indica il suo nome consente di trasferire i dati dalla memoria virtuale di un
+processo (ad esempio per un file mappato in memoria) verso una \textit{pipe};
+il suo prototipo è:
  \begin{functions}  
    \headdecl{fcntl.h} 
    \headdecl{sys/uio.h}
  \begin{functions}  
    \headdecl{fcntl.h} 
    \headdecl{sys/uio.h}
@@ -4351,24 +4351,25 @@ prototipo 
  
  La \textit{pipe} indicata da \param{fd} dovrà essere specificata tramite il
  file descriptor corrispondente al suo capo aperto in scrittura (di nuovo si
  
  La \textit{pipe} indicata da \param{fd} dovrà essere specificata tramite il
  file descriptor corrispondente al suo capo aperto in scrittura (di nuovo si
-faccia riferimento a sez.~\ref{sec:ipc_unix}), mentre per indicare quali zone
-di memoria devono essere trasferita si dovrà utilizzare un vettore di
-strutture \struct{iovec} (vedi fig.~\ref{fig:file_iovec}), esattamente con gli
-stessi criteri con cui le si usano per l'I/O vettorizzato, indicando gli
-indirizzi e le dimensioni di ciascun segmento di memoria su cui si vuole
-operare; le dimensioni del suddetto vettore devono essere passate
-nell'argomento \param{nr\_segs} che indica il numero di segmenti di memoria da
-trasferire.  Sia per il vettore che per il valore massimo di \param{nr\_segs}
-valgono le stesse limitazioni illustrate in sez.~\ref{sec:file_multiple_io}.
+faccia riferimento a sez.~\ref{sec:ipc_unix}), mentre per indicare quali
+segmenti della memoria del processo devono essere trasferiti verso di essa si
+dovrà utilizzare un vettore di strutture \struct{iovec} (vedi
+fig.~\ref{fig:file_iovec}), esattamente con gli stessi criteri con cui le si
+usano per l'I/O vettorizzato, indicando gli indirizzi e le dimensioni di
+ciascun segmento di memoria su cui si vuole operare; le dimensioni del
+suddetto vettore devono essere passate nell'argomento \param{nr\_segs} che
+indica il numero di segmenti di memoria da trasferire.  Sia per il vettore che
+per il valore massimo di \param{nr\_segs} valgono le stesse limitazioni
+illustrate in sez.~\ref{sec:file_multiple_io}.
  
  In caso di successo la funzione ritorna il numero di byte trasferiti sulla
  \textit{pipe}. In generale, se i dati una volta creati non devono essere
  riutilizzati (se cioè l'applicazione che chiama \func{vmsplice} non
  modificherà più la memoria trasferita), è opportuno utilizzare
  per \param{flag} il valore \const{SPLICE\_F\_GIFT}; questo fa sì che il kernel
  
  In caso di successo la funzione ritorna il numero di byte trasferiti sulla
  \textit{pipe}. In generale, se i dati una volta creati non devono essere
  riutilizzati (se cioè l'applicazione che chiama \func{vmsplice} non
  modificherà più la memoria trasferita), è opportuno utilizzare
  per \param{flag} il valore \const{SPLICE\_F\_GIFT}; questo fa sì che il kernel
-possa rimuovere le relative pagine dallo spazio degli indirizzi del processo,
-e scaricarle nella cache, così che queste possono essere utilizzate
-immediatamente senza necessità di eseguire una copia dei dati che contengono.
+possa rimuovere le relative pagine dalla cache della memoria virtuale, così
+che queste possono essere utilizzate immediatamente senza necessità di
+eseguire una copia dei dati che contengono.
  
  La seconda funzione aggiunta insieme a \func{splice} è \func{tee}, che deve il
  suo nome all'omonimo comando in user space, perché in analogia con questo
  
  La seconda funzione aggiunta insieme a \func{splice} è \func{tee}, che deve il
  suo nome all'omonimo comando in user space, perché in analogia con questo
@@ -4403,7 +4404,12 @@ sorgente e \param{fd\_out} il capo in scrittura della \textit{pipe}
  destinazione; a differenza di quanto avviene con \func{read} i dati letti con
  \func{tee} da \func{fd\_in} non vengono \textsl{consumati} e restano
  disponibili sulla \textit{pipe} per una successiva lettura (di nuovo per il
  destinazione; a differenza di quanto avviene con \func{read} i dati letti con
  \func{tee} da \func{fd\_in} non vengono \textsl{consumati} e restano
  disponibili sulla \textit{pipe} per una successiva lettura (di nuovo per il
-comportamento delle \textit{pipe} si veda sez.~\ref{sec:ipc_unix}).
+comportamento delle \textit{pipe} si veda sez.~\ref{sec:ipc_unix}). Al
+momento\footnote{quello della stesura di questo paragrafo, avvenuta il Gennaio
+  2010, in futuro potrebbe essere implementato anche \const{SPLICE\_F\_MORE}.}
+il solo valore utilizzabile per \param{flag}, fra quelli elencati in
+tab.~\ref{tab:splice_flag}, è \const{SPLICE\_F\_NONBLOCK} che rende la
+funzione non bloccante.
  
  La funzione restituisce il numero di byte copiati da una \textit{pipe}
  all'altra (o $-1$ in caso di errore), un valore nullo indica che non ci sono
  
  La funzione restituisce il numero di byte copiati da una \textit{pipe}
  all'altra (o $-1$ in caso di errore), un valore nullo indica che non ci sono
@@ -4521,35 +4527,37 @@ La funzione richiede che venga letto in anticipo il contenuto del file
  \index{memoria~virtuale} memoria virtuale ed il meccanismo della
  \index{paginazione} paginazione per cui la lettura viene eseguita in blocchi
  corrispondenti alle dimensioni delle pagine di memoria, ed i valori di
  \index{memoria~virtuale} memoria virtuale ed il meccanismo della
  \index{paginazione} paginazione per cui la lettura viene eseguita in blocchi
  corrispondenti alle dimensioni delle pagine di memoria, ed i valori di
-\param{offset} e \param{count} arrotondati di conseguenza.
+\param{offset} e \param{count} vengono arrotondati di conseguenza.
  
  La funzione estende quello che è un comportamento normale del kernel che
  quando si legge un file, aspettandosi che l'accesso prosegua, esegue sempre
  una lettura preventiva di una certa quantità di dati; questo meccanismo di
  lettura anticipata viene chiamato \textit{read-ahead}, da cui deriva il nome
  
  La funzione estende quello che è un comportamento normale del kernel che
  quando si legge un file, aspettandosi che l'accesso prosegua, esegue sempre
  una lettura preventiva di una certa quantità di dati; questo meccanismo di
  lettura anticipata viene chiamato \textit{read-ahead}, da cui deriva il nome
-della funzione. La funzione, per ottimizzare gli accessi a disco, effettua la
-lettura in cache della sezione richiesta e si blocca fintanto che questa non
-viene completata.  La posizione corrente sul file non viene modificata ed
-indipendentemente da quanto indicato con \param{count} la lettura dei dati si
-interrompe una volta raggiunta la fine del file.
+della funzione. La funzione \func{readahead}, per ottimizzare gli accessi a
+disco, effettua la lettura in cache della sezione richiesta e si blocca
+fintanto che questa non viene completata.  La posizione corrente sul file non
+viene modificata ed indipendentemente da quanto indicato con \param{count} la
+lettura dei dati si interrompe una volta raggiunta la fine del file.
  
  Si può utilizzare questa funzione per velocizzare le operazioni di lettura
  
  Si può utilizzare questa funzione per velocizzare le operazioni di lettura
-all'interno del programma tutte le volte che si conosce in anticipo quanti
-dati saranno necessari in seguito. Si potrà così concentrare in un unico
-momento (ad esempio in fase di inizializzazione) la lettura, così da ottenere
-una migliore risposta nelle operazioni successive.
+all'interno di un programma tutte le volte che si conosce in anticipo quanti
+dati saranno necessari nelle elaborazioni successive. Si potrà così
+concentrare in un unico momento (ad esempio in fase di inizializzazione) la
+lettura dei dati da disco, così da ottenere una migliore velocità di risposta
+nelle operazioni successive.
  
  \itindend{read-ahead}
  
  Il concetto di \func{readahead} viene generalizzato nello standard
  
  \itindend{read-ahead}
  
  Il concetto di \func{readahead} viene generalizzato nello standard
-POSIX.1-2001 dalla funzione \funcd{posix\_fadvise},\footnote{anche se
+POSIX.1-2001 dalla funzione \func{posix\_fadvise},\footnote{anche se
    l'argomento \param{len} è stato modificato da \ctyp{size\_t} a \ctyp{off\_t}
    nella revisione POSIX.1-2003 TC5.} che consente di ``\textsl{avvisare}'' il
  kernel sulle modalità con cui si intende accedere nel futuro ad una certa
  porzione di un file,\footnote{la funzione però è stata introdotta su Linux
    solo a partire dal kernel 2.5.60.} così che esso possa provvedere le
    l'argomento \param{len} è stato modificato da \ctyp{size\_t} a \ctyp{off\_t}
    nella revisione POSIX.1-2003 TC5.} che consente di ``\textsl{avvisare}'' il
  kernel sulle modalità con cui si intende accedere nel futuro ad una certa
  porzione di un file,\footnote{la funzione però è stata introdotta su Linux
    solo a partire dal kernel 2.5.60.} così che esso possa provvedere le
-opportune ottimizzazioni; il suo prototipo, che può è disponibile solo se si
-definisce la macro \macro{\_XOPEN\_SOURCE} ad almeno 600, è:
+opportune ottimizzazioni; il prototipo di \funcd{posix\_fadvise}, che è
+disponibile soltanto se è stata definita la macro \macro{\_XOPEN\_SOURCE} ad
+valore di almeno 600, è:
  \begin{functions}  
    \headdecl{fcntl.h} 
  
  \begin{functions}  
    \headdecl{fcntl.h} 
  
@@ -4617,18 +4625,18 @@ che utilizza semplicemente l'informazione.
  
  Come \func{madvise} anche \func{posix\_fadvise} si appoggia al sistema della
  memoria virtuale ed al meccanismo standard del \textit{read-ahead} utilizzato
  
  Come \func{madvise} anche \func{posix\_fadvise} si appoggia al sistema della
  memoria virtuale ed al meccanismo standard del \textit{read-ahead} utilizzato
-dal kernel; in particolare con \const{POSIX\_FADV\_SEQUENTIAL} si raddoppia la
-dimensione dell'ammontare di dati letti preventivamente rispetto al default,
-aspettandosi appunto una lettura sequenziale che li utilizzerà, mentre con
-\const{POSIX\_FADV\_RANDOM} si disabilita del tutto il suddetto meccanismo,
-dato che con un accesso del tutto casuale è inutile mettersi a leggere i dati
-immediatamente successivi gli attuali; infine l'uso di
-\const{POSIX\_FADV\_NORMAL} consente di riportarsi al comportamento di
-default.
+dal kernel; in particolare utilizzando il valore
+\const{POSIX\_FADV\_SEQUENTIAL} si raddoppia la dimensione dell'ammontare di
+dati letti preventivamente rispetto al default, aspettandosi appunto una
+lettura sequenziale che li utilizzerà, mentre con \const{POSIX\_FADV\_RANDOM}
+si disabilita del tutto il suddetto meccanismo, dato che con un accesso del
+tutto casuale è inutile mettersi a leggere i dati immediatamente successivi
+gli attuali; infine l'uso di \const{POSIX\_FADV\_NORMAL} consente di
+riportarsi al comportamento di default.
  
  Le due modalità \const{POSIX\_FADV\_NOREUSE} e \const{POSIX\_FADV\_WILLNEED}
  fino al kernel 2.6.18 erano equivalenti, a partire da questo kernel la prima
  
  Le due modalità \const{POSIX\_FADV\_NOREUSE} e \const{POSIX\_FADV\_WILLNEED}
  fino al kernel 2.6.18 erano equivalenti, a partire da questo kernel la prima
-viene non ha più alcune effetto, mentre la seconda dà inizio ad una lettura in
+viene non ha più alcun effetto, mentre la seconda dà inizio ad una lettura in
  cache della regione del file indicata.  La quantità di dati che verranno letti
  è ovviamente limitata in base al carico che si viene a creare sul sistema
  della memoria virtuale, ma in genere una lettura di qualche megabyte viene
  cache della regione del file indicata.  La quantità di dati che verranno letti
  è ovviamente limitata in base al carico che si viene a creare sul sistema
  della memoria virtuale, ma in genere una lettura di qualche megabyte viene
@@ -4647,11 +4655,12 @@ nuovi dati utili.\footnote{la pagina di manuale riporta l'esempio dello
  
  Sia \func{posix\_fadvise} che \func{readahead} attengono alla ottimizzazione
  dell'accesso in lettura; lo standard POSIX.1-2001 prevede anche una funzione
  
  Sia \func{posix\_fadvise} che \func{readahead} attengono alla ottimizzazione
  dell'accesso in lettura; lo standard POSIX.1-2001 prevede anche una funzione
-specifica per le operazioni di scrittura, \func{posix\_fallocate},\footnote{la
-  funzione è stata introdotta a partire dalle glibc 2.1.94.} che consente di
-preallocare dello spazio disco per assicurarsi che una seguente scrittura non
-fallisca, il suo prototipo, anch'esso disponibile solo se si definisce la
-macro \macro{\_XOPEN\_SOURCE} ad almeno 600, è:
+specifica per le operazioni di scrittura,
+\funcd{posix\_fallocate},\footnote{la funzione è stata introdotta a partire
+  dalle glibc 2.1.94.} che consente di preallocare dello spazio disco per
+assicurarsi che una seguente scrittura non fallisca, il suo prototipo,
+anch'esso disponibile solo se si definisce la macro \macro{\_XOPEN\_SOURCE} ad
+almeno 600, è:
  \begin{functions}  
    \headdecl{fcntl.h} 
  
  \begin{functions}  
    \headdecl{fcntl.h} 
  
@@ -4686,6 +4695,14 @@ saranno incrementate di conseguenza. Dopo aver eseguito con successo la
  funzione è garantito che una scrittura nella regione indicata non fallirà per
  mancanza di spazio disco.
  
  funzione è garantito che una scrittura nella regione indicata non fallirà per
  mancanza di spazio disco.
  
+Ci si può chiedere a cosa serva una funzione come \func{posix\_fallocate} dato
+che è sempre possibile ottenere l'effetto voluto eseguendo manualmente sul
+file la scrittura\footnote{usando \funcd{pwrite} per evitare spostamenti della
+  posizione corrente sul file.} di una serie di zeri per l'estensione di
+spazio necessaria. In realtà questa è la modalità con cui la funzione veniva
+realizzata nella prima versione fornita dalle \acr{glibc}, e si trattava nel
+caso soltanto di una standardizzazione delle modalità di
+
  % TODO controllare la trattazione della nuova funzionalità di preallocazione 
  
  % TODO documentare \func{posix\_fadvise}
  % TODO controllare la trattazione della nuova funzionalità di preallocazione 
  
  % TODO documentare \func{posix\_fadvise}
@@ -4792,7 +4809,8 @@ sez.~\ref{sec:intro_syscall}; il suo prototipo 
  % LocalWords:  nwrite segs patch readahead posix fadvise TC advice FADV NORMAL
  % LocalWords:  SEQUENTIAL NOREUSE WILLNEED DONTNEED streaming fallocate EFBIG
  % LocalWords:  POLLRDHUP half close pwait Gb madvise MADV ahead REMOVE tmpfs
  % LocalWords:  nwrite segs patch readahead posix fadvise TC advice FADV NORMAL
  % LocalWords:  SEQUENTIAL NOREUSE WILLNEED DONTNEED streaming fallocate EFBIG
  % LocalWords:  POLLRDHUP half close pwait Gb madvise MADV ahead REMOVE tmpfs
-% LocalWords:  DONTFORK DOFORK shmfs preadv pwritev syscall linux loff
+% LocalWords:  DONTFORK DOFORK shmfs preadv pwritev syscall linux loff head
+% LocalWords:  MERGEABLE EOVERFLOW conditions prealloca
  
  
  %%% Local Variables: 
  
  
  %%% Local Variables: