Completata remap_file_pages, e documentati un po' meglio MAP_POPULATE e

[gapil.git] / fileadv.tex
diff --git a/fileadv.tex b/fileadv.tex

index 2f55a322ac0c34087b7b09545541eb81142f32fb..67d6795a113785b3eb8ff1e9c00e73d4a833304c 100644 (file)
--- a/fileadv.tex
+++ b/fileadv.tex
@@ -56,7 +56,7 @@ un'altro disponibile. Questo comporta nel migliore dei casi una operazione
  ritardata inutilmente nell'attesa del completamento di quella bloccata, mentre
  nel peggiore dei casi (quando la conclusione della operazione bloccata dipende
  da quanto si otterrebbe dal file descriptor ``\textsl{disponibile}'') si
-potrebbe addirittura arrivare ad un \textit{deadlock}\index{\textit{deadlock}}.
+potrebbe addirittura arrivare ad un \textit{deadlock}\itindex{deadlock}.
  
  Abbiamo già accennato in sez.~\ref{sec:file_open} che è possibile prevenire
  questo tipo di comportamento delle funzioni di I/O aprendo un file in
@@ -66,7 +66,7 @@ eseguite sul file che si sarebbero bloccate, ritornano immediatamente,
  restituendo l'errore \errcode{EAGAIN}.  L'utilizzo di questa modalità di I/O
  permette di risolvere il problema controllando a turno i vari file descriptor,
  in un ciclo in cui si ripete l'accesso fintanto che esso non viene garantito.
-Ovviamente questa tecnica, detta \textit{polling}\index{\textit{polling}}, è
+Ovviamente questa tecnica, detta \textit{polling}\itindex{polling}, è
  estremamente inefficiente: si tiene costantemente impiegata la CPU solo per
  eseguire in continuazione delle system call che nella gran parte dei casi
  falliranno.
@@ -123,15 +123,15 @@ degli insiemi specificati (\param{readfds}, \param{writefds} e
  \param{exceptfds}), non diventa attivo, per un tempo massimo specificato da
  \param{timeout}.
  
-\index{\textit{file~descriptor~set}|(}
+\itindbeg{file~descriptor~set} 
+
  Per specificare quali file descriptor si intende \textsl{selezionare}, la
  funzione usa un particolare oggetto, il \textit{file descriptor set},
  identificato dal tipo \type{fd\_set}, che serve ad identificare un insieme di
  file descriptor, in maniera analoga a come un
-\index{\textit{signal~set}}\textit{signal set} (vedi
-sez.~\ref{sec:sig_sigset}) identifica un insieme di segnali. Per la
-manipolazione di questi \textit{file descriptor set} si possono usare delle
-opportune macro di preprocessore:
+\itindex{signal~set}\textit{signal set} (vedi sez.~\ref{sec:sig_sigset})
+identifica un insieme di segnali. Per la manipolazione di questi \textit{file
+  descriptor set} si possono usare delle opportune macro di preprocessore:
  \begin{functions}
    \headdecl{sys/time.h}
    \headdecl{sys/types.h}
@@ -186,7 +186,7 @@ ritorni; se impostato a \val{NULL} la funzione attende indefinitamente. Si pu
  specificare anche un tempo nullo (cioè una struttura \struct{timeval} con i
  campi impostati a zero), qualora si voglia semplicemente controllare lo stato
  corrente dei file descriptor.
-\index{\textit{file~descriptor~set}|)}
+\itindend{file~descriptor~set}
  
  La funzione restituisce il numero di file descriptor pronti,\footnote{questo è
    il comportamento previsto dallo standard, ma la standardizzazione della
@@ -270,7 +270,7 @@ immediatamente prima di eseguire l'attesa, e ripristinata al ritorno della
  funzione.
  
  L'uso di \param{sigmask} è stato introdotto allo scopo di prevenire possibili
-race condition\index{\textit{race~condition}} quando ci si deve porre in
+\textit{race condition}\itindex{race~condition} quando ci si deve porre in
  attesa sia di un segnale che di dati. La tecnica classica è quella di
  utilizzare il gestore per impostare una variabile globale e controllare questa
  nel corpo principale del programma; abbiamo visto in
@@ -285,29 +285,29 @@ sotto controllo anche dei file descriptor con \func{select}, in questo caso si
  può fare conto sul fatto che all'arrivo di un segnale essa verrebbe interrotta
  e si potrebbero eseguire di conseguenza le operazioni relative al segnale e
  alla gestione dati con un ciclo del tipo:
-\includecodesnip{listati/select_race.c} qui però emerge una race
-condition,\index{\textit{race~condition}} perché se il segnale arriva prima
-della chiamata a \func{select}, questa non verrà interrotta, e la ricezione
-del segnale non sarà rilevata.
+\includecodesnip{listati/select_race.c} qui però emerge una \textit{race
+  condition},\itindex{race~condition} perché se il segnale arriva prima della
+chiamata a \func{select}, questa non verrà interrotta, e la ricezione del
+segnale non sarà rilevata.
  
  Per questo è stata introdotta \func{pselect} che attraverso l'argomento
  \param{sigmask} permette di riabilitare la ricezione il segnale
  contestualmente all'esecuzione della funzione,\footnote{in Linux però non è
    presente la relativa system call, e la funzione è implementata nelle
    \acr{glibc} attraverso \func{select} (vedi \texttt{man select\_tut}) per cui
-  la possibilità di race condition permane; esiste però una soluzione,
-  chiamata \index{\textit{self-pipe trick}}\textit{self-pipe trick}, che
-  consiste nell'aprire una pipe (vedi sez.~\ref{sec:ipc_pipes}) ed usare
-  \func{select} sul capo in lettura della stessa, e indicare l'arrivo di un
-  segnale scrivendo sul capo in scrittura all'interno del manipolatore; in
-  questo modo anche se il segnale va perso prima della chiamata di
-  \func{select} questa lo riconoscerà comunque dalla presenza di dati sulla
-  pipe.} ribloccandolo non appena essa ritorna, così che il precedente codice
-potrebbe essere riscritto nel seguente modo:
-\includecodesnip{listati/pselect_norace.c} in questo caso utilizzando
-\var{oldmask} durante l'esecuzione di \func{pselect} la ricezione del segnale
-sarà abilitata, ed in caso di interruzione si potranno eseguire le relative
-operazioni.
+  la possibilità di \itindex{race~condition}\textit{race condition} permane;
+  esiste però una soluzione, chiamata \itindex{self-pipe trick}
+  \textit{self-pipe trick}, che consiste nell'aprire una pipe (vedi
+  sez.~\ref{sec:ipc_pipes}) ed usare \func{select} sul capo in lettura della
+  stessa, e indicare l'arrivo di un segnale scrivendo sul capo in scrittura
+  all'interno del manipolatore; in questo modo anche se il segnale va perso
+  prima della chiamata di \func{select} questa lo riconoscerà comunque dalla
+  presenza di dati sulla pipe.} ribloccandolo non appena essa ritorna, così
+che il precedente codice potrebbe essere riscritto nel seguente modo:
+\includecodesnip{listati/pselect_norace.c} 
+in questo caso utilizzando \var{oldmask} durante l'esecuzione di
+\func{pselect} la ricezione del segnale sarà abilitata, ed in caso di
+interruzione si potranno eseguire le relative operazioni.
  
  
  
@@ -420,8 +420,8 @@ distinzione ha senso solo per i dati \textit{out-of-band} dei socket (vedi
  sez.~\ref{sec:TCP_urgent_data}), ma su questo e su come \func{poll} reagisce
  alle varie condizioni dei socket torneremo in sez.~\ref{sec:TCP_serv_poll},
  dove vedremo anche un esempio del suo utilizzo. Si tenga conto comunque che le
-costanti relative ai diversi tipi di dati (come \macro{POLLRDNORM} e
-\macro{POLLRDBAND}) sono utilizzabili soltanto qualora si sia definita la
+costanti relative ai diversi tipi di dati (come \const{POLLRDNORM} e
+\const{POLLRDBAND}) sono utilizzabili soltanto qualora si sia definita la
  macro \macro{\_XOPEN\_SOURCE}.\footnote{e ci si ricordi di farlo sempre in
    testa al file, definirla soltanto prima di includere \file{sys/poll.h} non è
    sufficiente.}
@@ -736,7 +736,7 @@ esaurimento.
  
  Oltre alle operazioni di lettura e scrittura l'interfaccia POSIX.1b mette a
  disposizione un'altra operazione, quella di sincronizzazione dell'I/O,
-compiuta dalla funzione \func{aio\_fsync}, che ha lo stesso effetto della
+compiuta dalla funzione \funcd{aio\_fsync}, che ha lo stesso effetto della
  analoga \func{fsync}, ma viene eseguita in maniera asincrona; il suo prototipo
  è:
  \begin{prototype}{aio.h}
@@ -946,7 +946,7 @@ prototipi sono:
    \end{errlist}
    ed inoltre \errval{EISDIR}, \errval{ENOMEM}, \errval{EFAULT} (se non sono
    stato allocati correttamente i buffer specificati nei campi
-  \func{iov\_base}), più tutti gli ulteriori errori che potrebbero avere le
+  \var{iov\_base}), più tutti gli ulteriori errori che potrebbero avere le
    usuali funzioni di lettura e scrittura eseguite su \param{fd}.}
  \end{functions}
  
@@ -977,6 +977,7 @@ si sono specificati nel vettore \param{vector}.
  \subsection{File mappati in memoria}
  \label{sec:file_memory_map}
  
+\itindbeg{memory~mapping}
  Una modalità alternativa di I/O, che usa una interfaccia completamente diversa
  rispetto a quella classica vista in cap.~\ref{cha:file_unix_interface}, è il
  cosiddetto \textit{memory-mapped I/O}, che, attraverso il meccanismo della
@@ -1003,7 +1004,7 @@ si pu
    \label{fig:file_mmap_layout}
  \end{figure}
  
-L'uso del \textit{memory-mappung} comporta una notevole semplificazione delle
+L'uso del \textit{memory-mapping} comporta una notevole semplificazione delle
  operazioni di I/O, in quanto non sarà più necessario utilizzare dei buffer
  intermedi su cui appoggiare i dati da traferire, poiché questi potranno essere
  acceduti direttamente nella sezione di memoria mappata; inoltre questa
@@ -1037,7 +1038,7 @@ eseguire la mappatura in memoria di un file, 
    \funcdecl{void * mmap(void * start, size\_t length, int prot, int flags, int
      fd, off\_t offset)}
    
-  Esegue la mappatura in memoria del file \param{fd}.
+  Esegue la mappatura in memoria della sezione specificata del file \param{fd}.
    
    \bodydesc{La funzione restituisce il puntatore alla zona di memoria mappata
      in caso di successo, e \const{MAP\_FAILED} (-1) in caso di errore, nel
@@ -1055,11 +1056,18 @@ eseguire la mappatura in memoria di un file, 
        dimensione delle pagine).
      \item[\errcode{ETXTBSY}] Si è impostato \const{MAP\_DENYWRITE} ma
        \param{fd} è aperto in scrittura.
-    \item[\errcode{EAGAIN}] Il file è bloccato, o si è bloccata troppa memoria.
+    \item[\errcode{EAGAIN}] Il file è bloccato, o si è bloccata troppa memoria
+      rispetto a quanto consentito dai limiti di sistema (vedi
+      sez.~\ref{sec:sys_resource_limit}).
      \item[\errcode{ENOMEM}] Non c'è memoria o si è superato il limite sul
        numero di mappature possibili.
      \item[\errcode{ENODEV}] Il filesystem di \param{fd} non supporta il memory
        mapping.
+    \item[\errcode{EPERM}] L'argomento \param{prot} ha richiesto
+      \const{PROT\_EXEC}, ma il filesystem di \param{fd} è montato con
+      l'opzione \texttt{noexec}.
+    \item[\errcode{ENFILE}] Si è superato il limite del sistema sul numero di
+      file aperti (vedi sez.~\ref{sec:sys_resource_limit}).
      \end{errlist}
    }
  \end{functions}
@@ -1093,11 +1101,11 @@ multiplo della dimensione di una pagina di memoria.
  Il valore dell'argomento \param{prot} indica la protezione\footnote{in Linux
    la memoria reale è divisa in pagine: ogni processo vede la sua memoria
    attraverso uno o più segmenti lineari di memoria virtuale.  Per ciascuno di
-  questi segmenti il kernel mantiene nella \textit{page table} la mappatura
-  sulle pagine di memoria reale, ed le modalità di accesso (lettura,
-  esecuzione, scrittura); una loro violazione causa quella che si chiama una
-  \textit{segment violation}, e la relativa emissione del segnale
-  \const{SIGSEGV}.} da applicare al segmento di memoria e deve essere
+  questi segmenti il kernel mantiene nella \itindex{page~table}\textit{page
+    table} la mappatura sulle pagine di memoria reale, ed le modalità di
+  accesso (lettura, esecuzione, scrittura); una loro violazione causa quella
+  che si chiama una \textit{segment violation}, e la relativa emissione del
+  segnale \const{SIGSEGV}.} da applicare al segmento di memoria e deve essere
  specificato come maschera binaria ottenuta dall'OR di uno o più dei valori
  riportati in tab.~\ref{tab:file_mmap_flag}; il valore specificato deve essere
  compatibile con la modalità di accesso con cui si è aperto il file.
@@ -1127,7 +1135,7 @@ tab.~\ref{tab:file_mmap_flag}.
                               visibili agli altri processi che mappano lo stesso
                               file.\footnotemark Il file su disco però non sarà
                               aggiornato fino alla chiamata di \func{msync} o
-                             \func{unmap}), e solo allora le modifiche saranno
+                             \func{munmap}), e solo allora le modifiche saranno
                               visibili per l'I/O convenzionale. Incompatibile
                               con \const{MAP\_PRIVATE}. \\ 
      \const{MAP\_PRIVATE}   & I cambiamenti sulla memoria mappata non vengono
@@ -1135,7 +1143,7 @@ tab.~\ref{tab:file_mmap_flag}.
                               privata cui solo il processo chiamante ha
                               accesso.  Le modifiche sono mantenute attraverso
                               il meccanismo del \textit{copy on
-                               write}\index{\textit{copy~on~write}} e 
+                               write}\itindex{copy~on~write} e 
                               salvate su swap in caso di necessità. Non è
                               specificato se i cambiamenti sul file originale
                               vengano riportati sulla regione
@@ -1147,15 +1155,14 @@ tab.~\ref{tab:file_mmap_flag}.
      \const{MAP\_EXECUTABLE}& Ignorato. \\
      \const{MAP\_NORESERVE} & Si usa con \const{MAP\_PRIVATE}. Non riserva
                               delle pagine di swap ad uso del meccanismo del
-                             \textit{copy on
-                               write}\index{\textit{copy~on~write}}
+                             \textit{copy on write}\itindex{copy~on~write}
                               per mantenere le
                               modifiche fatte alla regione mappata, in
                               questo caso dopo una scrittura, se non c'è più
                               memoria disponibile, si ha l'emissione di
                               un \const{SIGSEGV}. \\
      \const{MAP\_LOCKED}    & Se impostato impedisce lo swapping delle pagine
-                             mappate. \\
+                             mappate.\\
      \const{MAP\_GROWSDOWN} & Usato per gli stack. Indica 
                               che la mappatura deve essere effettuata con gli
                               indirizzi crescenti verso il basso.\\
@@ -1163,17 +1170,26 @@ tab.~\ref{tab:file_mmap_flag}.
                               argomenti \param{fd} e \param{offset} sono
                               ignorati.\footnotemark\\
      \const{MAP\_ANON}      & Sinonimo di \const{MAP\_ANONYMOUS}, deprecato.\\
-    \const{MAP\_FILE}      & Valore di compatibilità, deprecato.\\
+    \const{MAP\_FILE}      & Valore di compatibilità, ignorato.\\
+    \const{MAP\_32BIT}     & Esegue la mappatura sui primi 2GiB dello spazio
+                             degli indirizzi, viene supportato solo sulle
+                             piattaforme \texttt{x86-64} per compatibilità con
+                             le applicazioni a 32 bit. Viene ignorato se si è
+                             richiesto \const{MAP\_FIXED}.\\
+    \const{MAP\_POPULATE}  & Esegue il \itindex{prefaulting}
+                             \textit{prefaulting} delle pagine di memoria
+                             necessarie alla mappatura. \\
+    \const{MAP\_NONBLOCK}  & Esegue un \textit{prefaulting} più limitato che
+                             non causa I/O.\footnotemark \\
+%     \const{MAP\_DONTEXPAND}& Non consente una successiva espansione dell'area
+%                              mappata con \func{mremap}, proposto ma pare non
+%                              implementato.\\
      \hline
    \end{tabular}
    \caption{Valori possibili dell'argomento \param{flag} di \func{mmap}.}
    \label{tab:file_mmap_flag}
  \end{table}
  
-\footnotetext{Dato che tutti faranno riferimento alle stesse pagine di
-  memoria.}  
-\footnotetext{L'uso di questo flag con \const{MAP\_SHARED} è
-  stato implementato in Linux a partire dai kernel della serie 2.4.x.}
  
  Gli effetti dell'accesso ad una zona di memoria mappata su file possono essere
  piuttosto complessi, essi si possono comprendere solo tenendo presente che
@@ -1184,14 +1200,6 @@ sola lettura si avr
  (\const{SIGSEGV}), dato che i permessi sul segmento di memoria relativo non
  consentono questo tipo di accesso.
  
-\begin{figure}[!htb]
-  \centering
-  \includegraphics[width=10cm]{img/mmap_boundary}
-  \caption{Schema della mappatura in memoria di una sezione di file di
-    dimensioni non corrispondenti al bordo di una pagina.}
-  \label{fig:file_mmap_boundary}
-\end{figure}
-
  È invece assai diversa la questione relativa agli accessi al di fuori della
  regione di cui si è richiesta la mappatura. A prima vista infatti si potrebbe
  ritenere che anch'essi debbano generare un segnale di violazione di accesso;
@@ -1199,11 +1207,30 @@ questo per
  paginazione\index{paginazione}, la mappatura in memoria non può che essere
  eseguita su un segmento di dimensioni rigorosamente multiple di quelle di una
  pagina, ed in generale queste potranno non corrispondere alle dimensioni
-effettive del file o della sezione che si vuole mappare. Il caso più comune è
-quello illustrato in fig.~\ref{fig:file_mmap_boundary}, in cui la sezione di
-file non rientra nei confini di una pagina: in tal caso verrà il file sarà
-mappato su un segmento di memoria che si estende fino al bordo della pagina
-successiva.
+effettive del file o della sezione che si vuole mappare. 
+
+\footnotetext[20]{Dato che tutti faranno riferimento alle stesse pagine di
+  memoria.}  
+\footnotetext[21]{L'uso di questo flag con \const{MAP\_SHARED} è
+  stato implementato in Linux a partire dai kernel della serie 2.4.x.}
+
+\footnotetext{questo flag ed il precedente \const{MAP\_POPULATE} sono stati
+  introdotti nel kernel 2.5.46 insieme alla mappatura non lineare di cui
+  parleremo più avanti.}
+
+\begin{figure}[!htb] 
+  \centering
+  \includegraphics[width=12cm]{img/mmap_boundary}
+  \caption{Schema della mappatura in memoria di una sezione di file di
+    dimensioni non corrispondenti al bordo di una pagina.}
+  \label{fig:file_mmap_boundary}
+\end{figure}
+
+
+Il caso più comune è quello illustrato in fig.~\ref{fig:file_mmap_boundary},
+in cui la sezione di file non rientra nei confini di una pagina: in tal caso
+verrà il file sarà mappato su un segmento di memoria che si estende fino al
+bordo della pagina successiva.
  
  In questo caso è possibile accedere a quella zona di memoria che eccede le
  dimensioni specificate da \param{lenght}, senza ottenere un \const{SIGSEGV}
@@ -1217,14 +1244,6 @@ file mappato sono pi
  file è stato troncato, dopo che è stato mappato, ad una dimensione inferiore a
  quella della mappatura in memoria.
  
-\begin{figure}[htb]
-  \centering
-  \includegraphics[width=10cm]{img/mmap_exceed}
-  \caption{Schema della mappatura in memoria di file di dimensioni inferiori
-    alla lunghezza richiesta.}
-  \label{fig:file_mmap_exceed}
-\end{figure}
-
  In questa situazione, per la sezione di pagina parzialmente coperta dal
  contenuto del file, vale esattamente quanto visto in precedenza; invece per la
  parte che eccede, fino alle dimensioni date da \param{length}, l'accesso non
@@ -1242,6 +1261,14 @@ sez.~\ref{sec:file_vfs_work}). Si tenga presente per
  di dispositivi (un esempio è l'interfaccia al ponte PCI-VME del chip Universe)
  che sono utilizzabili solo con questa interfaccia.
  
+\begin{figure}[htb]
+  \centering
+  \includegraphics[width=12cm]{img/mmap_exceed}
+  \caption{Schema della mappatura in memoria di file di dimensioni inferiori
+    alla lunghezza richiesta.}
+  \label{fig:file_mmap_exceed}
+\end{figure}
+
  Dato che passando attraverso una \func{fork} lo spazio di indirizzi viene
  copiato integralmente, i file mappati in memoria verranno ereditati in maniera
  trasparente dal processo figlio, mantenendo gli stessi attributi avuti nel
@@ -1293,8 +1320,9 @@ memoria mappata con il file su disco; il suo prototipo 
    \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
      errore nel qual caso \var{errno} assumerà uno dei valori:
      \begin{errlist}
-    \item[\errcode{EINVAL}] O \param{start} non è multiplo di \const{PAGESIZE},
-    o si è specificato un valore non valido per \param{flags}.
+    \item[\errcode{EINVAL}] O \param{start} non è multiplo di
+      \const{PAGE\_SIZE}, o si è specificato un valore non valido per
+      \param{flags}.
      \item[\errcode{EFAULT}] L'intervallo specificato non ricade in una zona
        precedentemente mappata.
      \end{errlist}
@@ -1355,16 +1383,223 @@ mappatura della memoria usando la funzione \funcd{munmap}, il suo prototipo 
    }
  \end{functions}
  
-La funzione cancella la mappatura per l'intervallo specificato attraverso
-\param{start} e \param{length}, ed ogni successivo accesso a tale regione
-causerà un errore di accesso in memoria. L'argomento \param{start} deve essere
-allineato alle dimensioni di una pagina di memoria, e la mappatura di tutte le
-pagine contenute (anche parzialmente) nell'intervallo indicato, verrà rimossa.
-Indicare un intervallo che non contiene pagine mappate non è un errore.
+La funzione cancella la mappatura per l'intervallo specificato con
+\param{start} e \param{length}; ogni successivo accesso a tale regione causerà
+un errore di accesso in memoria. L'argomento \param{start} deve essere
+allineato alle dimensioni di una pagina, e la mappatura di tutte le pagine
+contenute anche parzialmente nell'intervallo indicato, verrà rimossa.
+Indicare un intervallo che non contiene mappature non è un errore.  Si tenga
+presente inoltre che alla conclusione di un processo ogni pagina mappata verrà
+automaticamente rilasciata, mentre la chiusura del file descriptor usato per
+il \textit{memory mapping} non ha alcun effetto su di esso.
+
+Lo standard POSIX prevede anche una funzione che permetta di cambiare le
+protezioni delle pagine di memoria; lo standard prevede che essa si applichi
+solo ai \textit{memory mapping} creati con \func{mmap}, ma nel caso di Linux
+la funzione può essere usata con qualunque pagina valida nella memoria
+virtuale. Questa funzione è \funcd{mprotect} ed il suo prototipo è:
+\begin{functions}  
+%  \headdecl{unistd.h}
+  \headdecl{sys/mman.h} 
+
+  \funcdecl{int mprotect(const void *addr, size\_t len, int prot)}
+  
+  Modifica le protezioni delle pagine di memoria comprese nell'intervallo
+  specificato.
+
+  \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
+    errore nel qual caso \var{errno} assumerà uno dei valori:
+    \begin{errlist}
+    \item[\errcode{EINVAL}] il valore di \param{addr} non è valido o non è un
+      multiplo di \const{PAGE\_SIZE}.
+    \item[\errcode{EACCESS}] l'operazione non è consentita, ad esempio si è
+      cercato di marcare con \const{PROT\_WRITE} un segmento di memoria cui si
+      ha solo accesso in lettura.
+%     \item[\errcode{ENOMEM}] non è stato possibile allocare le risorse
+%       necessarie all'interno del kernel.
+%     \item[\errcode{EFAULT}] si è specificato un indirizzo di memoria non
+%       accessibile.
+    \end{errlist}
+    ed inoltre \errval{ENOMEM} ed \errval{EFAULT}.
+  } 
+\end{functions}
+
+
+La funzione prende come argomenti un indirizzo di partenza in \param{addr},
+allineato alle dimensioni delle pagine di memoria, ed una dimensione
+\param{size}. La nuova protezione deve essere specificata in \param{prot} con
+una combinazione dei valori di tab.~\ref{tab:file_mmap_prot}.  La nuova
+protezione verrà applicata a tutte le pagine contenute, anche parzialmente,
+dall'intervallo fra \param{addr} e \param{addr}+\param{size}-1.
+
+
+Infine Linux supporta alcune operazioni specifiche non disponibili su altri
+kernel unix-like. La prima di queste è la possibilità di modificare un
+precedente \textit{memory mapping}, ad esempio per espanderlo o restringerlo.
+Questo è realizzato dalla funzione \funcd{mremap}, il cui prototipo è:
+\begin{functions}  
+  \headdecl{unistd.h}
+  \headdecl{sys/mman.h} 
+
+  \funcdecl{void * mremap(void *old\_address, size\_t old\_size , size\_t
+    new\_size, unsigned long flags)}
+  
+  Restringe o allarga una mappatura in memoria di un file.
+
+  \bodydesc{La funzione restituisce l'indirizzo alla nuova area di memoria in
+    caso di successo od il valore \const{MAP\_FAILED} (pari a \texttt{(void *)
+      -1}) in caso di errore, nel qual caso \var{errno} assumerà uno dei
+    valori:
+    \begin{errlist}
+    \item[\errcode{EINVAL}] il valore di \param{old\_address} non è un
+      puntatore valido.
+    \item[\errcode{EFAULT}] ci sono indirizzi non validi nell'intervallo
+      specificato da \param{old\_address} e \param{old\_size}, o ci sono altre
+      mappature di tipo non corrispondente a quella richiesta.
+    \item[\errcode{ENOMEM}] non c'è memoria sufficiente oppure l'area di
+      memoria non può essere espansa all'indirizzo virtuale corrente, e non si
+      è specificato \const{MREMAP\_MAYMOVE} nei flag.
+    \item[\errcode{EAGAIN}] il segmento di memoria scelto è bloccato e non può
+      essere rimappato.
+    \end{errlist}
+  }
+\end{functions}
+
+La funzione richiede come argomenti \param{old\_address} (che deve essere
+allineato alle dimensioni di una pagina di memoria) che specifica il
+precedente indirizzo del \textit{memory mapping} e \param{old\_size}, che ne
+indica la dimensione. Con \param{new\_size} si specifica invece la nuova
+dimensione che si vuole ottenere. Infine l'argomento \param{flags} è una
+maschera binaria per i flag che controllano il comportamento della funzione.
+Il solo valore utilizzato è \const{MREMAP\_MAYMOVE}\footnote{per poter
+  utilizzare questa costante occorre aver definito \macro{\_GNU\_SOURCE} prima
+  di includere \file{sys/mman.h}.}  che consente di eseguire l'espansione
+anche quando non è possibile utilizzare il precedente indirizzo. Per questo
+motivo, se si è usato questo flag, la funzione può restituire un indirizzo
+della nuova zona di memoria che non è detto coincida con \param{old\_address}.
+
+La funzione si appoggia al sistema della \index{memoria~virtuale} memoria
+virtuale per modificare l'associazione fra gli indirizzi virtuali del processo
+e le pagine di memoria, modificando i dati direttamente nella
+\itindex{page~table} \textit{page table} del processo. Come per
+\func{mprotect} la funzione può essere usata in generale, anche per pagine di
+memoria non corrispondenti ad un \textit{memory mapping}, e consente così di
+implementare la funzione \func{realloc} in maniera molto efficiente.
+
+Una caratteristica comune a tutti i sistemi unix-like è che la mappatura in
+memoria di un file viene eseguita in maniera lineare, cioè parti successive di
+un file vengono mappate linearmente su indirizzi successivi in memoria.
+Esistono però delle applicazioni\footnote{in particolare la tecnica è usata
+  dai database o dai programmi che realizzano macchine virtuali.} in cui è
+utile poter mappare sezioni diverse di un file su diverse zone di memoria.
+
+Questo è ovviamente sempre possibile eseguendo ripetutamente la funzione
+\func{mmap} per ciascuna delle diverse aree del file che si vogliono mappare
+in sequenza non lineare,\footnote{ed in effetti è quello che veniva fatto
+  anche con Linux prima che fossero introdotte queste estensioni.} ma questo
+approccio ha delle conseguenze molto pesanti in termini di prestazioni.
+Infatti per ciascuna mappatura in memoria deve essere definita nella
+\itindex{page~table} \textit{page table} del processo una nuova area di
+memoria virtuale\footnote{quella che nel gergo del kernel viene chiamata VMA
+  (\textit{virtual memory area}).} che corrisponda alla mappatura, in modo che
+questa diventi visibile nello spazio degli indirizzi come illustrato in
+fig.~\ref{fig:file_mmap_layout}.
+
+Quando un processo esegue un gran numero di mappature diverse\footnote{si può
+  arrivare anche a centinaia di migliaia.} per realizzare a mano una mappatura
+non-linare si avrà un accrescimento eccessivo della sua \itindex{page~table}
+\textit{page table}, e lo stesso accadrà per tutti gli altri processi che
+utilizzano questa tecnica. In situazioni in cui le applicazioni hanno queste
+esigenze si avranno delle prestazioni ridotte, dato che il kernel dovrà
+impiegare molte risorse\footnote{sia in termini di memoria interna per i dati
+  delle \itindex{page~table} \textit{page table}, che di CPU per il loro
+  aggiornamento.} solo per mantenere i dati di una gran quantità di
+\textit{memory mapping}.
+
+Per questo motivo con il kernel 2.5.46 è stato introdotto, ad opera di Ingo
+Molnar, un meccanismo che consente la mappatura non-lineare. Anche questa è
+una caratteristica specifica di Linux, non presente in altri sistemi
+unix-like.  Diventa così possibile utilizzare una sola mappatura
+iniziale\footnote{e quindi una sola \textit{virtual memory area} nella
+  \itindex{page~table} \textit{page table} del processo.} e poi rimappare a
+piacere all'interno di questa i dati del file. Ciò è possibile grazie ad una
+nuova system call, \funcd{remap\_file\_pages}, il cui prototipo è:
+\begin{functions}  
+  \headdecl{sys/mman.h} 
+
+  \funcdecl{int remap\_file\_pages(void *start, size\_t size, int prot,
+    ssize\_t pgoff, int flags)}
+  
+  Permette di rimappare non linearmente un precedente \textit{memory mapping}.
+
+  \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
+    errore, nel qual caso \var{errno} assumerà uno dei valori:
+    \begin{errlist}
+    \item[\errcode{EINVAL}] Si è usato un valore non valido per uno degli
+      argomenti o \param{start} non fa riferimento ad un \textit{memory
+        mapping} valido creato con \const{MAP\_SHARED}.
+    \end{errlist}
+  }
+\end{functions}
+
+Per poter utilizzare questa funzione occorre anzitutto effettuare
+preliminarmente una chiamata a \func{mmap} con \const{MAP\_SHARED} per
+definire l'area di memoria che poi sarà rimappata non linearmente. Poi di
+chiamerà questa funzione per modificare le corrispondenze fra pagine di
+memoria e pagine del file; si tenga presente che \func{remap\_file\_pages}
+permette anche di mappare la stessa pagina di un file in più pagine della
+regione mappata.
+
+La funzione richiede che si identifichi la sezione del file che si vuole
+riposizionare all'interno del \textit{memory mapping} con gli argomenti
+\param{pgoff} e \param{size}; l'argomento \param{start} invece deve indicare
+un indirizzo all'interno dell'area definita dall'\func{mmap} iniziale, a
+partire dal quale la sezione di file indicata verrà rimappata. L'argomento
+\param{prot} deve essere sempre nullo, mentre \param{flags} prende gli stessi
+valori di \func{mmap} (quelli di tab.~\ref{tab:file_mmap_prot}) ma di tutti i
+flag solo \const{MAP\_NONBLOCK} non viene ignorato.
+
+Insieme alla funzione \func{remap\_file\_pages} nel kernel 2.5.46 con sono
+stati introdotti anche due nuovi flag per \func{mmap}: \const{MAP\_POPULATE} e
+\const{MAP\_NONBLOCK}.  Il primo dei due consente di abilitare il meccanismo
+del \itindex{prefaulting} \textit{prefaulting}. Questo viene di nuovo in aiuto
+per migliorare le prestazioni in certe condizioni di utilizzo del
+\textit{memory mapping}. 
+
+Il problema si pone tutte le volte che si vuole mappare in memoria un file di
+grosse dimensioni. Il comportamento normale del sistema della
+\index{memoria~virtuale} memoria virtuale è quello per cui la regione mappata
+viene aggiunta alla \itindex{page~table} \textit{page table} del processo, ma
+i dati verranno effettivamente utilizzati (si avrà cioè un
+\itindex{page~fault} \textit{page fault} che li trasferisce dal disco alla
+memoria) soltanto in corrispondenza dell'accesso a ciascuna delle pagine
+interessate dal \textit{memory mapping}. 
+
+Questo vuol dire che il passaggio dei dati dal disco alla memoria avverrà una
+pagina alla volta con un gran numero di \itindex{page~fault} \textit{page
+  fault}, chiaramente se si sa in anticipo che il file verrà utilizzato
+immediatamente, è molto più efficiente eseguire un \itindex{prefaulting}
+\textit{prefaulting} in cui tutte le pagine di memoria interessate alla
+mappatura vengono ``\textsl{popolate}'' in una sola volta, questo
+comportamento viene abilitato quando si usa con \func{mmap} il flag
+\const{MAP\_POPULATE}.
+
+Dato che l'uso di \const{MAP\_POPULATE} comporta dell'l'I/O su disco che può
+rallentare l'esecuzione di \func{mmap} è stato introdotto anche un secondo
+flag, \const{MAP\_NONBLOCK}, che esegue un \itindex{prefaulting}
+\textit{prefaulting} più limitato in cui vengono popolate solo le pagine della
+mappatura che già si trovano nella cache del kernel.\footnote{questo può
+  essere utile per il linker dinamico, in particolare quando viene effettuato
+  il \textit{prelink} delle applicazioni.}
+
+\itindend{memory~mapping}
+
+
+% i raw device 
+%\subsection{I \textit{raw} device}
+%\label{sec:file_raw_device}
+
  
-Alla conclusione del processo, ogni pagina mappata verrà automaticamente
-rilasciata, mentre la chiusura del file descriptor usato per effettuare la
-mappatura in memoria non ha alcun effetto sulla stessa.
  
  
  \section{Il file locking}
@@ -1377,18 +1612,18 @@ diversi. In quell'occasione si 
  in \textit{append mode}, quando più processi scrivono contemporaneamente sullo
  stesso file non è possibile determinare la sequenza in cui essi opereranno.
  
-Questo causa la possibilità di race condition\index{\textit{race~condition}};
-in generale le situazioni più comuni sono due: l'interazione fra un processo
-che scrive e altri che leggono, in cui questi ultimi possono leggere
-informazioni scritte solo in maniera parziale o incompleta; o quella in cui
-diversi processi scrivono, mescolando in maniera imprevedibile il loro output
-sul file.
+Questo causa la possibilità di una \textit{race condition}
+\itindex{race~condition}; in generale le situazioni più comuni sono due:
+l'interazione fra un processo che scrive e altri che leggono, in cui questi
+ultimi possono leggere informazioni scritte solo in maniera parziale o
+incompleta; o quella in cui diversi processi scrivono, mescolando in maniera
+imprevedibile il loro output sul file.
  
  In tutti questi casi il \textit{file locking} è la tecnica che permette di
-evitare le race condition\index{\textit{race~condition}}, attraverso una serie
-di funzioni che permettono di bloccare l'accesso al file da parte di altri
-processi, così da evitare le sovrapposizioni, e garantire la atomicità delle
-operazioni di scrittura.
+evitare le \textit{race condition}\itindex{race~condition}, attraverso una
+serie di funzioni che permettono di bloccare l'accesso al file da parte di
+altri processi, così da evitare le sovrapposizioni, e garantire la atomicità
+delle operazioni di scrittura.
  
  
  
@@ -1547,13 +1782,13 @@ anche se richiesto attraverso un file descriptor, agisce sempre su un file;
  perciò le informazioni relative agli eventuali \textit{file lock} sono
  mantenute a livello di inode\index{inode},\footnote{in particolare, come
    accennato in fig.~\ref{fig:file_flock_struct}, i \textit{file lock} sono
-  mantenuti un una \textit{linked list}\index{linked list} di strutture
-  \struct{file\_lock}. La lista è referenziata dall'indirizzo di partenza
-  mantenuto dal campo \var{i\_flock} della struttura \struct{inode} (per le
-  definizioni esatte si faccia riferimento al file \file{fs.h} nei sorgenti
-  del kernel).  Un bit del campo \var{fl\_flags} di specifica se si tratta di
-  un lock in semantica BSD (\const{FL\_FLOCK}) o POSIX (\const{FL\_POSIX}).}
-dato che questo è l'unico riferimento in comune che possono avere due processi
+  mantenuti un una \textit{linked~list} di strutture \struct{file\_lock}. La
+  lista è referenziata dall'indirizzo di partenza mantenuto dal campo
+  \var{i\_flock} della struttura \struct{inode} (per le definizioni esatte si
+  faccia riferimento al file \file{fs.h} nei sorgenti del kernel).  Un bit del
+  campo \var{fl\_flags} di specifica se si tratta di un lock in semantica BSD
+  (\const{FL\_FLOCK}) o POSIX (\const{FL\_POSIX}).} \itindex{linked~list} dato
+che questo è l'unico riferimento in comune che possono avere due processi
  diversi che aprono lo stesso file.
  
  \begin{figure}[htb]
@@ -1636,8 +1871,8 @@ essa viene usata solo secondo il prototipo:
      \item[\errcode{EDEADLK}] Si è richiesto un lock su una regione bloccata da
        un altro processo che è a sua volta in attesa dello sblocco di un lock
        mantenuto dal processo corrente; si avrebbe pertanto un
-      \textit{deadlock}\index{\textit{deadlock}}. Non è garantito che il
-      sistema riconosca sempre questa situazione.
+      \textit{deadlock}\itindex{deadlock}. Non è garantito che il sistema
+      riconosca sempre questa situazione.
      \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale prima
        di poter acquisire un lock.
      \end{errlist}
@@ -1756,8 +1991,7 @@ stato effettivamente acquisito.
  
  \begin{figure}[htb]
    \centering \includegraphics[width=9cm]{img/file_lock_dead}
-  \caption{Schema di una situazione di
-    \textit{deadlock}\index{\textit{deadlock}}.}
+  \caption{Schema di una situazione di \textit{deadlock}\itindex{deadlock}.}
    \label{fig:file_flock_dead}
  \end{figure}
  
@@ -1769,12 +2003,11 @@ un lock sulla regione 2 che non pu
  del processo 2; il processo 1 si bloccherà fintanto che il processo 2 non
  rilasci il blocco. Ma cosa accade se il processo 2 nel frattempo tenta a sua
  volta di ottenere un lock sulla regione A? Questa è una tipica situazione che
-porta ad un \textit{deadlock}\index{\textit{deadlock}}, dato che a quel punto
-anche il processo 2 si bloccherebbe, e niente potrebbe sbloccare l'altro
-processo. Per questo motivo il kernel si incarica di rilevare situazioni di
-questo tipo, ed impedirle restituendo un errore di \errcode{EDEADLK} alla
-funzione che cerca di acquisire un lock che porterebbe ad un
-\textit{deadlock}.
+porta ad un \textit{deadlock}\itindex{deadlock}, dato che a quel punto anche
+il processo 2 si bloccherebbe, e niente potrebbe sbloccare l'altro processo.
+Per questo motivo il kernel si incarica di rilevare situazioni di questo tipo,
+ed impedirle restituendo un errore di \errcode{EDEADLK} alla funzione che
+cerca di acquisire un lock che porterebbe ad un \textit{deadlock}.
  
  \begin{figure}[!bht]
    \centering \includegraphics[width=13cm]{img/file_posix_lock}
@@ -1801,7 +2034,8 @@ questo caso la titolarit
  voce nella file table, ma con il valore del \acr{pid} del processo.
  
  Quando si richiede un lock il kernel effettua una scansione di tutti i lock
-presenti sul file\footnote{scandisce cioè la linked list delle strutture
+presenti sul file\footnote{scandisce cioè la
+  \itindex{linked~list}\textit{linked list} delle strutture
    \struct{file\_lock}, scartando automaticamente quelle per cui
    \var{fl\_flags} non è \const{FL\_POSIX}, così che le due interfacce restano
    ben separate.}  per verificare se la regione richiesta non si sovrappone ad