From: Simone Piccardi Date: Wed, 7 Aug 2002 17:47:51 +0000 (+0000) Subject: Sistemato il memory mapping X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=commitdiff_plain;h=486c2be2a052783e6dec09bc288c76ecaa4f21e6;ds=sidebyside Sistemato il memory mapping --- diff --git a/fileadv.tex b/fileadv.tex index 790ccdb..40dc7a5 100644 --- a/fileadv.tex +++ b/fileadv.tex @@ -446,7 +446,7 @@ sottratto il valore di questo campo. Il campo \var{aio\_lio\_opcode} è usato soltanto dalla funzione \func{lio\_listio}, che, come vedremo più avanti, permette di eseguire con una -sola chiamanta una serie di operazioni, usando un vettore di \textit{control +sola chiamata una serie di operazioni, usando un vettore di \textit{control block}. Tramite questo campo si specifica quale è la natura di ciascuna di esse. @@ -465,7 +465,7 @@ struct sigevent \end{lstlisting} \end{minipage} \normalsize - \caption{La struttura \type{sigevent}, usata per specificare le modailtà di + \caption{La struttura \type{sigevent}, usata per specificare le modalità di notifica degli eventi relativi alle operazioni di I/O asincrono.} \label{fig:file_sigevent} \end{figure} @@ -528,7 +528,7 @@ operazione pu campi per eseguire l'operazione può avvenire in un momento qualsiasi dopo la richiesta. Questo comporta che occorre evitare di usare per \param{aiocbp} variabili automatiche e che non si deve riutilizzare la stessa struttura per -un'ulteriore operazione fintanto che la precedente non sia stata ultimata. In +un ulteriore operazione fintanto che la precedente non sia stata ultimata. In generale per ogni operazione di I/O asincrono si deve utilizzare una diversa struttura \type{aiocb}. @@ -597,9 +597,9 @@ asincrono non verrebbero liberate, rischiando di arrivare ad un loro esaurimento. Oltre alle operazioni di lettura e scrittura l'interfaccia POSIX.1b mette a -disposizione un'altra operazione, quella di sincronizzazione delll'I/O, essa è +disposizione un'altra operazione, quella di sincronizzazione dell'I/O, essa è compiuta dalla funzione \func{aio\_fsync}, che ha lo stesso effetto della -analoga \func{fsync}, ma viene esguita in maniera asincrona; il suo prototipo +analoga \func{fsync}, ma viene eseguita in maniera asincrona; il suo prototipo è: \begin{prototype}{aio.h} {ssize\_t aio\_return(int op, struct aiocb *aiocbp)} @@ -627,7 +627,7 @@ specificato un meccanismo di notifica questo sar operazioni di sincronizzazione dei dati saranno completate. In alcuni casi può essere necessario interrompere le operazioni (in genere -quando viene richiesta un'uscita immediata dal programam), per questo lo +quando viene richiesta un'uscita immediata dal programma), per questo lo standard POSIX.1b prevede una funzioni apposita, \func{aio\_cancel}, che permette di cancellare una operazione richiesta in precedenza; il suo prototipo è: @@ -682,7 +682,7 @@ specifica operazione; il suo prototipo operazioni specificate da \param{list}. \bodydesc{La funzione restituisce 0 se una (o più) operazioni sono state - completate, e -1 in caso di errorem nel qual caso \var{errno} viene + completate, e -1 in caso di errore nel qual caso \var{errno} viene settata ai valori: \begin{errlist} \item[\macro{EAGAIN}] Nessuna operazione è stata completata entro @@ -742,7 +742,7 @@ non completate. L'argomento \param{mode} permette di stabilire il comportamento della funzione, se viene specificato il valore \macro{LIO\_WAIT} la funzione si blocca fino al completamento di tutte le operazioni richieste; se invece si -spercifica \macro{LIO\_NOWAIT} la funzione ritorna immediatamente dopo aver +specifica \macro{LIO\_NOWAIT} la funzione ritorna immediatamente dopo aver messo in coda tutte le richieste. In questo caso il chiamante può richiedere la notifica del completamento di tutte le richieste, settando l'argomento \param{sig} in maniera analoga a come si fa per il campo \var{aio\_sigevent} @@ -765,7 +765,7 @@ Per questo motivo BSD 4.2\footnote{Le due funzioni sono riprese da BSD4.4 ed integrate anche dallo standard Unix 98; fino alle libc5 Linux usava \type{size\_t} come tipo dell'argomento \param{count}, una scelta logica, che è stata dismessa per restare aderenti allo standard.} ha introdotto due -nuove system call, \func{readv} e \func{writev}, che permettono di effettare +nuove system call, \func{readv} e \func{writev}, che permettono di effettuare con una sola chiamata una lettura o una scrittura su una serie di buffer (quello che viene chiamato \textsl{I/O vettorizzato}. I relativi prototipi sono: @@ -820,8 +820,8 @@ struct iovec { \label{fig:file_iovec} \end{figure} -I buffer da utlizzare sono specificati attraverso l'argomento \var{vector} che -è un array di tale strutture, la cui lunghezza è specificata da \param{count}. +I buffer da utilizzare sono specificati attraverso l'argomento \var{vector} che +è un vettore di tale strutture, la cui lunghezza è specificata da \param{count}. Essi verranno letti (o scritti) nell'ordine in cui li si sono specificati. @@ -955,7 +955,7 @@ come maschera binaria ottenuta dall'OR di uno o pi riportati sul file e saranno immediatamente visibili agli altri processi che mappano lo stesso file.\footnotemark Il file su disco però non sarà - aggiornato fino alla chiamata di \func{rsync} o + aggiornato fino alla chiamata di \func{msync} o \func{unmap}), e solo allora le modifiche saranno visibili per l'I/O convenzionale. Incompatibile con \macro{MAP\_PRIVATE}. \\ @@ -975,15 +975,16 @@ come maschera binaria ottenuta dall'OR di uno o pi \macro{MAP\_EXECUTABLE}& Ignorato. \\ \macro{MAP\_NORESERVE} & Si usa con \macro{MAP\_PRIVATE}. Non riserva delle pagine di swap ad uso del meccanismo di - \textit{copy on write} per mantere le modifiche + \textit{copy on write} per mantenere le modifiche fatte alla regione mappata, in questo caso dopo una scrittura, se non c'è più memoria disponibile, si ha l'emissione di un \macro{SIGSEGV}. \\ \macro{MAP\_LOCKED} & Se settato impedisce lo swapping delle pagine mappate. \\ - \macro{MAP\_GROWSDOWN} & Usato per gli stack. Indica alla virtual memory - che la mappatura deve essere effettuata .\\ + \macro{MAP\_GROWSDOWN} & Usato per gli stack. Indica + che la mappatura deve essere effettuata con gli + indirizzi crecenti verso il basso.\\ \macro{MAP\_ANONYMOUS} & La mappatura non è associata a nessun file. Gli argomenti \param{fd} e \param{offset} sono ignorati.\footnotemark\\ @@ -1005,42 +1006,58 @@ qualora esso sia pi scritture in quella zona di memoria non vengono riportate sul file. Se le dimensioni del file cambiano (esso viene esteso o troncato), non è specificato quale effetto viene a aversi sulle pagine di memoria che corrispondono alle -regioni aggiunte o tolte. - -Si tenga presente che non tutti i file possono venire mappati in memoria; ad -esempio non è possibile mappare in memoria pipe, socket e fifo; lo stesso vale -anche per alcuni file di dispositivo, che non dispongono dell'operazione -relativa \var{mmap} (si ricordi quanto esposto in \secref{sec:file_vfs_work}). - -La memoria mappata viene mantenuta attraverso una \func{fork}; con gli stessi -attributi. In particolare se la memoria è condivisa lo sarà anche fra padre e -figlio, se è privata ognuno di essi manterrà una sua versione privata. Non c'è -invece nessun passaggio attraverso una \func{exec}, dato che quest'ultima -sostituisce tutto lo spazio degli indirizzo con quello del nuovo programma. - -Quando si effettua una mappatura di un file, i relativi tempi (vedi -\secref{sec:file_file_times}) vengono pure modificati. Il valore di -\var{st\_atime} può venir cambiato in un qualunque momento in cui la mappatura -sia attiva: il primo riferimento ad una pagina mappata aggiorna questo tempo. -I valori di \var{st\_ctime} e \var{st\_mtime} vengono cambiati solo quando è -possibile una scrittura (cioè per un file mappato con \macro{PROT\_WRITE} e -\macro{MAP\_SHARED}) e sono aggiornati dopo la scrittura e prima di una -eventuale \func{msync}. +regioni aggiunte o tolte. + +Si tenga presente che non tutti i file possono venire mappati in memoria, la +mappatura infatti introduce una corrispondenza biunivoca fra una sezione di un +file ed una sezione di memoria, pertanto si può parlare tanto di file mappato +in memoria, quanto di memoria mappata su file. Questo comporta che ad esempio +non è possibile mappare in memoria pipe, socket e fifo, per le quali non ha +senso parlare di \textsl{sezione}. Lo stesso vale anche per alcuni file di +dispositivo, che non dispongono della relativa operazione \var{mmap} (si +ricordi quanto esposto in \secref{sec:file_vfs_work}), ma esistono anche casi +(un esempio è l'interfaccia ponte PCI-VME del chip Universe) di dispositivi +che sono utilizzabili praticamente solo con questa interfaccia. + +Passando attraverso una \func{fork} i file mappati in memoria vengono +ereditati in maniera trasparente dal processo figlio, mantenendo gli stessi +attributi avuti nel padre; così se si è usato \macro{MAP\_SHARED} padre e +figlio accederanno allo stesso file in maniera condivisa, mentre se si è usato +\macro{MAP\_PRIVATE} ciascuno di essi manterrà una sua versione privata +indipendente. Non c'è invece nessun passaggio attraverso una \func{exec}, dato +che quest'ultima sostituisce tutto lo spazio degli indirizzi di un processo +con quello di un nuovo programma. + +Quando si effettua la mappatura di un file vengono pure modificati i tempi ad +esso associati (si ricordi quanto esposto in \secref{sec:file_file_times}). Il +valore di \var{st\_atime} può venir cambiato in qualunque istante a partire +dal momento in cui la mappatura è stata effettuata: il primo riferimento ad +una pagina mappata su un file aggiorna questo tempo. I valori di +\var{st\_ctime} e \var{st\_mtime} possono venir cambiati solo quando si è +consentita la scrittura sul file (cioè per un file mappato con +\macro{PROT\_WRITE} e \macro{MAP\_SHARED}) e sono aggiornati dopo la scrittura +o in corrispondenza di una eventuale \func{msync}. Dato per i file mappati in memoria le operazioni di I/O sono gestite direttamente dalla memoria virtuale, occorre essere consapevoli delle interazioni che possono esserci con operazioni effettuate con l'interfaccia -standard di \capref{sec:file_unix_interface}. Il problema è che una volta che -si è mappato un file, le operazioni di lettura e scrittura saranno eseguite -sulla memoria, e riportate su disco in maniera autonoma dal sistema della -memoria virtuale. +standard dei file di \capref{sec:file_unix_interface}. Il problema è che una +volta che si è mappato un file, le operazioni di lettura e scrittura saranno +eseguite sulla memoria, e riportate su disco in maniera autonoma dal sistema +della memoria virtuale. Pertanto se si modifica un file con l'interfaccia standard queste modifiche potranno essere visibili o meno a seconda del momento in cui la memoria -virtuale leggerà dal disco in memoria quella sezione del file, ed è del tutto -indefinito quale può essere il contenuto della memoria mappata. È però -possibile usare la funzione \func{msync} per sincronizzare il contenuto della -memoria con il file su disco; il suo prototipo è: +virtuale leggerà dal disco in memoria quella sezione del file, perciò è del +tutto indefinito il risultato della modifica nei confronti del contenuto della +memoria mappata. + +Se è, per quanto appena visto, sconsigliabile eseguire scritture su file +attraverso l'interfaccia standard quando lo si è mappato in memoria, è invece +possibile usare l'interfaccia standard per leggere un file mappato in memoria, +purché si abbia una certa cura; infatti l'interfaccia dell'I/O mappato in +memoria mette a disposizione la funzione \func{msync} per sincronizzare il +contenuto della memoria mappata con il file su disco; il suo prototipo è: \begin{functions} \headdecl{unistd.h} \headdecl{sys/mman.h} @@ -1054,16 +1071,18 @@ memoria con il file su disco; il suo prototipo \begin{errlist} \item[\macro{EINVAL}] O \param{start} non è multiplo di \macro{PAGESIZE}, o si è specificato un valore non valido per \param{flags}. - \item[\macro{EFAULT}] Il range specificato non ricade in una zona + \item[\macro{EFAULT}] L'intervallo specificato non ricade in una zona precedentemente mappata. \end{errlist} } \end{functions} -La funzione esegue la sincronizzazione su file di quanto scritto nella sezione -di memoria indicata da \param{start} e \param{offset}. Provvede anche ad -aggiornare i relativi tempi di modifica; in questo modo le funzioni -dell'interfaccia standard potranno accedere al contenuto aggiornato. +La funzione esegue la sincronizzazione di quanto scritto nella sezione di +memoria indicata da \param{start} e \param{offset}, scrivendo le modifiche sul +file (qualora questo non sia già stato fatto). Provvede anche ad aggiornare i +relativi tempi di modifica. In questo modo si è sicuri che dopo l'esecuzione +di \func{msync} le funzioni dell'interfaccia standard troveranno un contenuto +del file aggiornato. L'argomento \param{flag} è specificato come maschera binaria composta da un OR dei valori riportati in \tabref{tab:file_mmap_rsync}, di questi però @@ -1093,8 +1112,8 @@ aggiornate ai nuovi valori. \label{tab:file_mmap_rsync} \end{table} -Una volta completate le operazioni di I/O si può eliminare la mappatura della -memoria usando la funzione \func{munmap}, il cui prototipo è: +Una volta che si sono completate le operazioni di I/O si può eliminare la +mappatura della memoria usando la funzione \func{munmap}, il suo prototipo è: \begin{functions} \headdecl{unistd.h} \headdecl{sys/mman.h} @@ -1106,13 +1125,22 @@ memoria usando la funzione \func{munmap}, il cui prototipo \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di errore nel qual caso \var{errno} viene settata ai valori: \begin{errlist} - \item[\macro{EINVAL}] Il range specificato non ricade in una zona + \item[\macro{EINVAL}] L'intervallo specificato non ricade in una zona precedentemente mappata. \end{errlist} } \end{functions} -La funzione +La funzione cancella la mappatura per l'intervallo specificato attraverso +\param{start} e \param{length}, ed ogni successivo accesso a tale regione +causerà un errore di accesso in memoria. L'argomento \param{start} deve essere +allineato alle dimensioni di una pagina di memoria, e la mappatura di tutte le +pagine contenute (anche parzialmente) nell'intervallo indicato, verrà rimossa. +Indicare un intervallo che non contiene pagine mappate non è un errore. + +Alla conclusione del processo, ogni pagina mappata verrà automaticamente +rilasciata, mentre la chiusura del file descriptor non ha alcun effetto sulla +mappatura della memoria. \section{Il file locking}