Inizio revisione capitolo 6.
[gapil.git] / process.tex
index 9f52a4203f5d1c842564a54cc015da1d994848dc..4fc31e6783bdc9d99bee5595a800228ab29c716b 100644 (file)
@@ -84,11 +84,11 @@ di \cmd{ld.so} e per un approfondimento dell'argomento si può consultare
 sez.~3.1.2 di \cite{AGL}.
 
 Una volta completate le operazioni di inizializzazione di \cmd{ld-linux.so}, il
-sistema fa partire qualunque programma chiamando la funzione \func{main}. Sta
+sistema fa partire qualunque programma chiamando la funzione \code{main}. Sta
 al programmatore chiamare così la funzione principale del programma da cui si
 suppone che inizi l'esecuzione. In ogni caso senza questa funzione lo stesso
 \textit{link-loader} darebbe luogo ad errori.  Lo standard ISO C specifica che
-la funzione \func{main} può non avere argomenti o prendere due argomenti che
+la funzione \code{main} può non avere argomenti o prendere due argomenti che
 rappresentano gli argomenti passati da linea di comando (su cui torneremo in
 sez.~\ref{sec:proc_par_format}), in sostanza un prototipo che va sempre bene è
 il seguente:
@@ -97,7 +97,7 @@ il seguente:
 \itindend{link-loader}
 
 In realtà nei sistemi Unix esiste un altro modo per definire la funzione
-\func{main}, che prevede la presenza di un terzo argomento, \code{char
+\code{main}, che prevede la presenza di un terzo argomento, \code{char
   *envp[]}, che fornisce l'\textsl{ambiente} del programma; questa forma però
 non è prevista dallo standard POSIX.1 per cui se si vogliono scrivere
 programmi portabili è meglio evitarla. Per accedere all'ambiente, come vedremo
@@ -105,9 +105,9 @@ in sez.~\ref{sec:proc_environ} si usa in genere una variabile globale che
 viene sempre definita automaticamente.
 
 Ogni programma viene fatto partire mettendo in esecuzione il codice contenuto
-nella funzione \func{main}, ogni altra funzione usata dal programma, che sia
+nella funzione \code{main}, ogni altra funzione usata dal programma, che sia
 ottenuta da una libreria condivisa, o che sia direttamente definita nel
-codice, dovrà essere invocata a partire dal codice di \func{main}. Nel caso di
+codice, dovrà essere invocata a partire dal codice di \code{main}. Nel caso di
 funzioni definite nel programma occorre tenere conto che, nel momento stesso
 in cui si usano le librerie di sistema (vale a dire la \acr{glibc}) alcuni
 nomi sono riservati e non possono essere utilizzati. 
@@ -359,11 +359,11 @@ direttamente valori numerici.
 \label{sec:proc_conclusion}
 
 Normalmente un programma conclude la sua esecuzione quando si fa ritornare la
-funzione \func{main}, si usa cioè l'istruzione \instruction{return} del
+funzione \code{main}, si usa cioè l'istruzione \instruction{return} del
 linguaggio C all'interno della stessa, o se si richiede esplicitamente la
 chiusura invocando direttamente la funzione \func{exit}. Queste due modalità
 sono assolutamente equivalenti, dato che \func{exit} viene chiamata in maniera
-trasparente anche quando \func{main} ritorna, passandogli come argomento il
+trasparente anche quando \code{main} ritorna, passandogli come argomento il
 valore di ritorno (che essendo .
 
 La funzione \funcd{exit}, che è completamente generale, essendo definita dallo
@@ -389,18 +389,18 @@ vedremo a breve) che completa la terminazione del processo.
 
 \itindbeg{exit~status}
 
-Il valore dell'argomento \param{status} o il valore di ritorno di \func{main},
+Il valore dell'argomento \param{status} o il valore di ritorno di \code{main},
 costituisce quello che viene chiamato lo \textsl{stato di uscita}
 (l'\textit{exit status}) del processo. In generale si usa questo valore per
 fornire al processo padre (come vedremo in sez.~\ref{sec:proc_wait}) delle
 informazioni generiche sulla riuscita o il fallimento del programma appena
 terminato.
 
-Anche se l'argomento \param{status} (ed il valore di ritorno di \func{main})
+Anche se l'argomento \param{status} (ed il valore di ritorno di \code{main})
 sono numeri interi di tipo \ctyp{int}, si deve tener presente che il valore
 dello stato di uscita viene comunque troncato ad 8 bit,
 per cui deve essere sempre compreso fra 0 e 255. Si tenga presente che se si
-raggiunge la fine della funzione \func{main} senza ritornare esplicitamente si
+raggiunge la fine della funzione \code{main} senza ritornare esplicitamente si
 ha un valore di uscita indefinito, è pertanto consigliabile di concludere
 sempre in maniera esplicita detta funzione.
 
@@ -448,10 +448,10 @@ registrate con \func{atexit} e \func{on\_exit} non vengono eseguite. La
 funzione chiude tutti i file descriptor appartenenti al processo, cosa che
 però non comporta il salvataggio dei dati eventualmente presenti nei buffer
 degli \textit{stream}, (torneremo sulle due interfacce dei file in
-cap.~\ref{cha:files_std_interface} e
-cap.~\ref{cha:file_unix_interface})). Infine fa sì che ogni figlio del
-processo sia adottato da \cmd{init} (vedi sez.~\ref{sec:proc_termination}),
-manda un segnale \signal{SIGCHLD} al processo padre (vedi
+sez.~\ref{sec:file_unix_interface} e
+sez.~\ref{sec:files_std_interface}). Infine fa sì che ogni figlio del processo
+sia adottato da \cmd{init} (vedi sez.~\ref{sec:proc_termination}), manda un
+segnale \signal{SIGCHLD} al processo padre (vedi
 sez.~\ref{sec:sig_job_control}) e ritorna lo stato di uscita specificato
 in \param{status} che può essere raccolto usando la funzione \func{wait} (vedi
 sez.~\ref{sec:proc_wait}).
@@ -482,14 +482,18 @@ registrare un certo numero di funzioni che verranno eseguite all'uscita dal
 programma,\footnote{nel caso di \func{atexit} lo standard POSIX.1-2001
   richiede che siano registrabili almeno \const{ATEXIT\_MAX} funzioni (il
   valore può essere ottenuto con \func{sysconf}, vedi
-  sez.~\ref{sec:sys_sysconf}).} sia per la chiamata ad \func{exit} che per il
-ritorno di \func{main}. La prima funzione che si può utilizzare a tal fine è
+  sez.~\ref{sec:sys_limits}).} sia per la chiamata ad \func{exit} che per il
+ritorno di \code{main}. La prima funzione che si può utilizzare a tal fine è
 \funcd{atexit}, il cui prototipo è:
 
-\begin{funcproto}{ \fhead{stdlib.h} \fdecl{void (*function)(void)}
-    \fdesc{Registra la funzione \param{function} per la chiamata all'uscita
-      dal programma.}  } {La funzione ritorna $0$ in caso di successo e
-    $-1$ per un errore, \var{errno} non viene modificata.}
+\begin{funcproto}{ 
+\fhead{stdlib.h} 
+\fdecl{int atexit(void (*function)(void))}
+\fdesc{Registra la funzione \param{function} per la chiamata all'uscita
+      dal programma.}  
+} 
+{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, \var{errno}
+  non viene modificata.}
 \end{funcproto}
 
 La funzione richiede come argomento \param{function} l'indirizzo di una
@@ -504,7 +508,7 @@ definita su altri sistemi,\footnote{non essendo prevista dallo standard POSIX
 
 \begin{funcproto}{ 
 \fhead{stdlib.h} 
-\fdecl{void (*function)(int , void *), void *arg)}
+\fdecl{int on\_exit(void (*function)(int, void *), void *arg))}
 \fdesc{Registra la funzione \param{function} per la chiamata all'uscita dal
   programma.} 
 }
@@ -563,7 +567,7 @@ Allo stesso modo l'unico modo in cui un programma può concludere
 volontariamente la propria esecuzione è attraverso una chiamata alla
 \textit{system call} \func{\_exit}, sia che questa venga fatta esplicitamente,
 o in maniera indiretta attraverso l'uso di \func{exit} o il ritorno di
-\func{main}. 
+\code{main}. 
 
 Uno schema riassuntivo che illustra le modalità con cui si avvia e conclude
 normalmente un programma è riportato in fig.~\ref{fig:proc_prog_start_stop}.
@@ -931,8 +935,8 @@ semplicemente allocati \param{size} byte e l'area di memoria non viene
 inizializzata.
 
 Una volta che non sia più necessaria la memoria allocata dinamicamente deve
-essere esplicitamente rilasciata usando la funzione \func{free},\footnote{le
-  glibc provvedono anche una funzione \func{cfree} definita per compatibilità
+essere esplicitamente rilasciata usando la funzione \funcd{free},\footnote{le
+  glibc provvedono anche una funzione \funcm{cfree} definita per compatibilità
   con SunOS, che è deprecata.} il suo prototipo è:
 
 \begin{funcproto}{ 
@@ -1014,7 +1018,7 @@ come quello dei \itindex{double~free} \textit{double~free} o i
 \begin{itemize*}
 \item se la variabile è posta a $0$ gli errori vengono ignorati;
 \item se la variabile è posta a $1$ viene stampato un avviso sullo
-  \textit{standard error} (vedi sez.~\ref{sec:file_std_stream});
+  \textit{standard error} (vedi sez.~\ref{sec:file_fd});
 \item se la variabile è posta a $2$ viene chiamata la funzione \func{abort}
   (vedi sez.~\ref{sec:sig_alarm_abort}), che in genere causa l'immediata
   terminazione del programma;
@@ -1141,6 +1145,9 @@ dando luogo ad una \itindex{segment~violation} \textit{segment violation} la
 prima volta che cercherà di accedere alla memoria non effettivamente
 disponibile. 
 
+
+\index{segmento!dati|(}
+
 Le due funzioni seguenti\footnote{le due funzioni sono state definite con BSD
   4.3, sono marcate obsolete in SUSv2 e non fanno parte delle librerie
   standard del C e mentre sono state esplicitamente rimosse dallo standard
@@ -1162,25 +1169,25 @@ prototipo è:
 \end{funcproto}
 
 La funzione è un'interfaccia all'omonima \textit{system call} ed imposta
-l'indirizzo finale del \index{segmento!dati} segmento dati di un processo (più
-precisamente dello \itindex{heap} \textit{heap}) all'indirizzo specificato
+l'indirizzo finale del segmento dati di un processo (più precisamente dello
+\itindex{heap} \textit{heap}) all'indirizzo specificato
 da \param{addr}. Quest'ultimo deve essere un valore ragionevole, e la
 dimensione totale non deve comunque eccedere un eventuale limite (vedi
 sez.~\ref{sec:sys_resource_limit}) imposto sulle dimensioni massime del
-\index{segmento!dati} segmento dati del processo.
+segmento dati del processo.
 
 Il valore di ritorno della funzione fa riferimento alla versione fornita dalla
 \acr{glibc}, in realtà in Linux la \textit{system call} corrispondente
-restituisce come valore di ritorno il nuovo valore della fine del
-\index{segmento!dati} segmento dati in caso di successo e quello corrente in
-caso di fallimento, è la funzione di interfaccia usata dalla \acr{glibc} che
-fornisce i valori di ritorno appena descritti; se si usano librerie diverse
-questo potrebbe non accadere.
+restituisce come valore di ritorno il nuovo valore della fine del segmento
+dati in caso di successo e quello corrente in caso di fallimento, è la
+funzione di interfaccia usata dalla \acr{glibc} che fornisce i valori di
+ritorno appena descritti; se si usano librerie diverse questo potrebbe non
+accadere.
 
-Una seconda funzione per la manipolazione diretta delle dimensioni
-\index{segmento!dati} del segmento dati\footnote{in questo caso si tratta
-  soltanto di una funzione di libreria, anche se basata sulla stessa
-  \textit{system call}.} è \funcd{sbrk}, ed il suo prototipo è:
+Una seconda funzione per la manipolazione diretta delle dimensioni del
+segmento dati\footnote{in questo caso si tratta soltanto di una funzione di
+  libreria, anche se basata sulla stessa \textit{system call}.} è
+\funcd{sbrk}, ed il suo prototipo è:
 
 \begin{funcproto}{ 
 \fhead{unistd.h} 
@@ -1198,8 +1205,7 @@ nuovo indirizzo finale dello stesso.  L'argomento è definito come di tipo
 \type{intptr\_t}, ma a seconda della versione delle librerie e del sistema può
 essere indicato con una serie di tipi equivalenti come \type{ptrdiff\_t},
 \type{ssize\_t}, \ctyp{int}. Se invocata con un valore nullo la funzione
-permette di ottenere l'attuale posizione della fine del \index{segmento!dati}
-segmento dati.
+permette di ottenere l'attuale posizione della fine del segmento dati.
 
 Queste due funzioni sono state deliberatamente escluse dallo standard POSIX.1
 dato che per i normali programmi è sempre opportuno usare le funzioni di
@@ -1207,6 +1213,8 @@ allocazione standard descritte in precedenza, a meno di non voler realizzare
 per proprio conto un diverso meccanismo di gestione della memoria del segmento
 dati.
 
+\index{segmento!dati|)}
+
 
 \subsection{Il controllo della memoria virtuale}  
 \label{sec:proc_mem_lock}
@@ -1250,11 +1258,11 @@ motivi per cui si possono avere di queste necessità sono due:
 \end{itemize*}
 
 Per ottenere informazioni sulle modalità in cui un programma sta usando la
-memoria virtuale è disponibile una apposita funzione, \funcd{mincore}, che
-però non è standardizzata da POSIX e pertanto non è disponibile su tutte le
-versioni di kernel unix-like;\footnote{nel caso di Linux devono essere
-  comunque definite le macro \macro{\_BSD\_SOURCE} e \macro{\_SVID\_SOURCE}.}
-il suo prototipo è:
+memoria virtuale è disponibile una apposita funzione di sistema,
+\funcd{mincore}, che però non è standardizzata da POSIX e pertanto non è
+disponibile su tutte le versioni di kernel unix-like;\footnote{nel caso di
+  Linux devono essere comunque definite le macro \macro{\_BSD\_SOURCE} e
+  \macro{\_SVID\_SOURCE}.}  il suo prototipo è:
 
 \begin{funcproto}{
 \fhead{unistd.h}
@@ -1358,32 +1366,9 @@ poi ogni processo può sbloccare le pagine relative alla propria memoria, se
 però diversi processi bloccano la stessa pagina questa resterà bloccata
 fintanto che ci sarà almeno un processo che la blocca.
 
-Le funzioni per bloccare e sbloccare la \index{paginazione} paginazione di
-singole sezioni di memoria sono rispettivamente \funcd{mlock} e
+Le funzioni di sistema per bloccare e sbloccare la \index{paginazione}
+paginazione di singole sezioni di memoria sono rispettivamente \funcd{mlock} e
 \funcd{munlock}; i loro prototipi sono:
-% \begin{functions}
-%   \headdecl{sys/mman.h} 
-
-%   \funcdecl{int mlock(const void *addr, size\_t len)}
-%   Blocca la paginazione su un intervallo di memoria.
-
-%   \funcdecl{int munlock(const void *addr, size\_t len)}
-%   Rimuove il blocco della paginazione su un intervallo di memoria.
-  
-%   \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e $-1$ in
-%     caso di errore, nel qual caso \var{errno} assumerà uno dei
-%     valori:
-%   \begin{errlist}
-%   \item[\errcode{ENOMEM}] alcuni indirizzi dell'intervallo specificato non
-%     corrispondono allo spazio di indirizzi del processo o si è ecceduto
-%     il numero massimo consentito di pagine bloccate.
-%   \item[\errcode{EINVAL}] \param{len} non è un valore positivo.
-%   \item[\errcode{EPERM}] con un kernel successivo al 2.6.9 il processo non è
-%     privilegiato e si un limite nullo per \const{RLIMIT\_MEMLOCK}.
-%   \end{errlist}
-%   e, per \func{mlock}, anche \errval{EPERM} quando il processo non ha i
-%   privilegi richiesti per l'operazione.}
-% \end{functions}
 
 \begin{funcproto}{
   \fhead{sys/mman.h} 
@@ -1416,9 +1401,10 @@ la durata del blocco. Con kernel diversi da Linux si può ottenere un errore di
 pagine di memoria, pertanto se si ha a cuore la portabilità si deve avere cura
 di allinearne correttamente il valore.
 
-Altre due funzioni, \funcd{mlockall} e \funcd{munlockall}, consentono di
-bloccare genericamente la \index{paginazione} paginazione per l'intero spazio
-di indirizzi di un processo.  I prototipi di queste funzioni sono:
+Altre due funzioni di sistema, \funcd{mlockall} e \funcd{munlockall},
+consentono di bloccare genericamente la \index{paginazione} paginazione per
+l'intero spazio di indirizzi di un processo.  I prototipi di queste funzioni
+sono:
 
 \begin{funcproto}{ 
 \fhead{sys/mman.h} 
@@ -1617,7 +1603,7 @@ errore ed agire di conseguenza.
 Nonostante la scarsa leggibilità del prototipo si tratta semplicemente di
 definire una funzione di tipo \code{void abortfn(enum mcheck\_status status)},
 che non deve restituire nulla e che deve avere un unico argomento di tipo
-\type{mcheck\_status}. In caso di errore la funzione verrà eseguita ricevendo
+\code{mcheck\_status}. In caso di errore la funzione verrà eseguita ricevendo
 un opportuno valore di \param{status} che è un tipo enumerato che può assumere
 soltanto i valori di tab.~\ref{tab:mcheck_status_value} che indicano la
 tipologia di errore riscontrata.
@@ -1630,20 +1616,20 @@ tipologia di errore riscontrata.
     \textbf{Valore} & \textbf{Significato} \\
     \hline
     \hline
-    \const{MCHECK\_OK}      & riportato a \func{mprobe} se nessuna
+    \const{MCHECK\_OK}      & Riportato a \func{mprobe} se nessuna
                               inconsistenza è presente.\\
-    \const{MCHECK\_DISABLED}& riportato a \func{mprobe} se si è chiamata
+    \const{MCHECK\_DISABLED}& Riportato a \func{mprobe} se si è chiamata
                               \func{mcheck} dopo aver già usato
                               \func{malloc}.\\
-    \const{MCHECK\_HEAD}    & i dati immediatamente precedenti il buffer sono
+    \const{MCHECK\_HEAD}    & I dati immediatamente precedenti il buffer sono
                               stati modificati, avviene in genere quando si
                               decrementa eccessivamente il valore di un
                               puntatore scrivendo poi prima dell'inizio del
                               buffer.\\
-    \const{MCHECK\_TAIL}    & i dati immediatamente seguenti il buffer sono
+    \const{MCHECK\_TAIL}    & I dati immediatamente seguenti il buffer sono
                               stati modificati, succede quando si va scrivere
                               oltre la dimensione corretta del buffer.\\
-    \const{MCHECK\_FREE}    & il buffer è già stato disallocato.\\
+    \const{MCHECK\_FREE}    & Il buffer è già stato disallocato.\\
     \hline
   \end{tabular}
   \caption{Valori dello stato dell'allocazione di memoria ottenibili dalla
@@ -1693,7 +1679,7 @@ operazioni.
 Tutti i programmi hanno la possibilità di ricevere argomenti e opzioni quando
 vengono lanciati e come accennato in sez.~\ref{sec:proc_main} questo viene
 effettuato attraverso gli argomenti \param{argc} e \param{argv} ricevuti nella
-funzione \func{main} all'avvio del programma. Questi argomenti vengono passati
+funzione \code{main} all'avvio del programma. Questi argomenti vengono passati
 al programma dalla shell o dal processo che esegue la \func{exec} (secondo le
 modalità che vedremo in sez.~\ref{sec:proc_exec}) quando questo viene messo in
 esecuzione.
@@ -1780,7 +1766,7 @@ in \param{argv} la libreria standard del C fornisce la funzione
 \fhead{unistd.h} 
 \fdecl{int getopt(int argc, char * const argv[], const char *optstring)}
 \fdesc{Esegue la scansione delle opzioni negli argomenti della funzione
-  \func{main}.} 
+  \code{main}.} 
 }
 {Ritorna il carattere che segue l'opzione, ``\texttt{:}'' se manca un
   parametro all'opzione, ``\texttt{?}'' se l'opzione è sconosciuta, e $-1$ se
@@ -1788,7 +1774,7 @@ in \param{argv} la libreria standard del C fornisce la funzione
 \end{funcproto}
 
 Questa funzione prende come argomenti le due variabili \param{argc} e
-\param{argv} che devono essere quelle passate come argomenti di \func{main}
+\param{argv} che devono essere quelle passate come argomenti di \code{main}
 all'esecuzione del programma, ed una stringa \param{optstring} che indica
 quali sono le opzioni valide. La funzione effettua la scansione della lista
 degli argomenti ricercando ogni stringa che comincia con il carattere
@@ -2540,7 +2526,7 @@ Il C però non consente di effettuare un salto ad una etichetta definita in
 un'altra funzione, per cui se l'errore avviene in una funzione, e la sua
 gestione ordinaria è in un'altra, occorre usare quello che viene chiamato un
 \textsl{salto non-locale}.  Il caso classico in cui si ha questa necessità,
-citato sia in \cite{APUE} che in \cite{glibc}, è quello di un programma nel
+citato sia in \cite{APUE} che in \cite{GlibcMan}, è quello di un programma nel
 cui corpo principale vengono letti dei dati in ingresso sui quali viene
 eseguita, tramite una serie di funzioni di analisi, una scansione dei
 contenuti, da cui si ottengono le indicazioni per l'esecuzione di opportune
@@ -2553,10 +2539,10 @@ caso si dovrebbe gestire, per ciascuna fase, tutta la casistica del passaggio
 all'indietro di tutti gli errori rilevabili dalle funzioni usate nelle fasi
 successive.  Questo comporterebbe una notevole complessità, mentre sarebbe
 molto più comodo poter tornare direttamente al ciclo di lettura principale,
-scartando l'input come errato.\footnote{a meno che, come precisa \cite{glibc},
-  alla chiusura di ciascuna fase non siano associate operazioni di pulizia
-  specifiche (come deallocazioni, chiusure di file, ecc.), che non potrebbero
-  essere eseguite con un salto non-locale.}
+scartando l'input come errato.\footnote{a meno che, come precisa
+  \cite{GlibcMan}, alla chiusura di ciascuna fase non siano associate
+  operazioni di pulizia specifiche (come deallocazioni, chiusure di file,
+  ecc.), che non potrebbero essere eseguite con un salto non-locale.}
 
 Tutto ciò può essere realizzato proprio con un salto non-locale; questo di
 norma viene realizzato salvando il contesto dello \itindex{stack}