X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=process.tex;h=3069d292982dddf97840eb29484c09a5d403ca41;hp=dd898a8c338ee0fe60edec06a334af6865d9ff0e;hb=0345bbfd866e46d3c76d0df7f37a83f9a3924926;hpb=387047dacdae5dbaed66ec9b493cad869372f83d diff --git a/process.tex b/process.tex index dd898a8..3069d29 100644 --- a/process.tex +++ b/process.tex @@ -1,3 +1,13 @@ +%% process.tex +%% +%% Copyright (C) 2000-2002 Simone Piccardi. Permission is granted to +%% copy, distribute and/or modify this document under the terms of the GNU Free +%% Documentation License, Version 1.1 or any later version published by the +%% Free Software Foundation; with the Invariant Sections being "Prefazione", +%% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the +%% license is included in the section entitled "GNU Free Documentation +%% License". +%% \chapter{L'interfaccia base con i processi} \label{cha:process_interface} @@ -105,8 +115,8 @@ valore dello stato di uscita incorrere nel caso in cui restituendo un codice di errore 256, si otterrebbe uno stato di uscita uguale a zero, che verrebbe interpretato come un successo. -In \file{stdlib.h} sono definite, seguendo lo standard POSIX, le due macro -\macro{EXIT\_SUCCESS} e \macro{EXIT\_FAILURE}, da usare sempre per specificare +In \file{stdlib.h} sono definite, seguendo lo standard POSIX, le due costanti +\const{EXIT\_SUCCESS} e \const{EXIT\_FAILURE}, da usare sempre per specificare lo stato di uscita di un processo. In Linux esse sono poste rispettivamente ai valori di tipo \ctyp{int} 0 e 1. @@ -146,7 +156,7 @@ non vengono salvati e le eventuali funzioni registrate con \func{atexit} e La funzione chiude tutti i file descriptor appartenenti al processo (si tenga presente che questo non comporta il salvataggio dei dati bufferizzati degli stream), fa sì che ogni figlio del processo sia ereditato da \cmd{init} (vedi -\secref{cha:process_handling}), manda un segnale \macro{SIGCHLD} al processo +\secref{cha:process_handling}), manda un segnale \const{SIGCHLD} al processo padre (vedi \secref{sec:sig_job_control}) ed infine ritorna lo stato di uscita specificato in \param{status} che può essere raccolto usando la funzione \func{wait} (vedi \secref{sec:proc_wait}). @@ -322,7 +332,7 @@ commette quando si chiamato un \textit{segmentation fault}. Se si tenta cioè di leggere o scrivere da un indirizzo per il quale non esiste un'associazione della pagina virtuale, il kernel risponde al relativo \textit{page fault}\index{page fault} -mandando un segnale \macro{SIGSEGV} al processo, che normalmente ne causa la +mandando un segnale \const{SIGSEGV} al processo, che normalmente ne causa la terminazione immediata. È pertanto importante capire come viene strutturata \textsl{la memoria @@ -365,7 +375,7 @@ seguenti segmenti: \end{lstlisting} questo vettore sarà immagazzinato in questo segmento. Anch'esso viene allocato all'avvio, e tutte le variabili vengono inizializzate a zero (ed i - puntatori a \macro{NULL}).\footnote{si ricordi che questo vale solo per le + puntatori a \val{NULL}).\footnote{si ricordi che questo vale solo per le variabili che vanno nel segmento dati, e non è affatto vero in generale.} Storicamente questo segmento viene chiamato BBS (da \textit{block started by @@ -456,21 +466,21 @@ prototipi sono i seguenti: Alloca \var{size} byte nello heap. La memoria viene inizializzata a 0. La funzione restituisce il puntatore alla zona di memoria allocata in caso - di successo e \macro{NULL} in caso di fallimento, nel qual caso - \var{errno} assumerà il valore \macro{ENOMEM}. + di successo e \val{NULL} in caso di fallimento, nel qual caso + \var{errno} assumerà il valore \errval{ENOMEM}. \funcdecl{void *malloc(size\_t size)} Alloca \var{size} byte nello heap. La memoria non viene inizializzata. La funzione restituisce il puntatore alla zona di memoria allocata in caso - di successo e \macro{NULL} in caso di fallimento, nel qual caso - \var{errno} assumerà il valore \macro{ENOMEM}. + di successo e \val{NULL} in caso di fallimento, nel qual caso + \var{errno} assumerà il valore \errval{ENOMEM}. \funcdecl{void *realloc(void *ptr, size\_t size)} Cambia la dimensione del blocco allocato all'indirizzo \var{ptr} portandola a \var{size}. La funzione restituisce il puntatore alla zona di memoria allocata in caso - di successo e \macro{NULL} in caso di fallimento, nel qual caso - \var{errno} assumerà il valore \macro{ENOMEM}. + di successo e \val{NULL} in caso di fallimento, nel qual caso + \var{errno} assumerà il valore \errval{ENOMEM}. \funcdecl{void free(void *ptr)} Disalloca lo spazio di memoria puntato da \var{ptr}. @@ -482,10 +492,15 @@ allineato correttamente per tutti i tipi di dati; ad esempio sulle macchine a multipli di 8 byte. In genere si usano le funzioni \func{malloc} e \func{calloc} per allocare -dinamicamente la memoria necessaria al programma, e siccome i puntatori -ritornati sono di tipo generico non è necessario effettuare un cast per -assegnarli a puntatori al tipo di variabile per la quale si effettua -l'allocazione. +dinamicamente la quantità di memoria necessaria al programma indicata da +\param{size},\footnote{queste funzioni presentano un comportamento diverso fra + le \acr{glibc} e le \acr{uClib} quando il valore di \param{size} è nullo. + Nel primo caso viene comunque restituito un puntatore valido, anche se non è + chiaro a cosa esso possa fare riferimento, nel secondo caso viene restituito + \val{NULL}. Il comportamento è analogo con \code{realloc(NULL, 0)}.} e +siccome i puntatori ritornati sono di tipo generico non è necessario +effettuare un cast per assegnarli a puntatori al tipo di variabile per la +quale si effettua l'allocazione. La memoria allocata dinamicamente deve essere esplicitamente rilasciata usando \func{free}\footnote{le glibc provvedono anche una funzione \func{cfree} @@ -498,7 +513,7 @@ in caso contrario il comportamento della funzione La funzione \func{realloc} si usa invece per cambiare (in genere aumentare) la dimensione di un'area di memoria precedentemente allocata, la funzione vuole in ingresso il puntatore restituito dalla precedente chiamata ad una -\func{malloc} (se è passato un valore \macro{NULL} allora la funzione si +\func{malloc} (se è passato un valore \val{NULL} allora la funzione si comporta come \func{malloc})\footnote{questo è vero per Linux e l'implementazione secondo lo standard ANSI C, ma non è vero per alcune vecchie implementazioni, inoltre alcune versioni delle librerie del C @@ -521,17 +536,17 @@ blocco di dati ridimensionato. Un errore abbastanza frequente (specie se si ha a che fare con array di puntatori) è quello di chiamare \func{free} più di una volta sullo stesso puntatore; per evitare questo problema una soluzione di ripiego è quella di -assegnare sempre a \macro{NULL} ogni puntatore liberato con \func{free}, dato +assegnare sempre a \val{NULL} ogni puntatore liberato con \func{free}, dato che, quando il parametro è un puntatore nullo, \func{free} non esegue nessuna operazione. Le \acr{glibc} hanno un'implementazione delle routine di allocazione che è controllabile dall'utente attraverso alcune variabili di ambiente, in particolare diventa possibile tracciare questo tipo di errori usando la -variabile \macro{MALLOC\_CHECK\_} che quando viene definita mette in uso una -versione meno efficiente delle funzioni suddette, che però è più tollerante -nei confronti di piccoli errori come quello di chiamate doppie a \func{free}. -In particolare: +variabile d'ambiente \val{MALLOC\_CHECK\_} che quando viene definita mette in +uso una versione meno efficiente delle funzioni suddette, che però è più +tollerante nei confronti di piccoli errori come quello di chiamate doppie a +\func{free}. In particolare: \begin{itemize} \item se la variabile è posta a zero gli errori vengono ignorati. \item se è posta ad 1 viene stampato un avviso sullo \textit{standard error} @@ -611,8 +626,8 @@ stack della funzione corrente. La sintassi La memoria non viene inizializzata. La funzione restituisce il puntatore alla zona di memoria allocata in caso - di successo e \macro{NULL} in caso di fallimento, nel qual caso - \var{errno} assumerà il valore \macro{ENOMEM}. + di successo e \val{NULL} in caso di fallimento, nel qual caso + \var{errno} assumerà il valore \errval{ENOMEM}. \end{prototype} \noindent ma in questo caso non è più necessario liberare la memoria (e quindi non esiste un analogo della \func{free}) in quanto essa viene rilasciata @@ -664,15 +679,15 @@ analoghe system call a cui fanno da interfaccia. I loro prototipi sono: \var{end\_data\_segment}. La funzione restituisce 0 in caso di successo e -1 in caso di - fallimento, nel qual caso \var{errno} assumerà il valore \macro{ENOMEM}. + fallimento, nel qual caso \var{errno} assumerà il valore \errval{ENOMEM}. \funcdecl{void *sbrk(ptrdiff\_t increment)} Incrementa lo spazio dati di un programma di \var{increment}. Un valore zero restituisce l'attuale posizione della fine del segmento dati. La funzione restituisce il puntatore all'inizio della nuova zona di memoria - allocata in caso di successo e \macro{NULL} in caso di fallimento, nel qual - caso \macro{errno} assumerà il valore \macro{ENOMEM}. + allocata in caso di successo e \val{NULL} in caso di fallimento, nel qual + caso \var{errno} assumerà il valore \errval{ENOMEM}. \end{functions} \noindent in genere si usa \func{sbrk} con un valore zero per ottenere l'attuale posizione della fine del segmento dati. @@ -739,23 +754,25 @@ sbloccarla due volte, una pagina o Il \textit{memory lock} persiste fintanto che il processo che detiene la memoria bloccata non la sblocca. Chiaramente la terminazione del processo comporta anche la fine dell'uso della sua memoria virtuale, e quindi anche di -tutti i suoi \textit{memory lock}. - -I \textit{memory lock} non sono ereditati dai processi figli.\footnote{ma - siccome Linux usa il \textit{copy on write}\index{copy on write} (vedi - \secref{sec:proc_fork}) gli indirizzi virtuali del figlio sono mantenuti - sullo stesso segmento di RAM del padre, quindi fintanto che un figlio non - scrive su un segmento, può usufruire del memory lock del padre.} Siccome la -presenza di un \textit{memory lock} riduce la memoria disponibile al sistema, -con un impatto su tutti gli altri processi, solo l'amministratore ha la -capacità di bloccare una pagina. Ogni processo può però sbloccare le pagine +tutti i suoi \textit{memory lock}. Infine \textit{memory lock} non sono +ereditati dai processi figli.\footnote{ma siccome Linux usa il \textit{copy on + write}\index{copy on write} (vedi \secref{sec:proc_fork}) gli indirizzi + virtuali del figlio sono mantenuti sullo stesso segmento di RAM del padre, + quindi fintanto che un figlio non scrive su un segmento, può usufruire del + memory lock del padre.} + +Siccome la richiesta di un \textit{memory lock} da parte di un processo riduce +la memoria fisica disponibile nel sistema, questo ha un evidente impatto su +tutti gli altri processi, per cui solo un processo con i privilegi di +amministratore (vedremo in \secref{sec:proc_perms} cosa significa) ha la +capacità di bloccare una pagina. Ogni processo può però sbloccare le pagine relative alla propria memoria. Il sistema pone dei limiti all'ammontare di memoria di un processo che può -essere bloccata e al totale di memoria fisica che può dedicare a questo, lo -standard POSIX.1 richiede che sia definita in \file{unistd.h} la costante +essere bloccata e al totale di memoria fisica che si può dedicare a questo, lo +standard POSIX.1 richiede che sia definita in \file{unistd.h} la macro \macro{\_POSIX\_MEMLOCK\_RANGE} per indicare la capacità di eseguire il -\textit{memory locking} e la costante \macro{PAGESIZE} in \file{limits.h} per +\textit{memory locking} e la costante \const{PAGESIZE} in \file{limits.h} per indicare la dimensione di una pagina in byte. Le funzioni per bloccare e sbloccare singole sezioni di memoria sono @@ -776,12 +793,12 @@ Le funzioni per bloccare e sbloccare singole sezioni di memoria sono caso di errore, nel qual caso \var{errno} assumerà uno dei valori seguenti: \begin{errlist} - \item[\macro{ENOMEM}] alcuni indirizzi dell'intervallo specificato non + \item[\errcode{ENOMEM}] alcuni indirizzi dell'intervallo specificato non corrispondono allo spazio di indirizzi del processo o si è ecceduto il numero massimo consentito di pagine bloccate. - \item[\macro{EINVAL}] \var{len} non è un valore positivo. + \item[\errcode{EINVAL}] \var{len} non è un valore positivo. \end{errlist} - e, per \func{mlock}, anche \macro{EPERM} quando il processo non ha i + e, per \func{mlock}, anche \errval{EPERM} quando il processo non ha i privilegi richiesti per l'operazione.} \end{functions} @@ -806,9 +823,9 @@ Il parametro \var{flags} di \func{mlockall} permette di controllarne il comportamento; esso può essere specificato come l'OR aritmetico delle due costanti: \begin{basedescript}{\desclabelwidth{2.5cm}} -\item[\macro{MCL\_CURRENT}] blocca tutte le pagine correntemente mappate nello +\item[\const{MCL\_CURRENT}] blocca tutte le pagine correntemente mappate nello spazio di indirizzi del processo. -\item[\macro{MCL\_FUTURE}] blocca tutte le pagine che saranno mappate nello +\item[\const{MCL\_FUTURE}] blocca tutte le pagine che saranno mappate nello spazio di indirizzi del processo. \end{basedescript} @@ -994,7 +1011,7 @@ Normalmente \func{getopt} compie una permutazione degli elementi di \var{argv} cosicché alla fine della scansione gli elementi che non sono opzioni sono spostati in coda al vettore. Oltre a questa esistono altre due modalità di gestire gli elementi di \var{argv}; se \var{optstring} inizia con il carattere -\texttt{'+'} (o è impostata la variabile di ambiente \macro{POSIXLY\_CORRECT}) +\texttt{'+'} (o è impostata la variabile di ambiente \val{POSIXLY\_CORRECT}) la scansione viene fermata non appena si incontra un elemento che non è un'opzione. L'ultima modalità, usata quando un programma può gestire la mescolanza fra opzioni e argomenti, ma se li aspetta in un ordine definito, si @@ -1026,7 +1043,7 @@ nella chiamata alla funzione \func{exec} quando questo viene lanciato. Come per la lista dei parametri anche questa lista è un array di puntatori a caratteri, ciascuno dei quali punta ad una stringa, terminata da un -\macro{NULL}. A differenza di \var{argv[]} in questo caso non si ha una +\val{NULL}. A differenza di \var{argv[]} in questo caso non si ha una lunghezza dell'array data da un equivalente di \var{argc}, ma la lista è terminata da un puntatore nullo. @@ -1047,16 +1064,21 @@ pi \end{figure} Per convenzione le stringhe che definiscono l'ambiente sono tutte del tipo -\textsl{\texttt{nome=valore}}. Inoltre alcune variabili, come quelle elencate +\textsl{\texttt{nome=valore}}. Inoltre alcune variabili, come quelle elencate in \figref{fig:proc_envirno_list}, sono definite dal sistema per essere usate da diversi programmi e funzioni: per queste c'è l'ulteriore convenzione di -usare nomi espressi in caratteri maiuscoli. +usare nomi espressi in caratteri maiuscoli.\footnote{la convenzione vuole che + si usino dei nomi maiuscoli per le variabili di ambiente di uso generico, i + nomi minuscoli sono in genere riservati alle variabili interne degli script + di shell.} Il kernel non usa mai queste variabili, il loro uso e la loro interpretazione è riservata alle applicazioni e ad alcune funzioni di libreria; in genere esse costituiscono un modo comodo per definire un comportamento specifico senza dover ricorrere all'uso di opzioni a linea di comando o di file di -configurazione. +configurazione. É di norma cura della shell, quando esegue un comando, passare +queste variabili al programma messo in esecuzione attraverso un uso opportuno +delle relative chiamate (si veda \secref{sec:proc_exec}). La shell ad esempio ne usa molte per il suo funzionamento (come \var{PATH} per la ricerca dei comandi, o \cmd{IFS} per la scansione degli argomenti), e @@ -1081,35 +1103,38 @@ controllare \cmd{man environ}. & \textbf{Linux} & \textbf{Descrizione} \\ \hline \hline - \macro{USER} & $\bullet$ & $\bullet$ & $\bullet$ & Nome utente\\ - \macro{LOGNAME} & $\bullet$ & $\bullet$ & $\bullet$ & Nome di login\\ - \macro{HOME} & $\bullet$ & $\bullet$ & $\bullet$ & + \val{USER} & $\bullet$ & $\bullet$ & $\bullet$ & Nome utente\\ + \val{LOGNAME} & $\bullet$ & $\bullet$ & $\bullet$ & Nome di login\\ + \val{HOME} & $\bullet$ & $\bullet$ & $\bullet$ & Directory base dell'utente\\ - \macro{LANG} & $\bullet$ & $\bullet$ & $\bullet$ & Localizzazione\\ - \macro{PATH} & $\bullet$ & $\bullet$ & $\bullet$ & Elenco delle directory - dei programmi\\ - \macro{PWD} & $\bullet$ & $\bullet$ & $\bullet$ & Directory corrente\\ - \macro{SHELL} & $\bullet$ & $\bullet$ & $\bullet$ & Shell in uso\\ - \macro{TERM} & $\bullet$ & $\bullet$ & $\bullet$ & Tipo di terminale\\ - \macro{PAGER} & $\bullet$ & $\bullet$ & $\bullet$ & Programma per vedere i - testi\\ - \macro{EDITOR} & $\bullet$ & $\bullet$ & $\bullet$ & Editor preferito\\ - \macro{BROWSER} & $\bullet$ & $\bullet$ & $\bullet$ & Browser preferito\\ + \val{LANG} & $\bullet$ & $\bullet$ & $\bullet$ & Localizzazione\\ + \val{PATH} & $\bullet$ & $\bullet$ & $\bullet$ & Elenco delle directory + dei programmi\\ + \val{PWD} & $\bullet$ & $\bullet$ & $\bullet$ & Directory corrente\\ + \val{SHELL} & $\bullet$ & $\bullet$ & $\bullet$ & Shell in uso\\ + \val{TERM} & $\bullet$ & $\bullet$ & $\bullet$ & Tipo di terminale\\ + \val{PAGER} & $\bullet$ & $\bullet$ & $\bullet$ & Programma per vedere i + testi\\ + \val{EDITOR} & $\bullet$ & $\bullet$ & $\bullet$ & Editor preferito\\ + \val{BROWSER} & $\bullet$ & $\bullet$ & $\bullet$ & Browser preferito\\ + \val{TMPDIR} & $\bullet$ & $\bullet$ & $\bullet$ & Directory dei file + temporanei\\ \hline \end{tabular} - \caption{Variabili di ambiente più comuni definite da vari standard.} + \caption{Esempi di variabili di ambiente più comuni definite da vari + standard.} \label{tab:proc_env_var} \end{table} -Lo standard ANSI C prevede l'esistenza di un ambiente, pur non entrando nelle -specifiche di come sono strutturati i contenuti, e definisce la funzione -\func{getenv} che permette di ottenere i valori delle variabili di ambiente, -il cui prototipo è: +Lo standard ANSI C prevede l'esistenza di un ambiente, e pur non entrando +nelle specifiche di come sono strutturati i contenuti, definisce la funzione +\func{getenv} che permette di ottenere i valori delle variabili di ambiente; +il suo prototipo è: \begin{prototype}{stdlib.h}{char *getenv(const char *name)} Esamina l'ambiente del processo cercando una stringa che corrisponda a quella specificata da \param{name}. - \bodydesc{La funzione ritorna \macro{NULL} se non trova nulla, o il + \bodydesc{La funzione ritorna \val{NULL} se non trova nulla, o il puntatore alla stringa che corrisponde (di solito nella forma \cmd{NOME=valore}).} \end{prototype} @@ -1145,10 +1170,11 @@ in \tabref{tab:proc_env_func}. \label{tab:proc_env_func} \end{table} -In Linux solo le prime quattro funzioni di \tabref{tab:proc_env_func} sono -definite, \func{getenv} l'abbiamo già esaminata; delle tre restanti le prime -due, \func{putenv} e \func{setenv}, servono per assegnare nuove variabili di -ambiente, i loro prototipi sono i seguenti: +In Linux sono definite solo le prime quattro delle funzioni elencate in +\tabref{tab:proc_env_func}. La prima, \func{getenv}, l'abbiamo appena +esaminata; delle tre restanti le prime due, \func{putenv} e \func{setenv}, +servono per assegnare nuove variabili di ambiente, i loro prototipi sono i +seguenti: \begin{functions} \headdecl{stdlib.h} @@ -1159,7 +1185,7 @@ ambiente, i loro prototipi sono i seguenti: all'ambiente. \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e -1 per un - errore, che è sempre \macro{ENOMEM}.} + errore, che è sempre \errval{ENOMEM}.} \end{functions} \noindent la terza, \func{unsetenv}, serve a cancellare una variabile di ambiente; il suo prototipo è: @@ -1318,7 +1344,7 @@ stati scritti. Per fare questo in \file{stdarg.h} sono definite delle apposite macro; la procedura da seguire è la seguente: \begin{enumerate*} \item Inizializzare un puntatore alla lista degli argomenti di tipo - \type{va\_list} attraverso la macro \macro{va\_start}. + \macro{va\_list} attraverso la macro \macro{va\_start}. \item Accedere ai vari argomenti opzionali con chiamate successive alla macro \macro{va\_arg}, la prima chiamata restituirà il primo argomento, la seconda il secondo e così via. @@ -1415,7 +1441,7 @@ per \func{printf}). Una modalità diversa, che può essere applicata solo quando il tipo dei parametri lo rende possibile, è quella che prevede di usare un valore speciale come ultimo argomento (come fa ad esempio \func{execl} che usa un puntatore -\macro{NULL} per indicare la fine della lista degli argomenti). +\val{NULL} per indicare la fine della lista degli argomenti). \subsection{Potenziali problemi con le variabili automatiche} @@ -1543,8 +1569,16 @@ Uno dei punti critici dei salti non-locali variabili, ed in particolare quello delle variabili automatiche della funzione a cui si ritorna. In generale le variabili globali e statiche mantengono i valori che avevano al momento della chiamata di \func{longjmp}, ma quelli -delle variabili automatiche (o di quelle dichiarate \code{register}) sono in -genere indeterminati. +delle variabili automatiche (o di quelle dichiarate +\direct{register}\footnote{la direttiva \direct{register} del compilatore + chiede che la variabile dichiarata tale sia mantenuta, nei limiti del + possibile, all'interno di un registro del processore. Questa direttiva + origina dai primi compilatori, quando stava al programmatore scrivere codice + ottimizzato, riservando esplicitamente alle variabili più usate l'uso dei + registri del processore. Oggi questa direttiva oggi è in disuso dato che + tutti i compilatori sono normalmente in grado di valutare con maggior + efficacia degli stessi programmatori quando sia il caso di eseguire questa + ottimizzazione.}) sono in genere indeterminati. Quello che succede infatti è che i valori delle variabili che sono tenute in memoria manterranno il valore avuto al momento della chiamata di @@ -1553,7 +1587,13 @@ chiamata ad un'altra funzioni vengono salvati nel contesto nello stack) torneranno al valore avuto al momento della chiamata di \func{setjmp}; per questo quando si vuole avere un comportamento coerente si può bloccare l'ottimizzazione che porta le variabili nei registri dichiarandole tutte come -\code{volatile}. +\direct{volatile}\footnote{la direttiva \ctyp{volatile} informa il compilatore + che la variabile che è dichiarata può essere modificata, durante + l'esecuzione del nostro, da altri programmi. Per questo motivo occorre dire + al compilatore che non deve essere mai utilizzata l'ottimizzazione per cui + quanto opportuno essa viene mantenuta in un registro, poiché in questo modo + si perderebbero le eventuali modifiche fatte dagli altri programmi (che + avvengono solo in una copia posta in memoria).}.