X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=process.tex;h=9d1916f6eecce3af2871bbfbe1d842b7f578f42c;hp=5e30c7aa2b0a72c6dd88c07025e65f4b9c3811b7;hb=2ee09e1100e6d070dbf5d4d13d900dba516d83de;hpb=dcf2c2df897955ff3503a7c426025457ab456fd7 diff --git a/process.tex b/process.tex index 5e30c7a..9d1916f 100644 --- a/process.tex +++ b/process.tex @@ -1,6 +1,6 @@ %% process.tex %% -%% Copyright (C) 2000-2012 Simone Piccardi. Permission is granted to +%% Copyright (C) 2000-2014 Simone Piccardi. Permission is granted to %% copy, distribute and/or modify this document under the terms of the GNU Free %% Documentation License, Version 1.1 or any later version published by the %% Free Software Foundation; with the Invariant Sections being "Un preambolo", @@ -448,10 +448,10 @@ registrate con \func{atexit} e \func{on\_exit} non vengono eseguite. La funzione chiude tutti i file descriptor appartenenti al processo, cosa che però non comporta il salvataggio dei dati eventualmente presenti nei buffer degli \textit{stream}, (torneremo sulle due interfacce dei file in -cap.~\ref{cha:files_std_interface} e -cap.~\ref{cha:file_unix_interface})). Infine fa sì che ogni figlio del -processo sia adottato da \cmd{init} (vedi sez.~\ref{sec:proc_termination}), -manda un segnale \signal{SIGCHLD} al processo padre (vedi +sez.~\ref{sec:file_unix_interface} e +sez.~\ref{sec:files_std_interface}). Infine fa sì che ogni figlio del processo +sia adottato da \cmd{init} (vedi sez.~\ref{sec:proc_termination}), manda un +segnale \signal{SIGCHLD} al processo padre (vedi sez.~\ref{sec:sig_job_control}) e ritorna lo stato di uscita specificato in \param{status} che può essere raccolto usando la funzione \func{wait} (vedi sez.~\ref{sec:proc_wait}). @@ -482,14 +482,18 @@ registrare un certo numero di funzioni che verranno eseguite all'uscita dal programma,\footnote{nel caso di \func{atexit} lo standard POSIX.1-2001 richiede che siano registrabili almeno \const{ATEXIT\_MAX} funzioni (il valore può essere ottenuto con \func{sysconf}, vedi - sez.~\ref{sec:sys_sysconf}).} sia per la chiamata ad \func{exit} che per il + sez.~\ref{sec:sys_limits}).} sia per la chiamata ad \func{exit} che per il ritorno di \code{main}. La prima funzione che si può utilizzare a tal fine è \funcd{atexit}, il cui prototipo è: -\begin{funcproto}{ \fhead{stdlib.h} \fdecl{void (*function)(void)} - \fdesc{Registra la funzione \param{function} per la chiamata all'uscita - dal programma.} } {La funzione ritorna $0$ in caso di successo e - $-1$ per un errore, \var{errno} non viene modificata.} +\begin{funcproto}{ +\fhead{stdlib.h} +\fdecl{int atexit(void (*function)(void))} +\fdesc{Registra la funzione \param{function} per la chiamata all'uscita + dal programma.} +} +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, \var{errno} + non viene modificata.} \end{funcproto} La funzione richiede come argomento \param{function} l'indirizzo di una @@ -504,7 +508,7 @@ definita su altri sistemi,\footnote{non essendo prevista dallo standard POSIX \begin{funcproto}{ \fhead{stdlib.h} -\fdecl{void (*function)(int , void *), void *arg)} +\fdecl{int on\_exit(void (*function)(int, void *), void *arg))} \fdesc{Registra la funzione \param{function} per la chiamata all'uscita dal programma.} } @@ -652,13 +656,13 @@ necessariamente adiacenti. Per la gestione da parte del kernel la memoria viene divisa in pagine di dimensione fissa. Inizialmente queste pagine erano di 4kb sulle macchine a 32 bit e di 8kb sulle alpha. Con le versioni più recenti del kernel è possibile -anche utilizzare pagine di dimensioni maggiori (di 4Mb, dette \textit{huge - page}), per sistemi con grandi quantitativi di memoria in cui l'uso di -pagine troppo piccole comporta una perdita di prestazioni. In alcuni sistemi -la costante \const{PAGE\_SIZE}, definita in \headfile{limits.h}, indica la -dimensione di una pagina in byte, con Linux questo non avviene e per ottenere -questa dimensione si deve ricorrere alla funzione \func{getpagesize} (vedi -sez.~\ref{sec:sys_memory_res}). +anche utilizzare pagine di dimensioni maggiori (di 4Mb, dette +\itindex{huge~page} \textit{huge page}), per sistemi con grandi quantitativi +di memoria in cui l'uso di pagine troppo piccole comporta una perdita di +prestazioni. In alcuni sistemi la costante \const{PAGE\_SIZE}, definita in +\headfile{limits.h}, indica la dimensione di una pagina in byte, con Linux +questo non avviene e per ottenere questa dimensione si deve ricorrere alla +funzione \func{getpagesize} (vedi sez.~\ref{sec:sys_memory_res}). Ciascuna pagina di memoria nello spazio di indirizzi virtuale è associata ad un supporto che può essere una pagina di memoria reale o ad un dispositivo di @@ -733,7 +737,7 @@ accedere. Solitamente un programma C viene suddiviso nei seguenti segmenti: Contiene il codice del programma, delle funzioni di librerie da esso utilizzate, e le costanti. Normalmente viene condiviso fra tutti i processi che eseguono lo stesso programma e nel caso delle librerie anche da processi - che eseguono altri programmi. + che eseguono altri programmi. Quando l'architettura hardware lo supporta viene marcato in sola lettura per evitare sovrascritture accidentali (o maliziose) che ne modifichino le @@ -1014,7 +1018,7 @@ come quello dei \itindex{double~free} \textit{double~free} o i \begin{itemize*} \item se la variabile è posta a $0$ gli errori vengono ignorati; \item se la variabile è posta a $1$ viene stampato un avviso sullo - \textit{standard error} (vedi sez.~\ref{sec:file_std_stream}); + \textit{standard error} (vedi sez.~\ref{sec:file_fd}); \item se la variabile è posta a $2$ viene chiamata la funzione \func{abort} (vedi sez.~\ref{sec:sig_alarm_abort}), che in genere causa l'immediata terminazione del programma; @@ -1141,6 +1145,9 @@ dando luogo ad una \itindex{segment~violation} \textit{segment violation} la prima volta che cercherà di accedere alla memoria non effettivamente disponibile. + +\index{segmento!dati|(} + Le due funzioni seguenti\footnote{le due funzioni sono state definite con BSD 4.3, sono marcate obsolete in SUSv2 e non fanno parte delle librerie standard del C e mentre sono state esplicitamente rimosse dallo standard @@ -1162,25 +1169,25 @@ prototipo è: \end{funcproto} La funzione è un'interfaccia all'omonima \textit{system call} ed imposta -l'indirizzo finale del \index{segmento!dati} segmento dati di un processo (più -precisamente dello \itindex{heap} \textit{heap}) all'indirizzo specificato +l'indirizzo finale del segmento dati di un processo (più precisamente dello +\itindex{heap} \textit{heap}) all'indirizzo specificato da \param{addr}. Quest'ultimo deve essere un valore ragionevole, e la dimensione totale non deve comunque eccedere un eventuale limite (vedi sez.~\ref{sec:sys_resource_limit}) imposto sulle dimensioni massime del -\index{segmento!dati} segmento dati del processo. +segmento dati del processo. Il valore di ritorno della funzione fa riferimento alla versione fornita dalla \acr{glibc}, in realtà in Linux la \textit{system call} corrispondente -restituisce come valore di ritorno il nuovo valore della fine del -\index{segmento!dati} segmento dati in caso di successo e quello corrente in -caso di fallimento, è la funzione di interfaccia usata dalla \acr{glibc} che -fornisce i valori di ritorno appena descritti; se si usano librerie diverse -questo potrebbe non accadere. +restituisce come valore di ritorno il nuovo valore della fine del segmento +dati in caso di successo e quello corrente in caso di fallimento, è la +funzione di interfaccia usata dalla \acr{glibc} che fornisce i valori di +ritorno appena descritti; se si usano librerie diverse questo potrebbe non +accadere. -Una seconda funzione per la manipolazione diretta delle dimensioni -\index{segmento!dati} del segmento dati\footnote{in questo caso si tratta - soltanto di una funzione di libreria, anche se basata sulla stessa - \textit{system call}.} è \funcd{sbrk}, ed il suo prototipo è: +Una seconda funzione per la manipolazione diretta delle dimensioni del +segmento dati\footnote{in questo caso si tratta soltanto di una funzione di + libreria, anche se basata sulla stessa \textit{system call}.} è +\funcd{sbrk}, ed il suo prototipo è: \begin{funcproto}{ \fhead{unistd.h} @@ -1198,8 +1205,7 @@ nuovo indirizzo finale dello stesso. L'argomento è definito come di tipo \type{intptr\_t}, ma a seconda della versione delle librerie e del sistema può essere indicato con una serie di tipi equivalenti come \type{ptrdiff\_t}, \type{ssize\_t}, \ctyp{int}. Se invocata con un valore nullo la funzione -permette di ottenere l'attuale posizione della fine del \index{segmento!dati} -segmento dati. +permette di ottenere l'attuale posizione della fine del segmento dati. Queste due funzioni sono state deliberatamente escluse dallo standard POSIX.1 dato che per i normali programmi è sempre opportuno usare le funzioni di @@ -1207,6 +1213,8 @@ allocazione standard descritte in precedenza, a meno di non voler realizzare per proprio conto un diverso meccanismo di gestione della memoria del segmento dati. +\index{segmento!dati|)} + \subsection{Il controllo della memoria virtuale} \label{sec:proc_mem_lock} @@ -1250,11 +1258,11 @@ motivi per cui si possono avere di queste necessità sono due: \end{itemize*} Per ottenere informazioni sulle modalità in cui un programma sta usando la -memoria virtuale è disponibile una apposita funzione, \funcd{mincore}, che -però non è standardizzata da POSIX e pertanto non è disponibile su tutte le -versioni di kernel unix-like;\footnote{nel caso di Linux devono essere - comunque definite le macro \macro{\_BSD\_SOURCE} e \macro{\_SVID\_SOURCE}.} -il suo prototipo è: +memoria virtuale è disponibile una apposita funzione di sistema, +\funcd{mincore}, che però non è standardizzata da POSIX e pertanto non è +disponibile su tutte le versioni di kernel unix-like;\footnote{nel caso di + Linux devono essere comunque definite le macro \macro{\_BSD\_SOURCE} e + \macro{\_SVID\_SOURCE}.} il suo prototipo è: \begin{funcproto}{ \fhead{unistd.h} @@ -1358,32 +1366,9 @@ poi ogni processo può sbloccare le pagine relative alla propria memoria, se però diversi processi bloccano la stessa pagina questa resterà bloccata fintanto che ci sarà almeno un processo che la blocca. -Le funzioni per bloccare e sbloccare la \index{paginazione} paginazione di -singole sezioni di memoria sono rispettivamente \funcd{mlock} e +Le funzioni di sistema per bloccare e sbloccare la \index{paginazione} +paginazione di singole sezioni di memoria sono rispettivamente \funcd{mlock} e \funcd{munlock}; i loro prototipi sono: -% \begin{functions} -% \headdecl{sys/mman.h} - -% \funcdecl{int mlock(const void *addr, size\_t len)} -% Blocca la paginazione su un intervallo di memoria. - -% \funcdecl{int munlock(const void *addr, size\_t len)} -% Rimuove il blocco della paginazione su un intervallo di memoria. - -% \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e $-1$ in -% caso di errore, nel qual caso \var{errno} assumerà uno dei -% valori: -% \begin{errlist} -% \item[\errcode{ENOMEM}] alcuni indirizzi dell'intervallo specificato non -% corrispondono allo spazio di indirizzi del processo o si è ecceduto -% il numero massimo consentito di pagine bloccate. -% \item[\errcode{EINVAL}] \param{len} non è un valore positivo. -% \item[\errcode{EPERM}] con un kernel successivo al 2.6.9 il processo non è -% privilegiato e si un limite nullo per \const{RLIMIT\_MEMLOCK}. -% \end{errlist} -% e, per \func{mlock}, anche \errval{EPERM} quando il processo non ha i -% privilegi richiesti per l'operazione.} -% \end{functions} \begin{funcproto}{ \fhead{sys/mman.h} @@ -1416,9 +1401,10 @@ la durata del blocco. Con kernel diversi da Linux si può ottenere un errore di pagine di memoria, pertanto se si ha a cuore la portabilità si deve avere cura di allinearne correttamente il valore. -Altre due funzioni, \funcd{mlockall} e \funcd{munlockall}, consentono di -bloccare genericamente la \index{paginazione} paginazione per l'intero spazio -di indirizzi di un processo. I prototipi di queste funzioni sono: +Altre due funzioni di sistema, \funcd{mlockall} e \funcd{munlockall}, +consentono di bloccare genericamente la \index{paginazione} paginazione per +l'intero spazio di indirizzi di un processo. I prototipi di queste funzioni +sono: \begin{funcproto}{ \fhead{sys/mman.h} @@ -1617,7 +1603,7 @@ errore ed agire di conseguenza. Nonostante la scarsa leggibilità del prototipo si tratta semplicemente di definire una funzione di tipo \code{void abortfn(enum mcheck\_status status)}, che non deve restituire nulla e che deve avere un unico argomento di tipo -\type{mcheck\_status}. In caso di errore la funzione verrà eseguita ricevendo +\code{mcheck\_status}. In caso di errore la funzione verrà eseguita ricevendo un opportuno valore di \param{status} che è un tipo enumerato che può assumere soltanto i valori di tab.~\ref{tab:mcheck_status_value} che indicano la tipologia di errore riscontrata. @@ -1630,20 +1616,20 @@ tipologia di errore riscontrata. \textbf{Valore} & \textbf{Significato} \\ \hline \hline - \const{MCHECK\_OK} & riportato a \func{mprobe} se nessuna + \const{MCHECK\_OK} & Riportato a \func{mprobe} se nessuna inconsistenza è presente.\\ - \const{MCHECK\_DISABLED}& riportato a \func{mprobe} se si è chiamata + \const{MCHECK\_DISABLED}& Riportato a \func{mprobe} se si è chiamata \func{mcheck} dopo aver già usato \func{malloc}.\\ - \const{MCHECK\_HEAD} & i dati immediatamente precedenti il buffer sono + \const{MCHECK\_HEAD} & I dati immediatamente precedenti il buffer sono stati modificati, avviene in genere quando si decrementa eccessivamente il valore di un puntatore scrivendo poi prima dell'inizio del buffer.\\ - \const{MCHECK\_TAIL} & i dati immediatamente seguenti il buffer sono + \const{MCHECK\_TAIL} & I dati immediatamente seguenti il buffer sono stati modificati, succede quando si va scrivere oltre la dimensione corretta del buffer.\\ - \const{MCHECK\_FREE} & il buffer è già stato disallocato.\\ + \const{MCHECK\_FREE} & Il buffer è già stato disallocato.\\ \hline \end{tabular} \caption{Valori dello stato dell'allocazione di memoria ottenibili dalla @@ -1845,8 +1831,9 @@ possibili si è poi provveduto ad un'azione opportuna, ad esempio per le tre opzioni che prevedono un parametro si è effettuata la decodifica del medesimo, il cui indirizzo è contenuto nella variabile \var{optarg}), avvalorando la relativa variabile (\texttt{\small 12-14}, \texttt{\small 15-17} e -\texttt{\small 18-20}). Completato il ciclo troveremo in \var{optind} l'indice -in \code{argv[]} del primo degli argomenti rimanenti nella linea di comando. +\texttt{\small 18-20}). Completato il ciclo troveremo in \var{optind} +l'indice in \code{argv[]} del primo degli argomenti rimanenti nella linea di +comando. Normalmente \func{getopt} compie una permutazione degli elementi di \param{argv} cosicché alla fine della scansione gli elementi che non sono @@ -1980,22 +1967,22 @@ queste ed ulteriori variabili si può ottenere con il comando \cmd{man 7 & \textbf{Linux} & \textbf{Descrizione} \\ \hline \hline - \texttt{USER} &$\bullet$&$\bullet$&$\bullet$& Nome utente\\ - \texttt{LOGNAME}&$\bullet$&$\bullet$&$\bullet$& Nome di login\\ + \texttt{USER} &$\bullet$&$\bullet$&$\bullet$& Nome utente.\\ + \texttt{LOGNAME}&$\bullet$&$\bullet$&$\bullet$& Nome di login.\\ \texttt{HOME} &$\bullet$&$\bullet$&$\bullet$& Directory base - dell'utente\\ - \texttt{LANG} &$\bullet$&$\bullet$&$\bullet$& Localizzazione\\ + dell'utente.\\ + \texttt{LANG} &$\bullet$&$\bullet$&$\bullet$& Localizzazione.\\ \texttt{PATH} &$\bullet$&$\bullet$&$\bullet$& Elenco delle directory - dei programmi\\ - \texttt{PWD} &$\bullet$&$\bullet$&$\bullet$& Directory corrente\\ - \texttt{SHELL} &$\bullet$&$\bullet$&$\bullet$& Shell in uso\\ - \texttt{TERM} &$\bullet$&$\bullet$&$\bullet$& Tipo di terminale\\ + dei programmi.\\ + \texttt{PWD} &$\bullet$&$\bullet$&$\bullet$& Directory corrente.\\ + \texttt{SHELL} &$\bullet$&$\bullet$&$\bullet$& Shell in uso.\\ + \texttt{TERM} &$\bullet$&$\bullet$&$\bullet$& Tipo di terminale.\\ \texttt{PAGER} &$\bullet$&$\bullet$&$\bullet$& Programma per vedere i - testi\\ - \texttt{EDITOR} &$\bullet$&$\bullet$&$\bullet$& Editor preferito\\ - \texttt{BROWSER}&$\bullet$&$\bullet$&$\bullet$& Browser preferito\\ + testi.\\ + \texttt{EDITOR} &$\bullet$&$\bullet$&$\bullet$& Editor preferito.\\ + \texttt{BROWSER}&$\bullet$&$\bullet$&$\bullet$& Browser preferito.\\ \texttt{TMPDIR} &$\bullet$&$\bullet$&$\bullet$& Directory dei file - temporanei\\ + temporanei.\\ \hline \end{tabular} \caption{Esempi delle variabili di ambiente più comuni definite da vari @@ -2219,6 +2206,10 @@ versione ``\textsl{sicura}'' da zero. % TODO opzioni in formato esteso +% TODO trattare il vettore ausiliario e getauxval (vedi +% http://lwn.net/Articles/519085/) + + \section{Problematiche di programmazione generica} \label{sec:proc_gen_prog} @@ -2540,7 +2531,7 @@ Il C però non consente di effettuare un salto ad una etichetta definita in un'altra funzione, per cui se l'errore avviene in una funzione, e la sua gestione ordinaria è in un'altra, occorre usare quello che viene chiamato un \textsl{salto non-locale}. Il caso classico in cui si ha questa necessità, -citato sia in \cite{APUE} che in \cite{glibc}, è quello di un programma nel +citato sia in \cite{APUE} che in \cite{GlibcMan}, è quello di un programma nel cui corpo principale vengono letti dei dati in ingresso sui quali viene eseguita, tramite una serie di funzioni di analisi, una scansione dei contenuti, da cui si ottengono le indicazioni per l'esecuzione di opportune @@ -2553,10 +2544,10 @@ caso si dovrebbe gestire, per ciascuna fase, tutta la casistica del passaggio all'indietro di tutti gli errori rilevabili dalle funzioni usate nelle fasi successive. Questo comporterebbe una notevole complessità, mentre sarebbe molto più comodo poter tornare direttamente al ciclo di lettura principale, -scartando l'input come errato.\footnote{a meno che, come precisa \cite{glibc}, - alla chiusura di ciascuna fase non siano associate operazioni di pulizia - specifiche (come deallocazioni, chiusure di file, ecc.), che non potrebbero - essere eseguite con un salto non-locale.} +scartando l'input come errato.\footnote{a meno che, come precisa + \cite{GlibcMan}, alla chiusura di ciascuna fase non siano associate + operazioni di pulizia specifiche (come deallocazioni, chiusure di file, + ecc.), che non potrebbero essere eseguite con un salto non-locale.} Tutto ciò può essere realizzato proprio con un salto non-locale; questo di norma viene realizzato salvando il contesto dello \itindex{stack} @@ -2708,30 +2699,26 @@ una variabile per poi ristamparne il contenuto leggendolo un byte alla volta. Il codice di detto programma, \file{endtest.c}, è nei sorgenti allegati, allora se lo eseguiamo su un normale PC compatibile, che è \textit{little endian} otterremo qualcosa del tipo: -\begin{Command} -[piccardi@gont sources]$ ./endtest -\end{Command} -%$ -\begin{Terminal} +\begin{Console} +[piccardi@gont sources]$ \textbf{./endtest} Using value ABCDEF01 val[0]= 1 val[1]=EF val[2]=CD val[3]=AB -\end{Terminal} +\end{Console} +%$ mentre su un vecchio Macintosh con PowerPC, che è \textit{big endian} avremo qualcosa del tipo: -\begin{Command} -piccardi@anarres:~/gapil/sources$ ./endtest -\end{Command} -%$ -\begin{Terminal} +\begin{Console} +piccardi@anarres:~/gapil/sources$ \textbf{./endtest} Using value ABCDEF01 val[0]=AB val[1]=CD val[2]=EF val[3]= 1 -\end{Terminal} +\end{Console} +%$ L'attenzione alla \textit{endianness} nella programmazione è importante, perché se si fanno assunzioni relative alla propria architettura non è detto che @@ -2815,7 +2802,7 @@ basterà scegliere una volta per tutte quale usare e attenersi alla scelta. % LocalWords: capability MEMLOCK limits getpagesize RLIMIT munlock sys const % LocalWords: addr len EINVAL EPERM mlockall munlockall flags l'OR CURRENT IFS % LocalWords: argc argv parsing questofile txt getopt optstring switch optarg -% LocalWords: optind opterr optopt ForkTest POSIXLY CORRECT long options NdA +% LocalWords: optind opterr optopt POSIXLY CORRECT long options NdA % LocalWords: option parameter list environ PATH HOME XPG tab LOGNAME LANG PWD % LocalWords: TERM PAGER TMPDIR getenv name SVr setenv unsetenv putenv opz gcc % LocalWords: clearenv libc value overwrite string reference result argument