prochand.tex

   1 %% prochand.tex
   2 %%
   3 %% Copyright (C) 2000-2008 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{La gestione dei processi}
  13 \label{cha:process_handling}
  14
  15 Come accennato nell'introduzione in un sistema Unix tutte le operazioni
  16 vengono svolte tramite opportuni processi.  In sostanza questi ultimi vengono
  17 a costituire l'unità base per l'allocazione e l'uso delle risorse del sistema.
  18
  19 Nel precedente capitolo abbiamo esaminato il funzionamento di un processo come
  20 unità a se stante, in questo esamineremo il funzionamento dei processi
  21 all'interno del sistema. Saranno cioè affrontati i dettagli della creazione e
  22 della terminazione dei processi, della gestione dei loro attributi e
  23 privilegi, e di tutte le funzioni a questo connesse. Infine nella sezione
  24 finale introdurremo alcune problematiche generiche della programmazione in
  25 ambiente multitasking.
  26
  27
  28 \section{Introduzione}
  29 \label{sec:proc_gen}
  30
  31 Inizieremo con un'introduzione generale ai concetti che stanno alla base della
  32 gestione dei processi in un sistema unix-like. Introdurremo in questa sezione
  33 l'architettura della gestione dei processi e le sue principali
  34 caratteristiche, dando una panoramica sull'uso delle principali funzioni di
  35 gestione.
  36
  37
  38 \subsection{L'architettura della gestione dei processi}
  39 \label{sec:proc_hierarchy}
  40
  41 A differenza di quanto avviene in altri sistemi (ad esempio nel VMS la
  42 generazione di nuovi processi è un'operazione privilegiata) una delle
  43 caratteristiche di Unix (che esamineremo in dettaglio più avanti) è che
  44 qualunque processo può a sua volta generarne altri, detti processi figli
  45 (\textit{child process}). Ogni processo è identificato presso il sistema da un
  46 numero univoco, il cosiddetto \textit{process identifier} o, più brevemente,
  47 \acr{pid}, assegnato in forma progressiva (vedi sez.~\ref{sec:proc_pid})
  48 quando il processo viene creato.
  49
  50 Una seconda caratteristica di un sistema Unix è che la generazione di un
  51 processo è un'operazione separata rispetto al lancio di un programma. In
  52 genere la sequenza è sempre quella di creare un nuovo processo, il quale
  53 eseguirà, in un passo successivo, il programma desiderato: questo è ad esempio
  54 quello che fa la shell quando mette in esecuzione il programma che gli
  55 indichiamo nella linea di comando.
  56
  57 Una terza caratteristica è che ogni processo è sempre stato generato da un
  58 altro, che viene chiamato processo padre (\textit{parent process}). Questo
  59 vale per tutti i processi, con una sola eccezione: dato che ci deve essere un
  60 punto di partenza esiste un processo speciale (che normalmente è
  61 \cmd{/sbin/init}), che viene lanciato dal kernel alla conclusione della fase
  62 di avvio; essendo questo il primo processo lanciato dal sistema ha sempre il
  63 \acr{pid} uguale a 1 e non è figlio di nessun altro processo.
  64
  65 Ovviamente \cmd{init} è un processo speciale che in genere si occupa di far
  66 partire tutti gli altri processi necessari al funzionamento del sistema,
  67 inoltre \cmd{init} è essenziale per svolgere una serie di compiti
  68 amministrativi nelle operazioni ordinarie del sistema (torneremo su alcuni di
  69 essi in sez.~\ref{sec:proc_termination}) e non può mai essere terminato. La
  70 struttura del sistema comunque consente di lanciare al posto di \cmd{init}
  71 qualunque altro programma, e in casi di emergenza (ad esempio se il file di
  72 \cmd{init} si fosse corrotto) è ad esempio possibile lanciare una shell al suo
  73 posto, passando la riga \cmd{init=/bin/sh} come parametro di avvio.
  74
  75 \begin{figure}[!htb]
  76   \footnotesize
  77 \begin{verbatim}
  78 [piccardi@gont piccardi]$ pstree -n
  79 init-+-keventd
  80      |-kapm-idled
  81      |-kreiserfsd
  82      |-portmap
  83      |-syslogd
  84      |-klogd
  85      |-named
  86      |-rpc.statd
  87      |-gpm
  88      |-inetd
  89      |-junkbuster
  90      |-master-+-qmgr
  91      |        `-pickup
  92      |-sshd
  93      |-xfs
  94      |-cron
  95      |-bash---startx---xinit-+-XFree86
  96      |                       `-WindowMaker-+-ssh-agent
  97      |                                     |-wmtime
  98      |                                     |-wmmon
  99      |                                     |-wmmount
 100      |                                     |-wmppp
 101      |                                     |-wmcube
 102      |                                     |-wmmixer
 103      |                                     |-wmgtemp
 104      |                                     |-wterm---bash---pstree
 105      |                                     `-wterm---bash-+-emacs
 106      |                                                    `-man---pager
 107      |-5*[getty]
 108      |-snort
 109      `-wwwoffled
 110 \end{verbatim} %$
 111   \caption{L'albero dei processi, così come riportato dal comando
 112     \cmd{pstree}.}
 113   \label{fig:proc_tree}
 114 \end{figure}
 115
 116 Dato che tutti i processi attivi nel sistema sono comunque generati da
 117 \cmd{init} o da uno dei suoi figli\footnote{in realtà questo non è del tutto
 118   vero, in Linux ci sono alcuni processi speciali che pur comparendo come
 119   figli di \cmd{init}, o con \acr{pid} successivi, sono in realtà generati
 120   direttamente dal kernel, (come \cmd{keventd}, \cmd{kswapd}, ecc.).} si
 121 possono classificare i processi con la relazione padre/figlio in
 122 un'organizzazione gerarchica ad albero, in maniera analoga a come i file sono
 123 organizzati in un albero di directory (si veda
 124 sez.~\ref{sec:file_organization}); in fig.~\ref{fig:proc_tree} si è mostrato il
 125 risultato del comando \cmd{pstree} che permette di visualizzare questa
 126 struttura, alla cui base c'è \cmd{init} che è progenitore di tutti gli altri
 127 processi.
 128
 129 Il kernel mantiene una tabella dei processi attivi, la cosiddetta
 130 \itindex{process~table} \textit{process table}; per ciascun processo viene
 131 mantenuta una voce, costituita da una struttura \struct{task\_struct}, nella
 132 tabella dei processi che contiene tutte le informazioni rilevanti per quel
 133 processo. Tutte le strutture usate a questo scopo sono dichiarate nell'header
 134 file \file{linux/sched.h}, ed uno schema semplificato, che riporta la
 135 struttura delle principali informazioni contenute nella \struct{task\_struct}
 136 (che in seguito incontreremo a più riprese), è mostrato in
 137 fig.~\ref{fig:proc_task_struct}.
 138
 139 \begin{figure}[htb]
 140   \centering
 141   \includegraphics[width=12cm]{img/task_struct}
 142   \caption{Schema semplificato dell'architettura delle strutture usate dal
 143     kernel nella gestione dei processi.}
 144   \label{fig:proc_task_struct}
 145 \end{figure}
 146
 147 Come accennato in sez.~\ref{sec:intro_unix_struct} è lo \itindex{scheduler}
 148 \textit{scheduler} che decide quale processo mettere in esecuzione; esso viene
 149 eseguito ad ogni system call ed ad ogni interrupt,\footnote{più in una serie
 150   di altre occasioni.}
 151 % TODO completare questa parte su quando viene chiamato lo scheduler.
 152 (ma può essere anche attivato esplicitamente). Il timer di sistema provvede
 153 comunque a che esso sia invocato periodicamente; generando un interrupt
 154 periodico secondo la frequenza specificata dalla costante
 155 \const{HZ},\footnote{fino al kernel 2.4 il valore usuale di questa costante
 156   era 100, per tutte le architetture eccetto l'alpha, per la quale era 1000,
 157   nel 2.6 è stato portato a 1000 su tutte le architetture; occorre fare
 158   attenzione a non confondere questo valore con quello dei
 159   \itindex{clock~tick} \textit{clock tick} (vedi
 160   sez.~\ref{sec:sys_unix_time}).} definita in \file{asm/param.h}, ed il cui
 161 valore è espresso in Hertz.\footnote{a partire dal kernel 2.6.21 è stato
 162   introdotto (a cura di Ingo Molnar) un meccanismo completamente diverso,
 163   detto \textit{tickless}, in cui non c'è più una interruzione periodica con
 164   frequenza prefissata, ma ad ogni chiamata del time viene programmata
 165   l'interruzione successiva sulla base di una stima; in questo modo si evita
 166   di dover eseguire un migliaio di interruzioni al secondo anche su macchine
 167   che non stanno facendo nulla, con un forte risparmio nell'uso dell'energia
 168   da parte del processore che può essere messo in stato di sospensione anche
 169   per lunghi periodi di tempo.}
 170
 171
 172 Ogni volta che viene eseguito, lo \itindex{scheduler} \textit{scheduler}
 173 effettua il calcolo delle priorità dei vari processi attivi (torneremo su
 174 questo in sez.~\ref{sec:proc_priority}) e stabilisce quale di essi debba
 175 essere posto in esecuzione fino alla successiva invocazione.
 176
 177
 178 \subsection{Una panoramica sulle funzioni fondamentali}
 179 \label{sec:proc_handling_intro}
 180
 181 In un sistema unix-like i processi vengono sempre creati da altri processi
 182 tramite la funzione \func{fork}; il nuovo processo (che viene chiamato
 183 \textsl{figlio}) creato dalla \func{fork} è una copia identica del processo
 184 processo originale (detto \textsl{padre}), ma ha un nuovo \acr{pid} e viene
 185 eseguito in maniera indipendente (le differenze fra padre e figlio sono
 186 affrontate in dettaglio in sez.~\ref{sec:proc_fork}).
 187
 188 Se si vuole che il processo padre si fermi fino alla conclusione del processo
 189 figlio questo deve essere specificato subito dopo la \func{fork} chiamando la
 190 funzione \func{wait} o la funzione \func{waitpid} (si veda
 191 sez.~\ref{sec:proc_wait}); queste funzioni restituiscono anche un'informazione
 192 abbastanza limitata sulle cause della terminazione del processo figlio.
 193
 194 Quando un processo ha concluso il suo compito o ha incontrato un errore non
 195 risolvibile esso può essere terminato con la funzione \func{exit} (si veda
 196 quanto discusso in sez.~\ref{sec:proc_conclusion}). La vita del processo però
 197 termina completamente solo quando la notifica della sua conclusione viene
 198 ricevuta dal processo padre, a quel punto tutte le risorse allocate nel
 199 sistema ad esso associate vengono rilasciate.
 200
 201 Avere due processi che eseguono esattamente lo stesso codice non è molto
 202 utile, normalmente si genera un secondo processo per affidargli l'esecuzione
 203 di un compito specifico (ad esempio gestire una connessione dopo che questa è
 204 stata stabilita), o fargli eseguire (come fa la shell) un altro programma. Per
 205 quest'ultimo caso si usa la seconda funzione fondamentale per programmazione
 206 coi processi che è la \func{exec}.
 207
 208 Il programma che un processo sta eseguendo si chiama immagine del processo (o
 209 \textit{process image}), le funzioni della famiglia \func{exec} permettono di
 210 caricare un altro programma da disco sostituendo quest'ultimo all'immagine
 211 corrente; questo fa sì che l'immagine precedente venga completamente
 212 cancellata. Questo significa che quando il nuovo programma termina, anche il
 213 processo termina, e non si può tornare alla precedente immagine.
 214
 215 Per questo motivo la \func{fork} e la \func{exec} sono funzioni molto
 216 particolari con caratteristiche uniche rispetto a tutte le altre, infatti la
 217 prima ritorna due volte (nel processo padre e nel figlio) mentre la seconda
 218 non ritorna mai (in quanto con essa viene eseguito un altro programma).
 219
 220
 221 \section{Le funzioni di base}% della gestione dei processi}
 222 \label{sec:proc_handling}
 223
 224 In questa sezione tratteremo le problematiche della gestione dei processi
 225 all'interno del sistema, illustrandone tutti i dettagli.  Inizieremo con le
 226 funzioni elementari che permettono di leggerne gli identificatori, per poi
 227 passare alla spiegazione delle funzioni base che si usano per la creazione e
 228 la terminazione dei processi, e per la messa in esecuzione degli altri
 229 programmi.
 230
 231
 232 \subsection{Gli identificatori dei processi}
 233 \label{sec:proc_pid}
 234
 235 Come accennato nell'introduzione, ogni processo viene identificato dal sistema
 236 da un numero identificativo univoco, il \textit{process ID} o \acr{pid};
 237 quest'ultimo è un tipo di dato standard, il \type{pid\_t} che in genere è un
 238 intero con segno (nel caso di Linux e delle \acr{glibc} il tipo usato è
 239 \ctyp{int}).
 240
 241 Il \acr{pid} viene assegnato in forma progressiva\footnote{in genere viene
 242   assegnato il numero successivo a quello usato per l'ultimo processo creato,
 243   a meno che questo numero non sia già utilizzato per un altro \acr{pid},
 244   \acr{pgid} o \acr{sid} (vedi sez.~\ref{sec:sess_proc_group}).} ogni volta
 245 che un nuovo processo viene creato, fino ad un limite che, essendo il
 246 \acr{pid} un numero positivo memorizzato in un intero a 16 bit, arriva ad un
 247 massimo di 32768.  Oltre questo valore l'assegnazione riparte dal numero più
 248 basso disponibile a partire da un minimo di 300,\footnote{questi valori, fino
 249   al kernel 2.4.x, sono definiti dalla macro \const{PID\_MAX} in
 250   \file{threads.h} e direttamente in \file{fork.c}, con il kernel 2.5.x e la
 251   nuova interfaccia per i \itindex{thread} \textit{thread} creata da Ingo
 252   Molnar anche il meccanismo di allocazione dei \acr{pid} è stato modificato;
 253   il valore massimo è impostabile attraverso il file
 254   \procfile{/proc/sys/kernel/pid\_max} e di default vale 32768.} che serve a
 255 riservare i \acr{pid} più bassi ai processi eseguiti direttamente dal kernel.
 256 Per questo motivo, come visto in sez.~\ref{sec:proc_hierarchy}, il processo di
 257 avvio (\cmd{init}) ha sempre il \acr{pid} uguale a uno.
 258
 259 Tutti i processi inoltre memorizzano anche il \acr{pid} del genitore da cui
 260 sono stati creati, questo viene chiamato in genere \acr{ppid} (da
 261 \textit{parent process ID}).  Questi due identificativi possono essere
 262 ottenuti usando le due funzioni \funcd{getpid} e \funcd{getppid}, i cui
 263 prototipi sono:
 264 \begin{functions}
 265   \headdecl{sys/types.h}
 266   \headdecl{unistd.h}
 267   \funcdecl{pid\_t getpid(void)}
 268
 269   Restituisce il \acr{pid} del processo corrente.
 270
 271   \funcdecl{pid\_t getppid(void)}
 272
 273   Restituisce il \acr{pid} del padre del processo corrente.
 274
 275 \bodydesc{Entrambe le funzioni non riportano condizioni di errore.}
 276 \end{functions}
 277 \noindent esempi dell'uso di queste funzioni sono riportati in
 278 fig.~\ref{fig:proc_fork_code}, nel programma \file{ForkTest.c}.
 279
 280 Il fatto che il \acr{pid} sia un numero univoco per il sistema lo rende un
 281 candidato per generare ulteriori indicatori associati al processo di cui
 282 diventa possibile garantire l'unicità: ad esempio in alcune implementazioni la
 283 funzione \func{tempnam} (si veda sez.~\ref{sec:file_temp_file}) usa il
 284 \acr{pid} per generare un \itindex{pathname} \textit{pathname} univoco, che
 285 non potrà essere replicato da un altro processo che usi la stessa funzione.
 286
 287 Tutti i processi figli dello stesso processo padre sono detti
 288 \textit{sibling}, questa è una delle relazioni usate nel \textsl{controllo di
 289   sessione}, in cui si raggruppano i processi creati su uno stesso terminale,
 290 o relativi allo stesso login. Torneremo su questo argomento in dettaglio in
 291 cap.~\ref{cha:session}, dove esamineremo gli altri identificativi associati ad
 292 un processo e le varie relazioni fra processi utilizzate per definire una
 293 sessione.
 294
 295 Oltre al \acr{pid} e al \acr{ppid}, (e a quelli che vedremo in
 296 sez.~\ref{sec:sess_proc_group}, relativi al controllo di sessione), ad ogni
 297 processo vengono associati degli altri identificatori che vengono usati per il
 298 controllo di accesso.  Questi servono per determinare se un processo può
 299 eseguire o meno le operazioni richieste, a seconda dei privilegi e
 300 dell'identità di chi lo ha posto in esecuzione; l'argomento è complesso e sarà
 301 affrontato in dettaglio in sez.~\ref{sec:proc_perms}.
 302
 303
 304 \subsection{La funzione \func{fork} e le funzioni di creazione dei processi}
 305 \label{sec:proc_fork}
 306
 307 La funzione \funcd{fork} è la funzione fondamentale della gestione dei
 308 processi: come si è detto l'unico modo di creare un nuovo processo è
 309 attraverso l'uso di questa funzione, essa quindi riveste un ruolo centrale
 310 tutte le volte che si devono scrivere programmi che usano il multitasking.  Il
 311 prototipo della funzione è:
 312 \begin{functions}
 313   \headdecl{sys/types.h}
 314   \headdecl{unistd.h}
 315   \funcdecl{pid\_t fork(void)}
 316   Crea un nuovo processo.
 317
 318   \bodydesc{In caso di successo restituisce il \acr{pid} del figlio al padre e
 319     zero al figlio; ritorna -1 al padre (senza creare il figlio) in caso di
 320     errore; \var{errno} può assumere i valori:
 321   \begin{errlist}
 322   \item[\errcode{EAGAIN}] non ci sono risorse sufficienti per creare un altro
 323     processo (per allocare la tabella delle pagine e le strutture del task) o
 324     si è esaurito il numero di processi disponibili.
 325   \item[\errcode{ENOMEM}] non è stato possibile allocare la memoria per le
 326     strutture necessarie al kernel per creare il nuovo processo.
 327   \end{errlist}}
 328 \end{functions}
 329
 330 Dopo il successo dell'esecuzione di una \func{fork} sia il processo padre che
 331 il processo figlio continuano ad essere eseguiti normalmente a partire
 332 dall'istruzione successiva alla \func{fork}; il processo figlio è però una
 333 copia del padre, e riceve una copia dei \index{segmento!testo} segmenti di
 334 testo, \itindex{stack} \textit{stack} e \index{segmento!dati} dati (vedi
 335 sez.~\ref{sec:proc_mem_layout}), ed esegue esattamente lo stesso codice del
 336 padre. Si tenga presente però che la memoria è copiata, non condivisa,
 337 pertanto padre e figlio vedono variabili diverse.
 338
 339 Per quanto riguarda la gestione della memoria, in generale il
 340 \index{segmento!testo} segmento di testo, che è identico per i due processi, è
 341 condiviso e tenuto in read-only per il padre e per i figli. Per gli altri
 342 segmenti Linux utilizza la tecnica del \itindex{copy~on~write} \textit{copy on
 343   write}; questa tecnica comporta che una pagina di memoria viene
 344 effettivamente copiata per il nuovo processo solo quando ci viene effettuata
 345 sopra una scrittura (e si ha quindi una reale differenza fra padre e figlio).
 346 In questo modo si rende molto più efficiente il meccanismo della creazione di
 347 un nuovo processo, non essendo più necessaria la copia di tutto lo spazio
 348 degli indirizzi virtuali del padre, ma solo delle pagine di memoria che sono
 349 state modificate, e solo al momento della modifica stessa.
 350
 351 La differenza che si ha nei due processi è che nel processo padre il valore di
 352 ritorno della funzione \func{fork} è il \acr{pid} del processo figlio, mentre
 353 nel figlio è zero; in questo modo il programma può identificare se viene
 354 eseguito dal padre o dal figlio.  Si noti come la funzione \func{fork} ritorni
 355 \textbf{due} volte: una nel padre e una nel figlio.
 356
 357 La scelta di questi valori di ritorno non è casuale, un processo infatti può
 358 avere più figli, ed il valore di ritorno di \func{fork} è l'unico modo che gli
 359 permette di identificare quello appena creato; al contrario un figlio ha
 360 sempre un solo padre (il cui \acr{pid} può sempre essere ottenuto con
 361 \func{getppid}, vedi sez.~\ref{sec:proc_pid}) per cui si usa il valore nullo,
 362 che non è il \acr{pid} di nessun processo.
 363
 364 \begin{figure}[!htb]
 365   \footnotesize \centering
 366   \begin{minipage}[c]{15cm}
 367   \includecodesample{listati/ForkTest.c}
 368   \end{minipage}
 369   \normalsize
 370   \caption{Esempio di codice per la creazione di nuovi processi.}
 371   \label{fig:proc_fork_code}
 372 \end{figure}
 373
 374 Normalmente la chiamata a \func{fork} può fallire solo per due ragioni, o ci
 375 sono già troppi processi nel sistema (il che di solito è sintomo che
 376 qualcos'altro non sta andando per il verso giusto) o si è ecceduto il limite
 377 sul numero totale di processi permessi all'utente (vedi
 378 sez.~\ref{sec:sys_resource_limit}, ed in particolare
 379 tab.~\ref{tab:sys_rlimit_values}).
 380
 381 L'uso di \func{fork} avviene secondo due modalità principali; la prima è
 382 quella in cui all'interno di un programma si creano processi figli cui viene
 383 affidata l'esecuzione di una certa sezione di codice, mentre il processo padre
 384 ne esegue un'altra. È il caso tipico dei programmi server (il modello
 385 \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}) in cui il
 386 padre riceve ed accetta le richieste da parte dei programmi client, per
 387 ciascuna delle quali pone in esecuzione un figlio che è incaricato di fornire
 388 il servizio.
 389
 390 La seconda modalità è quella in cui il processo vuole eseguire un altro
 391 programma; questo è ad esempio il caso della shell. In questo caso il processo
 392 crea un figlio la cui unica operazione è quella di fare una \func{exec} (di
 393 cui parleremo in sez.~\ref{sec:proc_exec}) subito dopo la \func{fork}.
 394
 395 Alcuni sistemi operativi (il VMS ad esempio) combinano le operazioni di questa
 396 seconda modalità (una \func{fork} seguita da una \func{exec}) in un'unica
 397 operazione che viene chiamata \textit{spawn}. Nei sistemi unix-like è stato
 398 scelto di mantenere questa separazione, dato che, come per la prima modalità
 399 d'uso, esistono numerosi scenari in cui si può usare una \func{fork} senza
 400 aver bisogno di eseguire una \func{exec}. Inoltre, anche nel caso della
 401 seconda modalità d'uso, avere le due funzioni separate permette al figlio di
 402 cambiare gli attributi del processo (maschera dei segnali, redirezione
 403 dell'output, identificatori) prima della \func{exec}, rendendo così
 404 relativamente facile intervenire sulle le modalità di esecuzione del nuovo
 405 programma.
 406
 407 In fig.~\ref{fig:proc_fork_code} è riportato il corpo del codice del programma
 408 di esempio \cmd{forktest}, che permette di illustrare molte caratteristiche
 409 dell'uso della funzione \func{fork}. Il programma crea un numero di figli
 410 specificato da linea di comando, e prende anche alcune opzioni per indicare
 411 degli eventuali tempi di attesa in secondi (eseguiti tramite la funzione
 412 \func{sleep}) per il padre ed il figlio (con \cmd{forktest -h} si ottiene la
 413 descrizione delle opzioni); il codice completo, compresa la parte che gestisce
 414 le opzioni a riga di comando, è disponibile nel file \file{ForkTest.c},
 415 distribuito insieme agli altri sorgenti degli esempi su
 416 \href{http://gapil.truelite.it/gapil_source.tgz}
 417 {\textsf{http://gapil.truelite.it/gapil\_source.tgz}}.
 418
 419 Decifrato il numero di figli da creare, il ciclo principale del programma
 420 (\texttt{\small 24--40}) esegue in successione la creazione dei processi figli
 421 controllando il successo della chiamata a \func{fork} (\texttt{\small
 422   25--29}); ciascun figlio (\texttt{\small 31--34}) si limita a stampare il
 423 suo numero di successione, eventualmente attendere il numero di secondi
 424 specificato e scrivere un messaggio prima di uscire. Il processo padre invece
 425 (\texttt{\small 36--38}) stampa un messaggio di creazione, eventualmente
 426 attende il numero di secondi specificato, e procede nell'esecuzione del ciclo;
 427 alla conclusione del ciclo, prima di uscire, può essere specificato un altro
 428 periodo di attesa.
 429
 430 Se eseguiamo il comando\footnote{che è preceduto dall'istruzione \code{export
 431     LD\_LIBRARY\_PATH=./} per permettere l'uso delle librerie dinamiche.}
 432 senza specificare attese (come si può notare in (\texttt{\small 17--19}) i
 433 valori predefiniti specificano di non attendere), otterremo come output sul
 434 terminale:
 435 \begin{Verbatim}[fontsize=\footnotesize,xleftmargin=1cm,xrightmargin=1.5cm]
 436 [piccardi@selidor sources]$ export LD_LIBRARY_PATH=./; ./forktest 3
 437 Process 1963: forking 3 child
 438 Spawned 1 child, pid 1964
 439 Child 1 successfully executing
 440 Child 1, parent 1963, exiting
 441 Go to next child
 442 Spawned 2 child, pid 1965
 443 Child 2 successfully executing
 444 Child 2, parent 1963, exiting
 445 Go to next child
 446 Child 3 successfully executing
 447 Child 3, parent 1963, exiting
 448 Spawned 3 child, pid 1966
 449 Go to next child
 450 \end{Verbatim}
 451 %$
 452
 453 Esaminiamo questo risultato: una prima conclusione che si può trarre è che non
 454 si può dire quale processo fra il padre ed il figlio venga eseguito per primo
 455 dopo la chiamata a \func{fork}; dall'esempio si può notare infatti come nei
 456 primi due cicli sia stato eseguito per primo il padre (con la stampa del
 457 \acr{pid} del nuovo processo) per poi passare all'esecuzione del figlio
 458 (completata con i due avvisi di esecuzione ed uscita), e tornare
 459 all'esecuzione del padre (con la stampa del passaggio al ciclo successivo),
 460 mentre la terza volta è stato prima eseguito il figlio (fino alla conclusione)
 461 e poi il padre.
 462
 463 In generale l'ordine di esecuzione dipenderà, oltre che dall'algoritmo di
 464 \itindex{scheduler} scheduling usato dal kernel, dalla particolare situazione
 465 in cui si trova la macchina al momento della chiamata, risultando del tutto
 466 impredicibile.  Eseguendo più volte il programma di prova e producendo un
 467 numero diverso di figli, si sono ottenute situazioni completamente diverse,
 468 compreso il caso in cui il processo padre ha eseguito più di una \func{fork}
 469 prima che uno dei figli venisse messo in esecuzione.
 470
 471 Pertanto non si può fare nessuna assunzione sulla sequenza di esecuzione delle
 472 istruzioni del codice fra padre e figli, né sull'ordine in cui questi potranno
 473 essere messi in esecuzione. Se è necessaria una qualche forma di precedenza
 474 occorrerà provvedere ad espliciti meccanismi di sincronizzazione, pena il
 475 rischio di incorrere nelle cosiddette \itindex{race~condition} \textit{race
 476   condition} (vedi sez.~\ref{sec:proc_race_cond}).
 477
 478 In realtà a partire dal kernel 2.5.2-pre10 il nuovo \itindex{scheduler}
 479 \textit{scheduler} di Ingo Molnar esegue sempre per primo il
 480 figlio;\footnote{i risultati precedenti sono stati ottenuti usando un kernel
 481   della serie 2.4.}  questa è una ottimizzazione che serve a evitare che il
 482 padre, effettuando per primo una operazione di scrittura in memoria, attivi il
 483 meccanismo del \itindex{copy~on~write} \textit{copy on write}. Questa
 484 operazione infatti potrebbe risultare del tutto inutile qualora il figlio
 485 fosse stato creato solo per eseguire una \func{exec}, in tal caso infatti si
 486 invocherebbe un altro programma scartando completamente lo spazio degli
 487 indirizzi, rendendo superflua la copia della memoria modificata dal padre.
 488
 489 Eseguendo sempre per primo il figlio la \func{exec} verrebbe effettuata subito
 490 avendo così la certezza che il \itindex{copy~on~write} \textit{copy on write}
 491 viene utilizzato solo quando necessario. Quanto detto in precedenza vale
 492 allora soltanto per i kernel fino al 2.4; per mantenere la portabilità è però
 493 opportuno non fare affidamento su questo comportamento, che non si riscontra
 494 in altri Unix e nelle versioni del kernel precendenti a quella indicata.
 495
 496 Si noti inoltre che essendo i segmenti di memoria utilizzati dai singoli
 497 processi completamente separati, le modifiche delle variabili nei processi
 498 figli (come l'incremento di \var{i} in \texttt{\small 31}) sono visibili solo
 499 a loro (ogni processo vede solo la propria copia della memoria), e non hanno
 500 alcun effetto sul valore che le stesse variabili hanno nel processo padre (ed
 501 in eventuali altri processi figli che eseguano lo stesso codice).
 502
 503 Un secondo aspetto molto importante nella creazione dei processi figli è
 504 quello dell'interazione dei vari processi con i file; per illustrarlo meglio
 505 proviamo a redirigere su un file l'output del nostro programma di test, quello
 506 che otterremo è:
 507 \begin{Verbatim}[fontsize=\footnotesize,xleftmargin=1cm,xrightmargin=1.5cm]
 508 [piccardi@selidor sources]$ ./forktest 3 > output
 509 [piccardi@selidor sources]$ cat output
 510 Process 1967: forking 3 child
 511 Child 1 successfully executing
 512 Child 1, parent 1967, exiting
 513 Test for forking 3 child
 514 Spawned 1 child, pid 1968
 515 Go to next child
 516 Child 2 successfully executing
 517 Child 2, parent 1967, exiting
 518 Test for forking 3 child
 519 Spawned 1 child, pid 1968
 520 Go to next child
 521 Spawned 2 child, pid 1969
 522 Go to next child
 523 Child 3 successfully executing
 524 Child 3, parent 1967, exiting
 525 Test for forking 3 child
 526 Spawned 1 child, pid 1968
 527 Go to next child
 528 Spawned 2 child, pid 1969
 529 Go to next child
 530 Spawned 3 child, pid 1970
 531 Go to next child
 532 \end{Verbatim}
 533 che come si vede è completamente diverso da quanto ottenevamo sul terminale.
 534
 535 Il comportamento delle varie funzioni di interfaccia con i file è analizzato
 536 in gran dettaglio in cap.~\ref{cha:file_unix_interface} e in
 537 cap.~\ref{cha:files_std_interface}. Qui basta accennare che si sono usate le
 538 funzioni standard della libreria del C che prevedono l'output bufferizzato; e
 539 questa bufferizzazione (trattata in dettaglio in sez.~\ref{sec:file_buffering})
 540 varia a seconda che si tratti di un file su disco (in cui il buffer viene
 541 scaricato su disco solo quando necessario) o di un terminale (nel qual caso il
 542 buffer viene scaricato ad ogni carattere di a capo).
 543
 544 Nel primo esempio allora avevamo che ad ogni chiamata a \func{printf} il
 545 buffer veniva scaricato, e le singole righe erano stampate a video subito dopo
 546 l'esecuzione della \func{printf}. Ma con la redirezione su file la scrittura
 547 non avviene più alla fine di ogni riga e l'output resta nel buffer. Dato che
 548 ogni figlio riceve una copia della memoria del padre, esso riceverà anche
 549 quanto c'è nel buffer delle funzioni di I/O, comprese le linee scritte dal
 550 padre fino allora. Così quando il buffer viene scritto su disco all'uscita del
 551 figlio, troveremo nel file anche tutto quello che il processo padre aveva
 552 scritto prima della sua creazione. E alla fine del file (dato che in questo
 553 caso il padre esce per ultimo) troveremo anche l'output completo del padre.
 554
 555 L'esempio ci mostra un altro aspetto fondamentale dell'interazione con i file,
 556 valido anche per l'esempio precedente, ma meno evidente: il fatto cioè che non
 557 solo processi diversi possono scrivere in contemporanea sullo stesso file
 558 (l'argomento della condivisione dei file è trattato in dettaglio in
 559 sez.~\ref{sec:file_sharing}), ma anche che, a differenza di quanto avviene per
 560 le variabili, la posizione corrente sul file è condivisa fra il padre e tutti
 561 i processi figli.
 562
 563 Quello che succede è che quando lo standard output del padre viene rediretto
 564 come si è fatto nell'esempio, lo stesso avviene anche per tutti i figli; la
 565 funzione \func{fork} infatti ha la caratteristica di duplicare nei processi
 566 figli tutti i file descriptor aperti nel processo padre (allo stesso modo in
 567 cui lo fa la funzione \func{dup}, trattata in sez.~\ref{sec:file_dup}), il che
 568 comporta che padre e figli condividono le stesse voci della
 569 \itindex{file~table} \textit{file table} (per la spiegazione di questi termini
 570 si veda sez.~\ref{sec:file_sharing}) fra cui c'è anche la posizione corrente
 571 nel file.
 572
 573 In questo modo se un processo scrive sul file aggiornerà la posizione corrente
 574 sulla \itindex{file~table} \textit{file table}, e tutti gli altri processi,
 575 che vedono la stessa \itindex{file~table} \textit{file table}, vedranno il
 576 nuovo valore. In questo modo si evita, in casi come quello appena mostrato in
 577 cui diversi processi scrivono sullo stesso file, che l'output successivo di un
 578 processo vada a sovrapporsi a quello dei precedenti: l'output potrà risultare
 579 mescolato, ma non ci saranno parti perdute per via di una sovrascrittura.
 580
 581 Questo tipo di comportamento è essenziale in tutti quei casi in cui il padre
 582 crea un figlio e attende la sua conclusione per proseguire, ed entrambi
 583 scrivono sullo stesso file; un caso tipico è la shell quando lancia un
 584 programma, il cui output va sullo standard output.  In questo modo, anche se
 585 l'output viene rediretto, il padre potrà sempre continuare a scrivere in coda
 586 a quanto scritto dal figlio in maniera automatica; se così non fosse ottenere
 587 questo comportamento sarebbe estremamente complesso necessitando di una
 588 qualche forma di comunicazione fra i due processi per far riprendere al padre
 589 la scrittura al punto giusto.
 590
 591 In generale comunque non è buona norma far scrivere più processi sullo stesso
 592 file senza una qualche forma di sincronizzazione in quanto, come visto anche
 593 con il nostro esempio, le varie scritture risulteranno mescolate fra loro in
 594 una sequenza impredicibile. Per questo le modalità con cui in genere si usano
 595 i file dopo una \func{fork} sono sostanzialmente due:
 596 \begin{enumerate}
 597 \item Il processo padre aspetta la conclusione del figlio. In questo caso non
 598   è necessaria nessuna azione riguardo ai file, in quanto la sincronizzazione
 599   della posizione corrente dopo eventuali operazioni di lettura e scrittura
 600   effettuate dal figlio è automatica.
 601 \item L'esecuzione di padre e figlio procede indipendentemente. In questo caso
 602   ciascuno dei due processi deve chiudere i file che non gli servono una volta
 603   che la \func{fork} è stata eseguita, per evitare ogni forma di interferenza.
 604 \end{enumerate}
 605
 606 Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
 607 proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
 608 comune dopo l'esecuzione di una \func{fork} è la seguente:
 609 \begin{itemize*}
 610 \item i file aperti e gli eventuali flag di \itindex{close-on-exec}
 611   \textit{close-on-exec} impostati (vedi sez.~\ref{sec:proc_exec} e
 612   sez.~\ref{sec:file_fcntl});
 613 \item gli identificatori per il controllo di accesso: l'\textsl{user-ID
 614     reale}, il \textsl{group-ID reale}, l'\textsl{user-ID effettivo}, il
 615   \textsl{group-ID effettivo} ed i \textit{group-ID supplementari} (vedi
 616   sez.~\ref{sec:proc_access_id});
 617 \item gli identificatori per il controllo di sessione: il
 618   \itindex{process~group} \textit{process group-ID} e il \textit{session id}
 619   ed il terminale di controllo (vedi sez.~\ref{sec:sess_proc_group});
 620 \item la directory di lavoro e la directory radice (vedi
 621   sez.~\ref{sec:file_work_dir} e sez.~\ref{sec:file_chroot});
 622 \item la maschera dei permessi di creazione (vedi
 623   sez.~\ref{sec:file_perm_management});
 624 \item la maschera dei segnali bloccati (vedi sez.~\ref{sec:sig_sigmask}) e le
 625   azioni installate (vedi sez.~\ref{sec:sig_gen_beha});
 626 \item i segmenti di memoria condivisa agganciati al processo (vedi
 627   sez.~\ref{sec:ipc_sysv_shm});
 628 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
 629 \item le priorità real-time e le affinità di processore (vedi
 630   sez.~\ref{sec:proc_real_time} e sez.\ref{sec:proc_sched_multiprocess});
 631 \item le variabili di ambiente (vedi sez.~\ref{sec:proc_environ}).
 632 \end{itemize*}
 633 Le differenze fra padre e figlio dopo la \func{fork} invece sono:
 634 \begin{itemize*}
 635 \item il valore di ritorno di \func{fork};
 636 \item il \acr{pid} (\textit{process id});
 637 \item il \acr{ppid} (\textit{parent process id}), quello del figlio viene
 638   impostato al \acr{pid} del padre;
 639 \item i valori dei tempi di esecuzione della struttura \struct{tms} (vedi
 640   sez.~\ref{sec:sys_cpu_times}) che nel figlio sono posti a zero;
 641 \item i \textit{lock} sui file (vedi sez.~\ref{sec:file_locking}), che non
 642   vengono ereditati dal figlio;
 643 \item gli allarmi ed i segnali pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che
 644   per il figlio vengono cancellati.
 645 \end{itemize*}
 646
 647
 648 Una seconda funzione storica usata per la creazione di un nuovo processo è
 649 \func{vfork}, che è esattamente identica a \func{fork} ed ha la stessa
 650 semantica e gli stessi errori; la sola differenza è che non viene creata la
 651 tabella delle pagine né la struttura dei task per il nuovo processo. Il
 652 processo padre è posto in attesa fintanto che il figlio non ha eseguito una
 653 \func{execve} o non è uscito con una \func{\_exit}. Il figlio condivide la
 654 memoria del padre (e modifiche possono avere effetti imprevedibili) e non deve
 655 ritornare o uscire con \func{exit} ma usare esplicitamente \func{\_exit}.
 656
 657 Questa funzione è un rimasuglio dei vecchi tempi in cui eseguire una
 658 \func{fork} comportava anche la copia completa del segmento dati del processo
 659 padre, che costituiva un inutile appesantimento in tutti quei casi in cui la
 660 \func{fork} veniva fatta solo per poi eseguire una \func{exec}. La funzione
 661 venne introdotta in BSD per migliorare le prestazioni.
 662
 663 Dato che Linux supporta il \itindex{copy~on~write} \textit{copy on write} la
 664 perdita di prestazioni è assolutamente trascurabile, e l'uso di questa
 665 funzione (che resta un caso speciale della system call \func{\_\_clone}) è
 666 deprecato; per questo eviteremo di trattarla ulteriormente.
 667
 668
 669 \subsection{La conclusione di un processo}
 670 \label{sec:proc_termination}
 671
 672 In sez.~\ref{sec:proc_conclusion} abbiamo già affrontato le modalità con cui
 673 chiudere un programma, ma dall'interno del programma stesso; avendo a che fare
 674 con un sistema multitasking resta da affrontare l'argomento dal punto di vista
 675 di come il sistema gestisce la conclusione dei processi.
 676
 677 Abbiamo visto in sez.~\ref{sec:proc_conclusion} le tre modalità con cui un
 678 programma viene terminato in maniera normale: la chiamata di \func{exit} (che
 679 esegue le funzioni registrate per l'uscita e chiude gli stream), il ritorno
 680 dalla funzione \func{main} (equivalente alla chiamata di \func{exit}), e la
 681 chiamata ad \func{\_exit} (che passa direttamente alle operazioni di
 682 terminazione del processo da parte del kernel).
 683
 684 Ma abbiamo accennato che oltre alla conclusione normale esistono anche delle
 685 modalità di conclusione anomala; queste sono in sostanza due: il programma può
 686 chiamare la funzione \func{abort} per invocare una chiusura anomala, o essere
 687 terminato da un segnale (torneremo sui segnali in cap.~\ref{cha:signals}).  In
 688 realtà anche la prima modalità si riconduce alla seconda, dato che
 689 \func{abort} si limita a generare il segnale \const{SIGABRT}.
 690
 691 Qualunque sia la modalità di conclusione di un processo, il kernel esegue
 692 comunque una serie di operazioni: chiude tutti i file aperti, rilascia la
 693 memoria che stava usando, e così via; l'elenco completo delle operazioni
 694 eseguite alla chiusura di un processo è il seguente:
 695 \begin{itemize}
 696 \item tutti i file descriptor sono chiusi;
 697 \item viene memorizzato lo stato di terminazione del processo;
 698 \item ad ogni processo figlio viene assegnato un nuovo padre (in genere
 699   \cmd{init});
 700 \item viene inviato il segnale \const{SIGCHLD} al processo padre (vedi
 701   sez.~\ref{sec:sig_sigchld});
 702 \item se il processo è un leader di sessione ed il suo terminale di controllo
 703   è quello della sessione viene mandato un segnale di \const{SIGHUP} a tutti i
 704   processi del gruppo di \textit{foreground} e il terminale di controllo viene
 705   disconnesso (vedi sez.~\ref{sec:sess_ctrl_term});
 706 \item se la conclusione di un processo rende orfano un \textit{process
 707     group} ciascun membro del gruppo viene bloccato, e poi gli vengono
 708   inviati in successione i segnali \const{SIGHUP} e \const{SIGCONT}
 709   (vedi ancora sez.~\ref{sec:sess_ctrl_term}).
 710 \end{itemize}
 711
 712 Oltre queste operazioni è però necessario poter disporre di un meccanismo
 713 ulteriore che consenta di sapere come la terminazione è avvenuta: dato che in
 714 un sistema unix-like tutto viene gestito attraverso i processi, il meccanismo
 715 scelto consiste nel riportare lo stato di terminazione (il cosiddetto
 716 \textit{termination status}) al processo padre.
 717
 718 Nel caso di conclusione normale, abbiamo visto in
 719 sez.~\ref{sec:proc_conclusion} che lo stato di uscita del processo viene
 720 caratterizzato tramite il valore del cosiddetto \textit{exit status}, cioè il
 721 valore passato alle funzioni \func{exit} o \func{\_exit} (o dal valore di
 722 ritorno per \func{main}).  Ma se il processo viene concluso in maniera anomala
 723 il programma non può specificare nessun \textit{exit status}, ed è il kernel
 724 che deve generare autonomamente il \textit{termination status} per indicare le
 725 ragioni della conclusione anomala.
 726
 727 Si noti la distinzione fra \textit{exit status} e \textit{termination status}:
 728 quello che contraddistingue lo stato di chiusura del processo e viene
 729 riportato attraverso le funzioni \func{wait} o \func{waitpid} (vedi
 730 sez.~\ref{sec:proc_wait}) è sempre quest'ultimo; in caso di conclusione normale
 731 il kernel usa il primo (nel codice eseguito da \func{\_exit}) per produrre il
 732 secondo.
 733
 734 La scelta di riportare al padre lo stato di terminazione dei figli, pur
 735 essendo l'unica possibile, comporta comunque alcune complicazioni: infatti se
 736 alla sua creazione è scontato che ogni nuovo processo ha un padre, non è detto
 737 che sia così alla sua conclusione, dato che il padre potrebbe essere già
 738 terminato (si potrebbe avere cioè quello che si chiama un processo
 739 \textsl{orfano}).
 740
 741 % TODO verificare il reparenting
 742
 743 Questa complicazione viene superata facendo in modo che il processo orfano
 744 venga \textsl{adottato} da \cmd{init}. Come già accennato quando un processo
 745 termina, il kernel controlla se è il padre di altri processi in esecuzione: in
 746 caso positivo allora il \acr{ppid} di tutti questi processi viene sostituito
 747 con il \acr{pid} di \cmd{init} (e cioè con 1); in questo modo ogni processo
 748 avrà sempre un padre (nel caso possiamo parlare di un padre \textsl{adottivo})
 749 cui riportare il suo stato di terminazione.  Come verifica di questo
 750 comportamento possiamo eseguire il nostro programma \cmd{forktest} imponendo a
 751 ciascun processo figlio due secondi di attesa prima di uscire, il risultato è:
 752 \begin{Verbatim}[fontsize=\footnotesize,xleftmargin=1cm,xrightmargin=1.5cm]
 753 [piccardi@selidor sources]$ ./forktest -c2 3
 754 Process 1972: forking 3 child
 755 Spawned 1 child, pid 1973
 756 Child 1 successfully executing
 757 Go to next child
 758 Spawned 2 child, pid 1974
 759 Child 2 successfully executing
 760 Go to next child
 761 Child 3 successfully executing
 762 Spawned 3 child, pid 1975
 763 Go to next child
 764 [piccardi@selidor sources]$ Child 3, parent 1, exiting
 765 Child 2, parent 1, exiting
 766 Child 1, parent 1, exiting
 767 \end{Verbatim}
 768 come si può notare in questo caso il processo padre si conclude prima dei
 769 figli, tornando alla shell, che stampa il prompt sul terminale: circa due
 770 secondi dopo viene stampato a video anche l'output dei tre figli che
 771 terminano, e come si può notare in questo caso, al contrario di quanto visto
 772 in precedenza, essi riportano 1 come \acr{ppid}.
 773
 774 Altrettanto rilevante è il caso in cui il figlio termina prima del padre,
 775 perché non è detto che il padre possa ricevere immediatamente lo stato di
 776 terminazione, quindi il kernel deve comunque conservare una certa quantità di
 777 informazioni riguardo ai processi che sta terminando.
 778
 779 Questo viene fatto mantenendo attiva la voce nella tabella dei processi, e
 780 memorizzando alcuni dati essenziali, come il \acr{pid}, i tempi di CPU usati
 781 dal processo (vedi sez.~\ref{sec:sys_unix_time}) e lo stato di terminazione,
 782 mentre la memoria in uso ed i file aperti vengono rilasciati immediatamente. I
 783 processi che sono terminati, ma il cui stato di terminazione non è stato
 784 ancora ricevuto dal padre sono chiamati \index{zombie} \textit{zombie}, essi
 785 restano presenti nella tabella dei processi ed in genere possono essere
 786 identificati dall'output di \cmd{ps} per la presenza di una \texttt{Z} nella
 787 colonna che ne indica lo stato (vedi tab.~\ref{tab:proc_proc_states}). Quando
 788 il padre effettuerà la lettura dello stato di uscita anche questa
 789 informazione, non più necessaria, verrà scartata e la terminazione potrà dirsi
 790 completamente conclusa.
 791
 792 Possiamo utilizzare il nostro programma di prova per analizzare anche questa
 793 condizione: lanciamo il comando \cmd{forktest} in \textit{background} (vedi
 794 sez.~\ref{sec:sess_job_control}), indicando al processo padre di aspettare 10
 795 secondi prima di uscire; in questo caso, usando \cmd{ps} sullo stesso
 796 terminale (prima dello scadere dei 10 secondi) otterremo:
 797 \begin{Verbatim}[fontsize=\footnotesize,xleftmargin=1cm,xrightmargin=1.5cm]
 798 [piccardi@selidor sources]$ ps T
 799   PID TTY      STAT   TIME COMMAND
 800   419 pts/0    S      0:00 bash
 801   568 pts/0    S      0:00 ./forktest -e10 3
 802   569 pts/0    Z      0:00 [forktest <defunct>]
 803   570 pts/0    Z      0:00 [forktest <defunct>]
 804   571 pts/0    Z      0:00 [forktest <defunct>]
 805   572 pts/0    R      0:00 ps T
 806 \end{Verbatim}
 807 %$
 808 e come si vede, dato che non si è fatto nulla per riceverne lo
 809 stato di terminazione, i tre processi figli sono ancora presenti pur essendosi
 810 conclusi, con lo stato di \index{zombie} \textit{zombie} e l'indicazione che
 811 sono stati terminati.
 812
 813 La possibilità di avere degli \index{zombie} \textit{zombie} deve essere
 814 tenuta sempre presente quando si scrive un programma che deve essere mantenuto
 815 in esecuzione a lungo e creare molti figli. In questo caso si deve sempre
 816 avere cura di far leggere l'eventuale stato di uscita di tutti i figli (in
 817 genere questo si fa attraverso un apposito \textit{signal handler}, che chiama
 818 la funzione \func{wait}, vedi sez.~\ref{sec:sig_sigchld} e
 819 sez.~\ref{sec:proc_wait}).  Questa operazione è necessaria perché anche se gli
 820 \index{zombie} \textit{zombie} non consumano risorse di memoria o processore,
 821 occupano comunque una voce nella tabella dei processi, che a lungo andare
 822 potrebbe esaurirsi.
 823
 824 Si noti che quando un processo adottato da \cmd{init} termina, esso non
 825 diviene uno \index{zombie} \textit{zombie}; questo perché una delle funzioni
 826 di \cmd{init} è appunto quella di chiamare la funzione \func{wait} per i
 827 processi cui fa da padre, completandone la terminazione. Questo è quanto
 828 avviene anche quando, come nel caso del precedente esempio con \cmd{forktest},
 829 il padre termina con dei figli in stato di \index{zombie} \textit{zombie}:
 830 alla sua terminazione infatti tutti i suoi figli (compresi gli \index{zombie}
 831 \textit{zombie}) verranno adottati da \cmd{init}, il quale provvederà a
 832 completarne la terminazione.
 833
 834 Si tenga presente infine che siccome gli \index{zombie} \textit{zombie} sono
 835 processi già usciti, non c'è modo di eliminarli con il comando \cmd{kill};
 836 l'unica possibilità di cancellarli dalla tabella dei processi è quella di
 837 terminare il processo che li ha generati, in modo che \cmd{init} possa
 838 adottarli e provvedere a concluderne la terminazione.
 839
 840
 841 \subsection{La funzione \func{waitpid} e le funzioni di ricezione degli stati
 842   di uscita}
 843 \label{sec:proc_wait}
 844
 845 Uno degli usi più comuni delle capacità multitasking di un sistema unix-like
 846 consiste nella creazione di programmi di tipo server, in cui un processo
 847 principale attende le richieste che vengono poi soddisfatte da una serie di
 848 processi figli. Si è già sottolineato al paragrafo precedente come in questo
 849 caso diventi necessario gestire esplicitamente la conclusione dei figli onde
 850 evitare di riempire di \index{zombie} \textit{zombie} la tabella dei processi;
 851 le funzioni deputate a questo compito sono principalmente due, \funcd{wait} e
 852 \func{waitpid}. La prima, il cui prototipo è:
 853 \begin{functions}
 854 \headdecl{sys/types.h}
 855 \headdecl{sys/wait.h}
 856 \funcdecl{pid\_t wait(int *status)}
 857
 858 Sospende il processo corrente finché un figlio non è uscito, o finché un
 859 segnale termina il processo o chiama una funzione di gestione.
 860
 861 \bodydesc{La funzione restituisce il \acr{pid} del figlio in caso di successo
 862   e -1 in caso di errore; \var{errno} può assumere i valori:
 863   \begin{errlist}
 864   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
 865   \end{errlist}}
 866 \end{functions}
 867 \noindent
 868 è presente fin dalle prime versioni di Unix; la funzione ritorna non appena un
 869 processo figlio termina. Se un figlio è già terminato la funzione ritorna
 870 immediatamente, se più di un figlio è terminato occorre chiamare la funzione
 871 più volte se si vuole recuperare lo stato di terminazione di tutti quanti.
 872
 873 Al ritorno della funzione lo stato di terminazione del figlio viene salvato
 874 nella variabile puntata da \param{status} e tutte le risorse del kernel
 875 relative al processo (vedi sez.~\ref{sec:proc_termination}) vengono rilasciate.
 876 Nel caso un processo abbia più figli il valore di ritorno (il \acr{pid} del
 877 figlio) permette di identificare qual è quello che è uscito.
 878
 879 Questa funzione ha il difetto di essere poco flessibile, in quanto ritorna
 880 all'uscita di un qualunque processo figlio. Nelle occasioni in cui è
 881 necessario attendere la conclusione di un processo specifico occorrerebbe
 882 predisporre un meccanismo che tenga conto dei processi già terminati, e
 883 provvedere a ripetere la chiamata alla funzione nel caso il processo cercato
 884 sia ancora attivo.
 885
 886 Per questo motivo lo standard POSIX.1 ha introdotto la funzione
 887 \funcd{waitpid} che effettua lo stesso servizio, ma dispone di una serie di
 888 funzionalità più ampie, legate anche al controllo di sessione (si veda
 889 sez.~\ref{sec:sess_job_control}).  Dato che è possibile ottenere lo stesso
 890 comportamento di \func{wait}\footnote{in effetti il codice
 891   \code{wait(\&status)} è del tutto equivalente a \code{waitpid(WAIT\_ANY,
 892     \&status, 0)}.} si consiglia di utilizzare sempre questa funzione, il cui
 893 prototipo è:
 894 \begin{functions}
 895 \headdecl{sys/types.h}
 896 \headdecl{sys/wait.h}
 897 \funcdecl{pid\_t waitpid(pid\_t pid, int *status, int options)}
 898 Attende la conclusione di un processo figlio.
 899
 900 \bodydesc{La funzione restituisce il \acr{pid} del processo che è uscito, 0 se
 901   è stata specificata l'opzione \const{WNOHANG} e il processo non è uscito e
 902   -1 per un errore, nel qual caso \var{errno} assumerà i valori:
 903   \begin{errlist}
 904   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
 905     la funzione è stata interrotta da un segnale.
 906   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
 907     non è figlio del processo chiamante.
 908   \item[\errcode{EINVAL}] si è specificato un valore non valido per
 909     l'argomento \param{options}.
 910   \end{errlist}}
 911 \end{functions}
 912
 913 La prima differenza fra le due funzioni è che con \func{waitpid} si può
 914 specificare in maniera flessibile quale processo attendere, sulla base del
 915 valore fornito dall'argomento \param{pid}, questo può assumere diversi valori,
 916 secondo lo specchietto riportato in tab.~\ref{tab:proc_waidpid_pid}, dove si
 917 sono riportate anche le costanti definite per indicare alcuni di essi.
 918
 919 \begin{table}[!htb]
 920   \centering
 921   \footnotesize
 922   \begin{tabular}[c]{|c|c|p{8cm}|}
 923     \hline
 924     \textbf{Valore} & \textbf{Costante} &\textbf{Significato}\\
 925     \hline
 926     \hline
 927     $<-1$& --               & Attende per un figlio il cui
 928                               \itindex{process~group} \textit{process group}
 929                               (vedi sez.~\ref{sec:sess_proc_group}) è uguale
 930                               al valore assoluto di \param{pid}. \\
 931     $-1$&\const{WAIT\_ANY}  & Attende per un figlio qualsiasi, usata in
 932                               questa maniera senza specificare nessuna opzione
 933                               è equivalente a \func{wait}.\\
 934     $ 0$&\const{WAIT\_MYPGRP}&Attende per un figlio il cui
 935                               \itindex{process~group} \textit{process group}
 936                               (vedi sez.~\ref{sec:sess_proc_group}) è
 937                               uguale a quello del processo chiamante. \\
 938     $>0$& --                & Attende per un figlio il cui \acr{pid} è uguale
 939                               al valore di \param{pid}.\\
 940     \hline
 941   \end{tabular}
 942   \caption{Significato dei valori dell'argomento \param{pid} della funzione
 943     \func{waitpid}.}
 944   \label{tab:proc_waidpid_pid}
 945 \end{table}
 946
 947 Il comportamento di \func{waitpid} può inoltre essere modificato passando alla
 948 funzione delle opportune opzioni tramite l'argomento \param{options}; questo
 949 deve essere specificato come maschera binaria dei flag riportati in
 950 tab.~\ref{tab:proc_waitpid_options},\footnote{oltre a queste in Linux sono
 951   previste del altre opzioni non standard, relative al comportamento con i
 952   \itindex{thread} \textit{thread}, che riprenderemo in
 953   sez.~\ref{sec:thread_xxx}.} che possono essere combinati fra loro con un OR
 954 aritmetico.
 955
 956 L'uso dell'opzione \const{WNOHANG} consente di prevenire il blocco della
 957 funzione qualora nessun figlio sia uscito (o non si siano verificate le altre
 958 condizioni per l'uscita della funzione); in tal caso la funzione ritornerà un
 959 valore nullo anziché positivo.\footnote{anche in questo caso un valore
 960   positivo indicherà il \acr{pid} del processo di cui si è ricevuto lo stato
 961   ed un valore negativo un errore.}
 962
 963 \begin{table}[!htb]
 964   \centering
 965   \footnotesize
 966   \begin{tabular}[c]{|l|p{8cm}|}
 967     \hline
 968     \textbf{Macro} & \textbf{Descrizione}\\
 969     \hline
 970     \hline
 971     \const{WNOHANG}   & La funzione ritorna immediatamente anche se non è
 972                         terminato nessun processo figlio. \\
 973     \const{WUNTRACED} & Ritorna anche se un processo figlio è stato fermato. \\
 974     \const{WCONTINUED}& Ritorna anche quando un processo figlio che era stato
 975                         fermato ha ripreso l'esecuzione.\footnotemark \\
 976     \hline
 977   \end{tabular}
 978   \caption{Costanti che identificano i bit dell'argomento \param{options}
 979     della funzione \func{waitpid}.}
 980   \label{tab:proc_waitpid_options}
 981 \end{table}
 982
 983 \footnotetext{disponibile solo a partire dal kernel 2.6.10.}
 984
 985 Le altre due opzioni \const{WUNTRACED} e \const{WCONTINUED} consentono
 986 rispettivamente di tracciare non la terminazione di un processo, ma il fatto
 987 che esso sia stato fermato, o fatto ripartire, e sono utilizzate per la
 988 gestione del controllo di sessione (vedi sez.~\ref{sec:sess_job_control}).
 989
 990 Nel caso di \const{WUNTRACED} la funzione ritorna, restituendone il \acr{pid},
 991 quando un processo figlio entra nello stato \textit{stopped}\footnote{in
 992   realtà viene notificato soltanto il caso in cui il processo è stato fermato
 993   da un segnale di stop (vedi sez.~\ref{sec:sess_ctrl_term}), e non quello in
 994   cui lo stato \textit{stopped} è dovuto all'uso di \func{ptrace} (vedi
 995   sez.~\ref{sec:xxx_ptrace}).} (vedi tab.~\ref{tab:proc_proc_states}), mentre
 996 con \const{WCONTINUED} la funzione ritorna quando un processo in stato
 997 \textit{stopped} riprende l'esecuzione per la ricezione del segnale
 998 \const{SIGCONT} (l'uso di questi segnali per il controllo di sessione è
 999 dettagliato in sez.~\ref{sec:sess_ctrl_term}).
1000
1001 La terminazione di un processo figlio (così come gli altri eventi osservabili
1002 con \func{waitpid}) è chiaramente un evento asincrono rispetto all'esecuzione
1003 di un programma e può avvenire in un qualunque momento. Per questo motivo,
1004 come accennato nella sezione precedente, una delle azioni prese dal kernel
1005 alla conclusione di un processo è quella di mandare un segnale di
1006 \const{SIGCHLD} al padre. L'azione predefinita (si veda
1007 sez.~\ref{sec:sig_base}) per questo segnale è di essere ignorato, ma la sua
1008 generazione costituisce il meccanismo di comunicazione asincrona con cui il
1009 kernel avverte il processo padre che uno dei suoi figli è terminato.
1010
1011 Il comportamento delle funzioni è però cambiato nel passaggio dal kernel 2.4
1012 al kernel 2.6, quest'ultimo infatti si è adeguato alle prescrizioni dello
1013 standard POSIX.1-2001,\footnote{una revisione del 2001 dello standard POSIX.1
1014   che ha aggiunto dei requisiti e delle nuove funzioni, come \func{waitid}.}
1015 e come da esso richiesto se \const{SIGCHLD} viene ignorato, o se si imposta il
1016 flag di \const{SA\_NOCLDSTOP} nella ricezione dello stesso (si veda
1017 sez.~\ref{sec:sig_sigaction}) i processi figli che terminano non diventano
1018 \textit{zombie} e sia \func{wait} che \func{waitpid} si bloccano fintanto che
1019 tutti i processi figli non sono terminati, dopo di che falliscono con un
1020 errore di \errcode{ENOCHLD}.\footnote{questo è anche il motivo per cui le
1021   opzioni \const{WUNTRACED} e \const{WCONTINUED} sono utilizzabili soltanto
1022   qualora non si sia impostato il flag di \const{SA\_NOCLDSTOP} per il segnale
1023   \const{SIGCHLD}.}
1024
1025 Con i kernel della serie 2.4 e tutti i kernel delle serie precedenti entrambe
1026 le funzioni di attesa ignorano questa prescrizione\footnote{lo standard POSIX.1
1027   originale infatti lascia indefinito il comportamento di queste funzioni
1028   quando \const{SIGCHLD} viene ignorato.} e si comportano sempre nello stesso
1029 modo, indipendentemente dal fatto \const{SIGCHLD} sia ignorato o meno:
1030 attendono la terminazione di un processo figlio e ritornano il relativo
1031 \acr{pid} e lo stato di terminazione nell'argomento \param{status}.
1032
1033 In generale in un programma non si vuole essere forzati ad attendere la
1034 conclusione di un processo figlio per proseguire l'esecuzione, specie se tutto
1035 questo serve solo per leggerne lo stato di chiusura (ed evitare eventualmente
1036 la presenza di \index{zombie} \textit{zombie}). Per questo la modalità più
1037 comune di chiamare queste funzioni è quella di utilizzarle all'interno di un
1038 \textit{signal handler} (vedremo un esempio di come gestire \const{SIGCHLD}
1039 con i segnali in sez.~\ref{sec:sig_example}). In questo caso infatti, dato che
1040 il segnale è generato dalla terminazione di un figlio, avremo la certezza che
1041 la chiamata a \func{waitpid} non si bloccherà.
1042
1043 Come accennato sia \func{wait} che \func{waitpid} restituiscono lo stato di
1044 terminazione del processo tramite il puntatore \param{status} (se non
1045 interessa memorizzare lo stato si può passare un puntatore nullo). Il valore
1046 restituito da entrambe le funzioni dipende dall'implementazione, ma
1047 tradizionalmente alcuni bit (in genere 8) sono riservati per memorizzare lo
1048 stato di uscita, e altri per indicare il segnale che ha causato la
1049 terminazione (in caso di conclusione anomala), uno per indicare se è stato
1050 generato un \itindex{core~dump} \textit{core dump}, ecc.\footnote{le
1051   definizioni esatte si possono trovare in \file{<bits/waitstatus.h>} ma
1052   questo file non deve mai essere usato direttamente, esso viene incluso
1053   attraverso \file{<sys/wait.h>}.}
1054
1055 Lo standard POSIX.1 definisce una serie di macro di preprocessore da usare per
1056 analizzare lo stato di uscita. Esse sono definite sempre in
1057 \file{<sys/wait.h>} ed elencate in tab.~\ref{tab:proc_status_macro} (si tenga
1058 presente che queste macro prendono come parametro la variabile di tipo
1059 \ctyp{int} puntata da \param{status}).
1060
1061 \begin{table}[!htb]
1062   \centering
1063   \footnotesize
1064   \begin{tabular}[c]{|l|p{10cm}|}
1065     \hline
1066     \textbf{Macro} & \textbf{Descrizione}\\
1067     \hline
1068     \hline
1069     \macro{WIFEXITED(s)}   & Condizione vera (valore non nullo) per un processo
1070                              figlio che sia terminato normalmente. \\
1071     \macro{WEXITSTATUS(s)} & Restituisce gli otto bit meno significativi dello
1072                              stato di uscita del processo (passato attraverso
1073                              \func{\_exit}, \func{exit} o come valore di
1074                              ritorno di \func{main}); può essere valutata solo
1075                              se \val{WIFEXITED} ha restituito un valore non
1076                              nullo.\\
1077     \macro{WIFSIGNALED(s)} & Condizione vera se il processo figlio è terminato
1078                              in maniera anomala a causa di un segnale che non
1079                              è stato catturato (vedi
1080                              sez.~\ref{sec:sig_notification}).\\
1081     \macro{WTERMSIG(s)}    & Restituisce il numero del segnale che ha causato
1082                              la terminazione anomala del processo; può essere
1083                              valutata solo se \val{WIFSIGNALED} ha restituito
1084                              un valore non nullo.\\
1085     \macro{WCOREDUMP(s)}   & Vera se il processo terminato ha generato un
1086                              file di \itindex{core~dump} \textit{core
1087                                dump}; può essere valutata solo se
1088                              \val{WIFSIGNALED} ha restituito un valore non
1089                              nullo.\footnotemark \\
1090     \macro{WIFSTOPPED(s)}  & Vera se il processo che ha causato il ritorno di
1091                              \func{waitpid} è bloccato; l'uso è possibile solo
1092                              con \func{waitpid} avendo specificato l'opzione
1093                              \const{WUNTRACED}.\\
1094     \macro{WSTOPSIG(s)}    & Restituisce il numero del segnale che ha bloccato
1095                              il processo; può essere valutata solo se
1096                              \val{WIFSTOPPED} ha restituito un valore non
1097                              nullo. \\
1098     \macro{WIFCONTINUED(s)}& Vera se il processo che ha causato il ritorno è
1099                              stato riavviato da un
1100                              \const{SIGCONT}.\footnotemark  \\
1101     \hline
1102   \end{tabular}
1103   \caption{Descrizione delle varie macro di preprocessore utilizzabili per
1104     verificare lo stato di terminazione \var{s} di un processo.}
1105   \label{tab:proc_status_macro}
1106 \end{table}
1107
1108 \footnotetext[18]{questa macro non è definita dallo standard POSIX.1-2001, ma è
1109   presente come estensione sia in Linux che in altri Unix, deve essere
1110   pertanto utilizzata con attenzione (ad esempio è il caso di usarla in un
1111   blocco \texttt{\#ifdef WCOREDUMP ... \#endif}.}
1112
1113 \footnotetext{è presente solo a partire dal kernel 2.6.10.}
1114
1115 Si tenga conto che nel caso di conclusione anomala il valore restituito da
1116 \val{WTERMSIG} può essere confrontato con le costanti definite in
1117 \file{signal.h} ed elencate in tab.~\ref{tab:sig_signal_list}, e stampato
1118 usando le apposite funzioni trattate in sez.~\ref{sec:sig_strsignal}.
1119
1120 A partire dal kernel 2.6.9, sempre in conformità allo standard POSIX.1-2001, è
1121 stata introdotta una nuova funzione di attesa che consente di avere un
1122 controllo molto più preciso sui possibili cambiamenti di stato dei processi
1123 figli e più dettagli sullo stato di uscita; la funzione è \funcd{waitid} ed il
1124 suo prototipo è:
1125 \begin{functions}
1126   \headdecl{sys/types.h}
1127
1128   \headdecl{sys/wait.h}
1129
1130   \funcdecl{int waitid(idtype\_t idtype, id\_t id, siginfo\_t *infop, int
1131     options)}
1132
1133   Attende la conclusione di un processo figlio.
1134
1135   \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore,
1136     nel qual caso \var{errno} assumerà i valori:
1137   \begin{errlist}
1138   \item[\errcode{EINTR}] se non è stata specificata l'opzione \const{WNOHANG} e
1139     la funzione è stata interrotta da un segnale.
1140   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
1141     non è figlio del processo chiamante.
1142   \item[\errcode{EINVAL}] si è specificato un valore non valido per
1143     l'argomento \param{options}.
1144   \end{errlist}}
1145 \end{functions}
1146
1147 La funzione prevede che si specifichi quali processi si intendono osservare
1148 usando i due argomenti \param{idtype} ed \param{id}; il primo indica se si
1149 vuole porsi in attesa su un singolo processo, un gruppo di processi o un
1150 processo qualsiasi, e deve essere specificato secondo uno dei valori di
1151 tab.~\ref{tab:proc_waitid_idtype}; il secondo indica, a seconda del valore del
1152 primo, quale processo o quale gruppo di processi selezionare.
1153
1154
1155 \begin{table}[!htb]
1156   \centering
1157   \footnotesize
1158   \begin{tabular}[c]{|l|p{8cm}|}
1159     \hline
1160     \textbf{Macro} & \textbf{Descrizione}\\
1161     \hline
1162     \hline
1163     \const{P\_PID} & Indica la richiesta di attendere per un processo figlio
1164                      il cui \acr{pid} corrisponda al valore dell'argomento
1165                      \param{id}.\\
1166     \const{P\_PGID}& Indica la richiesta di attendere per un processo figlio
1167                      appartenente al \textit{process group} (vedi
1168                      sez.~\ref{sec:sess_proc_group}) il cui \acr{pgid}
1169                      corrisponda al valore dell'argomento \param{id}.\\
1170     \const{P\_ALL} & Indica la richiesta di attendere per un processo figlio
1171                      generico, il valore dell'argomento \param{id} viene
1172                      ignorato.\\
1173     \hline
1174   \end{tabular}
1175   \caption{Costanti per i valori dell'argomento \param{idtype} della funzione
1176     \func{waitid}.}
1177   \label{tab:proc_waitid_idtype}
1178 \end{table}
1179
1180 Come per \func{waitpid} anche il comportamento di \func{waitid} viene
1181 controllato dall'argomento \param{options}, da specificare come maschera
1182 binaria dei valori riportati in tab.~\ref{tab:proc_waitid_options}. Benché
1183 alcuni di questi siano identici come significato ed effetto ai precedenti di
1184 tab.~\ref{tab:proc_waitpid_options}, ci sono delle differenze significative:
1185 in questo caso si dovrà specificare esplicitamente l'attesa della terminazione
1186 di un processo impostando l'opzione \const{WEXITED}, mentre il precedente
1187 \const{WUNTRACED} è sostituito da \const{WSTOPPED}.  Infine è stata aggiunta
1188 l'opzione \const{WNOWAIT} che consente una lettura dello stato mantenendo il
1189 processo in attesa di ricezione, così che una successiva chiamata possa di
1190 nuovo riceverne lo stato.
1191
1192 \begin{table}[!htb]
1193   \centering
1194   \footnotesize
1195   \begin{tabular}[c]{|l|p{8cm}|}
1196     \hline
1197     \textbf{Macro} & \textbf{Descrizione}\\
1198     \hline
1199     \hline
1200     \const{WEXITED}   & Ritorna quando un processo figlio è terminato.\\
1201     \const{WNOHANG}   & Ritorna immediatamente anche se non c'è niente da
1202                         notificare.\\
1203     \const{WSTOPPED} &  Ritorna quando un processo figlio è stato fermato.\\
1204     \const{WCONTINUED}& Ritorna quando un processo figlio che era stato
1205                         fermato ha ripreso l'esecuzione.\\
1206     \const{WNOWAIT}   & Lascia il processo ancora in attesa di ricezione, così
1207                         che una successiva chiamata possa di nuovo riceverne
1208                         lo stato.\\
1209     \hline
1210   \end{tabular}
1211   \caption{Costanti che identificano i bit dell'argomento \param{options}
1212     della funzione \func{waitid}.}
1213   \label{tab:proc_waitid_options}
1214 \end{table}
1215
1216 La funzione \func{waitid} restituisce un valore nullo in caso di successo, e
1217 $-1$ in caso di errore; viene restituito un valore nullo anche se è stata
1218 specificata l'opzione \const{WNOHANG} e la funzione è ritornata immediatamente
1219 senza che nessun figlio sia terminato. Pertanto per verificare il motivo del
1220 ritorno della funzione occorre analizzare le informazioni che essa
1221 restituisce; queste, al contrario delle precedenti \func{wait} e
1222 \func{waitpid} che usavano un semplice valore numerico, sono ritornate in una
1223 struttura di tipo \struct{siginfo\_t} (vedi fig.~\ref{fig:sig_siginfo_t})
1224 all'indirizzo puntato dall'argomento \param{infop}.
1225
1226 Tratteremo nei dettagli la struttura \struct{siginfo\_t} ed il significato dei
1227 suoi vari campi in sez.~\ref{sec:sig_sigaction}, per quanto ci interessa qui
1228 basta dire che al ritorno di \func{waitid} verranno avvalorati i seguenti
1229 campi:
1230 \begin{basedescript}{\desclabelwidth{2.0cm}}
1231 \item[\var{si\_pid}] con il \acr{pid} del figlio.
1232 \item[\var{si\_uid}] con l'user-ID reale (vedi sez.~\ref{sec:proc_perms}) del
1233   figlio.
1234 \item[\var{si\_signo}] con \const{SIGCHLD}.
1235 \item[\var{si\_status}] con lo stato di uscita del figlio o con il segnale che
1236   lo ha terminato, fermato o riavviato.
1237 \item[\var{si\_code}] con uno fra \const{CLD\_EXITED}, \const{CLD\_KILLED},
1238   \const{CLD\_STOPPED}, \const{CLD\_CONTINUED} (vedi tab.~\ref{xxx_si_code}).
1239 \end{basedescript}
1240
1241 %TODO mettere riferimento alla tabella giusta (vedere man credentials e man
1242 %     waitid)
1243
1244 Infine Linux, seguendo un'estensione di BSD, supporta altre due funzioni per
1245 la lettura dello stato di terminazione di un processo, analoghe alle
1246 precedenti ma che prevedono un ulteriore argomento attraverso il quale il
1247 kernel può restituire al padre informazioni sulle risorse (vedi
1248 sez.~\ref{sec:sys_res_limits}) usate dal processo terminato e dai vari figli.
1249 Le due funzioni sono \funcd{wait3} e \funcd{wait4}, che diventano accessibili
1250 definendo la macro \macro{\_USE\_BSD}; i loro prototipi sono:
1251 \begin{functions}
1252   \headdecl{sys/times.h} \headdecl{sys/types.h} \headdecl{sys/wait.h}
1253   \headdecl{sys/resource.h}
1254
1255   \funcdecl{pid\_t wait4(pid\_t pid, int *status, int options, struct rusage
1256     *rusage)}
1257   È identica a \func{waitpid} sia per comportamento che per i valori degli
1258   argomenti, ma restituisce in \param{rusage} un sommario delle risorse usate
1259   dal processo.
1260
1261   \funcdecl{pid\_t wait3(int *status, int options, struct rusage *rusage)}
1262   Prima versione, equivalente a \code{wait4(-1, \&status, opt, rusage)} è
1263   ormai deprecata in favore di \func{wait4}.
1264 \end{functions}
1265 \noindent
1266 la struttura \struct{rusage} è definita in \file{sys/resource.h}, e viene
1267 utilizzata anche dalla funzione \func{getrusage} (vedi
1268 sez.~\ref{sec:sys_resource_use}) per ottenere le risorse di sistema usate da un
1269 processo; la sua definizione è riportata in fig.~\ref{fig:sys_rusage_struct}.
1270
1271 \subsection{La funzione \func{exec} e le funzioni di esecuzione dei programmi}
1272 \label{sec:proc_exec}
1273
1274 Abbiamo già detto che una delle modalità principali con cui si utilizzano i
1275 processi in Unix è quella di usarli per lanciare nuovi programmi: questo viene
1276 fatto attraverso una delle funzioni della famiglia \func{exec}. Quando un
1277 processo chiama una di queste funzioni esso viene completamente sostituito dal
1278 nuovo programma; il \acr{pid} del processo non cambia, dato che non viene
1279 creato un nuovo processo, la funzione semplicemente rimpiazza lo
1280 \itindex{stack} \textit{stack}, lo \itindex{heap} \textit{heap}, i
1281 \index{segmento!dati} dati ed il \index{segmento!testo} testo del processo
1282 corrente con un nuovo programma letto da disco.
1283
1284 Ci sono sei diverse versioni di \func{exec} (per questo la si è chiamata
1285 famiglia di funzioni) che possono essere usate per questo compito, in realtà
1286 (come mostrato in fig.~\ref{fig:proc_exec_relat}), sono tutte un front-end a
1287 \funcd{execve}. Il prototipo di quest'ultima è:
1288 \begin{prototype}{unistd.h}
1289 {int execve(const char *filename, char *const argv[], char *const envp[])}
1290   Esegue il programma contenuto nel file \param{filename}.
1291
1292   \bodydesc{La funzione ritorna solo in caso di errore, restituendo -1; nel
1293     qual caso \var{errno} può assumere i valori:
1294   \begin{errlist}
1295   \item[\errcode{EACCES}] il file non è eseguibile, oppure il filesystem è
1296     montato in \cmd{noexec}, oppure non è un file regolare o un interprete.
1297   \item[\errcode{EPERM}] il file ha i bit \itindex{suid~bit} \acr{suid} o
1298     \itindex{sgid~bit} \acr{sgid}, l'utente non è root, il processo viene
1299     tracciato, o il filesystem è montato con l'opzione \cmd{nosuid}.
1300   \item[\errcode{ENOEXEC}] il file è in un formato non eseguibile o non
1301     riconosciuto come tale, o compilato per un'altra architettura.
1302   \item[\errcode{ENOENT}] il file o una delle librerie dinamiche o l'interprete
1303     necessari per eseguirlo non esistono.
1304   \item[\errcode{ETXTBSY}] l'eseguibile è aperto in scrittura da uno o più
1305     processi.
1306   \item[\errcode{EINVAL}] l'eseguibile ELF ha più di un segmento
1307     \const{PF\_INTERP}, cioè chiede di essere eseguito da più di un
1308     interprete.
1309   \item[\errcode{ELIBBAD}] un interprete ELF non è in un formato
1310     riconoscibile.
1311   \item[\errcode{E2BIG}] la lista degli argomenti è troppo grande.
1312   \end{errlist}
1313   ed inoltre anche \errval{EFAULT}, \errval{ENOMEM}, \errval{EIO},
1314   \errval{ENAMETOOLONG}, \errval{ELOOP}, \errval{ENOTDIR}, \errval{ENFILE},
1315   \errval{EMFILE}.}
1316 \end{prototype}
1317
1318 La funzione \func{exec} esegue il file o lo script indicato da
1319 \param{filename}, passandogli la lista di argomenti indicata da \param{argv}
1320 e come ambiente la lista di stringhe indicata da \param{envp}; entrambe le
1321 liste devono essere terminate da un puntatore nullo. I vettori degli
1322 argomenti e dell'ambiente possono essere acceduti dal nuovo programma
1323 quando la sua funzione \func{main} è dichiarata nella forma
1324 \code{main(int argc, char *argv[], char *envp[])}.
1325
1326 Le altre funzioni della famiglia servono per fornire all'utente una serie di
1327 possibili diverse interfacce per la creazione di un nuovo processo. I loro
1328 prototipi sono:
1329 \begin{functions}
1330 \headdecl{unistd.h}
1331 \funcdecl{int execl(const char *path, const char *arg, ...)}
1332 \funcdecl{int execv(const char *path, char *const argv[])}
1333 \funcdecl{int execle(const char *path, const char *arg, ..., char
1334 * const envp[])}
1335 \funcdecl{int execlp(const char *file, const char *arg, ...)}
1336 \funcdecl{int execvp(const char *file, char *const argv[])}
1337
1338 Sostituiscono l'immagine corrente del processo con quella indicata nel primo
1339 argomento. Gli argomenti successivi consentono di specificare gli argomenti a
1340 linea di comando e l'ambiente ricevuti dal nuovo processo.
1341
1342 \bodydesc{Queste funzioni ritornano solo in caso di errore, restituendo -1;
1343   nel qual caso \var{errno} assumerà i valori visti in precedenza per
1344   \func{execve}.}
1345 \end{functions}
1346
1347 Per capire meglio le differenze fra le funzioni della famiglia si può fare
1348 riferimento allo specchietto riportato in tab.~\ref{tab:proc_exec_scheme}. La
1349 prima differenza riguarda le modalità di passaggio dei valori che poi andranno
1350 a costituire gli argomenti a linea di comando (cioè i valori di
1351 \param{argv} e \param{argc} visti dalla funzione \func{main} del programma
1352 chiamato).
1353
1354 Queste modalità sono due e sono riassunte dagli mnemonici \code{v} e \code{l}
1355 che stanno rispettivamente per \textit{vector} e \textit{list}. Nel primo caso
1356 gli argomenti sono passati tramite il vettore di puntatori \var{argv[]} a
1357 stringhe terminate con zero che costituiranno gli argomenti a riga di comando,
1358 questo vettore \emph{deve} essere terminato da un puntatore nullo.
1359
1360 Nel secondo caso le stringhe degli argomenti sono passate alla funzione come
1361 lista di puntatori, nella forma:
1362 \includecodesnip{listati/char_list.c}
1363 che deve essere terminata da un puntatore nullo.  In entrambi i casi vale la
1364 convenzione che il primo argomento (\var{arg0} o \var{argv[0]}) viene usato
1365 per indicare il nome del file che contiene il programma che verrà eseguito.
1366
1367 \begin{table}[!htb]
1368   \footnotesize
1369   \centering
1370   \begin{tabular}[c]{|l|c|c|c||c|c|c|}
1371     \hline
1372     \multicolumn{1}{|c|}{\textbf{Caratteristiche}} &
1373     \multicolumn{6}{|c|}{\textbf{Funzioni}} \\
1374     \hline
1375     &\func{execl}\texttt{ }&\func{execlp}&\func{execle}
1376     &\func{execv}\texttt{ }& \func{execvp}& \func{execve} \\
1377     \hline
1378     \hline
1379     argomenti a lista    &$\bullet$&$\bullet$&$\bullet$&&& \\
1380     argomenti a vettore  &&&&$\bullet$&$\bullet$&$\bullet$\\
1381     \hline
1382     filename completo     &$\bullet$&&$\bullet$&$\bullet$&&$\bullet$\\
1383     ricerca su \var{PATH} &&$\bullet$&&&$\bullet$& \\
1384     \hline
1385     ambiente a vettore   &&&$\bullet$&&&$\bullet$ \\
1386     uso di \var{environ} &$\bullet$&$\bullet$&&$\bullet$&$\bullet$& \\
1387     \hline
1388   \end{tabular}
1389   \caption{Confronto delle caratteristiche delle varie funzioni della
1390     famiglia \func{exec}.}
1391   \label{tab:proc_exec_scheme}
1392 \end{table}
1393
1394 La seconda differenza fra le funzioni riguarda le modalità con cui si
1395 specifica il programma che si vuole eseguire. Con lo mnemonico \code{p} si
1396 indicano le due funzioni che replicano il comportamento della shell nello
1397 specificare il comando da eseguire; quando l'argomento \param{file} non
1398 contiene una ``\texttt{/}'' esso viene considerato come un nome di programma,
1399 e viene eseguita automaticamente una ricerca fra i file presenti nella lista
1400 di directory specificate dalla variabile di ambiente \var{PATH}. Il file che
1401 viene posto in esecuzione è il primo che viene trovato. Se si ha un errore
1402 relativo a permessi di accesso insufficienti (cioè l'esecuzione della
1403 sottostante \func{execve} ritorna un \errcode{EACCES}), la ricerca viene
1404 proseguita nelle eventuali ulteriori directory indicate in \var{PATH}; solo se
1405 non viene trovato nessun altro file viene finalmente restituito
1406 \errcode{EACCES}.
1407
1408 Le altre quattro funzioni si limitano invece a cercare di eseguire il file
1409 indicato dall'argomento \param{path}, che viene interpretato come il
1410 \itindex{pathname} \textit{pathname} del programma.
1411
1412 \begin{figure}[htb]
1413   \centering
1414   \includegraphics[width=15cm]{img/exec_rel}
1415   \caption{La interrelazione fra le sei funzioni della famiglia \func{exec}.}
1416   \label{fig:proc_exec_relat}
1417 \end{figure}
1418
1419 La terza differenza è come viene passata la lista delle variabili di ambiente.
1420 Con lo mnemonico \texttt{e} vengono indicate quelle funzioni che necessitano
1421 di un vettore di parametri \var{envp[]} analogo a quello usato per gli
1422 argomenti a riga di comando (terminato quindi da un \val{NULL}), le altre
1423 usano il valore della variabile \var{environ} (vedi
1424 sez.~\ref{sec:proc_environ}) del processo di partenza per costruire
1425 l'ambiente.
1426
1427 Oltre a mantenere lo stesso \acr{pid}, il nuovo programma fatto partire da
1428 \func{exec} assume anche una serie di altre proprietà del processo chiamante;
1429 la lista completa è la seguente:
1430 \begin{itemize}
1431 \item il \textit{process id} (\acr{pid}) ed il \textit{parent process id}
1432   (\acr{ppid});
1433 \item l'\textsl{user-ID reale}, il \textit{group-ID reale} ed i
1434   \textsl{group-ID supplementari} (vedi sez.~\ref{sec:proc_access_id});
1435 \item il \textit{session ID} (\acr{sid}) ed il \itindex{process~group}
1436   \textit{process group ID} (\acr{pgid}), vedi sez.~\ref{sec:sess_proc_group};
1437 \item il terminale di controllo (vedi sez.~\ref{sec:sess_ctrl_term});
1438 \item il tempo restante ad un allarme (vedi sez.~\ref{sec:sig_alarm_abort});
1439 \item la directory radice e la directory di lavoro corrente (vedi
1440   sez.~\ref{sec:file_work_dir});
1441 \item la maschera di creazione dei file \itindex{umask} (\textit{umask}, vedi
1442   sez.~\ref{sec:file_perm_management}) ed i \textit{lock} sui file (vedi
1443   sez.~\ref{sec:file_locking});
1444 \item i segnali sospesi (\textit{pending}) e la maschera dei segnali (si veda
1445   sez.~\ref{sec:sig_sigmask});
1446 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
1447 \item i valori delle variabili \var{tms\_utime}, \var{tms\_stime},
1448   \var{tms\_cutime}, \var{tms\_ustime} (vedi sez.~\ref{sec:sys_cpu_times}).
1449 \end{itemize}
1450
1451 Inoltre i segnali che sono stati impostati per essere ignorati nel processo
1452 chiamante mantengono la stessa impostazione pure nel nuovo programma, tutti
1453 gli altri segnali vengono impostati alla loro azione predefinita. Un caso
1454 speciale è il segnale \const{SIGCHLD} che, quando impostato a
1455 \const{SIG\_IGN}, può anche non essere reimpostato a \const{SIG\_DFL} (si veda
1456 sez.~\ref{sec:sig_gen_beha}).
1457
1458 La gestione dei file aperti dipende dal valore che ha il flag di
1459 \itindex{close-on-exec} \textit{close-on-exec} (vedi anche
1460 sez.~\ref{sec:file_fcntl}) per ciascun file descriptor. I file per cui è
1461 impostato vengono chiusi, tutti gli altri file restano aperti. Questo
1462 significa che il comportamento predefinito è che i file restano aperti
1463 attraverso una \func{exec}, a meno di una chiamata esplicita a \func{fcntl}
1464 che imposti il suddetto flag.  Per le directory, lo standard POSIX.1 richiede
1465 che esse vengano chiuse attraverso una \func{exec}, in genere questo è fatto
1466 dalla funzione \func{opendir} (vedi sez.~\ref{sec:file_dir_read}) che effettua
1467 da sola l'impostazione del flag di \itindex{close-on-exec}
1468 \textit{close-on-exec} sulle directory che apre, in maniera trasparente
1469 all'utente.
1470
1471 Abbiamo detto che l'\textsl{user-ID reale} ed il \textsl{group-ID reale}
1472 restano gli stessi all'esecuzione di \func{exec}; normalmente vale lo stesso
1473 anche per l'\textsl{user-ID effettivo} ed il \textsl{group-ID effettivo} (il
1474 significato di questi identificatori è trattato in
1475 sez.~\ref{sec:proc_access_id}), tranne quando il file di cui viene chiesta
1476 l'esecuzione ha o il \itindex{suid~bit} \acr{suid} bit o lo \itindex{sgid~bit}
1477 \acr{sgid} bit impostato, in questo caso l'\textsl{user-ID effettivo} ed il
1478 \textsl{group-ID effettivo} vengono impostati rispettivamente all'utente o al
1479 gruppo cui il file appartiene (per i dettagli di questo comportamento si veda
1480 sez.~\ref{sec:proc_perms}).
1481
1482 Se il file da eseguire è in formato \emph{a.out} e necessita di librerie
1483 condivise, viene lanciato il \textit{linker} dinamico \cmd{/lib/ld.so} prima
1484 del programma per caricare le librerie necessarie ed effettuare il link
1485 dell'eseguibile.\footnote{il formato è ormai in completo disuso, per cui è
1486   molto probabile che non il relativo supporto non sia disponibile.} Se il
1487 programma è in formato ELF per caricare le librerie dinamiche viene usato
1488 l'interprete indicato nel segmento \const{PT\_INTERP} previsto dal formato
1489 stesso, in genere questo è \sysfile{/lib/ld-linux.so.1} per programmi
1490 collegati con le \acr{libc5}, e \sysfile{/lib/ld-linux.so.2} per programmi
1491 collegati con le \acr{glibc}.
1492
1493 Infine nel caso il file sia uno script esso deve iniziare con una linea nella
1494 forma \cmd{\#!/path/to/interpreter [argomenti]} dove l'interprete indicato
1495 deve essere un programma valido (binario, non un altro script) che verrà
1496 chiamato come se si fosse eseguito il comando \cmd{interpreter [argomenti]
1497   filename}.\footnote{si tenga presente che con Linux quanto viene scritto
1498   come \texttt{argomenti} viene passato all'interprete come un unico argomento
1499   con una unica stringa di lunghezza massima di 127 caratteri e se questa
1500   dimensione viene ecceduta la stringa viene troncata; altri Unix hanno
1501   dimensioni massime diverse, e diversi comportamenti, ad esempio FreeBSD
1502   esegue la scansione della riga e la divide nei vari argomenti e se è troppo
1503   lunga restituisce un errore di \const{ENAMETOOLONG}, una comparazione dei
1504   vari comportamenti si trova su
1505   \href{http://www.in-ulm.de/~mascheck/various/shebang/}
1506   {\textsf{http://www.in-ulm.de/\tild mascheck/various/shebang/}}.}
1507
1508 Con la famiglia delle \func{exec} si chiude il novero delle funzioni su cui è
1509 basata la gestione dei processi in Unix: con \func{fork} si crea un nuovo
1510 processo, con \func{exec} si lancia un nuovo programma, con \func{exit} e
1511 \func{wait} si effettua e verifica la conclusione dei processi. Tutte le
1512 altre funzioni sono ausiliarie e servono per la lettura e l'impostazione dei
1513 vari parametri connessi ai processi.
1514
1515
1516
1517 \section{Il controllo di accesso}
1518 \label{sec:proc_perms}
1519
1520 In questa sezione esamineremo le problematiche relative al controllo di
1521 accesso dal punto di vista dei processi; vedremo quali sono gli identificatori
1522 usati, come questi possono essere modificati nella creazione e nel lancio di
1523 nuovi processi, le varie funzioni per la loro manipolazione diretta e tutte le
1524 problematiche connesse ad una gestione accorta dei privilegi.
1525
1526
1527 \subsection{Gli identificatori del controllo di accesso}
1528 \label{sec:proc_access_id}
1529
1530 Come accennato in sez.~\ref{sec:intro_multiuser} il modello base\footnote{in
1531   realtà già esistono estensioni di questo modello base, che lo rendono più
1532   flessibile e controllabile, come le \itindex{capabilities}
1533   \textit{capabilities} illustrate in sez.~\ref{sec:proc_capabilities}, le ACL
1534   per i file (vedi sez.~\ref{sec:file_ACL}) o il
1535   \itindex{Mandatory~Access~Control~(MAC)} \textit{Mandatory Access Control}
1536   di \index{SELinux} SELinux; inoltre basandosi sul lavoro effettuato con
1537   SELinux, a partire dal kernel 2.5.x, è iniziato lo sviluppo di una
1538   infrastruttura di sicurezza, i \itindex{Linux~Security~Modules}
1539   \textit{Linux Security Modules}, o LSM, in grado di fornire diversi agganci
1540   a livello del kernel per modularizzare tutti i possibili controlli di
1541   accesso.} di sicurezza di un sistema unix-like è fondato sui concetti di
1542 utente e gruppo, e sulla separazione fra l'amministratore (\textsl{root},
1543 detto spesso anche \textit{superuser}) che non è sottoposto a restrizioni, ed
1544 il resto degli utenti, per i quali invece vengono effettuati i vari controlli
1545 di accesso.
1546
1547 Abbiamo già accennato come il sistema associ ad ogni utente e gruppo due
1548 identificatori univoci, lo user-ID ed il group-ID; questi servono al kernel per
1549 identificare uno specifico utente o un gruppo di utenti, per poi poter
1550 controllare che essi siano autorizzati a compiere le operazioni richieste.  Ad
1551 esempio in sez.~\ref{sec:file_access_control} vedremo come ad ogni file vengano
1552 associati un utente ed un gruppo (i suoi \textsl{proprietari}, indicati
1553 appunto tramite un \acr{uid} ed un \acr{gid}) che vengono controllati dal
1554 kernel nella gestione dei permessi di accesso.
1555
1556 Dato che tutte le operazioni del sistema vengono compiute dai processi, è
1557 evidente che per poter implementare un controllo sulle operazioni occorre
1558 anche poter identificare chi è che ha lanciato un certo programma, e pertanto
1559 anche a ciascun processo dovrà essere associato un utente e un gruppo.
1560
1561 Un semplice controllo di una corrispondenza fra identificativi non garantisce
1562 però sufficiente flessibilità per tutti quei casi in cui è necessario poter
1563 disporre di privilegi diversi, o dover impersonare un altro utente per un
1564 limitato insieme di operazioni. Per questo motivo in generale tutti gli Unix
1565 prevedono che i processi abbiano almeno due gruppi di identificatori, chiamati
1566 rispettivamente \textit{real} ed \textit{effective} (cioè \textsl{reali} ed
1567 \textsl{effettivi}). Nel caso di Linux si aggiungono poi altri due gruppi, il
1568 \textit{saved} (\textsl{salvati}) ed il \textit{filesystem} (\textsl{di
1569   filesystem}), secondo la situazione illustrata in
1570 tab.~\ref{tab:proc_uid_gid}.
1571
1572 \begin{table}[htb]
1573   \footnotesize
1574   \centering
1575   \begin{tabular}[c]{|c|c|l|p{7.3cm}|}
1576     \hline
1577     \textbf{Suffisso} & \textbf{Gruppo} & \textbf{Denominazione}
1578                                         & \textbf{Significato} \\
1579     \hline
1580     \hline
1581     \acr{uid}   & \textit{real} & \textsl{user-ID reale}
1582                 & Indica l'utente che ha lanciato il programma.\\
1583     \acr{gid}   & '' &\textsl{group-ID reale}
1584                 & Indica il gruppo principale dell'utente che ha lanciato
1585                   il programma.\\
1586     \hline
1587     \acr{euid}  & \textit{effective} &\textsl{user-ID effettivo}
1588                 & Indica l'utente usato nel controllo di accesso.\\
1589     \acr{egid}  & '' & \textsl{group-ID effettivo}
1590                 & Indica il gruppo usato nel controllo di accesso.\\
1591     --          & -- & \textsl{group-ID supplementari}
1592                 & Indicano gli ulteriori gruppi cui l'utente appartiene.\\
1593     \hline
1594     --          & \textit{saved} & \textsl{user-ID salvato}
1595                 & È una copia dell'\acr{euid} iniziale.\\
1596     --          & '' & \textsl{group-ID salvato}
1597                 & È una copia dell'\acr{egid} iniziale.\\
1598     \hline
1599     \acr{fsuid} & \textit{filesystem} &\textsl{user-ID di filesystem}
1600                 & Indica l'utente effettivo per l'accesso al filesystem. \\
1601     \acr{fsgid} & '' & \textsl{group-ID di filesystem}
1602                 & Indica il gruppo effettivo per l'accesso al filesystem.\\
1603     \hline
1604   \end{tabular}
1605   \caption{Identificatori di utente e gruppo associati a ciascun processo con
1606     indicazione dei suffissi usati dalle varie funzioni di manipolazione.}
1607   \label{tab:proc_uid_gid}
1608 \end{table}
1609
1610 Al primo gruppo appartengono l'\textsl{user-ID reale} ed il \textsl{group-ID
1611   reale}: questi vengono impostati al login ai valori corrispondenti
1612 all'utente con cui si accede al sistema (e relativo gruppo principale).
1613 Servono per l'identificazione dell'utente e normalmente non vengono mai
1614 cambiati. In realtà vedremo (in sez.~\ref{sec:proc_setuid}) che è possibile
1615 modificarli, ma solo ad un processo che abbia i privilegi di amministratore;
1616 questa possibilità è usata proprio dal programma \cmd{login} che, una volta
1617 completata la procedura di autenticazione, lancia una shell per la quale
1618 imposta questi identificatori ai valori corrispondenti all'utente che entra
1619 nel sistema.
1620
1621 Al secondo gruppo appartengono lo \textsl{user-ID effettivo} ed il
1622 \textsl{group-ID effettivo} (a cui si aggiungono gli eventuali \textsl{group-ID
1623   supplementari} dei gruppi dei quali l'utente fa parte).  Questi sono invece
1624 gli identificatori usati nelle verifiche dei permessi del processo e per il
1625 controllo di accesso ai file (argomento affrontato in dettaglio in
1626 sez.~\ref{sec:file_perm_overview}).
1627
1628 Questi identificatori normalmente sono identici ai corrispondenti del gruppo
1629 \textit{real} tranne nel caso in cui, come accennato in
1630 sez.~\ref{sec:proc_exec}, il programma che si è posto in esecuzione abbia i
1631 bit \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} impostati
1632 (il significato di questi bit è affrontato in dettaglio in
1633 sez.~\ref{sec:file_special_perm}). In questo caso essi saranno impostati
1634 all'utente e al gruppo proprietari del file. Questo consente, per programmi in
1635 cui ci sia necessità, di dare a qualunque utente normale privilegi o permessi
1636 di un altro (o dell'amministratore).
1637
1638 Come nel caso del \acr{pid} e del \acr{ppid}, anche tutti questi
1639 identificatori possono essere letti attraverso le rispettive funzioni:
1640 \funcd{getuid}, \funcd{geteuid}, \funcd{getgid} e \funcd{getegid}, i loro
1641 prototipi sono:
1642 \begin{functions}
1643   \headdecl{unistd.h}
1644   \headdecl{sys/types.h}
1645   \funcdecl{uid\_t getuid(void)} Restituisce l'\textsl{user-ID reale} del
1646   processo corrente.
1647
1648   \funcdecl{uid\_t geteuid(void)} Restituisce l'\textsl{user-ID effettivo} del
1649   processo corrente.
1650
1651   \funcdecl{gid\_t getgid(void)} Restituisce il \textsl{group-ID reale} del
1652   processo corrente.
1653
1654   \funcdecl{gid\_t getegid(void)} Restituisce il \textsl{group-ID effettivo}
1655   del processo corrente.
1656
1657   \bodydesc{Queste funzioni non riportano condizioni di errore.}
1658 \end{functions}
1659
1660 In generale l'uso di privilegi superiori deve essere limitato il più
1661 possibile, per evitare abusi e problemi di sicurezza, per questo occorre anche
1662 un meccanismo che consenta ad un programma di rilasciare gli eventuali
1663 maggiori privilegi necessari, una volta che si siano effettuate le operazioni
1664 per i quali erano richiesti, e a poterli eventualmente recuperare in caso
1665 servano di nuovo.
1666
1667 Questo in Linux viene fatto usando altri due gruppi di identificatori, il
1668 \textit{saved} ed il \textit{filesystem}. Il primo gruppo è lo stesso usato in
1669 SVr4, e previsto dallo standard POSIX quando è definita la costante
1670 \macro{\_POSIX\_SAVED\_IDS},\footnote{in caso si abbia a cuore la portabilità
1671   del programma su altri Unix è buona norma controllare sempre la
1672   disponibilità di queste funzioni controllando se questa costante è
1673   definita.} il secondo gruppo è specifico di Linux e viene usato per
1674 migliorare la sicurezza con NFS.
1675
1676 L'\textsl{user-ID salvato} ed il \textsl{group-ID salvato} sono copie
1677 dell'\textsl{user-ID effettivo} e del \textsl{group-ID effettivo} del processo
1678 padre, e vengono impostati dalla funzione \func{exec} all'avvio del processo,
1679 come copie dell'\textsl{user-ID effettivo} e del \textsl{group-ID effettivo}
1680 dopo che questi sono stati impostati tenendo conto di eventuali
1681 \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid}.  Essi quindi
1682 consentono di tenere traccia di quale fossero utente e gruppo effettivi
1683 all'inizio dell'esecuzione di un nuovo programma.
1684
1685 L'\textsl{user-ID di filesystem} e il \textsl{group-ID di filesystem} sono
1686 un'estensione introdotta in Linux per rendere più sicuro l'uso di NFS
1687 (torneremo sull'argomento in sez.~\ref{sec:proc_setuid}). Essi sono una
1688 replica dei corrispondenti identificatori del gruppo \textit{effective}, ai
1689 quali si sostituiscono per tutte le operazioni di verifica dei permessi
1690 relativi ai file (trattate in sez.~\ref{sec:file_perm_overview}).  Ogni
1691 cambiamento effettuato sugli identificatori effettivi viene automaticamente
1692 riportato su di essi, per cui in condizioni normali si può tranquillamente
1693 ignorarne l'esistenza, in quanto saranno del tutto equivalenti ai precedenti.
1694
1695
1696 \subsection{Le funzioni di gestione degli identificatori dei processi}
1697 \label{sec:proc_setuid}
1698
1699 Le due funzioni più comuni che vengono usate per cambiare identità (cioè
1700 utente e gruppo di appartenenza) ad un processo sono rispettivamente
1701 \funcd{setuid} e \funcd{setgid}; come accennato in
1702 sez.~\ref{sec:proc_access_id} in Linux esse seguono la semantica POSIX che
1703 prevede l'esistenza dell'\textit{user-ID salvato} e del \textit{group-ID
1704   salvato}; i loro prototipi sono:
1705 \begin{functions}
1706 \headdecl{unistd.h}
1707 \headdecl{sys/types.h}
1708
1709 \funcdecl{int setuid(uid\_t uid)} Imposta l'\textsl{user-ID} del processo
1710 corrente.
1711
1712 \funcdecl{int setgid(gid\_t gid)} Imposta il \textsl{group-ID} del processo
1713 corrente.
1714
1715 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso
1716   di fallimento: l'unico errore possibile è \errval{EPERM}.}
1717 \end{functions}
1718
1719 Il funzionamento di queste due funzioni è analogo, per cui considereremo solo
1720 la prima; la seconda si comporta esattamente allo stesso modo facendo
1721 riferimento al \textsl{group-ID} invece che all'\textsl{user-ID}.  Gli
1722 eventuali \textsl{group-ID supplementari} non vengono modificati.
1723
1724 L'effetto della chiamata è diverso a seconda dei privilegi del processo; se
1725 l'\textsl{user-ID effettivo} è zero (cioè è quello dell'amministratore di
1726 sistema) allora tutti gli identificatori (\textit{real}, \textit{effective} e
1727 \textit{saved}) vengono impostati al valore specificato da \param{uid},
1728 altrimenti viene impostato solo l'\textsl{user-ID effettivo}, e soltanto se il
1729 valore specificato corrisponde o all'\textsl{user-ID reale} o
1730 all'\textsl{user-ID salvato}. Negli altri casi viene segnalato un errore (con
1731 \errcode{EPERM}).
1732
1733 Come accennato l'uso principale di queste funzioni è quello di poter
1734 consentire ad un programma con i bit \itindex{suid~bit} \acr{suid} o
1735 \itindex{sgid~bit} \acr{sgid} impostati (vedi sez.~\ref{sec:file_special_perm})
1736 di riportare l'\textsl{user-ID effettivo} a quello dell'utente che ha lanciato
1737 il programma, effettuare il lavoro che non necessita di privilegi aggiuntivi,
1738 ed eventualmente tornare indietro.
1739
1740 Come esempio per chiarire l'uso di queste funzioni prendiamo quello con cui
1741 viene gestito l'accesso al file \sysfile{/var/log/utmp}.  In questo file viene
1742 registrato chi sta usando il sistema al momento corrente; chiaramente non può
1743 essere lasciato aperto in scrittura a qualunque utente, che potrebbe
1744 falsificare la registrazione. Per questo motivo questo file (e l'analogo
1745 \sysfile{/var/log/wtmp} su cui vengono registrati login e logout) appartengono
1746 ad un gruppo dedicato (\acr{utmp}) ed i programmi che devono accedervi (ad
1747 esempio tutti i programmi di terminale in X, o il programma \cmd{screen} che
1748 crea terminali multipli su una console) appartengono a questo gruppo ed hanno
1749 il bit \acr{sgid} impostato.
1750
1751 Quando uno di questi programmi (ad esempio \cmd{xterm}) viene lanciato, la
1752 situazione degli identificatori è la seguente:
1753 \begin{eqnarray*}
1754   \label{eq:1}
1755   \textsl{group-ID reale}      &=& \textrm{\acr{gid} (del chiamante)} \\
1756   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1757   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp}}
1758 \end{eqnarray*}
1759 in questo modo, dato che il \textsl{group-ID effettivo} è quello giusto, il
1760 programma può accedere a \sysfile{/var/log/utmp} in scrittura ed aggiornarlo.
1761 A questo punto il programma può eseguire una \code{setgid(getgid())} per
1762 impostare il \textsl{group-ID effettivo} a quello dell'utente (e dato che il
1763 \textsl{group-ID reale} corrisponde la funzione avrà successo), in questo modo
1764 non sarà possibile lanciare dal terminale programmi che modificano detto file,
1765 in tal caso infatti la situazione degli identificatori sarebbe:
1766 \begin{eqnarray*}
1767   \label{eq:2}
1768   \textsl{group-ID reale}      &=& \textrm{\acr{gid} (invariato)}  \\
1769   \textsl{group-ID effettivo}  &=& \textrm{\acr{gid}} \\
1770   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1771 \end{eqnarray*}
1772 e ogni processo lanciato dal terminale avrebbe comunque \acr{gid} come
1773 \textsl{group-ID effettivo}. All'uscita dal terminale, per poter di nuovo
1774 aggiornare lo stato di \sysfile{/var/log/utmp} il programma eseguirà una
1775 \code{setgid(utmp)} (dove \var{utmp} è il valore numerico associato al gruppo
1776 \acr{utmp}, ottenuto ad esempio con una precedente \func{getegid}), dato che
1777 in questo caso il valore richiesto corrisponde al \textsl{group-ID salvato} la
1778 funzione avrà successo e riporterà la situazione a:
1779 \begin{eqnarray*}
1780   \label{eq:3}
1781   \textsl{group-ID reale}      &=& \textrm{\acr{gid} (invariato)}  \\
1782   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1783   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1784 \end{eqnarray*}
1785 consentendo l'accesso a \sysfile{/var/log/utmp}.
1786
1787 Occorre però tenere conto che tutto questo non è possibile con un processo con
1788 i privilegi di amministratore, in tal caso infatti l'esecuzione di una
1789 \func{setuid} comporta il cambiamento di tutti gli identificatori associati al
1790 processo, rendendo impossibile riguadagnare i privilegi di amministratore.
1791 Questo comportamento è corretto per l'uso che ne fa \cmd{login} una volta che
1792 crea una nuova shell per l'utente; ma quando si vuole cambiare soltanto
1793 l'\textsl{user-ID effettivo} del processo per cedere i privilegi occorre
1794 ricorrere ad altre funzioni.
1795
1796 Le due funzioni \funcd{setreuid} e \funcd{setregid} derivano da BSD che, non
1797 supportando\footnote{almeno fino alla versione 4.3+BSD.} gli identificatori
1798 del gruppo \textit{saved}, le usa per poter scambiare fra di loro
1799 \textit{effective} e \textit{real}. I rispettivi prototipi sono:
1800 \begin{functions}
1801 \headdecl{unistd.h}
1802 \headdecl{sys/types.h}
1803
1804 \funcdecl{int setreuid(uid\_t ruid, uid\_t euid)} Imposta l'\textsl{user-ID
1805   reale} e l'\textsl{user-ID effettivo} del processo corrente ai valori
1806 specificati da \param{ruid} e \param{euid}.
1807
1808 \funcdecl{int setregid(gid\_t rgid, gid\_t egid)} Imposta il \textsl{group-ID
1809   reale} ed il \textsl{group-ID effettivo} del processo corrente ai valori
1810 specificati da \param{rgid} e \param{egid}.
1811
1812 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso
1813   di fallimento: l'unico errore possibile è \errval{EPERM}.}
1814 \end{functions}
1815
1816 La due funzioni sono analoghe ed il loro comportamento è identico; quanto
1817 detto per la prima riguardo l'user-ID, si applica immediatamente alla seconda
1818 per il group-ID. I processi non privilegiati possono impostare solo i valori
1819 del loro user-ID effettivo o reale; valori diversi comportano il fallimento
1820 della chiamata; l'amministratore invece può specificare un valore qualunque.
1821 Specificando un argomento di valore -1 l'identificatore corrispondente verrà
1822 lasciato inalterato.
1823
1824 Con queste funzioni si possono scambiare fra loro gli user-ID reale e
1825 effettivo, e pertanto è possibile implementare un comportamento simile a
1826 quello visto in precedenza per \func{setgid}, cedendo i privilegi con un primo
1827 scambio, e recuperandoli, eseguito il lavoro non privilegiato, con un secondo
1828 scambio.
1829
1830 In questo caso però occorre porre molta attenzione quando si creano nuovi
1831 processi nella fase intermedia in cui si sono scambiati gli identificatori, in
1832 questo caso infatti essi avranno un user-ID reale privilegiato, che dovrà
1833 essere esplicitamente eliminato prima di porre in esecuzione un nuovo
1834 programma (occorrerà cioè eseguire un'altra chiamata dopo la \func{fork} e
1835 prima della \func{exec} per uniformare l'user-ID reale a quello effettivo) in
1836 caso contrario il nuovo programma potrebbe a sua volta effettuare uno scambio
1837 e riottenere privilegi non previsti.
1838
1839 Lo stesso problema di propagazione dei privilegi ad eventuali processi figli
1840 si pone per l'user-ID salvato: questa funzione deriva da un'implementazione che
1841 non ne prevede la presenza, e quindi non è possibile usarla per correggere la
1842 situazione come nel caso precedente. Per questo motivo in Linux tutte le volte
1843 che si imposta un qualunque valore diverso da quello dall'user-ID reale
1844 corrente, l'user-ID salvato viene automaticamente uniformato al valore
1845 dell'user-ID effettivo.
1846
1847 Altre due funzioni, \funcd{seteuid} e \funcd{setegid}, sono un'estensione
1848 dello standard POSIX.1, ma sono comunque supportate dalla maggior parte degli
1849 Unix; esse vengono usate per cambiare gli identificatori del gruppo
1850 \textit{effective} ed i loro prototipi sono:
1851 \begin{functions}
1852 \headdecl{unistd.h}
1853 \headdecl{sys/types.h}
1854
1855 \funcdecl{int seteuid(uid\_t uid)} Imposta l'user-ID effettivo del processo
1856 corrente a \param{uid}.
1857
1858 \funcdecl{int setegid(gid\_t gid)} Imposta il group-ID effettivo del processo
1859 corrente a \param{gid}.
1860
1861 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso
1862   di fallimento: l'unico errore è \errval{EPERM}.}
1863 \end{functions}
1864
1865 Come per le precedenti le due funzioni sono identiche, per cui tratteremo solo
1866 la prima. Gli utenti normali possono impostare l'user-ID effettivo solo al
1867 valore dell'user-ID reale o dell'user-ID salvato, l'amministratore può
1868 specificare qualunque valore. Queste funzioni sono usate per permettere
1869 all'amministratore di impostare solo l'user-ID effettivo, dato che l'uso
1870 normale di \func{setuid} comporta l'impostazione di tutti gli identificatori.
1871
1872
1873 Le due funzioni \funcd{setresuid} e \funcd{setresgid} sono invece
1874 un'estensione introdotta in Linux,\footnote{per essere precisi a partire dal
1875   kernel 2.1.44.}  e permettono un completo controllo su tutti e tre i gruppi
1876 di identificatori (\textit{real}, \textit{effective} e \textit{saved}), i loro
1877 prototipi sono:
1878 \begin{functions}
1879 \headdecl{unistd.h}
1880 \headdecl{sys/types.h}
1881
1882 \funcdecl{int setresuid(uid\_t ruid, uid\_t euid, uid\_t suid)} Imposta
1883 l'user-ID reale, l'user-ID effettivo e l'user-ID salvato del processo corrente
1884 ai valori specificati rispettivamente da \param{ruid}, \param{euid} e
1885 \param{suid}.
1886
1887 \funcdecl{int setresgid(gid\_t rgid, gid\_t egid, gid\_t sgid)} Imposta il
1888 group-ID reale, il group-ID effettivo ed il group-ID salvato del processo
1889 corrente ai valori specificati rispettivamente da \param{rgid}, \param{egid} e
1890 \param{sgid}.
1891
1892 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso
1893   di fallimento: l'unico errore è \errval{EPERM}.}
1894 \end{functions}
1895
1896 Le due funzioni sono identiche, quanto detto per la prima riguardo gli user-ID
1897 si applica alla seconda per i group-ID. I processi non privilegiati possono
1898 cambiare uno qualunque degli user-ID solo ad un valore corrispondente o
1899 all'user-ID reale, o a quello effettivo o a quello salvato, l'amministratore
1900 può specificare i valori che vuole; un valore di -1 per un qualunque argomento
1901 lascia inalterato l'identificatore corrispondente.
1902
1903 Per queste funzioni esistono anche due controparti che permettono di leggere
1904 in blocco i vari identificatori: \funcd{getresuid} e \funcd{getresgid}; i loro
1905 prototipi sono:
1906 \begin{functions}
1907 \headdecl{unistd.h}
1908 \headdecl{sys/types.h}
1909
1910 \funcdecl{int getresuid(uid\_t *ruid, uid\_t *euid, uid\_t *suid)} Legge
1911 l'user-ID reale, l'user-ID effettivo e l'user-ID salvato del processo corrente.
1912
1913 \funcdecl{int getresgid(gid\_t *rgid, gid\_t *egid, gid\_t *sgid)} Legge il
1914 group-ID reale, il group-ID effettivo e il group-ID salvato del processo
1915 corrente.
1916
1917 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso di
1918   fallimento: l'unico errore possibile è \errval{EFAULT} se gli indirizzi delle
1919   variabili di ritorno non sono validi.}
1920 \end{functions}
1921
1922 Anche queste funzioni sono un'estensione specifica di Linux, e non richiedono
1923 nessun privilegio. I valori sono restituiti negli argomenti, che vanno
1924 specificati come puntatori (è un altro esempio di
1925 \itindex{value~result~argument} \textit{value result argument}). Si noti che
1926 queste funzioni sono le uniche in grado di leggere gli identificatori del
1927 gruppo \textit{saved}.
1928
1929
1930 Infine le funzioni \func{setfsuid} e \func{setfsgid} servono per impostare gli
1931 identificatori del gruppo \textit{filesystem} che sono usati da Linux per il
1932 controllo dell'accesso ai file.  Come già accennato in
1933 sez.~\ref{sec:proc_access_id} Linux definisce questo ulteriore gruppo di
1934 identificatori, che in circostanze normali sono assolutamente equivalenti a
1935 quelli del gruppo \textit{effective}, dato che ogni cambiamento di questi
1936 ultimi viene immediatamente riportato su di essi.
1937
1938 C'è un solo caso in cui si ha necessità di introdurre una differenza fra gli
1939 identificatori dei gruppi \textit{effective} e \textit{filesystem}, ed è per
1940 ovviare ad un problema di sicurezza che si presenta quando si deve
1941 implementare un server NFS.
1942
1943 Il server NFS infatti deve poter cambiare l'identificatore con cui accede ai
1944 file per assumere l'identità del singolo utente remoto, ma se questo viene
1945 fatto cambiando l'user-ID effettivo o l'user-ID reale il server si espone alla
1946 ricezione di eventuali segnali ostili da parte dell'utente di cui ha
1947 temporaneamente assunto l'identità.  Cambiando solo l'user-ID di filesystem si
1948 ottengono i privilegi necessari per accedere ai file, mantenendo quelli
1949 originari per quanto riguarda tutti gli altri controlli di accesso, così che
1950 l'utente non possa inviare segnali al server NFS.
1951
1952 Le due funzioni usate per cambiare questi identificatori sono \funcd{setfsuid}
1953 e \funcd{setfsgid}, ovviamente sono specifiche di Linux e non devono essere
1954 usate se si intendono scrivere programmi portabili; i loro prototipi sono:
1955 \begin{functions}
1956 \headdecl{sys/fsuid.h}
1957
1958 \funcdecl{int setfsuid(uid\_t fsuid)} Imposta l'user-ID di filesystem del
1959 processo corrente a \param{fsuid}.
1960
1961 \funcdecl{int setfsgid(gid\_t fsgid)} Imposta il group-ID di filesystem del
1962 processo corrente a \param{fsgid}.
1963
1964 \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso
1965   di fallimento: l'unico errore possibile è \errval{EPERM}.}
1966 \end{functions}
1967 \noindent queste funzioni hanno successo solo se il processo chiamante ha i
1968 privilegi di amministratore o, per gli altri utenti, se il valore specificato
1969 coincide con uno dei di quelli del gruppo \textit{real}, \textit{effective} o
1970 \textit{saved}.
1971
1972
1973 \subsection{Le funzioni per la gestione dei gruppi associati a un processo}
1974 \label{sec:proc_setgroups}
1975
1976 Le ultime funzioni che esamineremo sono quelle che permettono di operare sui
1977 gruppi supplementari cui un utente può appartenere. Ogni processo può avere
1978 almeno \const{NGROUPS\_MAX} gruppi supplementari\footnote{il numero massimo di
1979   gruppi secondari può essere ottenuto con \func{sysconf} (vedi
1980   sez.~\ref{sec:sys_sysconf}), leggendo il parametro
1981   \texttt{\_SC\_NGROUPS\_MAX}.} in aggiunta al gruppo primario; questi vengono
1982 ereditati dal processo padre e possono essere cambiati con queste funzioni.
1983
1984 La funzione che permette di leggere i gruppi supplementari associati ad un
1985 processo è \funcd{getgroups}; questa funzione è definita nello standard
1986 POSIX.1, ed il suo prototipo è:
1987 \begin{functions}
1988   \headdecl{sys/types.h}
1989   \headdecl{unistd.h}
1990
1991   \funcdecl{int getgroups(int size, gid\_t list[])}
1992
1993   Legge gli identificatori dei gruppi supplementari.
1994
1995   \bodydesc{La funzione restituisce il numero di gruppi letti in caso di
1996     successo e -1 in caso di fallimento, nel qual caso \var{errno} assumerà
1997     i valori:
1998     \begin{errlist}
1999     \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2000     \item[\errcode{EINVAL}] il valore di \param{size} è diverso da zero ma
2001       minore del numero di gruppi supplementari del processo.
2002     \end{errlist}}
2003 \end{functions}
2004
2005 La funzione legge gli identificatori dei gruppi supplementari del processo sul
2006 vettore \param{list} di dimensione \param{size}. Non è specificato se la
2007 funzione inserisca o meno nella lista il group-ID effettivo del processo. Se si
2008 specifica un valore di \param{size} uguale a 0 \param{list} non viene
2009 modificato, ma si ottiene il numero di gruppi supplementari.
2010
2011 Una seconda funzione, \funcd{getgrouplist}, può invece essere usata per
2012 ottenere tutti i gruppi a cui appartiene un certo utente; il suo prototipo è:
2013 \begin{functions}
2014   \headdecl{sys/types.h}
2015   \headdecl{grp.h}
2016
2017   \funcdecl{int getgrouplist(const char *user, gid\_t group, gid\_t *groups,
2018     int *ngroups)} Legge i gruppi supplementari.
2019
2020   \bodydesc{La funzione legge fino ad un massimo di \param{ngroups} valori,
2021     restituisce 0 in caso di successo e -1 in caso di fallimento.}
2022 \end{functions}
2023
2024 La funzione legge i gruppi supplementari dell'utente specificato da
2025 \param{user}, eseguendo una scansione del database dei gruppi (si veda
2026 sez.~\ref{sec:sys_user_group}). Ritorna poi in \param{groups} la lista di
2027 quelli a cui l'utente appartiene. Si noti che \param{ngroups} è passato come
2028 puntatore perché, qualora il valore specificato sia troppo piccolo, la
2029 funzione ritorna -1, passando indietro il numero dei gruppi trovati.
2030
2031 Per impostare i gruppi supplementari di un processo ci sono due funzioni, che
2032 possono essere usate solo se si hanno i privilegi di amministratore. La prima
2033 delle due è \funcd{setgroups}, ed il suo prototipo è:
2034 \begin{functions}
2035   \headdecl{sys/types.h}
2036   \headdecl{grp.h}
2037
2038   \funcdecl{int setgroups(size\_t size, gid\_t *list)}
2039
2040   Imposta i gruppi supplementari del processo.
2041
2042   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2043     fallimento, nel qual caso \var{errno} assumerà i valori:
2044     \begin{errlist}
2045     \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2046     \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2047     \item[\errcode{EINVAL}] il valore di \param{size} è maggiore del valore
2048     massimo consentito.
2049     \end{errlist}}
2050 \end{functions}
2051
2052 La funzione imposta i gruppi supplementari del processo corrente ai valori
2053 specificati nel vettore passato con l'argomento \param{list}, di dimensioni
2054 date dall'argomento \param{size}. Il numero massimo di gruppi supplementari è
2055 un parametro di sistema, che può essere ricavato con le modalità spiegate in
2056 sez.~\ref{sec:sys_characteristics}.
2057
2058 Se invece si vogliono impostare i gruppi supplementari del processo a quelli di
2059 un utente specifico, si può usare \funcd{initgroups} il cui prototipo è:
2060 \begin{functions}
2061   \headdecl{sys/types.h}
2062   \headdecl{grp.h}
2063
2064   \funcdecl{int initgroups(const char *user, gid\_t group)}
2065
2066   Inizializza la lista dei gruppi supplementari.
2067
2068   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2069     fallimento, nel qual caso \var{errno} assumerà gli stessi valori di
2070     \func{setgroups} più \errval{ENOMEM} quando non c'è memoria sufficiente
2071     per allocare lo spazio per informazioni dei gruppi.}
2072 \end{functions}
2073
2074 La funzione esegue la scansione del database dei gruppi (usualmente
2075 \conffile{/etc/group}) cercando i gruppi di cui è membro l'utente \param{user}
2076 con cui costruisce una lista di gruppi supplementari, a cui aggiunge anche
2077 \param{group}, infine imposta questa lista per il processo corrente usando
2078 \func{setgroups}.  Si tenga presente che sia \func{setgroups} che
2079 \func{initgroups} non sono definite nello standard POSIX.1 e che pertanto non
2080 è possibile utilizzarle quando si definisce \macro{\_POSIX\_SOURCE} o si
2081 compila con il flag \cmd{-ansi}, è pertanto meglio evitarle se si vuole
2082 scrivere codice portabile.
2083
2084
2085 \subsection{La gestione delle \textit{capabilities}}
2086 \label{sec:proc_capabilities}
2087
2088 \itindbeg{capabilities}
2089
2090 Come accennato in sez.~\ref{sec:proc_access_id} l'architettura classica della
2091 gestione dei privilegi in un sistema unix-like ha il sostanziale problema di
2092 fornire all'amministratore dei poteri troppo ampi, questo comporta che anche
2093 quando si siano predisposte delle misure di protezione per in essere in grado
2094 di difendersi dagli effetti di una eventuale compromissione del
2095 sistema,\footnote{come montare un filesystem in sola lettura per impedirne
2096   modifiche, o marcare un file come immutabile.} una volta che questa sia
2097 stata effettuata e si siano ottenuti i privilegi di amministratore, queste
2098 potranno essere comunque rimosse.\footnote{nei casi elencati nella precedente
2099   nota si potrà sempre rimontare il sistema in lettura-scrittura, o togliere
2100   la marcatura di immutabilità.}
2101
2102 Il problema consiste nel fatto che nell'architettura tradizionale di un
2103 sistema unix-like i controlli di accesso sono basati su un solo livello di
2104 separazione: per i processi normali essi sono posti in atto, mentre per i
2105 processi con i privilegi di amministratore essi non vengono neppure eseguiti;
2106 per questo motivo non era previsto alcun modo per evitare che un processo con
2107 diritti di amministratore non potesse eseguire certe operazioni, o per cedere
2108 definitivamente alcuni privilegi da un certo momento in poi.
2109
2110 Per ovviare a tutto ciò, a partire dai kernel della serie 2.2, è stato
2111 introdotto un meccanismo, detto \textit{capabilities}, che consentisse di
2112 suddividere i vari privilegi tradizionalmente associati all'amministratore in
2113 un insieme di \textsl{capacità} distinte.  L'idea era che queste capacità
2114 potessero essere abilitate e disabilitate in maniera indipendente per ciascun
2115 processo con privilegi di amministratore, permettendo così una granularità
2116 molto più fine nella distribuzione degli stessi che evitasse la originaria
2117 situazione di \textsl{tutto o nulla}.
2118
2119 Il meccanismo completo delle \textit{capabilities}\footnote{l'implementazione
2120   di Linux si rifà ad una bozza per quello che dovrebbe divenire lo standard
2121   POSIX.1e, che prevede questa funzionalità.} prevederebbe anche la
2122 possibilità di associare le stesse \textit{capabilities} anche ai singoli file
2123 eseguibili,\footnote{una descrizione sommaria di questa funzionalità è
2124   riportata nella pagina di manuale che descrive l'implementazione delle
2125   \textit{capabilities} con Linux (accessibile con \texttt{man capabilities}),
2126   ma non essendo implementata non ne tratteremo qui.} in modo da poter
2127 stabilire quali capacità possono essere utilizzate quando viene messo in
2128 esecuzione uno specifico programma; attualmente però questa funzionalità non è
2129 implementata.\footnote{per attualmente si intende fino al kernel 2.6.23;
2130   benché l'infrastruttura per crearla sia presente (vedi anche
2131   sez.~\ref{sec:file_xattr}) finora non è disponibile nessuna realizzazione
2132   delle specifiche POSIX.1e, esistono però dei patch di sicurezza del kernel,
2133   come LIDS (vedi \href{http://www.lids.org}{\textsf{http://www.lids.org/})}
2134   che realizzano qualcosa di simile.}
2135
2136 % TODO verificare per process capability bounding set, vedi:
2137 %  http://git.kernel.org/git/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commit;h=3b7391de67da515c91f48aa371de77cb6cc5c07e
2138
2139 % TODO capire cosa cambia con i patch del 2.6.26, vedi
2140 % http://lwn.net/Articles/280279/
2141
2142 \begin{table}[!h!bt]
2143   \centering
2144   \footnotesize
2145   \begin{tabular}{|l|p{12cm}|}
2146     \hline
2147     \textbf{Capacità}&\textbf{Descrizione}\\
2148     \hline
2149     \hline
2150 %
2151 % POSIX-draft defined capabilities.
2152 %
2153     \const{CAP\_CHOWN}      & La capacità di cambiare proprietario e gruppo
2154                               proprietario di un file (vedi
2155                               sez.~\ref{sec:file_ownership_management}).\\
2156     \const{CAP\_DAC\_OVERRIDE}& La capacità di evitare il controllo dei
2157                               permessi di lettura, scrittura ed esecuzione dei
2158                               file, (vedi sez.~\ref{sec:file_access_control})
2159                               caratteristici del modello classico del
2160                               controllo di accesso chiamato
2161                               \itindex{Discrectionary~Access~Control~(DAC)}
2162                               \textit{Discrectionary Access Control} (da cui
2163                               il nome DAC).\\
2164     \const{CAP\_DAC\_READ\_SEARCH}& La capacità di evitare il controllo dei
2165                               permessi di lettura, scrittura ed esecuzione per
2166                               le directory (vedi
2167                               sez.~\ref{sec:file_access_control}).\\
2168     \const{CAP\_FOWNER}     & La capacità di evitare il controllo che
2169                               l'user-ID effettivo del processo (o meglio il
2170                               \textit{filesystem user-ID}, vedi
2171                               sez.~\ref{sec:proc_setuid}) coincida con
2172                               quello del proprietario di un file per tutte
2173                               le operazioni privilegiate non coperte dalle
2174                               precedenti \const{CAP\_DAC\_OVERRIDE} e
2175                               \const{CAP\_DAC\_READ\_SEARCH}. Queste
2176                               comprendono i cambiamenti dei permessi e dei
2177                               tempi del file (vedi
2178                               sez.~\ref{sec:file_perm_management} e
2179                               sez.~\ref{sec:file_file_times}), le impostazioni
2180                               degli attributi estesi (con il comando
2181                               \cmd{chattr}) e delle ACL, poter ignorare lo
2182                               \itindex{sticky~bit} \textit{sticky bit} nella
2183                               cancellazione dei file (vedi
2184                               sez.~\ref{sec:file_special_perm}), la possibilità
2185                               di impostare il flag di \const{O\_NOATIME} con
2186                               \func{open} e \func{fcntl} (vedi
2187                               sez.~\ref{sec:file_open} e
2188                               sez.~\ref{sec:file_fcntl}).\\
2189     \const{CAP\_FSETID}     & La capacità di evitare la cancellazione
2190                               automatica dei bit \itindex{suid~bit} \acr{suid}
2191                               e \itindex{sgid~bit} \acr{sgid} quando un file
2192                               per i quali sono impostati viene modificato da
2193                               un processo senza questa capacità e la capacità
2194                               di impostare il bit \acr{sgid} su un file anche
2195                               quando questo è relativo ad un gruppo cui non si
2196                               appartiene (vedi
2197                               sez.~\ref{sec:file_perm_management}).\\
2198     \const{CAP\_KILL}       & La capacità di mandare segnali a qualunque
2199                               processo (vedi sez.~\ref{sec:sig_kill_raise}).\\
2200     \const{CAP\_SETGID}     & La capacità di manipolare i group ID dei
2201                               processi, sia il principale che i supplementari,
2202                               (vedi sez.~\ref{sec:proc_setgroups} che quelli
2203                               trasmessi tramite i socket \textit{unix domain}
2204                               (vedi sez.~\ref{sec:unix_socket}).\\
2205     \const{CAP\_SETUID}     & La capacità di manipolare gli user ID del
2206                               processo (con \func{setuid}, \func{setreuid},
2207                               \func{setresuid}, \func{setfsuid}) e di
2208                               trasmettere un valore arbitrario
2209                               dell'\textsl{uid} nel passaggio delle
2210                               credenziali coi socket \textit{unix domain} (vedi
2211                               sez.~\ref{sec:unix_socket}).\\
2212 %
2213 % Linux specific capabilities
2214 %
2215 \hline
2216     \const{CAP\_SETPCAP}    & La capacità di impostare o rimuovere una capacità
2217                               (limitatamente a quelle che il processo
2218                               chiamante ha nel suo insieme di capacità
2219                               permesse) da qualunque processo.\\
2220 % TODO cambiata nel 2.4.24 rc1 ?
2221     \const{CAP\_LINUX\_IMMUTABLE}& La capacità di impostare gli attributi
2222                               \textit{immutable} e \itindex{append~mode}
2223                               \textit{append only} per i file su un
2224                               filesystem che supporta questi
2225                               attributi estesi.\\
2226     \const{CAP\_NET\_BIND\_SERVICE}& La capacità di porre in ascolto server
2227                               su porte riservate (vedi
2228                               sez.~\ref{sec:TCP_func_bind}).\\
2229     \const{CAP\_NET\_BROADCAST}& La capacità di consentire l'uso di socket in
2230                               \itindex{broadcast} \textit{broadcast} e
2231                               \itindex{multicast} \textit{multicast}.\\
2232     \const{CAP\_NET\_ADMIN} & La capacità di eseguire alcune operazioni
2233                               privilegiate sulla rete (impostare le opzioni
2234                               privilegiate dei socket, abilitare il
2235                               \itindex{multicast} \textit{multicasting},
2236                               impostare interfacce di rete e
2237                               tabella di instradamento).\\
2238     \const{CAP\_NET\_RAW}   & La capacità di usare socket \texttt{RAW} e
2239                               \texttt{PACKET} (quelli che permettono di creare
2240                               pacchetti nei protocolli di basso livello).\\
2241     \const{CAP\_IPC\_LOCK}  & La capacità di effettuare il \textit{memory
2242                               locking} \itindex{memory~locking} con le
2243                               funzioni \func{mlock}, \func{mlockall},
2244                               \func{shmctl}, \func{mmap} (vedi
2245                               sez.~\ref{sec:proc_mem_lock} e
2246                               sez.~\ref{sec:file_memory_map}). \\
2247     \const{CAP\_IPC\_OWNER} & La capacità di evitare il controllo dei permessi
2248                               per le operazioni sugli oggetti di
2249                               intercomunicazione fra processi (vedi
2250                               sez.~\ref{sec:ipc_sysv}).\\
2251     \const{CAP\_SYS\_MODULE}& La capacità di caricare e rimuovere moduli del
2252                               kernel. \\
2253     \const{CAP\_SYS\_RAWIO} & La capacità di eseguire operazioni sulle porte
2254                               di I/O con \func{ioperm} e \func{iopl} (vedi
2255                               sez.~\ref{sec:file_io_port}).\\
2256     \const{CAP\_SYS\_CHROOT}& La capacità di eseguire la funzione
2257                               \func{chroot} (vedi
2258                               sez.~\ref{sec:file_chroot}).\\
2259     \const{CAP\_SYS\_PTRACE}& Consente di tracciare qualunque processo con
2260                               \func{ptrace} (vedi
2261                               sez.~\ref{sec:xxx_ptrace}).\\
2262     \const{CAP\_SYS\_PACCT} & La capacità di usare le funzioni di
2263                               \textit{accounting} dei processi (vedi
2264                               sez.~\ref{sec:sys_bsd_accounting}).\\
2265     \const{CAP\_SYS\_ADMIN} & La capacità di eseguire una serie di compiti
2266                               amministrativi (come impostare le quote,
2267                               attivare e disattivare la swap, montare,
2268                               rimontare e smontare filesystem, ecc.). \\
2269     \const{CAP\_SYS\_BOOT}  & La capacità di fare eseguire un riavvio del
2270                               sistema.\\
2271     \const{CAP\_SYS\_NICE}  & La capacità di modificare le priorità dei
2272                               processi (vedi sez.~\ref{sec:proc_priority}). \\
2273     \const{CAP\_SYS\_RESOURCE}& La capacità di superare le limitazioni sulle
2274                               risorse, aumentare le quote disco, usare lo
2275                               spazio disco riservato all'amministratore.\\
2276     \const{CAP\_SYS\_TIME}  & La capacità di modificare il tempo di sistema
2277                               (vedi sez.~\ref{sec:sys_time}).\\
2278     \const{CAP\_SYS\_TTY\_CONFIG}& La capacità di simulare un \textit{hangup}
2279                               della console, con la funzione
2280                               \func{vhangup}.\\
2281     \const{CAP\_MKNOD}      & La capacità di creare file di dispositivo con la
2282                               funzione \func{mknod} (vedi
2283                               sez.~\ref{sec:file_mknod}).\footnotemark\\
2284     \const{CAP\_LEASE}      & La capacità di creare dei \textit{file lease}
2285                               \index{file!lease} su di un file (vedi
2286                               sez.~\ref{sec:file_asyncronous_lease})
2287                               indipendentemente dalla proprietà dello
2288                               stesso.\footnotemark\\
2289     \const{CAP\_SETFCAP}    & La capacità di impostare le
2290                               \textit{capabilities} di un file (non
2291                               supportata).\\
2292     \hline
2293   \end{tabular}
2294   \caption{Le costanti che identificano le \textit{capabilities} presenti nel
2295     kernel.}
2296 \label{tab:proc_capabilities}
2297 \end{table}
2298
2299 \footnotetext[21]{questa capacità è presente soltanto a partire dai kernel
2300   della serie 2.4.x.}
2301
2302 \footnotetext{questa capacità è presente soltanto a partire dai kernel della
2303   serie 2.4.x.}
2304
2305 Per gestire questo nuovo meccanismo ciascun processo porta con sé tre distinti
2306 insiemi di \textit{capabilities}, che vengono denominati rispettivamente
2307 \textit{effective}, \textit{permitted} ed \textit{inherited}. Questi insiemi
2308 vengono mantenuti in forma di tre diverse maschere binarie,\footnote{il kernel
2309   li mantiene, come i vari identificatori di sez.~\ref{sec:proc_setuid},
2310   all'interno della \struct{task\_struct} di ciascun processo (vedi
2311   fig.~\ref{fig:proc_task_struct}), nei tre campi \texttt{cap\_effective},
2312   \texttt{cap\_inheritable}, \texttt{cap\_permitted} del tipo
2313   \texttt{kernel\_cap\_t}; questo è attualmente definito come intero a 32 bit,
2314   il che comporta un massimo di 32 \textit{capabilities} distinte.} in cui
2315 ciascun bit corrisponde ad una capacità diversa; se ne è riportato
2316 l'elenco,\footnote{si tenga presente che l'elenco delle \textit{capabilities}
2317   presentato questa tabella, ripreso dalla relativa pagina di manuale
2318   (accessibile con \texttt{man capabilities}) e dalle definizioni in
2319   \texttt{sys/capabilities.h}, è quello aggiornato al kernel 2.6.6.} con una
2320 breve descrizione, ed il nome delle costanti che identificano i singoli bit,
2321 in tab.~\ref{tab:proc_capabilities}; la tabella è divisa in due parti, la
2322 prima riporta le \textit{capabilities} previste nella bozza dello standard
2323 POSIX1.e, la seconda quelle specifiche di Linux.
2324
2325 L'utilizzo di tre distinti insiemi serve a fornire una interfaccia flessibile
2326 per l'uso delle \textit{capabilities}, con scopi analoghi a quelli per cui
2327 sono mantenuti i diversi insiemi di identificatori di
2328 sez.~\ref{sec:proc_setuid}; il loro significato è il seguente:
2329 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
2330 \item[\textit{effective}] l'insieme delle \textit{capabilities}
2331   ``\textsl{effettive}'', cioè di quelle che vengono effettivamente usate dal
2332   kernel quando deve eseguire il controllo di accesso per le varie operazioni
2333   compiute dal processo.
2334 \item[\textit{permitted}] l'insieme delle \textit{capabilities}
2335   ``\textsl{permesse}'', cioè l'insieme di quelle capacità che un processo
2336   \textsl{può} impostare come \textsl{effettive}. Se un processo cancella una
2337   capacità da questo insieme non potrà più riassumerla (almeno che non esegua
2338   un programma che è \acr{suid} di root).
2339 \item[\textit{inherited}] l'insieme delle \textit{capabilities}
2340   ``\textsl{ereditabili}'', cioè quelle che vengono trasmesse ad un nuovo
2341   programma eseguito attraverso una chiamata ad \func{exec} (con l'eccezione
2342   del caso che questo sia \acr{suid} di root).
2343 \label{sec:capabilities_set}
2344 \end{basedescript}
2345
2346 Oltre a questi tre insiemi, che sono relativi al singolo processo, il kernel
2347 mantiene un insieme generale valido per tutto il sistema, chiamato
2348 \itindex{capabilities~bounding~set} \textit{capabilities bounding set}. Ogni
2349 volta che un programma viene posto in esecuzione con \func{exec} il contenuto
2350 degli insiemi \textit{effective} e \textit{permitted} vengono mascherati con
2351 un \textsl{AND} binario del contenuto corrente del \textit{capabilities
2352   bounding set}, così che il nuovo processo potrà disporre soltanto delle
2353 capacità in esso elencate.
2354
2355 Il \textit{capabilities bounding set} è un parametro di sistema, accessibile
2356 attraverso il contenuto del file \procfile{/proc/sys/kernel/cap-bound}, che per
2357 questa sua caratteristica consente di impostare un limite generale alle
2358 capacità che possono essere accordate ai vari processi.  Questo valore può
2359 essere impostato ad un valore arbitrario esclusivamente dal primo processo
2360 eseguito nel sistema (di norma cioè da \texttt{/sbin/init}), ogni processo
2361 eseguito successivamente (cioè con \textsl{pid} diverso da 1) anche se
2362 eseguito con privilegi di amministratore potrà soltanto rimuovere uno dei bit
2363 già presenti dell'insieme: questo significa che una volta rimossa una
2364 \textit{capability} dal \textit{capabilities bounding set} essa non sarà più
2365 disponibile, neanche per l'amministratore, a meno di un riavvio.
2366
2367 Quando un programma viene messo in esecuzione\footnote{cioè quando viene
2368   eseguita la \func{execve} con cui lo si lancia; in corrispondenza di una
2369   \func{fork} le \textit{capabilities} non vengono modificate.} esso eredita
2370 (nel senso che assume negli insiemi \textit{effective} e \textit{permitted})
2371 le \textit{capabilities} mantenute nell'insieme \textit{inherited}, a meno che
2372 non sia eseguito un programma \acr{suid} di root o la \func{exec} sia stata
2373 eseguita da un programma con \textsl{uid} reale zero; in tal caso il programma
2374 ottiene tutte le \textit{capabilities} presenti nel \textit{capabilities
2375   bounding set}. In questo modo si può far si che ad un processo eseguito in
2376 un secondo tempo possano essere trasmesse solo un insieme limitato di
2377 capacità, impedendogli di recuperare quelle assenti nell'insieme
2378 \textit{inherited}. Si tenga presente invece che attraverso una \func{fork}
2379 vengono mantenute le stesse capacità del processo padre.
2380
2381 Per la gestione delle \textit{capabilities} il kernel mette a disposizione due
2382 funzioni che permettono rispettivamente di leggere ed impostare i valori dei
2383 tre insiemi illustrati in precedenza. Queste due funzioni sono \funcd{capget}
2384 e \funcd{capset} e costituiscono l'interfaccia di gestione basso livello; i
2385 loro rispettivi prototipi sono:
2386 \begin{functions}
2387   \headdecl{sys/capability.h}
2388
2389   \funcdecl{int capget(cap\_user\_header\_t hdrp, cap\_user\_data\_t datap)}
2390   Legge le \textit{capabilities}.
2391
2392   \funcdecl{int capset(cap\_user\_header\_t hdrp, const cap\_user\_data\_t
2393     datap)}
2394   Imposta le \textit{capabilities}.
2395
2396
2397   \bodydesc{Entrambe le funzioni ritornano 0 in caso di successo e -1 in caso
2398     di errore, nel qual caso \var{errno} può assumere i valori:
2399     \begin{errlist}
2400     \item[\errcode{ESRCH}] si è fatto riferimento ad un processo inesistente.
2401     \item[\errcode{EPERM}] si è tentato di aggiungere una capacità
2402       nell'insieme delle \textit{capabilities} permesse, o di impostare una
2403       capacità non presente nell'insieme di quelle permesse negli insieme
2404       delle effettive o ereditate, o si è cercato di impostare una
2405       \textit{capability} di un altro processo senza avare
2406       \const{CAP\_SETPCAP}.
2407   \end{errlist}
2408   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2409 }
2410
2411 \end{functions}
2412
2413 Queste due funzioni prendono come argomenti due tipi di dati dedicati,
2414 definiti come puntatori a due strutture specifiche di Linux, illustrate in
2415 fig.~\ref{fig:cap_kernel_struct}. Per poterle utilizzare occorre anche
2416 cancellare la macro \macro{\_POSIX\_SOURCE}.\footnote{per farlo occorre
2417   utilizzare la direttiva di preprocessore \direct{undef}; si dovrà cioè
2418   inserire una istruzione \texttt{\#undef \_POSIX\_SOURCE} prima di includere
2419   \texttt{sys/capability.h}.} Si tenga presente che le strutture di
2420 fig.~\ref{fig:cap_kernel_struct}, come i prototipi delle due funzioni
2421 \func{capget} e \func{capset}, sono soggette ad essere modificate con il
2422 cambiamento del kernel (in particolare i tipi di dati delle strutture) ed
2423 anche se finora l'interfaccia è risultata stabile, non c'è nessuna
2424 assicurazione che questa venga mantenuta.\footnote{anzi, visto lo scarso
2425   utilizzo di questa funzionalità ci sono state varie discussioni fra gli
2426   sviluppatori del kernel relative all'eliminarla o al modificarla
2427   radicalmente.} Pertanto se si vogliono scrivere programmi portabili che
2428 possano essere eseguiti su qualunque versione del kernel è opportuno
2429 utilizzare le interfacce di alto livello.
2430
2431 \begin{figure}[!htb]
2432   \footnotesize
2433   \centering
2434   \begin{minipage}[c]{15cm}
2435     \includestruct{listati/cap_user_header_t.h}
2436   \end{minipage}
2437   \normalsize
2438   \caption{Definizione delle strutture a cui fanno riferimento i puntatori
2439     \structd{cap\_user\_header\_t} e \structd{cap\_user\_data\_t} usati per
2440     l'interfaccia di gestione di basso livello delle \textit{capabilities}.}
2441   \label{fig:cap_kernel_struct}
2442 \end{figure}
2443
2444 La struttura a cui deve puntare l'argomento \param{hdrp} serve ad indicare,
2445 tramite il campo \var{pid}, il processo del quale si vogliono leggere o
2446 modificare le \textit{capabilities}. Il campo \var{version} deve essere
2447 impostato al valore della versione delle usata dal kernel (quello indicato
2448 dalla costante \const{\_LINUX\_CAPABILITY\_VERSION} di
2449 fig.~\ref{fig:cap_kernel_struct}) altrimenti le funzioni ritorneranno con un
2450 errore di \errcode{EINVAL}, restituendo nel campo stesso il valore corretto
2451 della versione in uso.  La struttura a cui deve puntare l'argomento
2452 \param{datap} invece conterrà i valori letti o da impostare per i tre insiemi
2453 delle capacità del processo.
2454
2455 Dato che le precedenti funzioni, oltre ad essere specifiche di Linux, non
2456 garantiscono la stabilità nell'interfaccia, è sempre opportuno effettuare la
2457 gestione delle \textit{capabilities} utilizzando le funzioni di libreria a
2458 questo dedicate. Queste funzioni, che seguono quanto previsto nelle bozze
2459 dello standard POSIX.1e, non fanno parte delle \acr{glibc} e sono fornite in
2460 una libreria a parte,\footnote{la libreria è \texttt{libcap2}, nel caso di
2461   Debian può essere installata con il pacchetto omonimo.} pertanto se un
2462 programma le utilizza si dovrà indicare esplicitamente l'uso della suddetta
2463 libreria attraverso l'opzione \texttt{-lcap} del compilatore.
2464
2465 Le funzioni dell'interfaccia delle bozze di POSIX.1e prevedono l'uso di uno
2466 tipo di dato opaco, \type{cap\_t}, come puntatore ai dati mantenuti nel
2467 cosiddetto \textit{capability state},\footnote{si tratta in sostanza di un
2468   puntatore ad una struttura interna utilizzata dalle librerie, i cui campi
2469   non devono mai essere acceduti direttamente.} in sono memorizzati tutti i
2470 dati delle \textit{capabilities}. In questo modo è possibile mascherare i
2471 dettagli della gestione di basso livello, che potranno essere modificati senza
2472 dover cambiare le funzioni dell'interfaccia, che faranno riferimento soltanto
2473 ad oggetti di questo tipo.  L'interfaccia pertanto non soltanto fornisce le
2474 funzioni per modificare e leggere le \textit{capabilities}, ma anche quelle
2475 per gestire i dati attraverso \type{cap\_t}.
2476
2477 La prima funzione dell'interfaccia è quella che permette di inizializzare un
2478 \textit{capability state}, allocando al contempo la memoria necessaria per i
2479 relativi dati. La funzione è \funcd{cap\_init} ed il suo prototipo è:
2480 \begin{functions}
2481   \headdecl{sys/capability.h}
2482
2483   \funcdecl{cap\_t cap\_init(void)}
2484   Crea ed inizializza un \textit{capability state}.
2485
2486   \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
2487     \macro{NULL} in caso di errore, nel qual caso \var{errno} assumerà il
2488     valore \errval{ENOMEM}.
2489   }
2490 \end{functions}
2491
2492 La funzione restituisce il puntatore \type{cap\_t} ad uno stato inizializzato
2493 con tutte le \textit{capabilities} azzerate. In caso di errore (cioè quando
2494 non c'è memoria sufficiente ad allocare i dati) viene restituito \macro{NULL}
2495 ed \var{errno} viene impostata a \errval{ENOMEM}.  La memoria necessaria a
2496 mantenere i dati viene automaticamente allocata da \func{cap\_init}, ma dovrà
2497 essere disallocata esplicitamente quando non è più necessaria utilizzando, per
2498 questo l'interfaccia fornisce una apposita funzione, \funcd{cap\_free}, il cui
2499 prototipo è:
2500 \begin{functions}
2501   \headdecl{sys/capability.h}
2502
2503   \funcdecl{int cap\_free(void *obj\_d)}
2504   Disalloca la memoria allocata per i dati delle \textit{capabilities}.
2505
2506   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
2507     errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
2508   }
2509 \end{functions}
2510
2511 La funzione permette di liberare la memoria allocata dalle altre funzioni
2512 della libreria sia per un \textit{capability state}, nel qual caso l'argomento
2513 dovrà essere un dato di tipo \type{cap\_t}, che per una descrizione testuale
2514 dello stesso,\footnote{cioè quanto ottenuto tramite la funzione
2515   \func{cap\_to\_text}.} nel qual caso l'argomento dovrà essere un dato di
2516 tipo \texttt{char *}. Per questo l'argomento \param{obj\_d} è dichiarato come
2517 \texttt{void *} e deve sempre corrispondere ad un puntatore ottenuto tramite
2518 le altre funzioni della libreria, altrimenti la funzione fallirà con un errore
2519 di \errval{EINVAL}.
2520
2521 Infine si può creare una copia di un \textit{capability state} ottenuto in
2522 precedenza tramite la funzione \funcd{cap\_dup}, il cui prototipo è:
2523 \begin{functions}
2524   \headdecl{sys/capability.h}
2525
2526   \funcdecl{cap\_t cap\_dup(cap\_t cap\_p)}
2527   Duplica un \textit{capability state} restituendone una copia.
2528
2529   \bodydesc{La funzione ritorna un valore non nullo in caso di successo e
2530     \macro{NULL} in caso di errore, nel qual caso \var{errno} potrà assumere i
2531     valori \errval{ENOMEM} o \errval{EINVAL}.
2532   }
2533 \end{functions}
2534
2535 La funzione crea una copia del \textit{capability state} posto all'indirizzo
2536 \param{cap\_p} che si è passato come argomento, restituendo il puntatore alla
2537 copia, che conterrà gli stessi valori delle \textit{capabilities} presenti
2538 nell'originale. La memoria necessaria viene allocata automaticamente dalla
2539 funzione. Una volta effettuata la copia i due \textit{capability state}
2540 potranno essere modificati in maniera completamente
2541 indipendente.\footnote{alla fine delle operazioni si ricordi però di
2542   disallocare anche la copia, oltre all'originale. }
2543
2544 Una seconda classe di funzioni di servizio previste dall'interfaccia sono
2545 quelle per la gestione dei dati contenuti all'interno di un \textit{capability
2546   state}; la prima di queste è \funcd{cap\_clear}, il cui prototipo è:
2547 \begin{functions}
2548   \headdecl{sys/capability.h}
2549
2550   \funcdecl{int cap\_clear(cap\_t cap\_p)}
2551   Inizializza un \textit{capability state} cancellando tutte le
2552   \textit{capabilities}.
2553
2554   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
2555     errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
2556   }
2557 \end{functions}
2558
2559 La funzione si limita ad azzerare tutte le \textit{capabilities} presenti nel
2560 \textit{capability state} all'indirizzo \param{cap\_p} passato come argomento,
2561 restituendo uno stato \textsl{vuoto}, analogo a quello che si ottiene nella
2562 creazione con \func{cap\_init}.
2563
2564 Per la gestione dei valori delle \textit{capabilities} presenti in un
2565 \textit{capability state} l'interfaccia prevede due funzioni,
2566 \funcd{cap\_get\_flag} e \funcd{cap\_set\_flag}, che permettono
2567 rispettivamente di leggere o impostare il valore di un flag delle
2568 \textit{capabilities}; i rispettivi prototipi sono:
2569 \begin{functions}
2570   \headdecl{sys/capability.h}
2571
2572   \funcdecl{int cap\_get\_flag(cap\_t cap\_p, cap\_value\_t cap, cap\_flag\_t
2573     flag, cap\_flag\_value\_t *value\_p)}
2574   Legge il valore di una \textit{capability}.
2575
2576   \funcdecl{int cap\_set\_flag(cap\_t cap\_p, cap\_flag\_t flag, int ncap,
2577     cap\_value\_t *caps, cap\_flag\_value\_t value)}
2578   Imposta il valore di una \textit{capability}.
2579
2580   \bodydesc{Le funzioni ritornano 0 in caso di successo e $-1$ in caso di
2581     errore, nel qual caso \var{errno} assumerà il valore \errval{EINVAL}.
2582 }
2583 \end{functions}
2584
2585 In entrambe le funzioni l'argomento \param{cap\_p} indica il puntatore al
2586 \textit{capability state} su cui operare, mentre l'argomento \param{flag}
2587 indica su quale dei tre insiemi illustrati a
2588 pag.~\pageref{sec:capabilities_set} si intende operare. Questi devono essere
2589 specificati con una variabile di tipo \type{cap\_flag\_t} che può assumere
2590 esclusivamente\footnote{si tratta in effetti di un tipo enumerato, come si può
2591   verificare dalla sua definizione che si trova in
2592   \texttt{/usr/include/sys/capability.h}.} uno dei valori illustrati in
2593 tab.~\ref{tab:cap_set_identifier}.
2594
2595 \begin{table}[htb]
2596   \centering
2597   \footnotesize
2598   \begin{tabular}[c]{|l|l|}
2599     \hline
2600     \textbf{Valore} & \textbf{Significato} \\
2601     \hline
2602     \hline
2603     \const{CAP\_EFFECTIVE}  & Capacità dell'insieme \textsl{effettivo}.\\
2604     \const{CAP\_PERMITTED}  & Capacità dell'insieme \textsl{permesso}.\\
2605     \const{CAP\_INHERITABLE}& Capacità dell'insieme \textsl{ereditabile}.\\
2606     \hline
2607   \end{tabular}
2608   \caption{Valori possibili per il tipo di dato \type{cap\_flag\_t} che
2609     identifica gli insiemi delle \textit{capabilities}.}
2610   \label{tab:cap_set_identifier}
2611 \end{table}
2612
2613 La capacità che si intende controllare o impostare invece deve essere
2614 specificata attraverso una variabile di tipo \type{cap\_value\_t}, che può
2615 prendere come valore uno qualunque di quelli riportati in
2616 tab.~\ref{tab:proc_capabilities}, in questo caso però non è possibile
2617 combinare diversi valori in una maschera binaria, una variabile di tipo
2618 \type{cap\_value\_t} deve indicare una sola capacità.\footnote{nel file di
2619   header citato nella nota precedente il tipo \type{cap\_value\_t} è definito
2620   come \ctyp{int}, ma i valori validi sono soltanto quelli di
2621   tab.~\ref{tab:proc_capabilities}.}
2622
2623 Infine lo stato di una capacità è descritto ad una variabile di tipo
2624 \type{cap\_flag\_value\_t}, che a sua volta può assumere soltanto
2625 uno\footnote{anche questo è un tipo enumerato.} dei valori di
2626 tab.~\ref{tab:cap_value_type}.
2627
2628 \begin{table}[htb]
2629   \centering
2630   \footnotesize
2631   \begin{tabular}[c]{|l|l|}
2632     \hline
2633     \textbf{Valore} & \textbf{Significato} \\
2634     \hline
2635     \hline
2636     \const{CAP\_CLEAR}& La capacità non è impostata.\\
2637     \const{CAP\_SET}  & La capacità è impostata.\\
2638     \hline
2639   \end{tabular}
2640   \caption{Valori possibili per il tipo di dato \type{cap\_flag\_value\_t} che
2641     indica lo stato di una capacità.}
2642   \label{tab:cap_value_type}
2643 \end{table}
2644
2645 La funzione \func{cap\_get\_flag} legge lo stato della capacità indicata
2646 dall'argomento \param{cap} all'interno dell'insieme indicato dall'argomento
2647 \param{flag} e ne restituisce il valore nella variabile posta all'indirizzo
2648 puntato dall'argomento \param{value\_p}; è possibile cioè leggere soltanto uno
2649 stato di una capacità alla volta.
2650
2651 La funzione \func{cap\_set\_flag} può invece impostare in una sola chiamata
2652 più \textit{capabilities}, anche se solo all'interno dello stesso insieme. Per
2653 questo motivo essa prende un vettore di valori di tipo \type{cap\_value\_t}
2654 nell'argomento \param{caps}, la cui dimensione viene specificata dall'argomento
2655 \param{ncap}. Il tipo di impostazione da eseguire (cancellazione o
2656 impostazione) viene indicato dall'argomento \param{value}.
2657
2658 Per la visualizzazione dello stato delle \textit{capabilities} l'interfaccia
2659 prevede una funzione apposita, \funcd{cap\_to\_text}, il cui prototipo è:
2660 \begin{functions}
2661   \headdecl{sys/capability.h}
2662
2663   \funcdecl{char * cap\_to\_text(cap\_t caps, ssize\_t * length\_p)}
2664
2665   Genera una visualizzazione testuale delle \textit{capabilities}.
2666
2667   \bodydesc{La funzione ritorna un puntatore alla stringa con la descrizione
2668     delle \textit{capabilities} in caso di successo e \val{NULL} in caso di
2669     errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL} o
2670     \errval{ENOMEM}.
2671   }
2672 \end{functions}
2673
2674 La funzione ritorna l'indirizzo di una stringa contente la descrizione
2675 testuale del contenuto del \textit{capabilities state} \param{caps} passato
2676 come argomento, e, qualora l'argomento \param{length\_p} sia diverso da
2677 \val{NULL}, restituisce nella variabile intera da questo puntata la lunghezza
2678 della stringa. La stringa restituita viene allocata automaticamente dalla
2679 funzione e pertanto dovrà essere liberata con \func{cap\_free}.
2680
2681 Fin quei abbiamo trattato solo le funzioni di servizio relative alla
2682 manipolazione dei \textit{capabilities state}; l'interfaccia di gestione
2683 prevede però anche le funzioni per la gestione delle \textit{capabilities}
2684 stesse. La prima di queste è \funcd{cap\_get\_proc} che consente la lettura
2685 delle \textit{capabilities} del processo corrente, il suo prototipo è:
2686 \begin{functions}
2687   \headdecl{sys/capability.h}
2688
2689   \funcdecl{cap\_t cap\_get\_proc(void)}
2690   Legge le \textit{capabilities} del processo corrente.
2691
2692   \bodydesc{La funzione ritorna un valore diverso da \val{NULL} in caso di
2693     successo e \val{NULL} in caso di errore, nel qual caso \var{errno} può
2694     assumere i valori \errval{EINVAL}, \errval{EPERM} o \errval{ENOMEM}.  }
2695 \end{functions}
2696
2697 La funzione legge il valore delle \textit{capabilities} associate al processo
2698 da cui viene invocata, restituendo il risultato tramite il puntatore ad un
2699 \textit{capabilities state} contenente tutti i dati che provvede ad allocare
2700 autonomamente e che di nuovo occorrerà liberare con \func{cap\_free} quando
2701 non sarà più utilizzato.
2702
2703 Se invece si vogliono leggere le \textit{capabilities} di un processo
2704 specifico occorre usare la funzione \funcd{capgetp}, il cui
2705 prototipo\footnote{su alcune pagine di manuale la funzione è descritta con un
2706   prototipo sbagliato, che prevede un valore di ritorno di tipo \type{cap\_t},
2707   ma il valore di ritorno è intero, come si può verificare anche dalla
2708   dichiarazione della stessa in \texttt{sys/capability.h}.} è:
2709 \begin{functions}
2710   \headdecl{sys/capability.h}
2711
2712   \funcdecl{int capgetp(pid\_t pid, cap\_t cap\_d)}
2713   Legge le \textit{capabilities} del processo indicato da \param{pid}.
2714
2715   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
2716     errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL},
2717     \errval{EPERM} o \errval{ENOMEM}.
2718   }
2719 \end{functions}
2720 %TODO controllare e correggere i codici di errore!!!
2721
2722 La funzione legge il valore delle \textit{capabilities} del processo indicato
2723 con l'argomento \param{pid}, e restituisce il risultato nel
2724 \textit{capabilities state} posto all'indirizzo indicato con l'argomento
2725 \param{cap\_d}; a differenza della precedente in questo caso il
2726 \textit{capability state} deve essere stato creato in precedenza. Qualora il
2727 processo indicato non esista si avrà un errore di \errval{ESRCH}. Gli stessi
2728 valori possono essere letti direttamente nel filesystem \textit{proc}, nei
2729 file \texttt{/proc/<pid>/status}; ad esempio per \texttt{init} si otterrà
2730 qualcosa del tipo:
2731 \begin{Verbatim}
2732 ...
2733 CapInh: 0000000000000000
2734 CapPrm: 00000000fffffeff
2735 CapEff: 00000000fffffeff
2736 ...
2737 \end{Verbatim}
2738
2739 Infine per impostare le \textit{capabilities} del processo corrente (non
2740 esiste una funzione che permetta di cambiare le \textit{capabilities} di un
2741 altro processo) si deve usare la funzione \funcd{cap\_set\_proc}, il cui
2742 prototipo è:
2743 \begin{functions}
2744   \headdecl{sys/capability.h}
2745
2746   \funcdecl{int cap\_set\_proc(cap\_t cap\_p)}
2747   Imposta le \textit{capabilities} del processo corrente.
2748
2749   \bodydesc{La funzione ritorna 0 in caso di successo e $-1$ in caso di
2750     errore, nel qual caso \var{errno} può assumere i valori \errval{EINVAL},
2751     \errval{EPERM} o \errval{ENOMEM}.
2752   }
2753 \end{functions}
2754
2755 La funzione modifica le \textit{capabilities} del processo corrente secondo
2756 quanto specificato con l'argomento \param{cap\_p}, posto che questo sia
2757 possibile nei termini spiegati in precedenza (non sarà ad esempio possibile
2758 impostare capacità non presenti nell'insieme di quelle permesse). In caso di
2759 successo i nuovi valori saranno effettivi al ritorno della funzione, in caso
2760 di fallimento invece lo stato delle capacità resterà invariato. Si tenga
2761 presente che \textsl{tutte} le capacità specificate tramite \param{cap\_p}
2762 devono essere permesse; se anche una sola non lo è la funzione fallirà, e per
2763 quanto appena detto, lo stato delle \textit{capabilities} non verrà modificato
2764 (neanche per le parti eventualmente permesse).
2765
2766 Come esempio di utilizzo di queste funzioni nei sorgenti allegati alla guida
2767 si è distribuito il programma \texttt{getcap.c}, che consente di leggere le
2768 \textit{capabilities} del processo corrente\footnote{vale a dire di sé stesso,
2769   quando lo si lancia, il che può sembrare inutile, ma serve a mostrarci quali
2770   sono le \textit{capabilities} standard che ottiene un processo lanciato
2771   dalla riga di comando.} o tramite l'opzione \texttt{-p}, quelle di un
2772 processo qualunque il cui pid viene passato come parametro dell'opzione.
2773
2774 \begin{figure}[htb]
2775   \footnotesize \centering
2776   \begin{minipage}[c]{15cm}
2777     \includecodesample{listati/getcap.c}
2778   \end{minipage}
2779   \normalsize
2780   \caption{Corpo principale del programma \texttt{getcap.c}.}
2781   \label{fig:proc_getcap}
2782 \end{figure}
2783
2784 La sezione principale del programma è riportata in fig.~\ref{fig:proc_getcap},
2785 e si basa su una condizione sulla variabile \var{pid} che se si è usato
2786 l'opzione \texttt{-p} è impostata (nella sezione di gestione delle opzioni,
2787 che si è tralasciata) al valore del \textsl{pid} del processo di cui si vuole
2788 leggere le \textit{capabilities} e nulla altrimenti. Nel primo caso
2789 (\texttt{\small 1--6}) si utilizza direttamente (\texttt{\small 2})
2790 \func{cap\_get\_proc} per ottenere lo stato delle capacità del processo, nel
2791 secondo (\texttt{\small 7--14}) prima si inizializza (\texttt{\small 8}) uno
2792 stato vuoto e poi (\texttt{\small 9}) si legge il valore delle capacità del
2793 processo indicato.
2794
2795 Il passo successivo è utilizzare (\texttt{\small 16}) \func{cap\_to\_text} per
2796 tradurre in una stringa lo stato, e poi (\texttt{\small 17}) stamparlo; infine
2797 (\texttt{\small 19--20}) si libera la memoria allocata dalle precedenti
2798 funzioni con \func{cap\_free} per poi ritornare dal ciclo principale della
2799 funzione.
2800
2801 \itindend{capabilities}
2802
2803 % TODO vedi http://lwn.net/Articles/198557/ e
2804 % http://www.madore.org/~david/linux/newcaps/
2805 % TODO documentare prctl ...
2806
2807
2808 % TODO: rivedere alla luce degli aggiornamenti del 2.6 (man sched_setscheduler)
2809
2810 \section{La gestione della priorità di esecuzione}
2811 \label{sec:proc_priority}
2812
2813 In questa sezione tratteremo più approfonditamente i meccanismi con il quale
2814 lo \itindex{scheduler} \textit{scheduler} assegna la CPU ai vari processi
2815 attivi.  In particolare prenderemo in esame i vari meccanismi con cui viene
2816 gestita l'assegnazione del tempo di CPU, ed illustreremo le varie funzioni di
2817 gestione.
2818
2819
2820 \subsection{I meccanismi di \textit{scheduling}}
2821 \label{sec:proc_sched}
2822
2823 \itindbeg{scheduler}
2824
2825 La scelta di un meccanismo che sia in grado di distribuire in maniera efficace
2826 il tempo di CPU per l'esecuzione dei processi è sempre una questione delicata,
2827 ed oggetto di numerose ricerche; in generale essa dipende in maniera
2828 essenziale anche dal tipo di utilizzo che deve essere fatto del sistema, per
2829 cui non esiste un meccanismo che sia valido per tutti gli usi.
2830
2831 La caratteristica specifica di un sistema multitasking come Linux è quella del
2832 cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
2833   multitasking}: questo significa che al contrario di altri sistemi (che usano
2834 invece il cosiddetto \itindex{cooperative~multitasking} \textit{cooperative
2835   multitasking}) non sono i singoli processi, ma il kernel stesso a decidere
2836 quando la CPU deve essere passata ad un altro processo. Come accennato in
2837 sez.~\ref{sec:proc_hierarchy} questa scelta viene eseguita da una sezione
2838 apposita del kernel, lo \textit{scheduler}, il cui scopo è quello di
2839 distribuire al meglio il tempo di CPU fra i vari processi.
2840
2841 La cosa è resa ancora più complicata dal fatto che con le architetture
2842 multi-processore si deve anche scegliere quale sia la CPU più opportuna da
2843 utilizzare.\footnote{nei processori moderni la presenza di ampie cache può
2844   rendere poco efficiente trasferire l'esecuzione di un processo da una CPU ad
2845   un'altra, per cui effettuare la migliore scelta fra le diverse CPU non è
2846   banale.}  Tutto questo comunque appartiene alle sottigliezze
2847 dell'implementazione del kernel; dal punto di vista dei programmi che girano
2848 in user space, anche quando si hanno più processori (e dei processi che sono
2849 eseguiti davvero in contemporanea), le politiche di scheduling riguardano
2850 semplicemente l'allocazione della risorsa \textsl{tempo di esecuzione}, la cui
2851 assegnazione sarà governata dai meccanismi di scelta delle priorità che
2852 restano gli stessi indipendentemente dal numero di processori.
2853
2854 Si tenga conto poi che i processi non devono solo eseguire del codice: ad
2855 esempio molto spesso saranno impegnati in operazioni di I/O, o potranno
2856 venire bloccati da un comando dal terminale, o sospesi per un certo periodo di
2857 tempo.  In tutti questi casi la CPU diventa disponibile ed è compito dello
2858 kernel provvedere a mettere in esecuzione un altro processo.
2859
2860 Tutte queste possibilità sono caratterizzate da un diverso \textsl{stato} del
2861 processo, in Linux un processo può trovarsi in uno degli stati riportati in
2862 tab.~\ref{tab:proc_proc_states}; ma soltanto i processi che sono nello stato
2863 \textit{runnable} concorrono per l'esecuzione. Questo vuol dire che, qualunque
2864 sia la sua priorità, un processo non potrà mai essere messo in esecuzione
2865 fintanto che esso si trova in uno qualunque degli altri stati.
2866
2867 \begin{table}[htb]
2868   \footnotesize
2869   \centering
2870   \begin{tabular}[c]{|p{2.8cm}|c|p{10cm}|}
2871     \hline
2872     \textbf{Stato} & \texttt{STAT} & \textbf{Descrizione} \\
2873     \hline
2874     \hline
2875     \textbf{Runnable}& \texttt{R} & Il processo è in esecuzione o è pronto ad
2876                                     essere eseguito (cioè è in attesa che gli
2877                                     venga assegnata la CPU). \\
2878     \textbf{Sleep}   & \texttt{S} & Il processo  è in attesa di un
2879                                     risposta dal sistema, ma può essere
2880                                     interrotto da un segnale. \\
2881     \textbf{Uninterrutible Sleep}& \texttt{D} & Il  processo è in
2882                                     attesa di un risposta dal sistema (in
2883                                     genere per I/O), e non può essere
2884                                     interrotto in nessuna circostanza. \\
2885     \textbf{Stopped} & \texttt{T} & Il processo è stato fermato con un
2886                                     \const{SIGSTOP}, o è tracciato.\\
2887     \textbf{Zombie}\index{zombie} & \texttt{Z} & Il processo è terminato ma il
2888                                     suo stato di terminazione non è ancora
2889                                     stato letto dal padre. \\
2890     \textbf{Killable}& \texttt{D} & Un nuovo stato introdotto con il kernel
2891                                     2.6.25, sostanzialmente identico
2892                                     all'\textbf{Uninterrutible Sleep} con la
2893                                     sola differenza che il processo può
2894                                     terminato (con \const{SIGKILL}). \\
2895     \hline
2896   \end{tabular}
2897   \caption{Elenco dei possibili stati di un processo in Linux, nella colonna
2898     \texttt{STAT} si è riportata la corrispondente lettera usata dal comando
2899     \cmd{ps} nell'omonimo campo.}
2900   \label{tab:proc_proc_states}
2901 \end{table}
2902
2903 % TODO nel 2.6.25 è stato aggiunto TASK_KILLABLE, da capire dova va messo.
2904
2905 Si deve quindi tenere presente che l'utilizzo della CPU è soltanto una delle
2906 risorse che sono necessarie per l'esecuzione di un programma, e a seconda
2907 dello scopo del programma non è detto neanche che sia la più importante (molti
2908 programmi dipendono in maniera molto più critica dall'I/O). Per questo motivo
2909 non è affatto detto che dare ad un programma la massima priorità di esecuzione
2910 abbia risultati significativi in termini di prestazioni.
2911
2912 Il meccanismo tradizionale di scheduling di Unix (che tratteremo in
2913 sez.~\ref{sec:proc_sched_stand}) è sempre stato basato su delle
2914 \textsl{priorità dinamiche}, in modo da assicurare che tutti i processi, anche
2915 i meno importanti, possano ricevere un po' di tempo di CPU. In sostanza quando
2916 un processo ottiene la CPU la sua priorità viene diminuita. In questo modo
2917 alla fine, anche un processo con priorità iniziale molto bassa, finisce per
2918 avere una priorità sufficiente per essere eseguito.
2919
2920 Lo standard POSIX.1b però ha introdotto il concetto di \textsl{priorità
2921   assoluta}, (chiamata anche \textsl{priorità statica}, in contrapposizione
2922 alla normale priorità dinamica), per tenere conto dei sistemi
2923 real-time,\footnote{per sistema real-time si intende un sistema in grado di
2924   eseguire operazioni in un tempo ben determinato; in genere si tende a
2925   distinguere fra l'\textit{hard real-time} in cui è necessario che i tempi di
2926   esecuzione di un programma siano determinabili con certezza assoluta (come
2927   nel caso di meccanismi di controllo di macchine, dove uno sforamento dei
2928   tempi avrebbe conseguenze disastrose), e \textit{soft-real-time} in cui un
2929   occasionale sforamento è ritenuto accettabile.} in cui è vitale che i
2930 processi che devono essere eseguiti in un determinato momento non debbano
2931 aspettare la conclusione di altri che non hanno questa necessità.
2932
2933 Il concetto di priorità assoluta dice che quando due processi si contendono
2934 l'esecuzione, vince sempre quello con la priorità assoluta più alta.
2935 Ovviamente questo avviene solo per i processi che sono pronti per essere
2936 eseguiti (cioè nello stato \textit{runnable}).  La priorità assoluta viene in
2937 genere indicata con un numero intero, ed un valore più alto comporta una
2938 priorità maggiore. Su questa politica di scheduling torneremo in
2939 sez.~\ref{sec:proc_real_time}.
2940
2941 In generale quello che succede in tutti gli Unix moderni è che ai processi
2942 normali viene sempre data una priorità assoluta pari a zero, e la decisione di
2943 assegnazione della CPU è fatta solo con il meccanismo tradizionale della
2944 priorità dinamica. In Linux tuttavia è possibile assegnare anche una priorità
2945 assoluta, nel qual caso un processo avrà la precedenza su tutti gli altri di
2946 priorità inferiore, che saranno eseguiti solo quando quest'ultimo non avrà
2947 bisogno della CPU.
2948
2949
2950 \subsection{Il meccanismo di \textit{scheduling} standard}
2951 \label{sec:proc_sched_stand}
2952
2953 A meno che non si abbiano esigenze specifiche, l'unico meccanismo di
2954 scheduling con il quale si avrà a che fare è quello tradizionale, che prevede
2955 solo priorità dinamiche. È di questo che, di norma, ci si dovrà preoccupare
2956 nella programmazione.
2957
2958 Come accennato in Linux tutti i processi ordinari hanno la stessa priorità
2959 assoluta. Quello che determina quale, fra tutti i processi in attesa di
2960 esecuzione, sarà eseguito per primo, è la priorità dinamica, che è chiamata
2961 così proprio perché varia nel corso dell'esecuzione di un processo. Oltre a
2962 questo la priorità dinamica determina quanto a lungo un processo continuerà ad
2963 essere eseguito, e quando un processo potrà subentrare ad un altro
2964 nell'esecuzione.
2965
2966 Il meccanismo usato da Linux è piuttosto semplice,\footnote{in realtà nella
2967   serie 2.6.x lo scheduler è stato riscritto da zero e può usare diversi
2968   algoritmi, selezionabili sia in fase di compilazione, che, nelle versioni
2969   più recenti, all'avvio (addirittura è stato ideato un sistema modulare che
2970   permette di cambiare lo scheduler al volo, che comunque non è incluso nel
2971   kernel ufficiale).} ad ogni processo è assegnata una \textit{time-slice},
2972 cioè un intervallo di tempo (letteralmente una fetta) per il quale esso deve
2973 essere eseguito. Il valore della \textit{time-slice} è controllato dalla
2974 cosiddetta \textit{nice} (o \textit{niceness}) del processo.  Essa è contenuta
2975 nel campo \var{nice} di \struct{task\_struct}; tutti i processi vengono creati
2976 con lo stesso valore, ed essa specifica il valore della durata iniziale della
2977 \textit{time-slice} che viene assegnato ad un altro campo della struttura
2978 (\var{counter}) quando il processo viene eseguito per la prima volta e
2979 diminuito progressivamente ad ogni interruzione del timer.
2980
2981 Durante la sua esecuzione lo scheduler scandisce la coda dei processi in stato
2982 \textit{runnable} associando, in base al valore di \var{counter}, un peso ad
2983 ogni processo in attesa di esecuzione,\footnote{il calcolo del peso in realtà
2984   è un po' più complicato, ad esempio nei sistemi multiprocessore viene
2985   favorito un processo eseguito sulla stessa CPU, e a parità del valore di
2986   \var{counter} viene favorito chi ha una priorità più elevata.} chi ha il
2987 peso più alto verrà posto in esecuzione, ed il precedente processo sarà
2988 spostato in fondo alla coda.  Dato che ad ogni interruzione del timer il
2989 valore di \var{counter} del processo corrente viene diminuito, questo assicura
2990 che anche i processi con priorità più bassa verranno messi in esecuzione.
2991
2992 La priorità di un processo è così controllata attraverso il valore di
2993 \var{nice}, che stabilisce la durata della \textit{time-slice}; per il
2994 meccanismo appena descritto infatti un valore più lungo assicura una maggiore
2995 attribuzione di CPU.  L'origine del nome di questo parametro sta nel fatto che
2996 generalmente questo viene usato per diminuire la priorità di un processo, come
2997 misura di cortesia nei confronti degli altri.  I processi infatti vengono
2998 creati dal sistema con lo stesso valore di \var{nice} (nullo) e nessuno è
2999 privilegiato rispetto agli altri; il valore può essere modificato solo
3000 attraverso la funzione \funcd{nice}, il cui prototipo è:
3001 \begin{prototype}{unistd.h}
3002 {int nice(int inc)}
3003   Aumenta il valore di \var{nice} per il processo corrente.
3004
3005   \bodydesc{La funzione ritorna zero o il nuovo valore di \var{nice} in caso
3006     di successo e -1 in caso di errore, nel qual caso \var{errno} può assumere
3007     i valori:
3008   \begin{errlist}
3009   \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha
3010     specificato un valore di \param{inc} negativo.
3011   \end{errlist}}
3012 \end{prototype}
3013
3014 L'argomento \param{inc} indica l'incremento del valore di \var{nice}:
3015 quest'ultimo può assumere valori compresi fra \const{PRIO\_MIN} e
3016 \const{PRIO\_MAX} (che nel caso di Linux sono $-19$ e $20$), ma per
3017 \param{inc} si può specificare un valore qualunque, positivo o negativo, ed il
3018 sistema provvederà a troncare il risultato nell'intervallo consentito. Valori
3019 positivi comportano maggiore \textit{cortesia} e cioè una diminuzione della
3020 priorità, ogni utente può solo innalzare il valore di un suo processo. Solo
3021 l'amministratore può specificare valori negativi che permettono di aumentare
3022 la priorità di un processo.
3023
3024 Gli standard SUSv2 e POSIX.1 prevedono che la funzione ritorni il nuovo valore
3025 di \var{nice} del processo; tuttavia la system call di Linux non segue questa
3026 convenzione e restituisce sempre 0 in caso di successo, questo perché $-1$ è
3027 un valore di \var{nice} legittimo e questo comporta una confusione con una
3028 eventuale condizione di errore.
3029
3030 Fino alle \acr{glibc} 2.2.4 la funzione di libreria riportava direttamente il
3031 valore ottenuto dalla system call, violando lo standard, per cui per ottenere
3032 il nuovo valore occorreva una successiva chiamata alla funzione
3033 \func{getpriority}. A partire dalla \acr{glibc} 2.2.4 \func{nice} è stata
3034 reimplementata come funzione di libreria, e restituisce il valore di
3035 \var{nice} come richiesto dallo standard.\footnote{questo viene fatto
3036   chiamando al suo interno \func{getpriority}, ed è questo il motivo delle due
3037   possibilità per i valori di ritorno citati nella descrizione del prototipo.}
3038 In questo caso l'unico modo per rilevare in maniera affidabile una condizione
3039 di errore è quello di azzerare \var{errno} prima della chiamata della funzione
3040 e verificarne il valore quando \func{nice} restituisce $-1$.
3041
3042
3043 Per leggere il valore di nice di un processo occorre usare la funzione
3044 \funcd{getpriority}, derivata da BSD; il suo prototipo è:
3045 \begin{prototype}{sys/resource.h}
3046 {int getpriority(int which, int who)}
3047
3048 Restituisce il valore di \var{nice} per l'insieme dei processi specificati.
3049
3050   \bodydesc{La funzione ritorna la priorità in caso di successo e -1 in caso di
3051     errore, nel qual caso \var{errno} può assumere i valori:
3052   \begin{errlist}
3053   \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
3054   \param{which} e \param{who}.
3055   \item[\errcode{EINVAL}] il valore di \param{which} non è valido.
3056   \end{errlist}}
3057 \end{prototype}
3058 \noindent nelle vecchie versioni può essere necessario includere anche
3059 \file{<sys/time.h>}, questo non è più necessario con versioni recenti delle
3060 librerie, ma è comunque utile per portabilità.
3061
3062 La funzione permette, a seconda del valore di \param{which}, di leggere la
3063 priorità di un processo, di un gruppo di processi (vedi
3064 sez.~\ref{sec:sess_proc_group}) o di un utente, specificando un corrispondente
3065 valore per \param{who} secondo la legenda di tab.~\ref{tab:proc_getpriority};
3066 un valore nullo di quest'ultimo indica il processo, il gruppo di processi o
3067 l'utente correnti.
3068
3069 \begin{table}[htb]
3070   \centering
3071   \footnotesize
3072   \begin{tabular}[c]{|c|c|l|}
3073     \hline
3074     \param{which} & \param{who} & \textbf{Significato} \\
3075     \hline
3076     \hline
3077     \const{PRIO\_PROCESS} & \type{pid\_t} & processo  \\
3078     \const{PRIO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
3079                                             \textit{process group}  \\
3080     \const{PRIO\_USER}    & \type{uid\_t} & utente \\
3081     \hline
3082   \end{tabular}
3083   \caption{Legenda del valore dell'argomento \param{which} e del tipo
3084     dell'argomento \param{who} delle funzioni \func{getpriority} e
3085     \func{setpriority} per le tre possibili scelte.}
3086   \label{tab:proc_getpriority}
3087 \end{table}
3088
3089 La funzione restituisce la priorità più alta (cioè il valore più basso) fra
3090 quelle dei processi specificati; di nuovo, dato che $-1$ è un valore
3091 possibile, per poter rilevare una condizione di errore è necessario cancellare
3092 sempre \var{errno} prima della chiamata alla funzione per verificare che essa
3093 resti uguale a zero.
3094
3095 Analoga a \func{getpriority} è la funzione \funcd{setpriority} che permette di
3096 impostare la priorità di uno o più processi; il suo prototipo è:
3097 \begin{prototype}{sys/resource.h}
3098 {int setpriority(int which, int who, int prio)}
3099   Imposta la priorità per l'insieme dei processi specificati.
3100
3101   \bodydesc{La funzione ritorna la priorità in caso di successo e -1 in caso di
3102     errore, nel qual caso \var{errno} può assumere i valori:
3103   \begin{errlist}
3104   \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
3105   \param{which} e \param{who}.
3106   \item[\errcode{EINVAL}] il valore di \param{which} non è valido.
3107   \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha
3108     specificato un valore di \param{inc} negativo.
3109   \item[\errcode{EACCES}] un processo senza i privilegi di amministratore ha
3110     cercato di modificare la priorità di un processo di un altro utente.
3111   \end{errlist}}
3112 \end{prototype}
3113
3114 La funzione imposta la priorità al valore specificato da \param{prio} per
3115 tutti i processi indicati dagli argomenti \param{which} e \param{who}.  La
3116 gestione dei permessi dipende dalle varie implementazioni; in Linux, secondo
3117 le specifiche dello standard SUSv3, e come avviene per tutti i sistemi che
3118 derivano da SysV, è richiesto che l'user-ID reale o effettivo del processo
3119 chiamante corrispondano al real user-ID (e solo quello) del processo di cui si
3120 vuole cambiare la priorità; per i sistemi derivati da BSD invece (SunOS,
3121 Ultrix, *BSD) la corrispondenza può essere anche con l'user-ID effettivo.
3122
3123
3124
3125 \subsection{Il meccanismo di \textit{scheduling real-time}}
3126 \label{sec:proc_real_time}
3127
3128 Come spiegato in sez.~\ref{sec:proc_sched} lo standard POSIX.1b ha introdotto
3129 le priorità assolute per permettere la gestione di processi real-time. In
3130 realtà nel caso di Linux non si tratta di un vero hard real-time, in quanto in
3131 presenza di eventuali interrupt il kernel interrompe l'esecuzione di un
3132 processo qualsiasi sia la sua priorità,\footnote{questo a meno che non si
3133   siano installate le patch di RTLinux, RTAI o Adeos, con i quali è possibile
3134   ottenere un sistema effettivamente hard real-time. In tal caso infatti gli
3135   interrupt vengono intercettati dall'interfaccia real-time (o nel caso di
3136   Adeos gestiti dalle code del nano-kernel), in modo da poterli controllare
3137   direttamente qualora ci sia la necessità di avere un processo con priorità
3138   più elevata di un \textit{interrupt handler}.} mentre con l'incorrere in un
3139 \itindex{page~fault} \textit{page fault} si possono avere ritardi non
3140 previsti.  Se l'ultimo problema può essere aggirato attraverso l'uso delle
3141 funzioni di controllo della memoria virtuale (vedi
3142 sez.~\ref{sec:proc_mem_lock}), il primo non è superabile e può comportare
3143 ritardi non prevedibili riguardo ai tempi di esecuzione di qualunque processo.
3144
3145 Occorre usare le priorità assolute con molta attenzione: se si dà ad un
3146 processo una priorità assoluta e questo finisce in un loop infinito, nessun
3147 altro processo potrà essere eseguito, ed esso sarà mantenuto in esecuzione
3148 permanentemente assorbendo tutta la CPU e senza nessuna possibilità di
3149 riottenere l'accesso al sistema. Per questo motivo è sempre opportuno, quando
3150 si lavora con processi che usano priorità assolute, tenere attiva una shell
3151 cui si sia assegnata la massima priorità assoluta, in modo da poter essere
3152 comunque in grado di rientrare nel sistema.
3153
3154 Quando c'è un processo con priorità assoluta lo scheduler lo metterà in
3155 esecuzione prima di ogni processo normale. In caso di più processi sarà
3156 eseguito per primo quello con priorità assoluta più alta. Quando ci sono più
3157 processi con la stessa priorità assoluta questi vengono tenuti in una coda e
3158 tocca al kernel decidere quale deve essere eseguito.  Il meccanismo con cui
3159 vengono gestiti questi processi dipende dalla politica di scheduling che si è
3160 scelta; lo standard ne prevede due:
3161 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
3162 \item[\textsf{FIFO}] \textit{First In First Out}. Il processo viene eseguito
3163   fintanto che non cede volontariamente la CPU (con \func{sched\_yield}), si
3164   blocca, finisce o viene interrotto da un processo a priorità più alta. Se il
3165   processo viene interrotto da uno a priorità più alta esso resterà in cima
3166   alla lista e sarà il primo ad essere eseguito quando i processi a priorità
3167   più alta diverranno inattivi. Se invece lo si blocca volontariamente sarà
3168   posto in coda alla lista (ed altri processi con la stessa priorità potranno
3169   essere eseguiti).
3170 \item[\textsf{RR}] \textit{Round Robin}. Il comportamento è del tutto analogo
3171   a quello precedente, con la sola differenza che ciascun processo viene
3172   eseguito al massimo per un certo periodo di tempo (la cosiddetta
3173   \textit{time slice}) dopo di che viene automaticamente posto in fondo alla
3174   coda dei processi con la stessa priorità. In questo modo si ha comunque una
3175   esecuzione a turno di tutti i processi, da cui il nome della politica. Solo
3176   i processi con la stessa priorità ed in stato \textit{runnable} entrano nel
3177   \textsl{girotondo}.
3178 \end{basedescript}
3179
3180 La funzione per impostare le politiche di scheduling (sia real-time che
3181 ordinarie) ed i relativi parametri è \funcd{sched\_setscheduler}; il suo
3182 prototipo è:
3183 \begin{prototype}{sched.h}
3184 {int sched\_setscheduler(pid\_t pid, int policy, const struct sched\_param *p)}
3185   Imposta priorità e politica di scheduling.
3186
3187   \bodydesc{La funzione ritorna la priorità in caso di successo e -1 in caso
3188     di errore, nel qual caso \var{errno} può assumere i valori:
3189     \begin{errlist}
3190     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3191     \item[\errcode{EINVAL}] il valore di \param{policy} non esiste o il
3192       relativo valore di \param{p} non è valido.
3193     \item[\errcode{EPERM}] il processo non ha i privilegi per attivare la
3194       politica richiesta.
3195   \end{errlist}}
3196 \end{prototype}
3197
3198 La funzione esegue l'impostazione per il processo specificato dall'argomento
3199 \param{pid}; un valore nullo esegue l'impostazione per il processo corrente.
3200 La politica di scheduling è specificata dall'argomento \param{policy} i cui
3201 possibili valori sono riportati in tab.~\ref{tab:proc_sched_policy}; un valore
3202 negativo per \param{policy} mantiene la politica di scheduling corrente.
3203 Solo un processo con i privilegi di amministratore può impostare priorità
3204 assolute diverse da zero o politiche \const{SCHED\_FIFO} e \const{SCHED\_RR}.
3205
3206 \begin{table}[htb]
3207   \centering
3208   \footnotesize
3209   \begin{tabular}[c]{|l|l|}
3210     \hline
3211     \textbf{Policy}  & \textbf{Significato} \\
3212     \hline
3213     \hline
3214     \const{SCHED\_FIFO} & Scheduling real-time con politica \textit{FIFO}. \\
3215     \const{SCHED\_RR}   & Scheduling real-time con politica \textit{Round
3216       Robin}. \\
3217     \const{SCHED\_OTHER}& Scheduling ordinario.\\
3218     \const{SCHED\_BATCH}& Scheduling ordinario con l'assunzione ulteriore di
3219     lavoro \textit{CPU intensive}.\footnotemark\\
3220     \hline
3221   \end{tabular}
3222   \caption{Valori dell'argomento \param{policy} per la funzione
3223     \func{sched\_setscheduler}.}
3224   \label{tab:proc_sched_policy}
3225 \end{table}
3226
3227 \footnotetext{introdotto con il kernel 2.6.16.}
3228
3229 % TODO manca SCHED_IDLE
3230
3231 Il valore della priorità è passato attraverso la struttura
3232 \struct{sched\_param} (riportata in fig.~\ref{fig:sig_sched_param}), il cui
3233 solo campo attualmente definito è \var{sched\_priority}, che nel caso delle
3234 priorità assolute deve essere specificato nell'intervallo fra un valore
3235 massimo ed uno minimo, che nel caso sono rispettivamente 1 e 99; il valore
3236 nullo è legale, ma indica i processi normali.
3237
3238 \begin{figure}[!bht]
3239   \footnotesize \centering
3240   \begin{minipage}[c]{15cm}
3241     \includestruct{listati/sched_param.c}
3242   \end{minipage}
3243   \normalsize
3244   \caption{La struttura \structd{sched\_param}.}
3245   \label{fig:sig_sched_param}
3246 \end{figure}
3247
3248 Si tenga presente che quando si imposta una politica di scheduling real-time
3249 per un processo (o se ne cambia la priorità con \func{sched\_setparam}) questo
3250 viene messo in cima alla lista dei processi con la stessa priorità; questo
3251 comporta che verrà eseguito subito, interrompendo eventuali altri processi con
3252 la stessa priorità in quel momento in esecuzione.
3253
3254 Lo standard POSIX.1b prevede comunque che i due valori della massima e minima
3255 priorità statica possano essere ottenuti, per ciascuna delle politiche di
3256 scheduling \textit{real-time}, tramite le due funzioni
3257 \funcd{sched\_get\_priority\_max} e \funcd{sched\_get\_priority\_min}, i cui
3258 prototipi sono:
3259 \begin{functions}
3260   \headdecl{sched.h}
3261
3262   \funcdecl{int sched\_get\_priority\_max(int policy)} Legge il valore
3263   massimo della priorità statica per la politica di scheduling \param{policy}.
3264
3265
3266   \funcdecl{int sched\_get\_priority\_min(int policy)} Legge il valore minimo
3267   della priorità statica per la politica di scheduling \param{policy}.
3268
3269   \bodydesc{La funzioni ritornano il valore della priorità in caso di successo
3270     e -1 in caso di errore, nel qual caso \var{errno} può assumere i valori:
3271     \begin{errlist}
3272     \item[\errcode{EINVAL}] il valore di \param{policy} non è valido.
3273   \end{errlist}}
3274 \end{functions}
3275
3276
3277 I processi con politica di scheduling \const{SCHED\_OTHER} devono specificare
3278 un valore nullo (altrimenti si avrà un errore \errcode{EINVAL}), questo valore
3279 infatti non ha niente a che vedere con la priorità dinamica determinata dal
3280 valore di \var{nice}, che deve essere impostato con le funzioni viste in
3281 precedenza.
3282
3283 Il kernel mantiene i processi con la stessa priorità assoluta in una lista, ed
3284 esegue sempre il primo della lista, mentre un nuovo processo che torna in
3285 stato \textit{runnable} viene sempre inserito in coda alla lista. Se la
3286 politica scelta è \const{SCHED\_FIFO} quando il processo viene eseguito viene
3287 automaticamente rimesso in coda alla lista, e la sua esecuzione continua
3288 fintanto che non viene bloccato da una richiesta di I/O, o non rilascia
3289 volontariamente la CPU (in tal caso, tornando nello stato \textit{runnable}
3290 sarà reinserito in coda alla lista); l'esecuzione viene ripresa subito solo
3291 nel caso che esso sia stato interrotto da un processo a priorità più alta.
3292
3293 Se si intende operare solo sulla priorità assoluta di un processo si possono
3294 usare le funzioni \funcd{sched\_setparam} e \funcd{sched\_getparam}, i cui
3295 prototipi sono:
3296 \begin{functions}
3297   \headdecl{sched.h}
3298
3299   \funcdecl{int sched\_setparam(pid\_t pid, const struct sched\_param *p)}
3300   Imposta la priorità assoluta del processo \param{pid}.
3301
3302   \funcdecl{int sched\_getparam(pid\_t pid, struct sched\_param *p)}
3303   Legge la priorità assoluta del processo \param{pid}.
3304
3305   \bodydesc{La funzione ritorna la priorità  in caso di successo
3306     e -1 in caso di errore, nel qual caso \var{errno} può assumere i valori:
3307     \begin{errlist}
3308     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3309     \item[\errcode{EINVAL}] il valore di \param{p} non ha senso per la
3310       politica scelta.
3311     \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
3312       eseguire l'operazione.
3313   \end{errlist}}
3314 \end{functions}
3315
3316 L'uso di \func{sched\_setparam} che è del tutto equivalente a
3317 \func{sched\_setscheduler} con \param{priority} uguale a -1. Come per
3318 \func{sched\_setscheduler} specificando 0 come valore di \param{pid} si opera
3319 sul processo corrente. La disponibilità di entrambe le funzioni può essere
3320 verificata controllando la macro \macro{\_POSIX\_PRIORITY\_SCHEDULING} che è
3321 definita nell'header \file{sched.h}.
3322
3323 Si tenga presente che per eseguire la funzione il processo chiamante deve
3324 avere un user-ID effettivo uguale all'user-ID reale o a quello effettivo del
3325 processo di cui vuole cambiare la priorità, oppure deve avere i privilegi di
3326 amministratore (con la capacità \const{CAP\_SYS\_NICE}).
3327
3328 La priorità assoluta può essere riletta indietro dalla funzione
3329 \funcd{sched\_getscheduler}, il cui prototipo è:
3330 \begin{prototype}{sched.h}
3331 {int sched\_getscheduler(pid\_t pid)}
3332   Legge la politica di scheduling per il processo \param{pid}.
3333
3334   \bodydesc{La funzione ritorna la politica di scheduling in caso di successo
3335     e -1 in caso di errore, nel qual caso \var{errno} può assumere i valori:
3336     \begin{errlist}
3337     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3338     \item[\errcode{EINVAL}] il valore di \param{pid} è negativo.
3339   \end{errlist}}
3340 \end{prototype}
3341
3342 La funzione restituisce il valore (secondo quanto elencato in
3343 tab.~\ref{tab:proc_sched_policy}) della politica di scheduling per il processo
3344 specificato; se \param{pid} è nullo viene restituito quello del processo
3345 chiamante.
3346
3347 L'ultima funzione che permette di leggere le informazioni relative ai processi
3348 real-time è \funcd{sched\_rr\_get\_interval}, che permette di ottenere la
3349 lunghezza della \textit{time slice} usata dalla politica \textit{round robin};
3350 il suo prototipo è:
3351 \begin{prototype}{sched.h}
3352   {int sched\_rr\_get\_interval(pid\_t pid, struct timespec *tp)} Legge in
3353   \param{tp} la durata della \textit{time slice} per il processo \param{pid}.
3354
3355   \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
3356     nel qual caso \var{errno} può assumere i valori:
3357     \begin{errlist}
3358     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3359     \item[\errcode{ENOSYS}] la system call non è stata implementata.
3360   \end{errlist}}
3361 \end{prototype}
3362
3363 La funzione restituisce il valore dell'intervallo di tempo usato per la
3364 politica \textit{round robin} in una struttura \struct{timespec}, (la cui
3365 definizione si può trovare in fig.~\ref{fig:sys_timeval_struct}). In realtà
3366 dato che in Linux questo intervallo di tempo è prefissato e non modificabile,
3367 questa funzione ritorna sempre un valore di 150 millisecondi, e non importa
3368 specificare il PID di un processo reale.
3369
3370 Come accennato ogni processo che usa lo scheduling real-time può rilasciare
3371 volontariamente la CPU; questo viene fatto attraverso la funzione
3372 \funcd{sched\_yield}, il cui prototipo è:
3373 \begin{prototype}{sched.h}
3374   {int sched\_yield(void)}
3375
3376   Rilascia volontariamente l'esecuzione.
3377
3378   \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
3379     nel qual caso \var{errno} viene impostata opportunamente.}
3380 \end{prototype}
3381
3382 La funzione fa sì che il processo rilasci la CPU, in modo da essere rimesso in
3383 coda alla lista dei processi da eseguire, e permettere l'esecuzione di un
3384 altro processo; se però il processo è l'unico ad essere presente sulla coda
3385 l'esecuzione non sarà interrotta. In genere usano questa funzione i processi
3386 in modalità \textit{fifo}, per permettere l'esecuzione degli altri processi
3387 con pari priorità quando la sezione più urgente è finita.
3388
3389 % TODO: con il 2.6.23 il comportamento è stato leggermente modificato ed è
3390 % stato introdotto /proc/sys/kernel/sched_compat_yield da mettere a 1 per aver
3391 % la compatibilità con il precedente.
3392
3393 \subsection{Il controllo dello \textit{scheduler} per i sistemi
3394   multiprocessore}
3395 \label{sec:proc_sched_multiprocess}
3396
3397 Infine con il supporto dei sistemi multiprocessore sono state introdotte delle
3398 funzioni che permettono di controllare in maniera più dettagliata la scelta di
3399 quale processore utilizzare per eseguire un certo programma. Uno dei problemi
3400 che si pongono nei sistemi multiprocessore è infatti quello del cosiddetto
3401 \index{effetto~ping-pong} \textsl{effetto ping-pong}. Può accadere cioè che lo
3402 scheduler, quando riavvia un processo precedentemente interrotto scegliendo il
3403 primo processore disponibile, lo faccia eseguire da un processore diverso
3404 rispetto a quello su cui era stato eseguito in precedenza. Se il processo
3405 passa da un processore all'altro in questo modo (cosa che avveniva abbastanza
3406 di frequente con i kernel della seria 2.4.x) si ha l'\textsl{effetto
3407   ping-pong}.
3408
3409 Questo tipo di comportamento può generare dei seri problemi di prestazioni;
3410 infatti tutti i processori moderni utilizzano una memoria interna (la
3411 \textit{cache}) contenente i dati più usati, che permette di evitare di
3412 eseguire un accesso (molto più lento) alla memoria principale sulla scheda
3413 madre.  Chiaramente un processo sarà favorito se i suoi dati sono nella cache
3414 del processore, ma è ovvio che questo può essere vero solo per un processore
3415 alla volta, perché in presenza di più copie degli stessi dati su più
3416 processori, non si potrebbe determinare quale di questi ha la versione dei
3417 dati aggiornata rispetto alla memoria principale.
3418
3419 Questo comporta che quando un processore inserisce un dato nella sua cache,
3420 tutti gli altri processori che hanno lo stesso dato devono invalidarlo, e
3421 questa operazione è molto costosa in termini di prestazioni. Il problema
3422 diventa serio quando si verifica l'\textsl{effetto ping-pong}, in tal caso
3423 infatti un processo \textsl{rimbalza} continuamente da un processore all'altro
3424 e si ha una continua invalidazione della cache, che non diventa mai
3425 disponibile.
3426
3427 \itindbeg{CPU~affinity}
3428
3429 Per ovviare a questo tipo di problemi è nato il concetto di \textsl{affinità
3430   di processore} (o \textit{CPU affinity}); la possibilità cioè di far sì che
3431 un processo possa essere assegnato per l'esecuzione sempre allo stesso
3432 processore. Lo scheduler dei kernel della serie 2.4.x aveva una scarsa
3433 \textit{CPU affinity}, e \index{effetto~ping-pong} l'effetto ping-pong era
3434 comune; con il nuovo scheduler dei kernel della 2.6.x questo problema è stato
3435 risolto ed esso cerca di mantenere il più possibile ciascun processo sullo
3436 stesso processore.
3437
3438 In certi casi però resta l'esigenza di poter essere sicuri che un processo sia
3439 sempre eseguito dallo stesso processore,\footnote{quella che viene detta
3440   \textit{hard CPU affinity}, in contrasto con quella fornita dallo scheduler,
3441   detta \textit{soft CPU affinity}, che di norma indica solo una preferenza,
3442   non un requisito assoluto.} e per poter risolvere questo tipo di
3443 problematiche nei nuovi kernel\footnote{le due system call per la gestione
3444   della \textit{CPU affinity} sono state introdotte nel kernel 2.5.8, e le
3445   funzioni di libreria nelle \textsl{glibc} 2.3.} è stata introdotta
3446 l'opportuna infrastruttura ed una nuova system call che permette di impostare
3447 su quali processori far eseguire un determinato processo attraverso una
3448 \textsl{maschera di affinità}. La corrispondente funzione di libreria è
3449 \funcd{sched\_setaffinity} ed il suo prototipo è:
3450 \begin{prototype}{sched.h}
3451   {int sched\_setaffinity (pid\_t pid, unsigned int cpusetsize, const
3452     cpu\_set\_t *cpuset)}
3453   Imposta la maschera di affinità del processo \param{pid}.
3454
3455   \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
3456     nel qual caso \var{errno} può assumere i valori:
3457     \begin{errlist}
3458     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3459     \item[\errcode{EINVAL}] il valore di \param{cpuset} contiene riferimenti a
3460       processori non esistenti nel sistema.
3461     \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
3462       eseguire l'operazione.
3463   \end{errlist}
3464   ed inoltre anche \errval{EFAULT}.}
3465 \end{prototype}
3466
3467
3468 Questa funzione e la corrispondente \func{sched\_setaffinity} hanno una storia
3469 abbastanza complessa, la system call prevede l'uso di due ulteriori argomenti
3470 di tipo \texttt{unsigned int len} e \texttt{unsigned long *mask}, che
3471 corrispondono al fatto che la implementazione effettiva usa una semplice
3472 maschera binaria. Quando le funzioni vennero incluse nelle \acr{glibc}
3473 assunsero invece il prototipo appena mostrato. A complicare la cosa si
3474 aggiunge il fatto che nella versione 2.3.3 delle \acr{glibc} l'argomento
3475 \param{cpusetsize} è stato eliminato, per poi essere ripristinato nella
3476 versione 2.3.4.\footnote{pertanto se la vostra pagina di manuale non è
3477   aggiornata, o usate quella particolare versione delle \acr{glibc}, potrete
3478   trovare indicazioni diverse, il prototipo illustrato è quello riportato
3479   nella versione corrente (maggio 2008) delle pagine di manuale e
3480   corrispondente alla definizione presente in \file{sched.h}.}
3481
3482 La funzione imposta, con l'uso del valore contenuto all'indirizzo
3483 \param{cpuset}, l'insieme dei processori sui quali deve essere eseguito il
3484 processo identificato tramite il valore passato in \param{pid}. Come in
3485 precedenza il valore nullo di \param{pid} indica il processo corrente.  Per
3486 poter utilizzare questa funzione sono richiesti i privilegi di amministratore
3487 (è necessaria la capacità \const{CAP\_SYS\_NICE}) altrimenti essa fallirà con
3488 un errore di \errcode{EPERM}. Una volta impostata una maschera di affinità,
3489 questa viene ereditata attraverso una \func{fork}, in questo modo diventa
3490 possibile legare automaticamente un gruppo di processi ad un singolo
3491 processore.
3492
3493 Nell'uso comune, almeno con i kernel della serie 2.6.x, l'uso di questa
3494 funzione non è necessario, in quanto è lo scheduler stesso che provvede a
3495 mantenere al meglio l'affinità di processore. Esistono però esigenze
3496 particolari, ad esempio quando un processo (o un gruppo di processi) è
3497 utilizzato per un compito importante (ad esempio per applicazioni real-time o
3498 la cui risposta è critica) e si vuole la massima velocità, con questa
3499 interfaccia diventa possibile selezionare gruppi di processori utilizzabili in
3500 maniera esclusiva.  Lo stesso dicasi quando l'accesso a certe risorse (memoria
3501 o periferiche) può avere un costo diverso a seconda del processore (come
3502 avviene nelle architetture NUMA).
3503
3504 Infine se un gruppo di processi accede alle stesse risorse condivise (ad
3505 esempio una applicazione con più \itindex{thread} \textit{thread}) può avere
3506 senso usare lo stesso processore in modo da sfruttare meglio l'uso della sua
3507 cache; questo ovviamente riduce i benefici di un sistema multiprocessore
3508 nell'esecuzione contemporanea dei \itindex{thread} \textit{thread}, ma in
3509 certi casi (quando i \itindex{thread} \textit{thread} sono inerentemente
3510 serializzati nell'accesso ad una risorsa) possono esserci sufficienti vantaggi
3511 nell'evitare la perdita della cache da rendere conveniente l'uso dell'affinità
3512 di processore.
3513
3514 Per facilitare l'uso dell'argomento \param{cpuset} le \acr{glibc} hanno
3515 introdotto un apposito dato di tipo, \ctyp{cpu\_set\_t},\footnote{questa è una
3516   estensione specifica delle \acr{glibc}, da attivare definendo la macro
3517   \macro{\_GNU\_SOURCE}, non esiste infatti una standardizzazione per
3518   questo tipo di interfaccia e POSIX al momento non prevede nulla al
3519   riguardo.} che permette di identificare un insieme di processori. Il dato è
3520 una maschera binaria: in generale è un intero a 32 bit in cui ogni bit
3521 corrisponde ad un processore, ma dato che per architetture particolari il
3522 numero di bit di un intero può non essere sufficiente, è stata creata questa
3523 che è una interfaccia generica che permette di usare a basso livello un tipo
3524 di dato qualunque rendendosi indipendenti dal numero di bit e dalla loro
3525 disposizione.
3526
3527 Questa interfaccia, oltre alla definizione del tipo di dato apposito, prevede
3528 anche una serie di macro di preprocessore per la manipolazione dello stesso,
3529 che consentono di svuotare un insieme, aggiungere o togliere un processore da
3530 esso o verificare se vi è già presente:
3531 \begin{functions}
3532   \headdecl{sched.h}
3533   \funcdecl{void \macro{CPU\_ZERO}(cpu\_set\_t *set)}
3534   Inizializza l'insieme (vuoto).
3535
3536   \funcdecl{void \macro{CPU\_SET}(int cpu, cpu\_set\_t *set)}
3537   Inserisce il processore \param{cpu} nell'insieme.
3538
3539   \funcdecl{void \macro{CPU\_CLR}(int cpu, cpu\_set\_t *set)}
3540   Rimuove il processore \param{cpu} nell'insieme.
3541
3542   \funcdecl{int \macro{CPU\_ISSET}(int cpu, cpu\_set\_t *set)}
3543   Controlla se il processore \param{cpu} è nell'insieme.
3544 \end{functions}
3545
3546 Oltre a queste macro, simili alle analoghe usate per gli insiemi di file
3547 descriptor (vedi sez.~\ref{sec:file_select}) è definita la costante
3548 \const{CPU\_SETSIZE} che indica il numero massimo di processori che possono
3549 far parte dell'insieme, e che costituisce un limite massimo al valore
3550 dell'argomento \param{cpu}.
3551
3552 In generale la maschera di affinità è preimpostata in modo che un processo
3553 possa essere eseguito su qualunque processore, se può comunque leggere il
3554 valore per un processo specifico usando la funzione
3555 \funcd{sched\_getaffinity}, il suo prototipo è:
3556 \begin{prototype}{sched.h}
3557   {int sched\_getaffinity (pid\_t pid, unsigned int cpusetsize,
3558     const cpu\_set\_t *cpuset)}
3559   Legge la maschera di affinità del processo \param{pid}.
3560
3561   \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
3562     nel qual caso \var{errno} può assumere i valori:
3563     \begin{errlist}
3564     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3565     \item[\errcode{EFAULT}] il valore di \param{cpuset} non è un indirizzo
3566       valido.
3567   \end{errlist} }
3568 \end{prototype}
3569
3570 La funzione restituirà all'indirizzo specificato da \param{cpuset} il valore
3571 della maschera di affinità del processo, così da poterla riutilizzare per una
3572 successiva reimpostazione. In questo caso non sono necessari privilegi
3573 particolari.
3574
3575 È chiaro che queste funzioni per la gestione dell'affinità hanno significato
3576 soltanto su un sistema multiprocessore, esse possono comunque essere
3577 utilizzate anche in un sistema con un processore singolo, nel qual caso però
3578 non avranno alcun risultato effettivo.
3579
3580 \itindend{scheduler}
3581 \itindend{CPU~affinity}
3582
3583
3584
3585 \section{Problematiche di programmazione multitasking}
3586 \label{sec:proc_multi_prog}
3587
3588 Benché i processi siano strutturati in modo da apparire il più possibile come
3589 indipendenti l'uno dall'altro, nella programmazione in un sistema multitasking
3590 occorre tenere conto di una serie di problematiche che normalmente non
3591 esistono quando si ha a che fare con un sistema in cui viene eseguito un solo
3592 programma alla volta.
3593
3594 Pur essendo questo argomento di carattere generale, ci è parso opportuno
3595 introdurre sinteticamente queste problematiche, che ritroveremo a più riprese
3596 in capitoli successivi, in questa sezione conclusiva del capitolo in cui
3597 abbiamo affrontato la gestione dei processi.
3598
3599
3600 \subsection{Le operazioni atomiche}
3601 \label{sec:proc_atom_oper}
3602
3603 La nozione di \textsl{operazione atomica} deriva dal significato greco della
3604 parola atomo, cioè indivisibile; si dice infatti che un'operazione è atomica
3605 quando si ha la certezza che, qualora essa venga effettuata, tutti i passaggi
3606 che devono essere compiuti per realizzarla verranno eseguiti senza possibilità
3607 di interruzione in una fase intermedia.
3608
3609 In un ambiente multitasking il concetto è essenziale, dato che un processo può
3610 essere interrotto in qualunque momento dal kernel che mette in esecuzione un
3611 altro processo o dalla ricezione di un segnale; occorre pertanto essere
3612 accorti nei confronti delle possibili \itindex{race~condition} \textit{race
3613   condition} (vedi sez.~\ref{sec:proc_race_cond}) derivanti da operazioni
3614 interrotte in una fase in cui non erano ancora state completate.
3615
3616 Nel caso dell'interazione fra processi la situazione è molto più semplice, ed
3617 occorre preoccuparsi della atomicità delle operazioni solo quando si ha a che
3618 fare con meccanismi di intercomunicazione (che esamineremo in dettaglio in
3619 cap.~\ref{cha:IPC}) o nelle operazioni con i file (vedremo alcuni esempi in
3620 sez.~\ref{sec:file_atomic}). In questi casi in genere l'uso delle appropriate
3621 funzioni di libreria per compiere le operazioni necessarie è garanzia
3622 sufficiente di atomicità in quanto le system call con cui esse sono realizzate
3623 non possono essere interrotte (o subire interferenze pericolose) da altri
3624 processi.
3625
3626 Nel caso dei segnali invece la situazione è molto più delicata, in quanto lo
3627 stesso processo, e pure alcune system call, possono essere interrotti in
3628 qualunque momento, e le operazioni di un eventuale \textit{signal handler}
3629 sono compiute nello stesso spazio di indirizzi del processo. Per questo, anche
3630 il solo accesso o l'assegnazione di una variabile possono non essere più
3631 operazioni atomiche (torneremo su questi aspetti in
3632 sez.~\ref{sec:sig_adv_control}).
3633
3634 In questo caso il sistema provvede un tipo di dato, il \type{sig\_atomic\_t},
3635 il cui accesso è assicurato essere atomico.  In pratica comunque si può
3636 assumere che, in ogni piattaforma su cui è implementato Linux, il tipo
3637 \ctyp{int}, gli altri interi di dimensione inferiore ed i puntatori sono
3638 atomici. Non è affatto detto che lo stesso valga per interi di dimensioni
3639 maggiori (in cui l'accesso può comportare più istruzioni in assembler) o per
3640 le strutture. In tutti questi casi è anche opportuno marcare come
3641 \direct{volatile} le variabili che possono essere interessate ad accesso
3642 condiviso, onde evitare problemi con le ottimizzazioni del codice.
3643
3644
3645
3646 \subsection{Le \textit{race condition} ed i \textit{deadlock}}
3647 \label{sec:proc_race_cond}
3648
3649 \itindbeg{race~condition}
3650
3651 Si definiscono \textit{race condition} tutte quelle situazioni in cui processi
3652 diversi operano su una risorsa comune, ed in cui il risultato viene a
3653 dipendere dall'ordine in cui essi effettuano le loro operazioni. Il caso
3654 tipico è quello di un'operazione che viene eseguita da un processo in più
3655 passi, e può essere compromessa dall'intervento di un altro processo che
3656 accede alla stessa risorsa quando ancora non tutti i passi sono stati
3657 completati.
3658
3659 Dato che in un sistema multitasking ogni processo può essere interrotto in
3660 qualunque momento per farne subentrare un altro in esecuzione, niente può
3661 assicurare un preciso ordine di esecuzione fra processi diversi o che una
3662 sezione di un programma possa essere eseguita senza interruzioni da parte di
3663 altri. Queste situazioni comportano pertanto errori estremamente subdoli e
3664 difficili da tracciare, in quanto nella maggior parte dei casi tutto
3665 funzionerà regolarmente, e solo occasionalmente si avranno degli errori.
3666
3667 Per questo occorre essere ben consapevoli di queste problematiche, e del fatto
3668 che l'unico modo per evitarle è quello di riconoscerle come tali e prendere
3669 gli adeguati provvedimenti per far sì che non si verifichino. Casi tipici di
3670 \textit{race condition} si hanno quando diversi processi accedono allo stesso
3671 file, o nell'accesso a meccanismi di intercomunicazione come la memoria
3672 condivisa. In questi casi, se non si dispone della possibilità di eseguire
3673 atomicamente le operazioni necessarie, occorre che quelle parti di codice in
3674 cui si compiono le operazioni sulle risorse condivise (le cosiddette
3675 \index{sezione~critica} \textsl{sezioni critiche}) del programma, siano
3676 opportunamente protette da meccanismi di sincronizzazione (torneremo su queste
3677 problematiche di questo tipo in cap.~\ref{cha:IPC}).
3678
3679 \itindbeg{deadlock}
3680 Un caso particolare di \textit{race condition} sono poi i cosiddetti
3681 \textit{deadlock}, particolarmente gravi in quanto comportano spesso il blocco
3682 completo di un servizio, e non il fallimento di una singola operazione. Per
3683 definizione un \textit{deadlock} è una situazione in cui due o più processi
3684 non sono più in grado di proseguire perché ciascuno aspetta il risultato di
3685 una operazione che dovrebbe essere eseguita dall'altro.
3686
3687
3688 L'esempio tipico di una situazione che può condurre ad un
3689 \textit{deadlock} è quello in cui un flag di
3690 ``\textsl{occupazione}'' viene rilasciato da un evento asincrono (come un
3691 segnale o un altro processo) fra il momento in cui lo si è controllato
3692 (trovandolo occupato) e la successiva operazione di attesa per lo sblocco. In
3693 questo caso, dato che l'evento di sblocco del flag è avvenuto senza che ce ne
3694 accorgessimo proprio fra il controllo e la messa in attesa, quest'ultima
3695 diventerà perpetua (da cui il nome di \textit{deadlock}).
3696
3697 In tutti questi casi è di fondamentale importanza il concetto di atomicità
3698 visto in sez.~\ref{sec:proc_atom_oper}; questi problemi infatti possono essere
3699 risolti soltanto assicurandosi, quando essa sia richiesta, che sia possibile
3700 eseguire in maniera atomica le operazioni necessarie.
3701 \itindend{race~condition}
3702 \itindend{deadlock}
3703
3704
3705 \subsection{Le funzioni rientranti}
3706 \label{sec:proc_reentrant}
3707
3708 \index{funzioni!rientranti|(}
3709
3710 Si dice \textsl{rientrante} una funzione che può essere interrotta in
3711 qualunque punto della sua esecuzione ed essere chiamata una seconda volta da
3712 un altro \itindex{thread} \textit{thread} di esecuzione senza che questo
3713 comporti nessun problema nell'esecuzione della stessa. La problematica è
3714 comune nella programmazione \itindex{thread} \textit{multi-thread}, ma si
3715 hanno gli stessi problemi quando si vogliono chiamare delle funzioni
3716 all'interno dei gestori dei segnali.
3717
3718 Fintanto che una funzione opera soltanto con le variabili locali è rientrante;
3719 queste infatti vengono allocate nello \itindex{stack} \textit{stack}, ed
3720 un'altra invocazione non fa altro che allocarne un'altra copia. Una funzione
3721 può non essere rientrante quando opera su memoria che non è nello
3722 \itindex{stack} \textit{stack}.  Ad esempio una funzione non è mai rientrante
3723 se usa una variabile globale o statica.
3724
3725 Nel caso invece la funzione operi su un oggetto allocato dinamicamente, la
3726 cosa viene a dipendere da come avvengono le operazioni: se l'oggetto è creato
3727 ogni volta e ritornato indietro la funzione può essere rientrante, se invece
3728 esso viene individuato dalla funzione stessa due chiamate alla stessa funzione
3729 potranno interferire quando entrambe faranno riferimento allo stesso oggetto.
3730 Allo stesso modo una funzione può non essere rientrante se usa e modifica un
3731 oggetto che le viene fornito dal chiamante: due chiamate possono interferire
3732 se viene passato lo stesso oggetto; in tutti questi casi occorre molta cura da
3733 parte del programmatore.
3734
3735 In genere le funzioni di libreria non sono rientranti, molte di esse ad
3736 esempio utilizzano variabili statiche, le \acr{glibc} però mettono a
3737 disposizione due macro di compilatore,\footnote{si ricordi quanto illustrato
3738   in sez.~\ref{sec:intro_gcc_glibc_std}.} \macro{\_REENTRANT} e
3739 \macro{\_THREAD\_SAFE}, la cui definizione attiva le versioni rientranti di
3740 varie funzioni di libreria, che sono identificate aggiungendo il suffisso
3741 \code{\_r} al nome della versione normale.
3742
3743 \index{funzioni!rientranti|)}
3744
3745
3746 % LocalWords:  multitasking like VMS child process identifier pid sez shell fig
3747 % LocalWords:  parent kernel init pstree keventd kswapd table struct linux call
3748 % LocalWords:  nell'header scheduler system interrupt timer HZ asm Hertz clock
3749 % LocalWords:  l'alpha tick fork wait waitpid exit exec image glibc int pgid ps
3750 % LocalWords:  sid thread Ingo Molnar ppid getpid getppid sys unistd LD
3751 % LocalWords:  void ForkTest tempnam pathname sibling cap errno EAGAIN ENOMEM
3752 % LocalWords:  stack read only copy write tab client spawn forktest sleep PATH
3753 % LocalWords:  source LIBRARY scheduling race condition printf descriptor dup
3754 % LocalWords:  close group session tms lock vfork execve BSD stream main abort
3755 % LocalWords:  SIGABRT SIGCHLD SIGHUP foreground SIGCONT termination signal ANY
3756 % LocalWords:  handler kill EINTR POSIX options WNOHANG ECHILD option WUNTRACED
3757 % LocalWords:  dump bits rusage getrusage heap const filename argv envp EACCES
3758 % LocalWords:  filesystem noexec EPERM suid sgid root nosuid ENOEXEC ENOENT ELF
3759 % LocalWords:  ETXTBSY EINVAL ELIBBAD BIG EFAULT EIO ENAMETOOLONG ELOOP ENOTDIR
3760 % LocalWords:  ENFILE EMFILE argc execl path execv execle execlp execvp vector
3761 % LocalWords:  list environ NULL umask pending utime cutime ustime fcntl linker
3762 % LocalWords:  opendir libc interpreter FreeBSD capabilities Mandatory Access
3763 % LocalWords:  Control MAC SELinux Security Modules LSM superuser uid gid saved
3764 % LocalWords:  effective euid egid dell' fsuid fsgid getuid geteuid getgid SVr
3765 % LocalWords:  getegid IDS NFS setuid setgid all' logout utmp screen xterm TODO
3766 % LocalWords:  setreuid setregid FIXME ruid rgid seteuid setegid setresuid size
3767 % LocalWords:  setresgid getresuid getresgid value result argument setfsuid DAC
3768 % LocalWords:  setfsgid NGROUPS sysconf getgroups getgrouplist groups ngroups
3769 % LocalWords:  setgroups initgroups patch LIDS CHOWN OVERRIDE Discrectionary PF
3770 % LocalWords:  SEARCH chattr sticky NOATIME socket domain immutable append mmap
3771 % LocalWords:  broadcast multicast multicasting memory locking mlock mlockall
3772 % LocalWords:  shmctl ioperm iopl chroot ptrace accounting swap reboot hangup
3773 % LocalWords:  vhangup mknod lease permitted inherited inheritable bounding AND
3774 % LocalWords:  capability capget capset header ESRCH undef version obj clear PT
3775 % LocalWords:  pag ssize length proc capgetp preemptive cache runnable Stopped
3776 % LocalWords:  Uninterrutible SIGSTOP soft slice nice niceness counter which SC
3777 % LocalWords:  getpriority who setpriority RTLinux RTAI Adeos fault FIFO First
3778 % LocalWords:  yield Robin setscheduler policy param OTHER priority setparam to
3779 % LocalWords:  min getparam getscheduler interval robin ENOSYS fifo ping long
3780 % LocalWords:  affinity setaffinity unsigned mask cpu NUMA CLR ISSET SETSIZE RR
3781 % LocalWords:  getaffinity assembler deadlock REENTRANT SAFE tgz MYPGRP l'OR rr
3782 % LocalWords:  WIFEXITED WEXITSTATUS WIFSIGNALED WTERMSIG WCOREDUMP WIFSTOPPED
3783 % LocalWords:  WSTOPSIG opt char INTERP arg SIG IGN DFL mascheck grp FOWNER RAW
3784 % LocalWords:  FSETID SETPCAP BIND SERVICE ADMIN PACKET IPC OWNER MODULE RAWIO
3785 % LocalWords:  PACCT RESOURCE TTY CONFIG SETFCAP hdrp datap libcap lcap text tp
3786 % LocalWords:  get ncap caps CapInh CapPrm fffffeff CapEff getcap STAT dall'I
3787 % LocalWords:  inc PRIO SUSv PRGR prio SysV SunOS Ultrix sched timespec len sig
3788 % LocalWords:  cpusetsize cpuset atomic tickless redirezione WCONTINUED stopped
3789 % LocalWords:  waitid NOCLDSTOP ENOCHLD WIFCONTINUED ifdef endif idtype siginfo
3790 % LocalWords:  infop ALL WEXITED WSTOPPED WNOWAIT signo CLD EXITED KILLED page
3791 % LocalWords:  CONTINUED sources forking Spawned successfully executing exiting
3792
3793 %%% Local Variables:
3794 %%% mode: latex
3795 %%% TeX-master: "gapil"
3796 %%% End:
3797 % LocalWords:  next cat for COMMAND pts bash defunct