prochand.tex

   1 %% prochand.tex
   2 %%
   3 %% Copyright (C) 2000-2011 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{La gestione dei processi}
  13 \label{cha:process_handling}
  14
  15 Come accennato nell'introduzione in un sistema unix-like tutte le operazioni
  16 vengono svolte tramite opportuni processi.  In sostanza questi ultimi vengono
  17 a costituire l'unità base per l'allocazione e l'uso delle risorse del sistema.
  18
  19 Nel precedente capitolo abbiamo esaminato il funzionamento di un processo come
  20 unità a se stante, in questo esamineremo il funzionamento dei processi
  21 all'interno del sistema. Saranno cioè affrontati i dettagli della creazione e
  22 della terminazione dei processi, della gestione dei loro attributi e
  23 privilegi, e di tutte le funzioni a questo connesse. Infine nella sezione
  24 finale introdurremo alcune problematiche generiche della programmazione in
  25 ambiente multitasking.
  26
  27
  28 \section{Le funzioni di base}% della gestione dei processi}
  29 \label{sec:proc_handling}
  30
  31 In questa sezione tratteremo le problematiche della gestione dei processi
  32 all'interno del sistema, illustrandone tutti i dettagli.  Inizieremo con una
  33 panoramica dell'architettura dei processi, tratteremo poi le funzioni
  34 elementari che permettono di leggerne gli identificatori, per poi passare alla
  35 spiegazione delle funzioni base che si usano per la creazione e la
  36 terminazione dei processi, e per la messa in esecuzione degli altri programmi.
  37
  38
  39 \subsection{L'architettura della gestione dei processi}
  40 \label{sec:proc_hierarchy}
  41
  42 A differenza di quanto avviene in altri sistemi, ad esempio nel VMS la
  43 generazione di nuovi processi è un'operazione privilegiata, una delle
  44 caratteristiche fondanti di Unix, che esamineremo in dettaglio più avanti, è
  45 che qualunque processo può a sua volta generarne altri. Ogni processo è
  46 identificato presso il sistema da un numero univoco, il cosiddetto
  47 \textit{process identifier} o, più brevemente, \acr{pid}, assegnato in forma
  48 progressiva (vedi sez.~\ref{sec:proc_pid}) quando il processo viene creato.
  49
  50 Una seconda caratteristica di un sistema unix-like è che la generazione di un
  51 processo è un'operazione separata rispetto al lancio di un programma. In
  52 genere la sequenza è sempre quella di creare un nuovo processo, il quale
  53 eseguirà, in un passo successivo, il programma desiderato: questo è ad esempio
  54 quello che fa la shell quando mette in esecuzione il programma che gli
  55 indichiamo nella linea di comando.
  56
  57 Una terza caratteristica del sistema è che ogni processo è sempre stato
  58 generato da un altro processo, il processo generato viene chiamato
  59 \textit{processo figlio} (\textit{child process}) mentre quello che lo ha
  60 viene chiamato \textsl{processo padre} (\textit{parent process}). Questo vale
  61 per tutti i processi, con una sola eccezione, dato che ci deve essere un punto
  62 di partenza esiste un processo speciale (che normalmente è \cmd{/sbin/init}),
  63 che come abbiamo accennato in sez.~\ref{sec:intro_kern_and_sys} viene lanciato
  64 dal kernel alla conclusione della fase di avvio. Essendo questo il primo
  65 processo lanciato dal sistema ha sempre il \acr{pid} uguale a 1 e non è figlio
  66 di nessun altro processo.
  67
  68 Ovviamente \cmd{init} è un processo speciale che in genere si occupa di far
  69 partire tutti gli altri processi necessari al funzionamento del sistema,
  70 inoltre \cmd{init} è essenziale per svolgere una serie di compiti
  71 amministrativi nelle operazioni ordinarie del sistema (torneremo su alcuni di
  72 essi in sez.~\ref{sec:proc_termination}) e non può mai essere terminato. La
  73 struttura del sistema comunque consente di lanciare al posto di \cmd{init}
  74 qualunque altro programma, e in casi di emergenza (ad esempio se il file di
  75 \cmd{init} si fosse corrotto) è ad esempio possibile lanciare una shell al suo
  76 posto.\footnote{la cosa si fa passando la riga \cmd{init=/bin/sh} come
  77   parametro di avvio del kernel, l'argomento è di natura amministrativa e
  78   trattato in sez.~5.3 di \cite{AGL}.}
  79
  80 \begin{figure}[!htb]
  81   \footnotesize
  82 \begin{Command}
  83 [piccardi@gont piccardi]$ pstree -n
  84 \end{Command}
  85 \begin{Terminal}
  86 init-+-keventd
  87      |-kapm-idled
  88      |-kreiserfsd
  89      |-portmap
  90      |-syslogd
  91      |-klogd
  92      |-named
  93      |-rpc.statd
  94      |-gpm
  95      |-inetd
  96      |-junkbuster
  97      |-master-+-qmgr
  98      |        `-pickup
  99      |-sshd
 100      |-xfs
 101      |-cron
 102      |-bash---startx---xinit-+-XFree86
 103      |                       `-WindowMaker-+-ssh-agent
 104      |                                     |-wmtime
 105      |                                     |-wmmon
 106      |                                     |-wmmount
 107      |                                     |-wmppp
 108      |                                     |-wmcube
 109      |                                     |-wmmixer
 110      |                                     |-wmgtemp
 111      |                                     |-wterm---bash---pstree
 112      |                                     `-wterm---bash-+-emacs
 113      |                                                    `-man---pager
 114      |-5*[getty]
 115      |-snort
 116      `-wwwoffled
 117 \end{Terminal}
 118 %$
 119   \caption{L'albero dei processi, così come riportato dal comando
 120     \cmd{pstree}.}
 121   \label{fig:proc_tree}
 122 \end{figure}
 123
 124 Dato che tutti i processi attivi nel sistema sono comunque generati da
 125 \cmd{init} o da uno dei suoi figli si possono classificare i processi con la
 126 relazione padre/figlio in un'organizzazione gerarchica ad albero. In
 127 fig.~\ref{fig:proc_tree} si è mostrato il risultato del comando \cmd{pstree}
 128 che permette di visualizzare questa struttura, alla cui base c'è \cmd{init}
 129 che è progenitore di tutti gli altri processi.\footnote{in realtà questo non è
 130   del tutto vero, in Linux, specialmente nelle versioni più recenti del
 131   kernel, ci sono alcuni processi speciali (come \cmd{keventd}, \cmd{kswapd},
 132   ecc.) che pur comparendo nei comandi come figli di \cmd{init}, o con
 133   \acr{pid} successivi ad uno, sono in realtà processi interni al kernel e che
 134   non rientrano in questa classificazione.}
 135
 136 Il kernel mantiene una tabella dei processi attivi, la cosiddetta
 137 \itindex{process~table} \textit{process table}. Per ciascun processo viene
 138 mantenuta una voce in questa tabella, costituita da una struttura
 139 \struct{task\_struct}, che contiene tutte le informazioni rilevanti per quel
 140 processo. Tutte le strutture usate a questo scopo sono dichiarate
 141 nell'\textit{header file} \file{linux/sched.h}, ed uno schema semplificato,
 142 che riporta la struttura delle principali informazioni contenute nella
 143 \struct{task\_struct} (che in seguito incontreremo a più riprese), è mostrato
 144 in fig.~\ref{fig:proc_task_struct}.
 145
 146 \begin{figure}[!htb]
 147   \centering \includegraphics[width=14cm]{img/task_struct}
 148   \caption{Schema semplificato dell'architettura delle strutture usate dal
 149     kernel nella gestione dei processi.}
 150   \label{fig:proc_task_struct}
 151 \end{figure}
 152
 153 % TODO la task_struct è cambiata per qualche dettaglio vedi anche
 154 % http://www.ibm.com/developerworks/linux/library/l-linux-process-management/
 155 % TODO completare la parte su quando viene chiamato lo scheduler.
 156
 157 Come accennato in sez.~\ref{sec:intro_unix_struct} è lo \itindex{scheduler}
 158 \textit{scheduler} che decide quale processo mettere in esecuzione; esso viene
 159 eseguito ad ogni \textit{system call} ed ad ogni interrupt e in una serie di
 160 altre occasioni, ma può essere anche attivato esplicitamente. Il timer di
 161 sistema provvede comunque a che esso sia invocato periodicamente; generando un
 162 interrupt periodico secondo la frequenza specificata dalla costante
 163 \const{HZ},\footnote{fino al kernel 2.4 il valore di \const{HZ} era 100 su
 164   tutte le architetture tranne l'alpha, per cui era 1000, nel 2.6 è stato
 165   portato a 1000 su tutte; dal 2.6.13 lo si può impostare in fase di
 166   compilazione del kernel, con un default di 250 e valori possibili di 100,
 167   250, 1000 e dal 2.6.20 anche 300 (che è divisibile per le frequenze di
 168   refresh della televisione); occorre fare attenzione a non confondere questo
 169   valore con quello dei \itindex{clock~tick} \textit{clock tick} (vedi
 170   sez.~\ref{sec:sys_unix_time}).} definita in \file{asm/param.h}, ed il cui
 171 valore è espresso in Hertz.
 172
 173 A partire dal kernel 2.6.21 è stato introdotto anche un meccanismo
 174 completamente diverso, detto \textit{tickless}, in cui non c'è più una
 175 interruzione periodica con frequenza prefissata, ma ad ogni chiamata del timer
 176 viene programmata l'interruzione successiva sulla base di una stima; in questo
 177 modo si evita di dover eseguire un migliaio di interruzioni al secondo anche
 178 su macchine che non stanno facendo nulla, con un forte risparmio nell'uso
 179 dell'energia da parte del processore che può essere messo in stato di
 180 sospensione anche per lunghi periodi di tempo.
 181
 182 Indipendentemente dalle motivazioni per cui questo avviene, ogni volta che
 183 viene eseguito lo \itindex{scheduler} \textit{scheduler} effettua il calcolo
 184 delle priorità dei vari processi attivi (torneremo su questo in
 185 sez.~\ref{sec:proc_priority}) e stabilisce quale di essi debba essere posto in
 186 esecuzione fino alla successiva invocazione.
 187
 188
 189 \subsection{Gli identificatori dei processi}
 190 \label{sec:proc_pid}
 191
 192 Come accennato nella sezione precedente ogni processo viene identificato dal
 193 sistema da un numero identificativo univoco, il \textit{process ID} o
 194 \acr{pid}. Questo è un tipo di dato standard, \type{pid\_t} che in genere è un
 195 intero con segno (nel caso di Linux e delle \acr{glibc} il tipo usato è
 196 \ctyp{int}).
 197
 198 Il \acr{pid} viene assegnato in forma progressiva ogni volta che un nuovo
 199 processo viene creato,\footnote{in genere viene assegnato il numero successivo
 200   a quello usato per l'ultimo processo creato, a meno che questo numero non
 201   sia già utilizzato per un altro \acr{pid}, \acr{pgid} o \acr{sid} (vedi
 202   sez.~\ref{sec:sess_proc_group}).} fino ad un limite che, essendo il
 203 tradizionalmente il \acr{pid} un numero positivo memorizzato in un intero a 16
 204 bit, arriva ad un massimo di 32768.  Oltre questo valore l'assegnazione
 205 riparte dal numero più basso disponibile a partire da un minimo di
 206 300,\footnote{questi valori, fino al kernel 2.4.x, erano definiti dalla macro
 207   \const{PID\_MAX} nei file \file{threads.h} e \file{fork.c} dei sorgenti del
 208   kernel, con il 2.6.x e la nuova interfaccia per i \itindex{thread}
 209   \textit{thread} anche il meccanismo di allocazione dei \acr{pid} è stato
 210   modificato ed il valore massimo è impostabile attraverso il file
 211   \procfile{/proc/sys/kernel/pid\_max} e di default vale 32768.} che serve a
 212 riservare i \acr{pid} più bassi ai processi eseguiti direttamente dal kernel.
 213 Per questo motivo, come visto in sez.~\ref{sec:proc_hierarchy}, il processo di
 214 avvio (\cmd{init}) ha sempre il \acr{pid} uguale a uno.
 215
 216 Tutti i processi inoltre memorizzano anche il \acr{pid} del genitore da cui
 217 sono stati creati, questo viene chiamato in genere \acr{ppid} (da
 218 \textit{parent process ID}).  Questi due identificativi possono essere
 219 ottenuti usando le due funzioni \funcd{getpid} e \funcd{getppid}, i cui
 220 prototipi sono:
 221
 222 \begin{funcproto}{
 223 \fhead{sys/types.h}
 224 \fhead{unistd.h}
 225 \fdecl{pid\_t getpid(void)}
 226 \fdesc{Restituisce il \acr{pid} del processo corrente..}
 227 \fdecl{pid\_t getppid(void)}
 228 \fdesc{Restituisce il \acr{pid} del padre del processo corrente.}
 229 }
 230 {Entrambe le funzioni non riportano condizioni di errore.}
 231 \end{funcproto}
 232
 233 \noindent esempi dell'uso di queste funzioni sono riportati in
 234 fig.~\ref{fig:proc_fork_code}, nel programma \file{ForkTest.c}.
 235
 236 Il fatto che il \acr{pid} sia un numero univoco per il sistema lo rende un
 237 candidato per generare ulteriori indicatori associati al processo di cui
 238 diventa possibile garantire l'unicità: ad esempio in alcune implementazioni la
 239 funzione \func{tempnam} (si veda sez.~\ref{sec:file_temp_file}) usa il
 240 \acr{pid} per generare un \itindex{pathname} \textit{pathname} univoco, che
 241 non potrà essere replicato da un altro processo che usi la stessa
 242 funzione. Questo utilizzo però può risultare pericoloso, un \acr{pid} infatti
 243 è univoco solo fintanto che un processo è attivo, una volta terminato esso
 244 potrà essere riutilizzato da un processo completamente diverso, e di questo
 245 bisogna essere ben consapevoli.
 246
 247 Tutti i processi figli dello stesso processo padre sono detti
 248 \textit{sibling}, questa è una delle relazioni usate nel \textsl{controllo di
 249   sessione}, in cui si raggruppano i processi creati su uno stesso terminale,
 250 o relativi allo stesso login. Torneremo su questo argomento in dettaglio in
 251 cap.~\ref{cha:session}, dove esamineremo gli altri identificativi associati ad
 252 un processo e le varie relazioni fra processi utilizzate per definire una
 253 sessione.
 254
 255 Oltre al \acr{pid} e al \acr{ppid}, e a quelli che vedremo in
 256 sez.~\ref{sec:sess_proc_group}, relativi al controllo di sessione, ad ogni
 257 processo vengono associati degli ulteriori identificatori ed in particolare
 258 quelli che vengono usati per il controllo di accesso.  Questi servono per
 259 determinare se un processo può eseguire o meno le operazioni richieste, a
 260 seconda dei privilegi e dell'identità di chi lo ha posto in esecuzione;
 261 l'argomento è complesso e sarà affrontato in dettaglio in
 262 sez.~\ref{sec:proc_perms}.
 263
 264
 265 \subsection{La funzione \func{fork} e le funzioni di creazione dei processi}
 266 \label{sec:proc_fork}
 267
 268 La funzione \funcd{fork} è la funzione fondamentale della gestione dei
 269 processi: come si è detto tradizionalmente l'unico modo di creare un nuovo
 270 processo era attraverso l'uso di questa funzione,\footnote{in realtà oggi la
 271   \textit{system call} usata da Linux per creare nuovi processi è \func{clone}
 272   (vedi \ref{sec:process_clone}), anche perché a partire dalle \acr{glibc}
 273   2.3.3 non viene più usata la \textit{system call} originale, ma la stessa
 274   \func{fork} viene implementata tramite \func{clone}, cosa che consente una
 275   migliore interazione coi \textit{thread}.} essa quindi riveste un ruolo
 276 centrale tutte le volte che si devono scrivere programmi che usano il
 277 multitasking.\footnote{oggi questa rilevanza, con la diffusione dell'uso dei
 278   \textit{thread} che tratteremo al cap.~\ref{cha:threads}, è in parte minore,
 279   ma \func{fork} resta comunque la funzione principale per la creazione di
 280   processi.} Il prototipo della funzione è:
 281
 282 \begin{funcproto}{
 283 \fhead{unistd.h}
 284 \fdecl{pid\_t fork(void)}
 285 \fdesc{Crea un nuovo processo.}
 286 }
 287 {La funzione ritorna il \acr{pid} del figlio al padre e $0$ al figlio in caso
 288   di successo e $-1$ al padre senza creare il figlio per un errore,
 289   nel qual caso \var{errno} assumerà uno dei valori:
 290   \begin{errlist}
 291   \item[\errcode{EAGAIN}] non ci sono risorse sufficienti per creare un altro
 292     processo (per allocare la tabella delle pagine e le strutture del task) o
 293     si è esaurito il numero di processi disponibili.
 294   \item[\errcode{ENOMEM}] non è stato possibile allocare la memoria per le
 295     strutture necessarie al kernel per creare il nuovo processo.
 296   \end{errlist}}
 297 \end{funcproto}
 298
 299 Dopo il successo dell'esecuzione di una \func{fork} sia il processo padre che
 300 il processo figlio continuano ad essere eseguiti normalmente a partire
 301 dall'istruzione successiva alla \func{fork}. Il processo figlio è una copia del
 302 padre, e riceve una copia dei \index{segmento!testo} segmenti di testo,
 303 \index{segmento!dati} dati e dello \itindex{stack} \textit{stack} (vedi
 304 sez.~\ref{sec:proc_mem_layout}), ed esegue esattamente lo stesso codice del
 305 padre. Si tenga presente però che la memoria è copiata e non condivisa,
 306 pertanto padre e figlio vedranno variabili diverse e le eventuali modifiche
 307 saranno totalmente indipendenti.
 308
 309 Per quanto riguarda la gestione della memoria, in generale il
 310 \index{segmento!testo} segmento di testo, che è identico per i due processi, è
 311 condiviso e tenuto in sola lettura per il padre e per i figli. Per gli altri
 312 segmenti Linux utilizza la tecnica del \itindex{copy~on~write} \textit{copy on
 313   write}. Questa tecnica comporta che una pagina di memoria viene
 314 effettivamente copiata per il nuovo processo solo quando ci viene effettuata
 315 sopra una scrittura, e si ha quindi una reale differenza fra padre e figlio.
 316 In questo modo si rende molto più efficiente il meccanismo della creazione di
 317 un nuovo processo, non essendo più necessaria la copia di tutto lo spazio
 318 degli indirizzi virtuali del padre, ma solo delle pagine di memoria che sono
 319 state modificate, e solo al momento della modifica stessa.
 320
 321 La differenza che si ha nei due processi è che nel processo padre il valore di
 322 ritorno della funzione \func{fork} è il \acr{pid} del processo figlio, mentre
 323 nel figlio è zero; in questo modo il programma può identificare se viene
 324 eseguito dal padre o dal figlio.  Si noti come la funzione \func{fork} ritorni
 325 due volte, una nel padre e una nel figlio.
 326
 327 La scelta di questi valori di ritorno non è casuale, un processo infatti può
 328 avere più figli, ed il valore di ritorno di \func{fork} è l'unico modo che gli
 329 permette di identificare quello appena creato. Al contrario un figlio ha
 330 sempre un solo padre, il cui \acr{pid} può sempre essere ottenuto con
 331 \func{getppid}, come spiegato in sez.~\ref{sec:proc_pid}, per cui si usa il
 332 valore nullo, che non è il \acr{pid} di nessun processo.
 333
 334 Normalmente la chiamata a \func{fork} può fallire solo per due ragioni: o ci
 335 sono già troppi processi nel sistema, il che di solito è sintomo che
 336 qualcos'altro non sta andando per il verso giusto, o si è ecceduto il limite
 337 sul numero totale di processi permessi all'utente argomento su cui torneremo
 338 in sez.~\ref{sec:sys_resource_limit}, (vedi in particolare
 339 tab.~\ref{tab:sys_rlimit_values}).
 340
 341 L'uso di \func{fork} avviene secondo due modalità principali; la prima è
 342 quella in cui all'interno di un programma si creano processi figli cui viene
 343 affidata l'esecuzione di una certa sezione di codice, mentre il processo padre
 344 ne esegue un'altra. È il caso tipico dei programmi server (il modello
 345 \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}) in cui il
 346 padre riceve ed accetta le richieste da parte dei programmi client, per
 347 ciascuna delle quali pone in esecuzione un figlio che è incaricato di fornire
 348 il servizio.
 349
 350 La seconda modalità è quella in cui il processo vuole eseguire un altro
 351 programma; questo è ad esempio il caso della shell. In questo caso il processo
 352 crea un figlio la cui unica operazione è quella di fare una \func{exec} (di
 353 cui parleremo in sez.~\ref{sec:proc_exec}) subito dopo la \func{fork}.
 354
 355 Alcuni sistemi operativi (il VMS ad esempio) combinano le operazioni di questa
 356 seconda modalità (una \func{fork} seguita da una \func{exec}) in un'unica
 357 operazione che viene chiamata \textit{spawn}. Nei sistemi unix-like è stato
 358 scelto di mantenere questa separazione, dato che, come per la prima modalità
 359 d'uso, esistono numerosi scenari in cui si può usare una \func{fork} senza
 360 aver bisogno di eseguire una \func{exec}.
 361
 362 Inoltre, anche nel caso della seconda modalità d'uso, avere le due funzioni
 363 separate permette al figlio di cambiare alcune caratteristiche del processo
 364 (maschera dei segnali, redirezione dell'output, utente per conto del cui viene
 365 eseguito, e molto altro su cui torneremo in seguito) prima della \func{exec},
 366 rendendo così relativamente facile intervenire sulle le modalità di esecuzione
 367 del nuovo programma.
 368
 369 \begin{figure}[!htb]
 370   \footnotesize \centering
 371   \begin{minipage}[c]{\codesamplewidth}
 372   \includecodesample{listati/ForkTest.c}
 373   \end{minipage}
 374   \normalsize
 375   \caption{Esempio di codice per la creazione di nuovi processi.}
 376   \label{fig:proc_fork_code}
 377 \end{figure}
 378
 379 In fig.~\ref{fig:proc_fork_code} è riportato il corpo del codice del programma
 380 di esempio \cmd{forktest}, che permette di illustrare molte caratteristiche
 381 dell'uso della funzione \func{fork}. Il programma crea un numero di figli
 382 specificato da linea di comando, e prende anche alcune opzioni per indicare
 383 degli eventuali tempi di attesa in secondi (eseguiti tramite la funzione
 384 \func{sleep}) per il padre ed il figlio (con \cmd{forktest -h} si ottiene la
 385 descrizione delle opzioni). Il codice completo, compresa la parte che gestisce
 386 le opzioni a riga di comando, è disponibile nel file \file{ForkTest.c},
 387 distribuito insieme agli altri sorgenti degli esempi su
 388 \url{http://gapil.truelite.it/gapil_source.tgz}.
 389
 390 Decifrato il numero di figli da creare, il ciclo principale del programma
 391 (\texttt{\small 24--40}) esegue in successione la creazione dei processi figli
 392 controllando il successo della chiamata a \func{fork} (\texttt{\small
 393   25--29}); ciascun figlio (\texttt{\small 31--34}) si limita a stampare il
 394 suo numero di successione, eventualmente attendere il numero di secondi
 395 specificato e scrivere un messaggio prima di uscire. Il processo padre invece
 396 (\texttt{\small 36--38}) stampa un messaggio di creazione, eventualmente
 397 attende il numero di secondi specificato, e procede nell'esecuzione del ciclo;
 398 alla conclusione del ciclo, prima di uscire, può essere specificato un altro
 399 periodo di attesa.
 400
 401 Se eseguiamo il comando, che è preceduto dall'istruzione \code{export
 402   LD\_LIBRARY\_PATH=./} per permettere l'uso delle librerie dinamiche, senza
 403 specificare attese (come si può notare in (\texttt{\small 17--19}) i valori
 404 predefiniti specificano di non attendere), otterremo come risultato sul
 405 terminale:
 406 \begin{Command}
 407 [piccardi@selidor sources]$ export LD_LIBRARY_PATH=./; ./forktest 3
 408 \end{Command}
 409 %$
 410 \begin{Terminal}
 411 Process 1963: forking 3 child
 412 Spawned 1 child, pid 1964
 413 Child 1 successfully executing
 414 Child 1, parent 1963, exiting
 415 Go to next child
 416 Spawned 2 child, pid 1965
 417 Child 2 successfully executing
 418 Child 2, parent 1963, exiting
 419 Go to next child
 420 Child 3 successfully executing
 421 Child 3, parent 1963, exiting
 422 Spawned 3 child, pid 1966
 423 Go to next child
 424 \end{Terminal}
 425
 426 Esaminiamo questo risultato: una prima conclusione che si può trarre è che non
 427 si può dire quale processo fra il padre ed il figlio venga eseguito per primo
 428 dopo la chiamata a \func{fork}; dall'esempio si può notare infatti come nei
 429 primi due cicli sia stato eseguito per primo il padre (con la stampa del
 430 \acr{pid} del nuovo processo) per poi passare all'esecuzione del figlio
 431 (completata con i due avvisi di esecuzione ed uscita), e tornare
 432 all'esecuzione del padre (con la stampa del passaggio al ciclo successivo),
 433 mentre la terza volta è stato prima eseguito il figlio (fino alla conclusione)
 434 e poi il padre.
 435
 436 In generale l'ordine di esecuzione dipenderà, oltre che dall'algoritmo di
 437 \itindex{scheduler} \textit{scheduling} usato dal kernel, dalla particolare
 438 situazione in cui si trova la macchina al momento della chiamata, risultando
 439 del tutto impredicibile.  Eseguendo più volte il programma di prova e
 440 producendo un numero diverso di figli, si sono ottenute situazioni
 441 completamente diverse, compreso il caso in cui il processo padre ha eseguito
 442 più di una \func{fork} prima che uno dei figli venisse messo in esecuzione.
 443
 444 Pertanto non si può fare nessuna assunzione sulla sequenza di esecuzione delle
 445 istruzioni del codice fra padre e figli, né sull'ordine in cui questi potranno
 446 essere messi in esecuzione. Se è necessaria una qualche forma di precedenza
 447 occorrerà provvedere ad espliciti meccanismi di sincronizzazione, pena il
 448 rischio di incorrere nelle cosiddette \itindex{race~condition} \textit{race
 449   condition} (vedi sez.~\ref{sec:proc_race_cond}).
 450
 451 In realtà con l'introduzione dei kernel della serie 2.6 lo \itindex{scheduler}
 452 \textit{scheduler} è stato modificato per eseguire sempre per primo il
 453 figlio.\footnote{i risultati precedenti infatti sono stati ottenuti usando un
 454   kernel della serie 2.4.}  Questa è una ottimizzazione adottata per evitare
 455 che il padre, effettuando per primo una operazione di scrittura in memoria,
 456 attivasse il meccanismo del \itindex{copy~on~write} \textit{copy on write},
 457 operazione inutile qualora il figlio venga creato solo per eseguire una
 458 \func{exec} su altro programma che scarta completamente lo spazio degli
 459 indirizzi e rende superflua la copia della memoria modificata dal
 460 padre. Eseguendo sempre per primo il figlio la \func{exec} verrebbe effettuata
 461 subito, con la certezza di utilizzare \itindex{copy~on~write} \textit{copy on
 462   write} solo quando necessario.
 463
 464 Con il kernel 2.6.32 però il comportamento è stato nuovamente cambiato,
 465 stavolta facendo eseguire per primo sempre il padre. Si è realizzato infatti
 466 che l'eventualità prospettata per la scelta precedente era comunque molto
 467 improbabile, mentre l'esecuzione immediata del padre presenta sempre il
 468 vantaggio di poter utilizzare immediatamente tutti i dati che sono nella cache
 469 della CPU e nella unità di gestione della memoria virtuale senza doverli
 470 invalidare, cosa che per i processori moderni, che hanno linee di cache
 471 interne molto profonde, avrebbe un forte impatto sulle prestazioni.
 472
 473 Allora anche se quanto detto in precedenza vale come comportamento effettivo
 474 dei programmi soltanto per i kernel fino alla serie 2.4, per mantenere la
 475 portabilità con altri kernel unix-like, e con i diversi comportamenti adottati
 476 dalle Linux nelle versioni successive, è opportuno non fare affidamento su
 477 nessun tipo comportamento predefinito e non dare per assunta l'esecuzione
 478 preventiva del padre o del figlio.
 479
 480 Si noti poi come dopo la \func{fork}, essendo i segmenti di memoria utilizzati
 481 dai singoli processi completamente indipendenti, le modifiche delle variabili
 482 nei processi figli, come l'incremento di \var{i} in (\texttt{\small 31}), sono
 483 visibili solo a loro, (ogni processo vede solo la propria copia della
 484 memoria), e non hanno alcun effetto sul valore che le stesse variabili hanno
 485 nel processo padre ed in eventuali altri processi figli che eseguano lo stesso
 486 codice.
 487
 488 Un secondo aspetto molto importante nella creazione dei processi figli è
 489 quello dell'interazione dei vari processi con i file. Ne parleremo qui anche
 490 se buona parte dei concetti relativi ai file verranno trattati più avanti
 491 (principalmente nel cap.~\ref{cha:file_unix_interface}). Per illustrare meglio
 492 quello che avviene si può redirigere su un file l'output del programma di
 493 test, quello che otterremo è:
 494 \begin{Command}
 495 [piccardi@selidor sources]$ ./forktest 3 > output
 496 [piccardi@selidor sources]$ cat output
 497 \end{Command}
 498 \begin{Terminal}
 499 Process 1967: forking 3 child
 500 Child 1 successfully executing
 501 Child 1, parent 1967, exiting
 502 Test for forking 3 child
 503 Spawned 1 child, pid 1968
 504 Go to next child
 505 Child 2 successfully executing
 506 Child 2, parent 1967, exiting
 507 Test for forking 3 child
 508 Spawned 1 child, pid 1968
 509 Go to next child
 510 Spawned 2 child, pid 1969
 511 Go to next child
 512 Child 3 successfully executing
 513 Child 3, parent 1967, exiting
 514 Test for forking 3 child
 515 Spawned 1 child, pid 1968
 516 Go to next child
 517 Spawned 2 child, pid 1969
 518 Go to next child
 519 Spawned 3 child, pid 1970
 520 Go to next child
 521 \end{Terminal}
 522 che come si vede è completamente diverso da quanto ottenevamo sul terminale.
 523
 524 Il comportamento delle varie funzioni di interfaccia con i file è analizzato
 525 in gran dettaglio in cap.~\ref{cha:file_unix_interface} per l'interfaccia
 526 nativa Unix ed in cap.~\ref{cha:files_std_interface} per la standardizzazione
 527 adottata nelle librerie del linguaggio C e valida per qualunque sistema
 528 operativo. Qui basta accennare che si sono usate le funzioni standard della
 529 libreria del C che prevedono l'output bufferizzato. Il punto è che questa
 530 bufferizzazione (che tratteremo in dettaglio in sez.~\ref{sec:file_buffering})
 531 varia a seconda che si tratti di un file su disco, in cui il buffer viene
 532 scaricato su disco solo quando necessario, o di un terminale, in cui il buffer
 533 viene scaricato ad ogni carattere di a capo.
 534
 535 Nel primo esempio allora avevamo che, essendovi un a capo nella stringa
 536 stampata, ad ogni chiamata a \func{printf} il buffer veniva scaricato, per cui
 537 le singole righe comparivano a video subito dopo l'esecuzione della
 538 \func{printf}. Ma con la redirezione su file la scrittura non avviene più alla
 539 fine di ogni riga e l'output resta nel buffer. Dato che ogni figlio riceve una
 540 copia della memoria del padre, esso riceverà anche quanto c'è nel buffer delle
 541 funzioni di I/O, comprese le linee scritte dal padre fino allora. Così quando
 542 il buffer viene scritto su disco all'uscita del figlio, troveremo nel file
 543 anche tutto quello che il processo padre aveva scritto prima della sua
 544 creazione. E alla fine del file (dato che in questo caso il padre esce per
 545 ultimo) troveremo anche l'output completo del padre.
 546
 547 L'esempio ci mostra un altro aspetto fondamentale dell'interazione con i file,
 548 valido anche per l'esempio precedente, ma meno evidente: il fatto cioè che non
 549 solo processi diversi possono scrivere in contemporanea sullo stesso file
 550 (l'argomento della condivisione dei file è trattato in dettaglio in
 551 sez.~\ref{sec:file_sharing}), ma anche che, a differenza di quanto avviene per
 552 le variabili in memoria, la posizione corrente sul file è condivisa fra il
 553 padre e tutti i processi figli.
 554
 555 Quello che succede è che quando lo \textit{standard output}\footnote{si chiama
 556   così il file su cui un programma scrive i suoi dati in uscita, tratteremo
 557   l'argomento in dettaglio in sez.~\ref{sec:file_std_descr}.} del padre viene
 558 rediretto come si è fatto nell'esempio, lo stesso avviene anche per tutti i
 559 figli. La funzione \func{fork} infatti ha la caratteristica di duplicare nei
 560 processi figli tutti i \textit{file descriptor} (vedi sez.~\ref{sec:file_fd})
 561 dei file aperti nel processo padre (allo stesso modo in cui lo fa la funzione
 562 \func{dup}, trattata in sez.~\ref{sec:file_dup}), il che comporta che padre e
 563 figli condividono le stesse voci della \itindex{file~table} \textit{file
 564   table} (tratteremo in dettagli questi termini in
 565 sez.~\ref{sec:file_sharing}) fra cui c'è anche la posizione corrente nel file.
 566
 567 In questo modo se un processo scrive su un file aggiornerà la posizione
 568 corrente sulla \itindex{file~table} \textit{file table}, e tutti gli altri
 569 processi, che vedono la stessa \itindex{file~table} \textit{file table},
 570 vedranno il nuovo valore. In questo modo si evita, in casi come quello appena
 571 mostrato in cui diversi processi scrivono sullo stesso file, che l'output
 572 successivo di un processo vada a sovrapporsi a quello dei precedenti: l'output
 573 potrà risultare mescolato, ma non ci saranno parti perdute per via di una
 574 sovrascrittura.
 575
 576 Questo tipo di comportamento è essenziale in tutti quei casi in cui il padre
 577 crea un figlio e attende la sua conclusione per proseguire, ed entrambi
 578 scrivono sullo stesso file. Un caso tipico di questo comportamento è la shell
 579 quando lancia un programma.  In questo modo, anche se lo standard output viene
 580 rediretto, il padre potrà sempre continuare a scrivere in coda a quanto
 581 scritto dal figlio in maniera automatica; se così non fosse ottenere questo
 582 comportamento sarebbe estremamente complesso necessitando di una qualche forma
 583 di comunicazione fra i due processi per far riprendere al padre la scrittura
 584 al punto giusto.
 585
 586 In generale comunque non è buona norma far scrivere più processi sullo stesso
 587 file senza una qualche forma di sincronizzazione in quanto, come visto anche
 588 con il nostro esempio, le varie scritture risulteranno mescolate fra loro in
 589 una sequenza impredicibile. Per questo le modalità con cui in genere si usano
 590 i file dopo una \func{fork} sono sostanzialmente due:
 591 \begin{enumerate*}
 592 \item Il processo padre aspetta la conclusione del figlio. In questo caso non
 593   è necessaria nessuna azione riguardo ai file, in quanto la sincronizzazione
 594   della posizione corrente dopo eventuali operazioni di lettura e scrittura
 595   effettuate dal figlio è automatica.
 596 \item L'esecuzione di padre e figlio procede indipendentemente. In questo caso
 597   ciascuno dei due processi deve chiudere i file che non gli servono una volta
 598   che la \func{fork} è stata eseguita, per evitare ogni forma di interferenza.
 599 \end{enumerate*}
 600
 601 Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
 602 proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
 603 comune dopo l'esecuzione di una \func{fork} è la seguente:
 604 \begin{itemize*}
 605 \item i file aperti e gli eventuali flag di \itindex{close-on-exec}
 606   \textit{close-on-exec} impostati (vedi sez.~\ref{sec:proc_exec} e
 607   sez.~\ref{sec:file_fcntl});
 608 \item gli identificatori per il controllo di accesso: l'\textsl{user-ID
 609     reale}, il \textsl{group-ID reale}, l'\textsl{user-ID effettivo}, il
 610   \textsl{group-ID effettivo} ed i \textit{group-ID supplementari} (vedi
 611   sez.~\ref{sec:proc_access_id});
 612 \item gli identificatori per il controllo di sessione: il
 613   \itindex{process~group} \textit{process group-ID} e il \textit{session id}
 614   ed il terminale di controllo (vedi sez.~\ref{sec:sess_proc_group});
 615 \item la directory di lavoro e la directory radice (vedi
 616   sez.~\ref{sec:file_work_dir} e sez.~\ref{sec:file_chroot});
 617 \item la maschera dei permessi di creazione dei file (vedi
 618   sez.~\ref{sec:file_perm_management});
 619 \item la maschera dei segnali bloccati (vedi sez.~\ref{sec:sig_sigmask}) e le
 620   azioni installate (vedi sez.~\ref{sec:sig_gen_beha});
 621 \item i segmenti di memoria condivisa agganciati al processo (vedi
 622   sez.~\ref{sec:ipc_sysv_shm});
 623 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
 624 \item il valori di \textit{nice}, le priorità real-time e le affinità di
 625   processore (vedi sez.~\ref{sec:proc_sched_stand},
 626   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
 627 \item le variabili di ambiente (vedi sez.~\ref{sec:proc_environ}).
 628 \item l'insieme dei descrittori associati alle code di messaggi POSIX (vedi
 629   sez.~\ref{sec:ipc_posix_mq}) che vengono copiate come i \textit{file
 630     descriptor}, questo significa che entrambi condivideranno gli stessi flag.
 631 \end{itemize*}
 632
 633 Oltre a quelle relative ad un diverso spazio degli indirizzi (e una memoria
 634 totalmente indipendente) le differenze fra padre e figlio dopo l'esecuzione di
 635 una \func{fork} invece sono:\footnote{a parte le ultime quattro, relative a
 636   funzionalità specifiche di Linux, le altre sono esplicitamente menzionate
 637   dallo standard POSIX.1-2001.}
 638 \begin{itemize*}
 639 \item il valore di ritorno di \func{fork};
 640 \item il \acr{pid} (\textit{process id}), quello del figlio viene assegnato ad
 641   un nuovo valore univoco;
 642 \item il \acr{ppid} (\textit{parent process id}), quello del figlio viene
 643   impostato al \acr{pid} del padre;
 644 \item i valori dei tempi di esecuzione (vedi sez.~\ref{sec:sys_cpu_times}) e
 645   delle risorse usate (vedi sez.~\ref{sec:sys_resource_use}), che nel figlio
 646   sono posti a zero;
 647 \item i \textit{lock} sui file (vedi sez.~\ref{sec:file_locking}) e sulla
 648   memoria (vedi sez.~\ref{sec:proc_mem_lock}), che non vengono ereditati dal
 649   figlio;
 650 \item gli allarmi, i timer (vedi sez.~\ref{sec:sig_alarm_abort}) ed i segnali
 651   pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che per il figlio vengono
 652   cancellati.
 653 \item le operazioni di I/O asincrono in corso (vedi
 654   sez.~\ref{sec:file_asyncronous_io}) che non vengono ereditate dal figlio;
 655 \item gli aggiustamenti fatti dal padre ai semafori con \func{semop} (vedi
 656   sez.~\ref{sec:ipc_sysv_sem}).
 657 \item le notifiche sui cambiamenti delle directory con \textit{dnotify} (vedi
 658   sez.~\ref{sec:sig_notification}), che non vengono ereditate dal figlio;
 659 \item le mappature di memoria marcate come \const{MADV\_DONTFORK} (vedi
 660   sez.~\ref{sec:file_memory_map}) che non vengono ereditate dal figlio;
 661 \item l'impostazione con \func{prctl} (vedi sez.~\ref{sec:process_prctl}) che
 662   notifica al figlio la terminazione del padre viene cancellata se presente
 663   nel padre;
 664 \item il segnale di terminazione del figlio è sempre \signal{SIGCHLD} anche
 665   qualora nel padre fosse stato modificato (vedi sez.~\ref{sec:process_clone}).
 666 \end{itemize*}
 667
 668 Una seconda funzione storica usata per la creazione di un nuovo processo è
 669 \func{vfork}, che è esattamente identica a \func{fork} ed ha la stessa
 670 semantica e gli stessi errori; la sola differenza è che non viene creata la
 671 tabella delle pagine né la struttura dei task per il nuovo processo. Il
 672 processo padre è posto in attesa fintanto che il figlio non ha eseguito una
 673 \func{execve} o non è uscito con una \func{\_exit}. Il figlio condivide la
 674 memoria del padre (e modifiche possono avere effetti imprevedibili) e non deve
 675 ritornare o uscire con \func{exit} ma usare esplicitamente \func{\_exit}.
 676
 677 Questa funzione è un rimasuglio dei vecchi tempi in cui eseguire una
 678 \func{fork} comportava anche la copia completa del segmento dati del processo
 679 padre, che costituiva un inutile appesantimento in tutti quei casi in cui la
 680 \func{fork} veniva fatta solo per poi eseguire una \func{exec}. La funzione
 681 venne introdotta in BSD per migliorare le prestazioni.
 682
 683 Dato che Linux supporta il \itindex{copy~on~write} \textit{copy on write} la
 684 perdita di prestazioni è assolutamente trascurabile, e l'uso di questa
 685 funzione, che resta un caso speciale della \textit{system call} \func{clone}
 686 (che tratteremo in dettaglio in sez.~\ref{sec:process_clone}) è deprecato; per
 687 questo eviteremo di trattarla ulteriormente.
 688
 689
 690 \subsection{La conclusione di un processo}
 691 \label{sec:proc_termination}
 692
 693 In sez.~\ref{sec:proc_conclusion} abbiamo già affrontato le modalità con cui
 694 chiudere un programma, ma dall'interno del programma stesso. Avendo a che fare
 695 con un sistema \textit{multitasking} resta da affrontare l'argomento dal punto
 696 di vista di come il sistema gestisce la conclusione dei processi.
 697
 698 Abbiamo visto in sez.~\ref{sec:proc_conclusion} le tre modalità con cui un
 699 programma viene terminato in maniera normale: la chiamata di \func{exit}, che
 700 esegue le funzioni registrate per l'uscita e chiude i \textit{file stream} e
 701 poi esegue \func{\_exit}, il ritorno dalla funzione \func{main} equivalente
 702 alla chiamata di \func{exit}, e la chiamata diretta a \func{\_exit}, che passa
 703 direttamente alle operazioni di terminazione del processo da parte del kernel.
 704
 705 Ma abbiamo accennato che oltre alla conclusione normale esistono anche delle
 706 modalità di conclusione anomala. Queste sono in sostanza due: il programma può
 707 chiamare la funzione \func{abort} (vedi sez.~\ref{sec:sig_alarm_abort}) per
 708 invocare una chiusura anomala, o essere terminato da un segnale (torneremo sui
 709 segnali in cap.~\ref{cha:signals}).  In realtà anche la prima modalità si
 710 riconduce alla seconda, dato che \func{abort} si limita a generare il segnale
 711 \signal{SIGABRT}.
 712
 713 Qualunque sia la modalità di conclusione di un processo, il kernel esegue
 714 comunque una serie di operazioni di terminazione: chiude tutti i file aperti,
 715 rilascia la memoria che stava usando, e così via; l'elenco completo delle
 716 operazioni eseguite alla chiusura di un processo è il seguente:
 717 \begin{itemize*}
 718 \item tutti i \textit{file descriptor} (vedi sez.~\ref{sec:file_fd}) sono
 719   chiusi;
 720 \item viene memorizzato lo stato di terminazione del processo;
 721 \item ad ogni processo figlio viene assegnato un nuovo padre (in genere
 722   \cmd{init});
 723 \item viene inviato il segnale \signal{SIGCHLD} al processo padre (vedi
 724   sez.~\ref{sec:sig_sigchld});
 725 \item se il processo è un leader di sessione ed il suo terminale di controllo
 726   è quello della sessione viene mandato un segnale di \signal{SIGHUP} a tutti i
 727   processi del gruppo di \textit{foreground} e il terminale di controllo viene
 728   disconnesso (vedi sez.~\ref{sec:sess_ctrl_term});
 729 \item se la conclusione di un processo rende orfano un \textit{process
 730     group} ciascun membro del gruppo viene bloccato, e poi gli vengono
 731   inviati in successione i segnali \signal{SIGHUP} e \signal{SIGCONT}
 732   (vedi ancora sez.~\ref{sec:sess_ctrl_term}).
 733 \end{itemize*}
 734
 735 \itindbeg{termination~status}
 736
 737 Oltre queste operazioni è però necessario poter disporre di un meccanismo
 738 ulteriore che consenta di sapere come la terminazione è avvenuta: dato che in
 739 un sistema unix-like tutto viene gestito attraverso i processi, il meccanismo
 740 scelto consiste nel riportare lo \itindex{termination~status} \textsl{stato di
 741   terminazione} (il cosiddetto \textit{termination status}) al processo padre.
 742
 743 Nel caso di conclusione normale, abbiamo visto in
 744 sez.~\ref{sec:proc_conclusion} che lo stato di uscita del processo viene
 745 caratterizzato tramite il valore del cosiddetto \textit{exit status}, cioè il
 746 valore passato come argomento alle funzioni \func{exit} o \func{\_exit} o il
 747 valore di ritorno per \func{main}.  Ma se il processo viene concluso in
 748 maniera anomala il programma non può specificare nessun \textit{exit status},
 749 ed è il kernel che deve generare autonomamente il \textit{termination status}
 750 per indicare le ragioni della conclusione anomala.
 751
 752 Si noti la distinzione fra \textit{exit status} e \textit{termination status}:
 753 quello che contraddistingue lo stato di chiusura del processo e viene
 754 riportato attraverso le funzioni \func{wait} o \func{waitpid} (vedi
 755 sez.~\ref{sec:proc_wait}) è sempre quest'ultimo; in caso di conclusione
 756 normale il kernel usa il primo (nel codice eseguito da \func{\_exit}) per
 757 produrre il secondo.
 758
 759 La scelta di riportare al padre lo stato di terminazione dei figli, pur
 760 essendo l'unica possibile, comporta comunque alcune complicazioni: infatti se
 761 alla sua creazione è scontato che ogni nuovo processo abbia un padre, non è
 762 detto che sia così alla sua conclusione, dato che il padre potrebbe essere già
 763 terminato; si potrebbe avere cioè quello che si chiama un processo
 764 \textsl{orfano}.
 765
 766 Questa complicazione viene superata facendo in modo che il processo orfano
 767 venga \textsl{adottato} da \cmd{init}, o meglio dal processo con \acr{pid} 1,
 768 cioè quello lanciato direttamente dal kernel all'avvio, che sta alla base
 769 dell'albero dei processi visto in sez.~\ref{sec:proc_hierarchy} e che anche
 770 per questo motivo ha un ruolo essenziale nel sistema e non può mai
 771 terminare.\footnote{almeno non senza un blocco completo del sistema, in caso
 772   di terminazione o di non esecuzione di \cmd{init} infatti il kernel si
 773   blocca con un cosiddetto \textit{kernel panic}, dato che questo è un errore
 774   fatale.}
 775
 776 Come già accennato quando un processo termina, il kernel controlla se è il
 777 padre di altri processi in esecuzione: in caso positivo allora il \acr{ppid}
 778 di tutti questi processi verrà sostituito dal kernel con il \acr{pid} di
 779 \cmd{init}, cioè con 1. In questo modo ogni processo avrà sempre un padre (nel
 780 caso possiamo parlare di un padre \textsl{adottivo}) cui riportare il suo
 781 stato di terminazione.
 782
 783 Come verifica di questo comportamento possiamo eseguire il nostro programma
 784 \cmd{forktest} imponendo a ciascun processo figlio due secondi di attesa prima
 785 di uscire, il risultato è:
 786 \begin{Command}
 787 [piccardi@selidor sources]$ ./forktest -c2 3
 788 \end{Command}
 789 \begin{Terminal}[commandchars=\\\{\}]
 790 Process 1972: forking 3 child
 791 Spawned 1 child, pid 1973
 792 Child 1 successfully executing
 793 Go to next child
 794 Spawned 2 child, pid 1974
 795 Child 2 successfully executing
 796 Go to next child
 797 Child 3 successfully executing
 798 Spawned 3 child, pid 1975
 799 Go to next child
 800
 801 \textbf{[piccardi@selidor sources]$} Child 3, parent 1, exiting
 802 Child 2, parent 1, exiting
 803 Child 1, parent 1, exiting
 804 \end{Terminal}
 805 come si può notare in questo caso il processo padre si conclude prima dei
 806 figli, tornando alla shell, che stampa il prompt sul terminale: circa due
 807 secondi dopo viene stampato a video anche l'output dei tre figli che
 808 terminano, e come si può notare in questo caso, al contrario di quanto visto
 809 in precedenza, essi riportano 1 come \acr{ppid}.
 810
 811 Altrettanto rilevante è il caso in cui il figlio termina prima del padre,
 812 perché non è detto che il padre possa ricevere immediatamente lo stato di
 813 terminazione, quindi il kernel deve comunque conservare una certa quantità di
 814 informazioni riguardo ai processi che sta terminando.
 815
 816 Questo viene fatto mantenendo attiva la voce nella tabella dei processi, e
 817 memorizzando alcuni dati essenziali, come il \acr{pid}, i tempi di CPU usati
 818 dal processo (vedi sez.~\ref{sec:sys_unix_time}) e lo stato di terminazione,
 819 mentre la memoria in uso ed i file aperti vengono rilasciati immediatamente.
 820
 821 I processi che sono terminati, ma il cui stato di terminazione non è stato
 822 ancora ricevuto dal padre sono chiamati \itindex{zombie} \textit{zombie}, essi
 823 restano presenti nella tabella dei processi ed in genere possono essere
 824 identificati dall'output di \cmd{ps} per la presenza di una \texttt{Z} nella
 825 colonna che ne indica lo stato (vedi tab.~\ref{tab:proc_proc_states}). Quando
 826 il padre effettuerà la lettura dello stato di terminazione anche questa
 827 informazione, non più necessaria, verrà scartata ed il processo potrà
 828 considerarsi completamente concluso.
 829
 830 Possiamo utilizzare il nostro programma di prova per analizzare anche questa
 831 condizione: lanciamo il comando \cmd{forktest} in \textit{background} (vedi
 832 sez.~\ref{sec:sess_job_control}), indicando al processo padre di aspettare 10
 833 secondi prima di uscire. In questo caso, usando \cmd{ps} sullo stesso
 834 terminale (prima dello scadere dei 10 secondi) otterremo:
 835 \begin{Command}
 836 [piccardi@selidor sources]$ ps T
 837 \end{Command}
 838 %$
 839 \begin{Terminal}
 840   PID TTY      STAT   TIME COMMAND
 841   419 pts/0    S      0:00 bash
 842   568 pts/0    S      0:00 ./forktest -e10 3
 843   569 pts/0    Z      0:00 [forktest <defunct>]
 844   570 pts/0    Z      0:00 [forktest <defunct>]
 845   571 pts/0    Z      0:00 [forktest <defunct>]
 846   572 pts/0    R      0:00 ps T
 847 \end{Terminal}
 848 e come si vede, dato che non si è fatto nulla per riceverne lo stato di
 849 terminazione, i tre processi figli sono ancora presenti pur essendosi
 850 conclusi, con lo stato di \itindex{zombie} \textit{zombie} e l'indicazione che
 851 sono terminati (la scritta \texttt{defunct}).
 852
 853 La possibilità di avere degli \itindex{zombie} \textit{zombie} deve essere
 854 tenuta sempre presente quando si scrive un programma che deve essere mantenuto
 855 in esecuzione a lungo e creare molti figli. In questo caso si deve sempre
 856 avere cura di far leggere l'eventuale stato di uscita di tutti i figli. In
 857 genere questo si fa attraverso un apposito \textit{signal handler}, che chiama
 858 la funzione \func{wait}, (vedi sez.~\ref{sec:sig_sigchld} e
 859 sez.~\ref{sec:proc_wait}) di cui vedremo un esempio in
 860 fig.~\ref{fig:sig_sigchld_handl}.
 861
 862 Questa operazione è necessaria perché anche se gli \itindex{zombie}
 863 \textit{zombie} non consumano risorse di memoria o processore, occupano
 864 comunque una voce nella tabella dei processi e se li si lascia accumulare a
 865 lungo quest'ultima potrebbe riempirsi, con l'impossibilità di lanciare nuovi
 866 processi.
 867
 868 Si noti tuttavia che quando un processo adottato da \cmd{init} termina, non
 869 diviene mai uno \itindex{zombie} \textit{zombie}. Questo perché una delle
 870 funzioni di \cmd{init} è appunto quella di chiamare la funzione \func{wait}
 871 per i processi a cui fa da padre, completandone la terminazione. Questo è
 872 quanto avviene anche quando, come nel caso del precedente esempio con
 873 \cmd{forktest}, il padre termina con dei figli in stato di \itindex{zombie}
 874 \textit{zombie}. Questi scompaiono quando, alla terminazione del padre dopo i
 875 secondi programmati, tutti figli che avevamo generato, e che erano diventati
 876 \itindex{zombie} \textit{zombie}, vengono adottati da \cmd{init}, il quale
 877 provvede a completarne la terminazione.
 878
 879 Si tenga presente infine che siccome gli \itindex{zombie} \textit{zombie} sono
 880 processi già terminati, non c'è modo di eliminarli con il comando \cmd{kill} o
 881 inviandogli un qualunque segnale di terminazione (l'argomento è trattato in
 882 sez.~\ref{sec:sig_termination}). L'unica possibilità di cancellarli dalla
 883 tabella dei processi è quella di terminare il processo che li ha generati, in
 884 modo che \cmd{init} possa adottarli e concluderne la terminazione.
 885
 886 \subsection{Le funzioni di attesa e ricezione degli stati di uscita}
 887 \label{sec:proc_wait}
 888
 889 Uno degli usi più comuni delle capacità multitasking di un sistema unix-like
 890 consiste nella creazione di programmi di tipo server, in cui un processo
 891 principale attende le richieste che vengono poi soddisfatte da una serie di
 892 processi figli.
 893
 894 Si è già sottolineato al paragrafo precedente come in questo caso diventi
 895 necessario gestire esplicitamente la conclusione dei figli onde evitare di
 896 riempire di \itindex{zombie} \textit{zombie} la tabella dei
 897 processi. Tratteremo in questa sezione le funzioni deputate a questo compito;
 898 la prima è \funcd{wait} ed il suo prototipo è:
 899
 900 \begin{funcproto}{
 901 \fhead{sys/types.h}
 902 \fhead{sys/wait.h}
 903 \fdecl{pid\_t wait(int *status)}
 904 \fdesc{Attende la terminazione di un processo.}
 905 }
 906 {La funzione ritorna il \acr{pid} del figlio in caso di successo e $-1$ per un
 907   errore, nel qual caso \var{errno} assumerà uno dei valori:
 908   \begin{errlist}
 909   \item[\errcode{ECHILD}] il processo non ha nessun figlio di cui attendere
 910     uno stato di terminazione.
 911   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
 912   \end{errlist}}
 913 \end{funcproto}
 914
 915 Questa funzione è presente fin dalle prime versioni di Unix ed è quella usata
 916 tradizionalmente per attendere la terminazione dei figli. La funzione sospende
 917 l'esecuzione del processo corrente e ritorna non appena un qualunque processo
 918 figlio termina. Se un figlio è già terminato prima della sua chiamata la
 919 funzione ritorna immediatamente, se più processi figli sono già terminati
 920 occorrerà continuare a chiamare la funzione più volte fintanto che non si è
 921 recuperato lo stato di terminazione di tutti quanti.
 922
 923 Al ritorno della funzione lo stato di terminazione del figlio viene salvato
 924 (come \itindex{value~result~argument} \textit{value result argument}) nella
 925 variabile puntata da \param{status} e tutte le risorse del kernel relative al
 926 processo (vedi sez.~\ref{sec:proc_termination}) vengono rilasciate.  Nel caso
 927 un processo abbia più figli il valore di ritorno della funzione sarà impostato
 928 al \acr{pid} del processo di cui si è ricevuto lo stato di terminazione, cosa
 929 che permette di identificare qual è il figlio che è terminato.
 930
 931 \itindend{termination~status}
 932
 933 Questa funzione ha il difetto di essere poco flessibile, in quanto ritorna
 934 all'uscita di un qualunque processo figlio. Nelle occasioni in cui è
 935 necessario attendere la conclusione di uno specifico processo fra tutti quelli
 936 esistenti occorre predisporre un meccanismo che tenga conto di tutti processi
 937 che sono terminati, e provveda a ripetere la chiamata alla funzione nel caso
 938 il processo cercato non risulti fra questi. Se infatti il processo cercato è
 939 già terminato e se è già ricevuto lo stato di uscita senza registrarlo, la
 940 funzione non ha modo di accorgersene, e si continuerà a chiamarla senza
 941 accorgersi che quanto interessava è già accaduto.
 942
 943 Per questo motivo lo standard POSIX.1 ha introdotto una seconda funzione che
 944 effettua lo stesso servizio, ma dispone di una serie di funzionalità più
 945 ampie, legate anche al controllo di sessione (si veda
 946 sez.~\ref{sec:sess_job_control}).  Dato che è possibile ottenere lo stesso
 947 comportamento di \func{wait}\footnote{in effetti il codice
 948   \code{wait(\&status)} è del tutto equivalente a \code{waitpid(WAIT\_ANY,
 949     \&status, 0)}.} si consiglia di utilizzare sempre questa nuova funzione,
 950 \funcd{waitpid}, il cui prototipo è:
 951
 952 \begin{funcproto}{
 953 \fhead{sys/types.h}
 954 \fhead{sys/wait.h}
 955 \fdecl{pid\_t waitpid(pid\_t pid, int *status, int options)}
 956 \fdesc{Attende il cambiamento di stato di un processo figlio.}
 957 }
 958 {La funzione ritorna il \acr{pid} del processo che ha cambiato stato in caso
 959   di successo, o 0 se è stata specificata l'opzione \const{WNOHANG} e il
 960   processo non è uscito e $-1$ per un errore, nel qual caso \var{errno}
 961   assumerà uno dei valori:
 962   \begin{errlist}
 963   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
 964     la funzione è stata interrotta da un segnale.
 965   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
 966     non è figlio del processo chiamante.
 967   \item[\errcode{EINVAL}] si è specificato un valore non valido per
 968     l'argomento \param{options}.
 969   \end{errlist}}
 970 \end{funcproto}
 971
 972 La prima differenza fra le due funzioni è che con \func{waitpid} si può
 973 specificare in maniera flessibile quale processo attendere, sulla base del
 974 valore fornito dall'argomento \param{pid}, questo può assumere diversi valori,
 975 secondo lo specchietto riportato in tab.~\ref{tab:proc_waidpid_pid}, dove si
 976 sono riportate anche le costanti definite per indicare alcuni di essi.
 977
 978 \begin{table}[!htb]
 979   \centering
 980   \footnotesize
 981   \begin{tabular}[c]{|c|c|p{8cm}|}
 982     \hline
 983     \textbf{Valore} & \textbf{Costante} &\textbf{Significato}\\
 984     \hline
 985     \hline
 986     $<-1$& --               & Attende per un figlio il cui
 987                               \itindex{process~group} \textit{process group}
 988                               (vedi sez.~\ref{sec:sess_proc_group}) è uguale
 989                               al valore assoluto di \param{pid}.\\
 990     $-1$&\const{WAIT\_ANY}  & Attende per un figlio qualsiasi, usata in
 991                               questa maniera senza specificare nessuna opzione
 992                               è equivalente a \func{wait}.\\
 993     $ 0$&\const{WAIT\_MYPGRP}&Attende per un figlio il cui
 994                               \itindex{process~group} \textit{process group}
 995                               (vedi sez.~\ref{sec:sess_proc_group}) è
 996                               uguale a quello del processo chiamante.\\
 997     $>0$& --                & Attende per un figlio il cui \acr{pid} è uguale
 998                               al valore di \param{pid}.\\
 999     \hline
1000   \end{tabular}
1001   \caption{Significato dei valori dell'argomento \param{pid} della funzione
1002     \func{waitpid}.}
1003   \label{tab:proc_waidpid_pid}
1004 \end{table}
1005
1006 Il comportamento di \func{waitpid} può inoltre essere modificato passando alla
1007 funzione delle opportune opzioni tramite l'argomento \param{options}; questo
1008 deve essere specificato come maschera binaria delle costanti riportati nella
1009 prima parte in tab.~\ref{tab:proc_waitpid_options} che possono essere
1010 combinate fra loro con un OR aritmetico. Nella seconda parte della stessa
1011 tabella si sono riportati anche alcune opzioni non standard specifiche di
1012 Linux, che consentono un controllo più dettagliato per i processi creati con
1013 la \textit{system call} generica \func{clone} (vedi
1014 sez.~\ref{sec:process_clone}) e che vengono usati principalmente per la
1015 gestione della terminazione dei \itindex{thread} \textit{thread} (vedi
1016 sez.~\ref{sec:thread_xxx}).
1017
1018 \begin{table}[!htb]
1019   \centering
1020   \footnotesize
1021   \begin{tabular}[c]{|l|p{8cm}|}
1022     \hline
1023     \textbf{Costante} & \textbf{Descrizione}\\
1024     \hline
1025     \hline
1026     \const{WNOHANG}   & La funzione ritorna immediatamente anche se non è
1027                         terminato nessun processo figlio.\\
1028     \const{WUNTRACED} & Ritorna anche quando un processo figlio è stato
1029                         fermato.\\
1030     \const{WCONTINUED}& Ritorna anche quando un processo figlio che era stato
1031                         fermato ha ripreso l'esecuzione (disponibile solo a
1032                         partire dal kernel 2.6.10).\\
1033     \hline
1034     \const{\_\_WCLONE}& Attende solo per i figli creati con \func{clone}
1035                         (vedi sez.~\ref{sec:process_clone}), vale a dire
1036                         processi che non emettono nessun segnale
1037                         o emettono un segnale diverso da \signal{SIGCHLD} alla
1038                         terminazione, il default è attendere soltanto i
1039                         processi figli ordinari ignorando quelli creati da
1040                         \func{clone}.\\
1041     \const{\_\_WALL}  & Attende per qualunque figlio, sia ordinario che creato
1042                         con  \func{clone}, se specificata insieme a
1043                         \const{\_\_WCLONE} quest'ultima viene ignorata. \\
1044     \const{\_\_WNOTHREAD}& Non attende per i figli di altri \textit{thread}
1045                         dello stesso \textit{thread group}, questo era il
1046                         comportamento di default del kernel 2.4 che non
1047                         supportava la possibilità, divenuta il default a
1048                         partire dal 2.6, di attendere un qualunque figlio
1049                         appartenente allo stesso \textit{thread group}. \\
1050     \hline
1051   \end{tabular}
1052   \caption{Costanti che identificano i bit dell'argomento \param{options}
1053     della funzione \func{waitpid}.}
1054   \label{tab:proc_waitpid_options}
1055 \end{table}
1056
1057
1058 L'uso dell'opzione \const{WNOHANG} consente di prevenire il blocco della
1059 funzione qualora nessun figlio sia uscito o non si siano verificate le altre
1060 condizioni per l'uscita della funzione. in tal caso. In tal caso la funzione,
1061 invece di restituire il \acr{pid} del processo (che è sempre un intero
1062 positivo) ritornerà un valore nullo.
1063
1064 Le altre due opzioni, \const{WUNTRACED} e \const{WCONTINUED}, consentono
1065 rispettivamente di tracciare non la terminazione di un processo, ma il fatto
1066 che esso sia stato fermato, o fatto ripartire, e sono utilizzate per la
1067 gestione del controllo di sessione (vedi sez.~\ref{sec:sess_job_control}).
1068
1069 Nel caso di \const{WUNTRACED} la funzione ritorna, restituendone il \acr{pid},
1070 quando un processo figlio entra nello stato \textit{stopped}\footnote{in
1071   realtà viene notificato soltanto il caso in cui il processo è stato fermato
1072   da un segnale di stop (vedi sez.~\ref{sec:sess_ctrl_term}), e non quello in
1073   cui lo stato \textit{stopped} è dovuto all'uso di \func{ptrace} (vedi
1074   sez.~\ref{sec:process_ptrace}).} (vedi tab.~\ref{tab:proc_proc_states}),
1075 mentre con \const{WCONTINUED} la funzione ritorna quando un processo in stato
1076 \textit{stopped} riprende l'esecuzione per la ricezione del segnale
1077 \signal{SIGCONT} (l'uso di questi segnali per il controllo di sessione è
1078 trattato in sez.~\ref{sec:sess_ctrl_term}).
1079
1080 La terminazione di un processo figlio (così come gli altri eventi osservabili
1081 con \func{waitpid}) è chiaramente un evento asincrono rispetto all'esecuzione
1082 di un programma e può avvenire in un qualunque momento. Per questo motivo,
1083 come accennato nella sezione precedente, una delle azioni prese dal kernel
1084 alla conclusione di un processo è quella di mandare un segnale di
1085 \signal{SIGCHLD} al padre. L'azione predefinita (si veda
1086 sez.~\ref{sec:sig_base}) per questo segnale è di essere ignorato, ma la sua
1087 generazione costituisce il meccanismo di comunicazione asincrona con cui il
1088 kernel avverte il processo padre che uno dei suoi figli è terminato.
1089
1090 Il comportamento delle funzioni è però cambiato nel passaggio dal kernel 2.4
1091 al kernel 2.6, quest'ultimo infatti si è adeguato alle prescrizioni dello
1092 standard POSIX.1-2001 e come da esso richiesto se \signal{SIGCHLD} viene
1093 ignorato, o se si imposta il flag di \const{SA\_NOCLDSTOP} nella ricezione
1094 dello stesso (si veda sez.~\ref{sec:sig_sigaction}) i processi figli che
1095 terminano non diventano \textit{zombie} e sia \func{wait} che \func{waitpid}
1096 si bloccano fintanto che tutti i processi figli non sono terminati, dopo di
1097 che falliscono con un errore di \errcode{ENOCHLD}.\footnote{questo è anche il
1098   motivo per cui le opzioni \const{WUNTRACED} e \const{WCONTINUED} sono
1099   utilizzabili soltanto qualora non si sia impostato il flag di
1100   \const{SA\_NOCLDSTOP} per il segnale \signal{SIGCHLD}.}
1101
1102 Con i kernel della serie 2.4 e tutti i kernel delle serie precedenti entrambe
1103 le funzioni di attesa ignorano questa prescrizione e si comportano sempre
1104 nello stesso modo,\footnote{lo standard POSIX.1 originale infatti lascia
1105   indefinito il comportamento di queste funzioni quando \signal{SIGCHLD} viene
1106   ignorato.} indipendentemente dal fatto \signal{SIGCHLD} sia ignorato o meno:
1107 attendono la terminazione di un processo figlio e ritornano il relativo
1108 \acr{pid} e lo stato di terminazione nell'argomento \param{status}.
1109
1110 In generale in un programma non si vuole essere forzati ad attendere la
1111 conclusione di un processo figlio per proseguire l'esecuzione, specie se tutto
1112 questo serve solo per leggerne lo stato di chiusura (ed evitare eventualmente
1113 la presenza di \itindex{zombie} \textit{zombie}).  Per questo la modalità più
1114 comune di chiamare queste funzioni è quella di utilizzarle all'interno di un
1115 \textit{signal handler} (vedremo un esempio di come gestire \signal{SIGCHLD}
1116 con i segnali in sez.~\ref{sec:sig_example}). In questo caso infatti, dato che
1117 il segnale è generato dalla terminazione di un figlio, avremo la certezza che
1118 la chiamata a \func{waitpid} non si bloccherà.
1119
1120 Come accennato sia \func{wait} che \func{waitpid} restituiscono lo stato di
1121 terminazione del processo tramite il puntatore \param{status}, e se non
1122 interessa memorizzare lo stato si può passare un puntatore nullo. Il valore
1123 restituito da entrambe le funzioni dipende dall'implementazione, ma
1124 tradizionalmente gli 8 bit meno significativi sono riservati per memorizzare
1125 lo \itindex{exit~status} stato di uscita del processo, e gli altri per
1126 indicare il segnale che ha causato la terminazione (in caso di conclusione
1127 anomala), uno per indicare se è stato generato un \itindex{core~dump}
1128 \textit{core dump}, ecc.\footnote{le definizioni esatte si possono trovare in
1129   \file{<bits/waitstatus.h>} ma questo file non deve mai essere usato
1130   direttamente, esso viene incluso attraverso \file{<sys/wait.h>}.}
1131
1132 \begin{table}[!htb]
1133   \centering
1134   \footnotesize
1135   \begin{tabular}[c]{|l|p{10cm}|}
1136     \hline
1137     \textbf{Macro} & \textbf{Descrizione}\\
1138     \hline
1139     \hline
1140     \macro{WIFEXITED(s)}   & Condizione vera (valore non nullo) per un processo
1141                              figlio che sia terminato normalmente. \\
1142     \macro{WEXITSTATUS(s)} & Restituisce gli otto bit meno significativi dello
1143                              stato di uscita del processo (passato attraverso
1144                              \func{\_exit}, \func{exit} o come valore di
1145                              ritorno di \func{main}); può essere valutata solo
1146                              se \val{WIFEXITED} ha restituito un valore non
1147                              nullo.\\
1148     \macro{WIFSIGNALED(s)} & Condizione vera se il processo figlio è terminato
1149                              in maniera anomala a causa di un segnale che non
1150                              è stato catturato (vedi
1151                              sez.~\ref{sec:sig_notification}).\\
1152     \macro{WTERMSIG(s)}    & Restituisce il numero del segnale che ha causato
1153                              la terminazione anomala del processo; può essere
1154                              valutata solo se \val{WIFSIGNALED} ha restituito
1155                              un valore non nullo.\\
1156     \macro{WCOREDUMP(s)}   & Vera se il processo terminato ha generato un
1157                              file di \itindex{core~dump} \textit{core
1158                                dump}; può essere valutata solo se
1159                              \val{WIFSIGNALED} ha restituito un valore non
1160                              nullo.\footnotemark \\
1161     \macro{WIFSTOPPED(s)}  & Vera se il processo che ha causato il ritorno di
1162                              \func{waitpid} è bloccato; l'uso è possibile solo
1163                              con \func{waitpid} avendo specificato l'opzione
1164                              \const{WUNTRACED}.\\
1165     \macro{WSTOPSIG(s)}    & Restituisce il numero del segnale che ha bloccato
1166                              il processo; può essere valutata solo se
1167                              \val{WIFSTOPPED} ha restituito un valore non
1168                              nullo. \\
1169     \macro{WIFCONTINUED(s)}& Vera se il processo che ha causato il ritorno è
1170                              stato riavviato da un \signal{SIGCONT}
1171                              (disponibile solo a partire dal kernel 2.6.10).\\
1172     \hline
1173   \end{tabular}
1174   \caption{Descrizione delle varie macro di preprocessore utilizzabili per
1175     verificare lo stato di terminazione \var{s} di un processo.}
1176   \label{tab:proc_status_macro}
1177 \end{table}
1178
1179 \footnotetext{questa macro non è definita dallo standard POSIX.1-2001, ma è
1180   presente come estensione sia in Linux che in altri Unix, deve essere
1181   pertanto utilizzata con attenzione (ad esempio è il caso di usarla in un
1182   blocco \texttt{\#ifdef WCOREDUMP ... \#endif}.}
1183
1184 Lo standard POSIX.1 definisce una serie di macro di preprocessore da usare per
1185 analizzare lo stato di uscita. Esse sono definite sempre in
1186 \file{<sys/wait.h>} ed elencate in tab.~\ref{tab:proc_status_macro}. Si tenga
1187 presente che queste macro prevedono che gli si passi come parametro la
1188 variabile di tipo \ctyp{int} puntata dall'argomento \param{status} restituito
1189 da \func{wait} o \func{waitpid}.
1190
1191 Si tenga conto che nel caso di conclusione anomala il valore restituito da
1192 \val{WTERMSIG} può essere confrontato con le costanti che identificano i
1193 segnali definite in \file{signal.h} ed elencate in
1194 tab.~\ref{tab:sig_signal_list}, e stampato usando le apposite funzioni
1195 trattate in sez.~\ref{sec:sig_strsignal}.
1196
1197 A partire dal kernel 2.6.9, sempre in conformità allo standard POSIX.1-2001, è
1198 stata introdotta una nuova funzione di attesa che consente di avere un
1199 controllo molto più preciso sui possibili cambiamenti di stato dei processi
1200 figli e più dettagli sullo stato di uscita; la funzione è \funcd{waitid} ed il
1201 suo prototipo è:
1202
1203 \begin{funcproto}{
1204 \fhead{sys/types.h}
1205 \fhead{sys/wait.h}
1206 \fdecl{int waitid(idtype\_t idtype, id\_t id, siginfo\_t *infop, int options)}
1207 \fdesc{Attende il cambiamento di stato di un processo figlio.}
1208 }
1209 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1210   caso \var{errno} assumerà uno dei valori:
1211   \begin{errlist}
1212   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
1213     la funzione è stata interrotta da un segnale.
1214   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
1215     non è figlio del processo chiamante.
1216   \item[\errcode{EINVAL}] si è specificato un valore non valido per
1217     l'argomento \param{options}.
1218   \end{errlist}}
1219 \end{funcproto}
1220
1221 La funzione prevede che si specifichi quali processi si intendono osservare
1222 usando i due argomenti \param{idtype} ed \param{id}; il primo indica se ci si
1223 vuole porre in attesa su un singolo processo, un gruppo di processi o un
1224 processo qualsiasi, e deve essere specificato secondo uno dei valori di
1225 tab.~\ref{tab:proc_waitid_idtype}; il secondo indica, a seconda del valore del
1226 primo, quale processo o quale gruppo di processi selezionare.
1227
1228 \begin{table}[!htb]
1229   \centering
1230   \footnotesize
1231   \begin{tabular}[c]{|l|p{8cm}|}
1232     \hline
1233     \textbf{Valore} & \textbf{Descrizione}\\
1234     \hline
1235     \hline
1236     \const{P\_PID} & Indica la richiesta di attendere per un processo figlio
1237                      il cui \acr{pid} corrisponda al valore dell'argomento
1238                      \param{id}.\\
1239     \const{P\_PGID}& Indica la richiesta di attendere per un processo figlio
1240                      appartenente al \textit{process group} (vedi
1241                      sez.~\ref{sec:sess_proc_group}) il cui \acr{pgid}
1242                      corrisponda al valore dell'argomento \param{id}.\\
1243     \const{P\_ALL} & Indica la richiesta di attendere per un processo figlio
1244                      generico, il valore dell'argomento \param{id} viene
1245                      ignorato.\\
1246     \hline
1247   \end{tabular}
1248   \caption{Costanti per i valori dell'argomento \param{idtype} della funzione
1249     \func{waitid}.}
1250   \label{tab:proc_waitid_idtype}
1251 \end{table}
1252
1253 Come per \func{waitpid} anche il comportamento di \func{waitid} viene
1254 controllato dall'argomento \param{options}, da specificare come maschera
1255 binaria dei valori riportati in tab.~\ref{tab:proc_waitid_options}. Benché
1256 alcuni di questi siano identici come significato ed effetto ai precedenti di
1257 tab.~\ref{tab:proc_waitpid_options}, ci sono delle differenze significative:
1258 in questo caso si dovrà specificare esplicitamente l'attesa della terminazione
1259 di un processo impostando l'opzione \const{WEXITED}, mentre il precedente
1260 \const{WUNTRACED} è sostituito da \const{WSTOPPED}.  Infine è stata aggiunta
1261 l'opzione \const{WNOWAIT} che consente una lettura dello stato mantenendo il
1262 processo in attesa di ricezione, così che una successiva chiamata possa di
1263 nuovo riceverne lo stato.
1264
1265 \begin{table}[!htb]
1266   \centering
1267   \footnotesize
1268   \begin{tabular}[c]{|l|p{8cm}|}
1269     \hline
1270     \textbf{Valore} & \textbf{Descrizione}\\
1271     \hline
1272     \hline
1273     \const{WEXITED}   & Ritorna quando un processo figlio è terminato.\\
1274     \const{WNOHANG}   & Ritorna immediatamente anche se non c'è niente da
1275                         notificare.\\
1276     \const{WSTOPPED} &  Ritorna quando un processo figlio è stato fermato.\\
1277     \const{WCONTINUED}& Ritorna quando un processo figlio che era stato
1278                         fermato ha ripreso l'esecuzione.\\
1279     \const{WNOWAIT}   & Lascia il processo ancora in attesa di ricezione, così
1280                         che una successiva chiamata possa di nuovo riceverne
1281                         lo stato.\\
1282     \hline
1283   \end{tabular}
1284   \caption{Costanti che identificano i bit dell'argomento \param{options}
1285     della funzione \func{waitid}.}
1286   \label{tab:proc_waitid_options}
1287 \end{table}
1288
1289 La funzione \func{waitid} restituisce un valore nullo in caso di successo, e
1290 $-1$ in caso di errore; viene restituito un valore nullo anche se è stata
1291 specificata l'opzione \const{WNOHANG} e la funzione è ritornata immediatamente
1292 senza che nessun figlio sia terminato. Pertanto per verificare il motivo del
1293 ritorno della funzione occorre analizzare le informazioni che essa
1294 restituisce; queste, al contrario delle precedenti \func{wait} e
1295 \func{waitpid} che usavano un semplice valore numerico, sono ritornate in una
1296 struttura di tipo \struct{siginfo\_t} (vedi fig.~\ref{fig:sig_siginfo_t})
1297 all'indirizzo puntato dall'argomento \param{infop}.
1298
1299 Tratteremo nei dettagli la struttura \struct{siginfo\_t} ed il significato dei
1300 suoi vari campi in sez.~\ref{sec:sig_sigaction}, per quanto ci interessa qui
1301 basta dire che al ritorno di \func{waitid} verranno avvalorati i seguenti
1302 campi:
1303 \begin{basedescript}{\desclabelwidth{2.0cm}}
1304 \item[\var{si\_pid}] con il \acr{pid} del figlio.
1305 \item[\var{si\_uid}] con l'user-ID reale (vedi sez.~\ref{sec:proc_perms}) del
1306   figlio.
1307 \item[\var{si\_signo}] con \signal{SIGCHLD}.
1308 \item[\var{si\_status}] con lo stato di uscita del figlio o con il segnale che
1309   lo ha terminato, fermato o riavviato.
1310 \item[\var{si\_code}] con uno fra \const{CLD\_EXITED}, \const{CLD\_KILLED},
1311   \const{CLD\_STOPPED}, \const{CLD\_CONTINUED}, \const{CLD\_TRAPPED} e
1312   \const{CLD\_DUMPED} a indicare la ragione del ritorno della funzione, il cui
1313   significato è, nell'ordine: uscita normale, terminazione da segnale,
1314   processo fermato, processo riavviato, processo terminato in \textit{core
1315     dump}.
1316 \end{basedescript}
1317
1318 Infine Linux, seguendo un'estensione di BSD, supporta altre due funzioni per
1319 la lettura dello stato di terminazione di un processo, analoghe alle
1320 precedenti ma che prevedono un ulteriore argomento attraverso il quale il
1321 kernel può restituire al padre informazioni sulle risorse (vedi
1322 sez.~\ref{sec:sys_res_limits}) usate dal processo terminato e dai vari figli.
1323 Le due funzioni sono \funcd{wait3} e \funcd{wait4}, che diventano accessibili
1324 definendo la macro \macro{\_USE\_BSD}, i loro prototipi sono:
1325
1326 \begin{funcproto}{
1327 \fhead{sys/types.h}
1328 \fhead{sys/times.h}
1329 \fhead{sys/resource.h}
1330 \fhead{sys/wait.h}
1331 \fdecl{int wait3(int *status, int options, struct rusage *rusage)}
1332 \fdecl{int wait4(pid\_t pid, int *status, int options, struct rusage *rusage)}
1333 \fdesc{Attende il cambiamento di stato di un processo figlio, riportando l'uso
1334   delle risorse.}
1335 }
1336 {La funzione ha gli stessi valori di ritorno e codici di errore di
1337   \func{waitpid}. }
1338 \end{funcproto}
1339
1340 La funzione \func{wait4} è identica \func{waitpid} sia nel comportamento che
1341 per i valori dei primi tre argomenti, ma in più restituisce nell'argomento
1342 aggiuntivo \param{rusage} un sommario delle risorse usate dal processo. Questo
1343 argomento è una struttura di tipo \struct{rusage} definita in
1344 \file{sys/resource.h}, che viene utilizzata anche dalla funzione
1345 \func{getrusage} per ottenere le risorse di sistema usate da un processo. La
1346 sua definizione è riportata in fig.~\ref{fig:sys_rusage_struct} e ne
1347 tratteremo in dettaglio il significato sez.~\ref{sec:sys_resource_use}. La
1348 funzione \func{wait3} è semplicemente un caso particolare di (e con Linux
1349 viene realizzata con la stessa \textit{system call}), ed è equivalente a
1350 chiamare \code{wait4(-1, \&status, opt, rusage)}, per questo motivo è ormai
1351 deprecata in favore di \func{wait4}.
1352
1353
1354
1355 \subsection{La famiglia delle funzioni \func{exec} per l'esecuzione dei
1356   programmi}
1357 \label{sec:proc_exec}
1358
1359 Abbiamo già detto che una delle modalità principali con cui si utilizzano i
1360 processi in Unix è quella di usarli per lanciare nuovi programmi: questo viene
1361 fatto attraverso una delle funzioni della famiglia \func{exec}. Quando un
1362 processo chiama una di queste funzioni esso viene completamente sostituito dal
1363 nuovo programma, il \acr{pid} del processo non cambia, dato che non viene
1364 creato un nuovo processo, la funzione semplicemente rimpiazza lo
1365 \itindex{stack} \textit{stack}, i \index{segmento!dati} dati ed il
1366 \index{segmento!testo} testo del processo corrente con un nuovo programma
1367 letto da disco, eseguendo il \itindex{link-loader} \textit{link-loader} con
1368 gli effetti illustrati in sez.~\ref{sec:proc_main}.
1369
1370 Ci sono sei diverse versioni di \func{exec} (per questo la si è chiamata
1371 famiglia di funzioni) che possono essere usate per questo compito, in realtà
1372 (come mostrato in fig.~\ref{fig:proc_exec_relat}), tutte queste funzioni sono
1373 tutte varianti che consentono di invocare in modi diversi, semplificando il
1374 passaggio degli argomenti, la \textit{system call} \funcd{execve}, il cui
1375 prototipo è:
1376
1377 \begin{funcproto}{
1378 \fhead{unistd.h}
1379 \fdecl{int execve(const char *filename, char *const argv[], char *const envp[])}
1380 \fdesc{Esegue un programma.}
1381 }
1382 {La funzione ritorna solo in caso di errore, restituendo $-1$, nel qual
1383  caso \var{errno} assumerà uno dei valori:
1384 \begin{errlist}
1385   \item[\errcode{EACCES}] il file o l'interprete non file ordinari, o non sono
1386     eseguibili, o il file è su un filesystem montato con l'opzione
1387     \cmd{noexec}, o manca  il permesso di attraversamento di una delle
1388     directory del pathname.
1389   \item[\errcode{EPERM}] il file ha i bit \itindex{suid~bit} \acr{suid} o
1390     \itindex{sgid~bit} \acr{sgid} e l'utente non è root, ed il processo viene
1391     tracciato, oppure il filesystem è montato con l'opzione \cmd{nosuid}.
1392   \item[\errcode{ENOEXEC}] il file è in un formato non eseguibile o non
1393     riconosciuto come tale, o compilato per un'altra architettura.
1394   \item[\errcode{ENOENT}] il file o una delle librerie dinamiche o l'interprete
1395     necessari per eseguirlo non esistono.
1396   \item[\errcode{ETXTBSY}] l'eseguibile è aperto in scrittura da uno o più
1397     processi.
1398   \item[\errcode{EINVAL}] l'eseguibile ELF ha più di un segmento
1399     \const{PF\_INTERP}, cioè chiede di essere eseguito da più di un
1400     interprete.
1401   \item[\errcode{ELIBBAD}] un interprete ELF non è in un formato
1402     riconoscibile.
1403   \item[\errcode{E2BIG}] la lista degli argomenti è troppo grande.
1404   \end{errlist}
1405   ed inoltre \errval{EFAULT}, \errval{ENOMEM},
1406   \errval{EIO}, \errval{ENAMETOOLONG}, \errval{ELOOP}, \errval{ENOTDIR},
1407   \errval{EISDIR}, \errval{ENFILE}, \errval{EMFILE} nel loro significato
1408   generico.
1409 }
1410 \end{funcproto}
1411
1412 La funzione \func{execve} esegue il programma o lo script indicato dal
1413 pathname \param{filename}, passandogli la lista di argomenti indicata
1414 da \param{argv} e come ambiente la lista di stringhe indicata
1415 da \param{envp}. Entrambe le liste devono essere terminate da un puntatore
1416 nullo. I vettori degli argomenti e dell'ambiente possono essere acceduti dal
1417 nuovo programma quando la sua funzione \func{main} è dichiarata nella forma
1418 \code{main(int argc, char *argv[], char *envp[])}.
1419
1420 In caso di successo la funzione non ritorna, in quanto al posto del programma
1421 chiamante viene eseguito il nuovo programma indicato da \param{filename}. Se
1422 il processo corrente è tracciato con \func{ptrace} (vedi
1423 sez.~\ref{sec:process_ptrace}) in caso di successo viene emesso il segnale
1424 \signal{SIGTRAP}.
1425
1426 Le altre funzioni della famiglia (\funcd{execl}, \funcd{execv},
1427 \funcd{execle}, \funcd{execlp}, \funcd{execvp}) servono per fornire all'utente
1428 una serie di possibili diverse interfacce nelle modalità di passaggio degli
1429 argomenti all'esecuzione del nuovo programma. I loro prototipi sono:
1430
1431 \begin{funcproto}{
1432 \fhead{unistd.h}
1433 \fdecl{int execl(const char *path, const char *arg, ...)}
1434 \fdecl{int execv(const char *path, char *const argv[])}
1435 \fdecl{int execle(const char *path, const char *arg, ..., char * const envp[])}
1436 \fdecl{int execlp(const char *file, const char *arg, ...)}
1437 \fdecl{int execvp(const char *file, char *const argv[])}
1438 \fdesc{Eseguono un programma.}
1439 }
1440 {Le funzioni ritorna solo in caso di errore, restituendo $-1$, i codici di
1441   errore sono gli stessi di \func{execve}.
1442 }
1443 \end{funcproto}
1444
1445 Tutte le funzioni mettono in esecuzione nel processo corrente il programma
1446 indicati nel primo argomento. Gli argomenti successivi consentono di
1447 specificare gli argomenti e l'ambiente che saranno ricevuti dal nuovo
1448 processo. Per capire meglio le differenze fra le funzioni della famiglia si può
1449 fare riferimento allo specchietto riportato in
1450 tab.~\ref{tab:proc_exec_scheme}. La relazione fra le funzioni è invece
1451 illustrata in fig.~\ref{fig:proc_exec_relat}.
1452
1453 \begin{table}[!htb]
1454   \footnotesize
1455   \centering
1456   \begin{tabular}[c]{|l|c|c|c||c|c|c|}
1457     \hline
1458     \multicolumn{1}{|c|}{\textbf{Caratteristiche}} &
1459     \multicolumn{6}{|c|}{\textbf{Funzioni}} \\
1460     \hline
1461     &\func{execl}\texttt{ }&\func{execlp}&\func{execle}
1462     &\func{execv}\texttt{ }& \func{execvp}& \func{execve} \\
1463     \hline
1464     \hline
1465     argomenti a lista    &$\bullet$&$\bullet$&$\bullet$&&& \\
1466     argomenti a vettore  &&&&$\bullet$&$\bullet$&$\bullet$\\
1467     \hline
1468     filename completo     &$\bullet$&&$\bullet$&$\bullet$&&$\bullet$\\
1469     ricerca su \var{PATH} &&$\bullet$&&&$\bullet$& \\
1470     \hline
1471     ambiente a vettore   &&&$\bullet$&&&$\bullet$ \\
1472     uso di \var{environ} &$\bullet$&$\bullet$&&$\bullet$&$\bullet$& \\
1473     \hline
1474   \end{tabular}
1475   \caption{Confronto delle caratteristiche delle varie funzioni della
1476     famiglia \func{exec}.}
1477   \label{tab:proc_exec_scheme}
1478 \end{table}
1479
1480 La prima differenza fra le funzioni riguarda le modalità di passaggio dei
1481 valori che poi andranno a costituire gli argomenti a linea di comando (cioè i
1482 valori di \param{argv} e \param{argc} visti dalla funzione \func{main} del
1483 programma chiamato). Queste modalità sono due e sono riassunte dagli mnemonici
1484 ``\texttt{v}'' e ``\texttt{l}'' che stanno rispettivamente per \textit{vector}
1485 e \textit{list}.
1486
1487 Nel primo caso gli argomenti sono passati tramite il vettore di puntatori
1488 \var{argv[]} a stringhe terminate con zero che costituiranno gli argomenti a
1489 riga di comando, questo vettore \emph{deve} essere terminato da un puntatore
1490 nullo. Nel secondo caso le stringhe degli argomenti sono passate alla funzione
1491 come lista di puntatori, nella forma:
1492 \includecodesnip{listati/char_list.c}
1493 che deve essere terminata da un puntatore nullo.  In entrambi i casi vale la
1494 convenzione che il primo argomento (\var{arg0} o \var{argv[0]}) viene usato
1495 per indicare il nome del file che contiene il programma che verrà eseguito.
1496
1497
1498 \begin{figure}[!htb]
1499   \centering \includegraphics[width=12cm]{img/exec_rel}
1500   \caption{La interrelazione fra le sei funzioni della famiglia \func{exec}.}
1501   \label{fig:proc_exec_relat}
1502 \end{figure}
1503
1504 La seconda differenza fra le funzioni riguarda le modalità con cui si
1505 specifica il programma che si vuole eseguire. Con lo mnemonico ``\texttt{p}''
1506 si indicano le due funzioni che replicano il comportamento della shell nello
1507 specificare il comando da eseguire; quando l'argomento \param{file} non
1508 contiene una ``\texttt{/}'' esso viene considerato come un nome di programma,
1509 e viene eseguita automaticamente una ricerca fra i file presenti nella lista
1510 di directory specificate dalla variabile di ambiente \var{PATH}. Il file che
1511 viene posto in esecuzione è il primo che viene trovato. Se si ha un errore
1512 relativo a permessi di accesso insufficienti (cioè l'esecuzione della
1513 sottostante \func{execve} ritorna un \errcode{EACCES}), la ricerca viene
1514 proseguita nelle eventuali ulteriori directory indicate in \var{PATH}; solo se
1515 non viene trovato nessun altro file viene finalmente restituito
1516 \errcode{EACCES}.  Le altre quattro funzioni si limitano invece a cercare di
1517 eseguire il file indicato dall'argomento \param{path}, che viene interpretato
1518 come il \itindex{pathname} \textit{pathname} del programma.
1519
1520 La terza differenza è come viene passata la lista delle variabili di ambiente.
1521 Con lo mnemonico ``\texttt{e}'' vengono indicate quelle funzioni che
1522 necessitano di un vettore di parametri \var{envp[]} analogo a quello usato per
1523 gli argomenti a riga di comando (terminato quindi da un \val{NULL}), le altre
1524 usano il valore della variabile \var{environ} (vedi
1525 sez.~\ref{sec:proc_environ}) del processo di partenza per costruire
1526 l'ambiente.
1527
1528 Oltre a mantenere lo stesso \acr{pid}, il nuovo programma fatto partire da una
1529 delle funzioni della famiglia \func{exec} mantiene la gran parte delle
1530 proprietà del processo chiamante; una lista delle più significative è la
1531 seguente:
1532 \begin{itemize*}
1533 \item il \textit{process id} (\acr{pid}) ed il \textit{parent process id}
1534   (\acr{ppid});
1535 \item l'\textsl{user-ID reale}, il \textit{group-ID reale} ed i
1536   \textsl{group-ID supplementari} (vedi sez.~\ref{sec:proc_access_id});
1537 \item la directory radice e la directory di lavoro corrente (vedi
1538   sez.~\ref{sec:file_work_dir});
1539 \item la maschera di creazione dei file \itindex{umask} (\textit{umask}, vedi
1540   sez.~\ref{sec:file_perm_management}) ed i \textit{lock} sui file (vedi
1541   sez.~\ref{sec:file_locking});
1542 \item il valori di \textit{nice}, le priorità real-time e le affinità di
1543   processore (vedi sez.~\ref{sec:proc_sched_stand};
1544   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
1545 \item il \textit{session ID} (\acr{sid}) ed il \itindex{process~group}
1546   \textit{process group ID} (\acr{pgid}), vedi sez.~\ref{sec:sess_proc_group};
1547 \item il terminale di controllo (vedi sez.~\ref{sec:sess_ctrl_term});
1548 \item il tempo restante ad un allarme (vedi sez.~\ref{sec:sig_alarm_abort});
1549 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
1550 \item i valori delle variabili \var{tms\_utime}, \var{tms\_stime};
1551   \var{tms\_cutime}, \var{tms\_ustime} (vedi sez.~\ref{sec:sys_cpu_times});
1552 % TODO ===========Importante=============
1553 % TODO questo sotto è incerto, verificare
1554 % TODO ===========Importante=============
1555 \item la maschera dei segnali (si veda sez.~\ref{sec:sig_sigmask}).
1556 \end{itemize*}
1557
1558 Una serie di proprietà del processo originale, che non avrebbe senso mantenere
1559 in un programma che esegue un codice completamente diverso in uno spazio di
1560 indirizzi totalmente indipendente e ricreato da zero, vengono perse con
1561 l'esecuzione di una \func{exec}. Lo standard POSIX.1-2001 prevede che le
1562 seguenti proprietà non vengano preservate:
1563 \begin{itemize*}
1564 \item l'insieme dei segnali pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che
1565   viene cancellato;
1566 \item gli eventuali stack alternativi per i segnali (vedi
1567   sez.~\ref{sec:sig_specific_features});
1568 \item i \textit{directory stream} (vedi sez.~\ref{sec:file_dir_read}), che
1569   vengono chiusi;
1570 \item le mappature dei file in memoria (vedi sez.~\ref{sec:file_memory_map});
1571 \item i segmenti di memoria condivisa SysV (vedi sez.~\ref{sec:ipc_sysv_shm})
1572   e POSIX (vedi sez.~\ref{sec:ipc_posix_shm});
1573 \item i \textit{memory lock} (vedi sez.~\ref{sec:proc_mem_lock});
1574 \item le funzioni registrate all'uscita (vedi sez.~\ref{sec:proc_atexit});
1575 \item i semafori e le code di messaggi POSIX (vedi
1576   sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq});
1577 \item i timer POSIX (vedi sez.~\ref{sec:sig_timer_adv}).
1578 \end{itemize*}
1579
1580 Inoltre i segnali che sono stati impostati per essere ignorati nel processo
1581 chiamante mantengono la stessa impostazione pure nel nuovo programma, ma tutti
1582 gli altri segnali, ed in particolare quelli per i quali è stato installato un
1583 gestore vengono impostati alla loro azione predefinita (vedi
1584 sez.~\ref{sec:sig_gen_beha}). Un caso speciale è il segnale \signal{SIGCHLD}
1585 che, quando impostato a \const{SIG\_IGN}, potrebbe anche essere reimpostato a
1586 \const{SIG\_DFL}. Lo standard POSIX.1-2001 prevede che questo comportamento
1587 sia deciso dalla singola implementazione, quella di Linux è di non modificare
1588 l'impostazione precedente.
1589
1590 Oltre alle precedenti, che sono completamente generali e disponibili anche su
1591 altri sistemi unix-like, esistono altre proprietà dei processi, attinenti alle
1592 caratteristiche specifiche di Linux, che non vengono preservate
1593 nell'esecuzione della funzione \func{exec}, queste sono:
1594 \begin{itemize*}
1595 \item le operazioni di I/O asincrono (vedi sez.~\ref{sec:file_asyncronous_io})
1596   pendenti vengono cancellate;
1597 \item le \itindex{capabilities} \textit{capabilities} vengono modificate come
1598   illustrato in sez.~\ref{sec:proc_capabilities};
1599 \item tutti i \itindex{thread} \textit{thread} tranne il chiamante (vedi
1600   sez.~\ref{sec:thread_xxx}) sono cancellati e tutti gli oggetti ad essi
1601   relativi (vedi sez.~\ref{sec:thread_xxx}) rimossi;
1602 \item viene impostato il flag \const{PR\_SET\_DUMPABLE} di \func{prctl} (vedi
1603   sez.~\ref{sec:process_prctl}) a meno che il programma da eseguire non sia
1604   \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} (vedi
1605   sez.~\ref{sec:proc_access_id});
1606 \item il flag \const{PR\_SET\_KEEPCAPS} di \func{prctl} (vedi
1607   sez.~\ref{sec:process_prctl}) viene cancellato;
1608 \item il nome del processo viene impostato al nome del file contenente il
1609   programma messo in esecuzione;
1610 \item il segnale di terminazione viene reimpostato a \signal{SIGCHLD};
1611 \item l'ambiente viene reinizializzato impostando le variabili attinenti alla
1612   localizzazione al valore di default POSIX.
1613 \end{itemize*}
1614
1615 La gestione dei file aperti nel passaggio al nuovo programma lanciato con
1616 \func{exec} dipende dal valore che ha il flag di \itindex{close-on-exec}
1617 \textit{close-on-exec} (vedi sez.~\ref{sec:file_fcntl}) per ciascun
1618 \textit{file descriptor}. I file per cui è impostato vengono chiusi, tutti gli
1619 altri file restano aperti. Questo significa che il comportamento predefinito è
1620 che i file restano aperti attraverso una \func{exec}, a meno di una chiamata
1621 esplicita a \func{fcntl} che imposti il suddetto flag.  Per le directory, lo
1622 standard POSIX.1 richiede che esse vengano chiuse attraverso una \func{exec},
1623 in genere questo è fatto dalla funzione \func{opendir} (vedi
1624 sez.~\ref{sec:file_dir_read}) che effettua da sola l'impostazione del flag di
1625 \itindex{close-on-exec} \textit{close-on-exec} sulle directory che apre, in
1626 maniera trasparente all'utente.
1627
1628 Il comportamento della funzione in relazione agli identificatori relativi al
1629 controllo di accesso verrà trattato in dettaglio in sez.~\ref{sec:proc_perms},
1630 qui è sufficiente anticipare (si faccia riferimento a
1631 sez.~\ref{sec:proc_access_id} per la definizione di questi identificatori)
1632 come l'\textsl{user-ID reale} ed il \textsl{group-ID reale} restano sempre gli
1633 stessi, mentre l'\textsl{user-ID salvato} ed il \textsl{group-ID salvato}
1634 vengono impostati rispettivamente all'\textsl{user-ID effettivo} ed il
1635 \textsl{group-ID effettivo}. Questi ultimi normalmente non vengono modificati,
1636 a meno che il file di cui viene chiesta l'esecuzione non abbia o il
1637 \itindex{suid~bit} \acr{suid} bit o lo \itindex{sgid~bit} \acr{sgid} bit
1638 impostato, in questo caso l'\textsl{user-ID effettivo} ed il \textsl{group-ID
1639   effettivo} vengono impostati rispettivamente all'utente o al gruppo cui il
1640 file appartiene.
1641
1642 Se il file da eseguire è in formato \emph{a.out} e necessita di librerie
1643 condivise, viene lanciato il \textit{linker} dinamico \cmd{/lib/ld.so} prima
1644 del programma per caricare le librerie necessarie ed effettuare il link
1645 dell'eseguibile.\footnote{il formato è ormai in completo disuso, per cui è
1646   molto probabile che non il relativo supporto non sia disponibile.} Se il
1647 programma è in formato ELF per caricare le librerie dinamiche viene usato
1648 l'interprete indicato nel segmento \const{PT\_INTERP} previsto dal formato
1649 stesso, in genere questo è \sysfile{/lib/ld-linux.so.1} per programmi
1650 collegati con le \acr{libc5}, e \sysfile{/lib/ld-linux.so.2} per programmi
1651 collegati con le \acr{glibc}.
1652
1653 Infine nel caso il programma che si vuole eseguire sia uno script e non un
1654 binario, questo deve essere un file di testo che deve iniziare con una linea
1655 nella forma:
1656 \begin{Example}
1657 \#!/path/to/interpreter [argomenti]
1658 \end{Example}
1659 dove l'interprete indicato deve essere un eseguibile binario e non un altro
1660 script, che verrà chiamato come se si fosse eseguito il comando
1661 \cmd{interpreter [argomenti] filename}.\footnote{si tenga presente che con
1662   Linux quanto viene scritto come \texttt{argomenti} viene passato
1663   all'interprete come un unico argomento con una unica stringa di lunghezza
1664   massima di 127 caratteri e se questa dimensione viene ecceduta la stringa
1665   viene troncata; altri Unix hanno dimensioni massime diverse, e diversi
1666   comportamenti, ad esempio FreeBSD esegue la scansione della riga e la divide
1667   nei vari argomenti e se è troppo lunga restituisce un errore di
1668   \const{ENAMETOOLONG}, una comparazione dei vari comportamenti si trova su
1669   \url{http://www.in-ulm.de/~mascheck/various/shebang/}.}
1670
1671 Con la famiglia delle \func{exec} si chiude il novero delle funzioni su cui è
1672 basata la gestione tradizionale dei processi in Unix: con \func{fork} si crea
1673 un nuovo processo, con \func{exec} si lancia un nuovo programma, con
1674 \func{exit} e \func{wait} si effettua e verifica la conclusione dei
1675 processi. Tutte le altre funzioni sono ausiliarie e servono per la lettura e
1676 l'impostazione dei vari parametri connessi ai processi.
1677
1678
1679
1680 \section{Il controllo di accesso}
1681 \label{sec:proc_perms}
1682
1683 In questa sezione esamineremo le problematiche relative al controllo di
1684 accesso dal punto di vista dei processi; vedremo quali sono gli identificatori
1685 usati, come questi possono essere modificati nella creazione e nel lancio di
1686 nuovi processi, le varie funzioni per la loro manipolazione diretta e tutte le
1687 problematiche connesse ad una gestione accorta dei privilegi.
1688
1689
1690 \subsection{Gli identificatori del controllo di accesso}
1691 \label{sec:proc_access_id}
1692
1693 Come accennato in sez.~\ref{sec:intro_multiuser} il modello base\footnote{in
1694   realtà già esistono estensioni di questo modello base, che lo rendono più
1695   flessibile e controllabile, come le \itindex{capabilities}
1696   \textit{capabilities} illustrate in sez.~\ref{sec:proc_capabilities}, le ACL
1697   per i file (vedi sez.~\ref{sec:file_ACL}) o il
1698   \itindex{Mandatory~Access~Control~(MAC)} \textit{Mandatory Access Control}
1699   di \index{SELinux} SELinux; inoltre basandosi sul lavoro effettuato con
1700   SELinux, a partire dal kernel 2.5.x, è iniziato lo sviluppo di una
1701   infrastruttura di sicurezza, i \itindex{Linux~Security~Modules}
1702   \textit{Linux Security Modules}, o LSM, in grado di fornire diversi agganci
1703   a livello del kernel per modularizzare tutti i possibili controlli di
1704   accesso, cosa che ha permesso di realizzare diverse alternative a
1705   \index{SELinux} SELinux.} di sicurezza di un sistema unix-like è fondato sui
1706 concetti di utente e gruppo, e sulla separazione fra l'amministratore
1707 (\textsl{root}, detto spesso anche \textit{superuser}) che non è sottoposto a
1708 restrizioni, ed il resto degli utenti, per i quali invece vengono effettuati i
1709 vari controlli di accesso.
1710
1711 Abbiamo già accennato come il sistema associ ad ogni utente e gruppo due
1712 identificatori univoci, lo \textsl{user-ID} (abbreviato in \acr{uid}) ed il
1713 \textsl{group-ID} (abbreviato in \acr{gid}). Questi servono al kernel per
1714 identificare uno specifico utente o un gruppo di utenti, per poi poter
1715 controllare che essi siano autorizzati a compiere le operazioni richieste.  Ad
1716 esempio in sez.~\ref{sec:file_access_control} vedremo come ad ogni file
1717 vengano associati un utente ed un gruppo (i suoi \textsl{proprietari},
1718 indicati appunto tramite un \acr{uid} ed un \acr{gid}) che vengono controllati
1719 dal kernel nella gestione dei permessi di accesso.
1720
1721 Dato che tutte le operazioni del sistema vengono compiute dai processi, è
1722 evidente che per poter implementare un controllo sulle operazioni occorre
1723 anche poter identificare chi è che ha lanciato un certo programma, e pertanto
1724 anche a ciascun processo dovrà essere associato un utente e un gruppo.
1725
1726 Un semplice controllo di una corrispondenza fra identificativi non garantisce
1727 però sufficiente flessibilità per tutti quei casi in cui è necessario poter
1728 disporre di privilegi diversi, o dover impersonare un altro utente per un
1729 limitato insieme di operazioni. Per questo motivo in generale tutti i sistemi
1730 unix-like prevedono che i processi abbiano almeno due gruppi di
1731 identificatori, chiamati rispettivamente \textit{real} ed \textit{effective}
1732 (cioè \textsl{reali} ed \textsl{effettivi}). Nel caso di Linux si aggiungono
1733 poi altri due gruppi, il \textit{saved} (\textsl{salvati}) ed il
1734 \textit{filesystem} (\textsl{di filesystem}), secondo la situazione illustrata
1735 in tab.~\ref{tab:proc_uid_gid}.
1736
1737 \begin{table}[htb]
1738   \footnotesize
1739   \centering
1740   \begin{tabular}[c]{|c|c|l|p{7.3cm}|}
1741     \hline
1742     \textbf{Suffisso} & \textbf{Gruppo} & \textbf{Denominazione}
1743                                         & \textbf{Significato} \\
1744     \hline
1745     \hline
1746     \acr{uid}   & \textit{real} & \textsl{user-ID reale}
1747                 & Indica l'utente che ha lanciato il programma.\\
1748     \acr{gid}   & '' &\textsl{group-ID reale}
1749                 & Indica il gruppo principale dell'utente che ha lanciato
1750                   il programma.\\
1751     \hline
1752     \acr{euid}  & \textit{effective} &\textsl{user-ID effettivo}
1753                 & Indica l'utente usato nel controllo di accesso.\\
1754     \acr{egid}  & '' & \textsl{group-ID effettivo}
1755                 & Indica il gruppo usato nel controllo di accesso.\\
1756     --          & -- & \textsl{group-ID supplementari}
1757                 & Indicano gli ulteriori gruppi cui l'utente appartiene.\\
1758     \hline
1759     --          & \textit{saved} & \textsl{user-ID salvato}
1760                 & È una copia dell'\acr{euid} iniziale.\\
1761     --          & '' & \textsl{group-ID salvato}
1762                 & È una copia dell'\acr{egid} iniziale.\\
1763     \hline
1764     \acr{fsuid} & \textit{filesystem} &\textsl{user-ID di filesystem}
1765                 & Indica l'utente effettivo per l'accesso al filesystem. \\
1766     \acr{fsgid} & '' & \textsl{group-ID di filesystem}
1767                 & Indica il gruppo effettivo per l'accesso al filesystem.\\
1768     \hline
1769   \end{tabular}
1770   \caption{Identificatori di utente e gruppo associati a ciascun processo con
1771     indicazione dei suffissi usati dalle varie funzioni di manipolazione.}
1772   \label{tab:proc_uid_gid}
1773 \end{table}
1774
1775 Al primo gruppo appartengono l'\acr{uid} \textsl{reale} ed il \acr{gid}
1776 \textsl{reale}: questi vengono impostati al login ai valori corrispondenti
1777 all'utente con cui si accede al sistema (e relativo gruppo principale).
1778 Servono per l'identificazione dell'utente e normalmente non vengono mai
1779 cambiati. In realtà vedremo (in sez.~\ref{sec:proc_setuid}) che è possibile
1780 modificarli, ma solo ad un processo che abbia i privilegi di amministratore;
1781 questa possibilità è usata proprio dal programma \cmd{login} che, una volta
1782 completata la procedura di autenticazione, lancia una shell per la quale
1783 imposta questi identificatori ai valori corrispondenti all'utente che entra
1784 nel sistema.
1785
1786 Al secondo gruppo appartengono l'\acr{uid} \textsl{effettivo} e il \acr{gid}
1787 \textsl{effettivo}, a cui si aggiungono gli eventuali \acr{gid}
1788 \textsl{supplementari} dei gruppi dei quali l'utente fa parte.  Questi sono
1789 invece gli identificatori usati nelle verifiche dei permessi del processo e
1790 per il controllo di accesso ai file (argomento affrontato in dettaglio in
1791 sez.~\ref{sec:file_perm_overview}).
1792
1793 Questi identificatori normalmente sono identici ai corrispondenti del gruppo
1794 \textit{real} tranne nel caso in cui, come accennato in
1795 sez.~\ref{sec:proc_exec}, il programma che si è posto in esecuzione abbia i
1796 bit \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} impostati
1797 (il significato di questi bit è affrontato in dettaglio in
1798 sez.~\ref{sec:file_special_perm}). In questo caso essi saranno impostati
1799 all'utente e al gruppo proprietari del file. Questo consente, per programmi in
1800 cui ci sia questa necessità, di dare a qualunque utente i privilegi o i
1801 permessi di un altro, compreso l'amministratore.
1802
1803 Come nel caso del \acr{pid} e del \acr{ppid}, anche tutti questi
1804 identificatori possono essere ottenuti da un programma attraverso altrettante
1805 funzioni di lettura, queste sono \funcd{getuid}, \funcd{geteuid},
1806 \funcd{getgid} e \funcd{getegid}, ed i loro prototipi sono:
1807
1808 \begin{funcproto}{
1809 \fhead{unistd.h}
1810 \fhead{sys/types.h}
1811 \fdecl{uid\_t getuid(void)}
1812 \fdesc{Legge l'\textsl{user-ID reale} del processo corrente.}
1813 \fdecl{uid\_t geteuid(void)}
1814 \fdesc{Legge l'\textsl{user-ID effettivo} del processo corrente.}
1815 \fdecl{gid\_t getgid(void)}
1816 \fdesc{Legge il \textsl{group-ID reale} del processo corrente.}
1817 \fdecl{gid\_t getegid(void)}
1818 \fdesc{Legge il \textsl{group-ID effettivo} del processo corrente.}
1819 }
1820 {Le funzioni ritornano i rispettivi identificativi del processo corrente, e
1821   non sono previste condizioni di errore.}
1822 \end{funcproto}
1823
1824 In generale l'uso di privilegi superiori, ottenibile con un \acr{uid}
1825 \textsl{effettivo} diverso da quello reale, deve essere limitato il più
1826 possibile, per evitare abusi e problemi di sicurezza, per questo occorre anche
1827 un meccanismo che consenta ad un programma di rilasciare gli eventuali
1828 maggiori privilegi necessari, una volta che si siano effettuate le operazioni
1829 per i quali erano richiesti, e a poterli eventualmente recuperare in caso
1830 servano di nuovo.
1831
1832 Questo in Linux viene fatto usando altri due gruppi di identificatori, il
1833 \textit{saved} ed il \textit{filesystem}. Il primo gruppo è lo stesso usato in
1834 SVr4, e previsto dallo standard POSIX quando è definita la costante
1835 \macro{\_POSIX\_SAVED\_IDS},\footnote{in caso si abbia a cuore la portabilità
1836   del programma su altri Unix è buona norma controllare sempre la
1837   disponibilità di queste funzioni controllando se questa costante è
1838   definita.} il secondo gruppo è specifico di Linux e viene usato per
1839 migliorare la sicurezza con NFS (il \textit{Network File System}, protocollo
1840 che consente di accedere ai file via rete).
1841
1842 L'\acr{uid} \textsl{salvato} ed il \acr{gid} \textsl{salvato} sono copie
1843 dell'\acr{uid} \textsl{effettivo} e del \acr{gid} \textsl{effettivo} del
1844 processo padre, e vengono impostati dalla funzione \func{exec} all'avvio del
1845 processo, come copie dell'\acr{uid} \textsl{effettivo} e del \acr{gid}
1846 \textsl{effettivo} dopo che questi sono stati impostati tenendo conto di
1847 eventuali \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid}.  Essi
1848 quindi consentono di tenere traccia di quale fossero utente e gruppo effettivi
1849 all'inizio dell'esecuzione di un nuovo programma.
1850
1851 L'\acr{uid} \textsl{di filesystem} e il \acr{gid} \textsl{di filesystem} sono
1852 un'estensione introdotta in Linux per rendere più sicuro l'uso di NFS
1853 (torneremo sull'argomento in sez.~\ref{sec:proc_setuid}). Essi sono una
1854 replica dei corrispondenti identificatori del gruppo \textit{effective}, ai
1855 quali si sostituiscono per tutte le operazioni di verifica dei permessi
1856 relativi ai file (trattate in sez.~\ref{sec:file_perm_overview}).  Ogni
1857 cambiamento effettuato sugli identificatori effettivi viene automaticamente
1858 riportato su di essi, per cui in condizioni normali si può tranquillamente
1859 ignorarne l'esistenza, in quanto saranno del tutto equivalenti ai precedenti.
1860
1861
1862 \subsection{Le funzioni di gestione degli identificatori dei processi}
1863 \label{sec:proc_setuid}
1864
1865 Le due funzioni più comuni che vengono usate per cambiare identità (cioè
1866 utente e gruppo di appartenenza) ad un processo sono rispettivamente
1867 \funcd{setuid} e \funcd{setgid}; come accennato in
1868 sez.~\ref{sec:proc_access_id} in Linux esse seguono la semantica POSIX che
1869 prevede l'esistenza dell'\textit{user-ID salvato} e del \textit{group-ID
1870   salvato}; i loro prototipi sono:
1871
1872 \begin{funcproto}{
1873 \fhead{unistd.h}
1874 \fhead{sys/types.h}
1875 \fdecl{int setuid(uid\_t uid)}
1876 \fdesc{Imposta l'\acr{uid} del processo corrente.}
1877 \fdecl{int setgid(gid\_t gid)}
1878 \fdesc{Imposta il \acr{gid} del processo corrente.}
1879 }
1880 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1881 caso \var{errno} può assumere solo il valore \errval{EPERM}.
1882 }
1883 \end{funcproto}
1884
1885 Il funzionamento di queste due funzioni è analogo, per cui considereremo solo
1886 la prima, la seconda si comporta esattamente allo stesso modo facendo
1887 riferimento al \acr{gid} invece che all'\acr{uid}.  Gli eventuali \acr{gid}
1888 supplementari non vengono modificati.
1889
1890 L'effetto della chiamata è diverso a seconda dei privilegi del processo; se
1891 l'\acr{uid} effettivo è zero (cioè è quello dell'amministratore di sistema)
1892 allora tutti gli identificatori (\textit{real}, \textit{effective} e
1893 \textit{saved}) vengono impostati al valore specificato da \param{uid},
1894 altrimenti viene impostato solo l'\acr{uid} effettivo, e soltanto se il valore
1895 specificato corrisponde o all'\acr{uid} reale o all'\acr{uid} salvato. Negli
1896 altri casi viene segnalato un errore con \errcode{EPERM}.
1897
1898 Come accennato l'uso principale di queste funzioni è quello di poter
1899 consentire ad un programma con i bit \itindex{suid~bit} \acr{suid} o
1900 \itindex{sgid~bit} \acr{sgid} impostati (vedi
1901 sez.~\ref{sec:file_special_perm}) di riportare l'\acr{uid} effettivo a quello
1902 dell'utente che ha lanciato il programma, effettuare il lavoro che non
1903 necessita di privilegi aggiuntivi, ed eventualmente tornare indietro.
1904
1905 Come esempio per chiarire l'uso di queste funzioni prendiamo quello con cui
1906 viene gestito l'accesso al file \sysfile{/var/run/utmp}.  In questo file viene
1907 registrato chi sta usando il sistema al momento corrente; chiaramente non può
1908 essere lasciato aperto in scrittura a qualunque utente, che potrebbe
1909 falsificare la registrazione. Per questo motivo questo file (e l'analogo
1910 \sysfile{/var/log/wtmp} su cui vengono registrati login e logout) appartengono
1911 ad un gruppo dedicato (in genere \acr{utmp}) ed i programmi che devono
1912 accedervi (ad esempio tutti i programmi di terminale in X, o il programma
1913 \cmd{screen} che crea terminali multipli su una console) appartengono a questo
1914 gruppo ed hanno il bit \acr{sgid} impostato.
1915
1916 Quando uno di questi programmi (ad esempio \cmd{xterm}) viene lanciato, la
1917 situazione degli identificatori è la seguente:
1918 \begin{eqnarray*}
1919   \label{eq:1}
1920   \textsl{group-ID reale}      &=& \textrm{\acr{gid} (del chiamante)} \\
1921   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1922   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp}}
1923 \end{eqnarray*}
1924 in questo modo, dato che il \textsl{group-ID effettivo} è quello giusto, il
1925 programma può accedere a \sysfile{/var/run/utmp} in scrittura ed aggiornarlo.
1926 A questo punto il programma può eseguire una \code{setgid(getgid())} per
1927 impostare il \textsl{group-ID effettivo} a quello dell'utente (e dato che il
1928 \textsl{group-ID reale} corrisponde la funzione avrà successo), in questo modo
1929 non sarà possibile lanciare dal terminale programmi che modificano detto file,
1930 in tal caso infatti la situazione degli identificatori sarebbe:
1931 \begin{eqnarray*}
1932   \label{eq:2}
1933   \textsl{group-ID reale}      &=& \textrm{\acr{gid} (invariato)}  \\
1934   \textsl{group-ID effettivo}  &=& \textrm{\acr{gid}} \\
1935   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1936 \end{eqnarray*}
1937 e ogni processo lanciato dal terminale avrebbe comunque \acr{gid} come
1938 \textsl{group-ID effettivo}. All'uscita dal terminale, per poter di nuovo
1939 aggiornare lo stato di \sysfile{/var/run/utmp} il programma eseguirà una
1940 \code{setgid(utmp)} (dove \var{utmp} è il valore numerico associato al gruppo
1941 \acr{utmp}, ottenuto ad esempio con una precedente \func{getegid}), dato che
1942 in questo caso il valore richiesto corrisponde al \textsl{group-ID salvato} la
1943 funzione avrà successo e riporterà la situazione a:
1944 \begin{eqnarray*}
1945   \label{eq:3}
1946   \textsl{group-ID reale}      &=& \textrm{\acr{gid} (invariato)}  \\
1947   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1948   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1949 \end{eqnarray*}
1950 consentendo l'accesso a \sysfile{/var/run/utmp}.
1951
1952 Occorre però tenere conto che tutto questo non è possibile con un processo con
1953 i privilegi di amministratore, in tal caso infatti l'esecuzione di una
1954 \func{setuid} comporta il cambiamento di tutti gli identificatori associati al
1955 processo, rendendo impossibile riguadagnare i privilegi di amministratore.
1956 Questo comportamento è corretto per l'uso che ne fa \cmd{login} una volta che
1957 crea una nuova shell per l'utente, ma quando si vuole cambiare soltanto
1958 l'\textsl{user-ID effettivo} del processo per cedere i privilegi occorre
1959 ricorrere ad altre funzioni.
1960
1961 Le due funzioni \funcd{setreuid} e \funcd{setregid} derivano da BSD che, non
1962 supportando (almeno fino alla versione 4.3+BSD) gli identificatori del gruppo
1963 \textit{saved}, le usa per poter scambiare fra di loro \textit{effective} e
1964 \textit{real}; i rispettivi prototipi sono:
1965
1966 \begin{funcproto}{
1967 \fhead{unistd.h}
1968 \fhead{sys/types.h}
1969 \fdecl{int setreuid(uid\_t ruid, uid\_t euid)}
1970 \fdesc{Imposta \acr{uid} reale e \acr{uid} effettivo del processo corrente.}
1971 \fdecl{int setregid(gid\_t rgid, gid\_t egid)}
1972 \fdesc{Imposta \acr{gid} reale e \acr{gid} effettivo del processo corrente.}
1973 }
1974 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1975 caso \var{errno} può assumere solo il valore \errval{EPERM}.
1976 }
1977 \end{funcproto}
1978
1979 Le due funzioni sono identiche, quanto diremo per la prima riguardo gli
1980 \acr{uid} si applica alla seconda per i \acr{gid}.  La funzione
1981 \func{setreuid} imposta rispettivamente l'\acr{uid} reale e l'\acr{uid}
1982 effettivo del processo corrente ai valori specificati da \param{ruid}
1983 e \param{euid}.  I processi non privilegiati possono impostare solo valori che
1984 corrispondano o al loro \acr{uid} effettivo o a quello reale o a quello
1985 salvato, valori diversi comportano il fallimento della chiamata.
1986 L'amministratore invece può specificare un valore qualunque.  Specificando un
1987 argomento di valore $-1$ l'identificatore corrispondente verrà lasciato
1988 inalterato.
1989
1990 Con queste funzioni si possono scambiare fra loro gli \acr{uid} reale ed
1991 effettivo, e pertanto è possibile implementare un comportamento simile a
1992 quello visto in precedenza per \func{setgid}, cedendo i privilegi con un primo
1993 scambio, e recuperandoli, una volta eseguito il lavoro non privilegiato, con
1994 un secondo scambio.
1995
1996 In questo caso però occorre porre molta attenzione quando si creano nuovi
1997 processi nella fase intermedia in cui si sono scambiati gli identificatori, in
1998 questo caso infatti essi avranno un \acr{uid} reale privilegiato, che dovrà
1999 essere esplicitamente eliminato prima di porre in esecuzione un nuovo
2000 programma, occorrerà cioè eseguire un'altra chiamata dopo la \func{fork} e
2001 prima della \func{exec} per uniformare l'\acr{uid} reale a quello effettivo,
2002 perché in caso contrario il nuovo programma potrebbe a sua volta effettuare
2003 uno scambio e riottenere dei privilegi non previsti.
2004
2005 Lo stesso problema di propagazione dei privilegi ad eventuali processi figli
2006 si pone anche per l'\acr{uid} salvato. Ma la funzione \func{setreuid} deriva
2007 da un'implementazione di sistema che non ne prevede la presenza, e quindi non
2008 è possibile usarla per correggere la situazione come nel caso precedente. Per
2009 questo motivo in Linux tutte le volte che si imposta un qualunque valore
2010 diverso da quello dall'\acr{uid} reale corrente, l'\acr{uid} salvato viene
2011 automaticamente uniformato al valore dell'\acr{uid} effettivo.
2012
2013 Altre due funzioni, \funcd{seteuid} e \funcd{setegid}, sono un'estensione
2014 dello standard POSIX.1, ma sono comunque supportate dalla maggior parte degli
2015 Unix, esse vengono usate per cambiare gli identificatori del gruppo
2016 \textit{effective} ed i loro prototipi sono:
2017
2018 \begin{funcproto}{
2019 \fhead{unistd.h}
2020 \fhead{sys/types.h}
2021 \fdecl{int seteuid(uid\_t uid)}
2022 \fdesc{Imposta l'\acr{uid} effettivo del processo corrente.}
2023 \fdecl{int setegid(gid\_t gid)}
2024 \fdesc{Imposta il \acr{gid} effettivo del processo corrente.}
2025 }
2026 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2027 caso \var{errno} può assumere solo il valore \errval{EPERM}.
2028 }
2029 \end{funcproto}
2030
2031 Ancora una volta le due funzioni sono identiche, e quanto diremo per la prima
2032 riguardo gli \acr{uid} si applica allo stesso modo alla seconda per i
2033 \acr{gid}. Con \func{seteuid} gli utenti normali possono impostare l'\acr{uid}
2034 effettivo solo al valore dell'\acr{uid} reale o dell'\acr{uid} salvato,
2035 l'amministratore può specificare qualunque valore. Queste funzioni sono usate
2036 per permettere all'amministratore di impostare solo l'\acr{uid} effettivo,
2037 dato che l'uso normale di \func{setuid} comporta l'impostazione di tutti gli
2038 identificatori.
2039
2040 Le due funzioni \funcd{setresuid} e \funcd{setresgid} sono invece
2041 un'estensione introdotta in Linux (a partire dal kernel 2.1.44) e permettono
2042 un completo controllo su tutti e tre i gruppi di identificatori
2043 (\textit{real}, \textit{effective} e \textit{saved}), i loro prototipi sono:
2044
2045 \begin{funcproto}{
2046 \fhead{unistd.h}
2047 \fhead{sys/types.h}
2048 \fdecl{int setresuid(uid\_t ruid, uid\_t euid, uid\_t suid)}
2049 \fdesc{Imposta l'\acr{uid} reale, effettivo e salvato del processo corrente.}
2050 \fdecl{int setresgid(gid\_t rgid, gid\_t egid, gid\_t sgid)}
2051 \fdesc{Imposta il \acr{gid} reale, effettivo e salvato del processo corrente.}
2052 }
2053 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2054 caso \var{errno} può assumere solo il valore \errval{EPERM}.
2055 }
2056 \end{funcproto}
2057
2058 Di nuovo le due funzioni sono identiche e quanto detto per la prima riguardo
2059 gli \acr{uid} si applica alla seconda per i \acr{gid}.  La funzione
2060 \func{setresuid} imposta l'\acr{uid} reale, l'\acr{uid} effettivo e
2061 l'\acr{uid} salvato del processo corrente ai valori specificati
2062 rispettivamente dagli argomenti \param{ruid}, \param{euid} e \param{suid}.  I
2063 processi non privilegiati possono cambiare uno qualunque degli\acr{uid} solo
2064 ad un valore corrispondente o all'\acr{uid} reale, o a quello effettivo o a
2065 quello salvato, l'amministratore può specificare i valori che vuole. Un valore
2066 di $-1$ per un qualunque argomento lascia inalterato l'identificatore
2067 corrispondente.
2068
2069 Per queste funzioni esistono anche due controparti, \funcd{getresuid} e
2070 \funcd{getresgid},\footnote{le funzioni non sono standard, anche se appaiono
2071   in altri kernel, su Linux sono presenti dal kernel 2.1.44 e con le versioni
2072   della \acr{glibc} a partire dalla 2.3.2, definendo la macro
2073   \macro{\_GNU\_SOURCE}.} che permettono di leggere in blocco i vari
2074 identificatori; i loro prototipi sono:
2075
2076 \begin{funcproto}{
2077 \fhead{unistd.h}
2078 \fhead{sys/types.h}
2079 \fdecl{int getresuid(uid\_t *ruid, uid\_t *euid, uid\_t *suid)}
2080 \fdesc{Legge l'\acr{uid} reale, effettivo e salvato del processo corrente.}
2081 \fdecl{int getresgid(gid\_t *rgid, gid\_t *egid, gid\_t *sgid)}
2082 \fdesc{Legge il \acr{gid} reale, effettivo e salvato del processo corrente.}
2083 }
2084 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2085   caso \var{errno} può assumere solo il valore \errval{EFAULT} se gli
2086   indirizzi delle variabili di ritorno non sono validi.  }
2087 \end{funcproto}
2088
2089 Anche queste funzioni sono un'estensione specifica di Linux, e non richiedono
2090 nessun privilegio. I valori sono restituiti negli argomenti, che vanno
2091 specificati come puntatori (è un altro esempio di
2092 \itindex{value~result~argument} \textit{value result argument}). Si noti che
2093 queste funzioni sono le uniche in grado di leggere gli identificatori del
2094 gruppo \textit{saved}.
2095
2096 Infine le funzioni \func{setfsuid} e \func{setfsgid} servono per impostare gli
2097 identificatori del gruppo \textit{filesystem} che sono usati da Linux per il
2098 controllo dell'accesso ai file.  Come già accennato in
2099 sez.~\ref{sec:proc_access_id} Linux definisce questo ulteriore gruppo di
2100 identificatori, che in circostanze normali sono assolutamente equivalenti a
2101 quelli del gruppo \textit{effective}, dato che ogni cambiamento di questi
2102 ultimi viene immediatamente riportato su di essi.
2103
2104 C'è un solo caso in cui si ha necessità di introdurre una differenza fra gli
2105 identificatori dei gruppi \textit{effective} e \textit{filesystem}, ed è per
2106 ovviare ad un problema di sicurezza che si presenta quando si deve
2107 implementare un server NFS.
2108
2109 Il server NFS infatti deve poter cambiare l'identificatore con cui accede ai
2110 file per assumere l'identità del singolo utente remoto, ma se questo viene
2111 fatto cambiando l'\acr{uid} effettivo o l'\acr{uid} reale il server si espone
2112 alla ricezione di eventuali segnali ostili da parte dell'utente di cui ha
2113 temporaneamente assunto l'identità.  Cambiando solo l'\acr{uid} di filesystem
2114 si ottengono i privilegi necessari per accedere ai file, mantenendo quelli
2115 originari per quanto riguarda tutti gli altri controlli di accesso, così che
2116 l'utente non possa inviare segnali al server NFS.
2117
2118 Le due funzioni usate per cambiare questi identificatori sono \funcd{setfsuid}
2119 e \funcd{setfsgid}, ed ovviamente sono specifiche di Linux e non devono essere
2120 usate se si intendono scrivere programmi portabili; i loro prototipi sono:
2121
2122 \begin{funcproto}{
2123 \fhead{sys/fsuid.h}
2124 \fdecl{int setfsuid(uid\_t fsuid)}
2125 \fdesc{Imposta l'\acr{uid} di filesystem del processo corrente.}
2126 \fdecl{int setfsgid(gid\_t fsgid)}
2127 \fdesc{Legge il \acr{gid} di filesystem del processo corrente.}
2128 }
2129 {Le funzioni restituiscono il nuovo valore dell'identificativo in caso di
2130   successo e quello corrente per un errore, in questo caso non viene però
2131   impostato nessun codice di errore in \var{errno}.}
2132 \end{funcproto}
2133
2134 Le due funzioni sono analoghe ed usano il valore passato come argomento per
2135 effettuare l'impostazione dell'identificativo.  Le funzioni hanno successo
2136 solo se il processo chiamante ha i privilegi di amministratore o, per gli
2137 altri utenti, se il valore specificato coincide con uno dei di quelli del
2138 gruppo \textit{real}, \textit{effective} o \textit{saved}.
2139
2140
2141 \subsection{Le funzioni per la gestione dei gruppi associati a un processo}
2142 \label{sec:proc_setgroups}
2143
2144 Le ultime funzioni che esamineremo sono quelle che permettono di operare sui
2145 gruppi supplementari cui un utente può appartenere. Ogni processo può avere
2146 almeno \const{NGROUPS\_MAX} gruppi supplementari\footnote{il numero massimo di
2147   gruppi secondari può essere ottenuto con \func{sysconf} (vedi
2148   sez.~\ref{sec:sys_sysconf}), leggendo il parametro
2149   \texttt{\_SC\_NGROUPS\_MAX}.} in aggiunta al gruppo primario; questi vengono
2150 ereditati dal processo padre e possono essere cambiati con queste funzioni.
2151
2152 La funzione che permette di leggere i gruppi supplementari associati ad un
2153 processo è \funcd{getgroups}; questa funzione è definita nello standard
2154 POSIX.1, ed il suo prototipo è:
2155
2156 \begin{funcproto}{
2157 \fhead{sys/types.h}
2158 \fhead{unistd.h}
2159 \fdecl{int getgroups(int size, gid\_t list[])}
2160 \fdesc{Legge gli identificatori dei gruppi supplementari.}
2161 }
2162 {La funzione ritorna il numero di gruppi letti in caso di successo e $-1$ per
2163   un errore, nel qual caso \var{errno} assumerà uno dei valori:
2164 \begin{errlist}
2165 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2166 \item[\errcode{EINVAL}] il valore di \param{size} è diverso da zero ma
2167   minore del numero di gruppi supplementari del processo.
2168 \end{errlist}}
2169 \end{funcproto}
2170
2171 La funzione legge gli identificatori dei gruppi supplementari del processo sul
2172 vettore \param{list} che deve essere di dimensione pari a \param{size}. Non è
2173 specificato se la funzione inserisca o meno nella lista il \acr{gid} effettivo
2174 del processo. Se si specifica un valore di \param{size} uguale a $0$ allora
2175 l'argomento \param{list} non viene modificato, ma si ottiene il numero di
2176 gruppi supplementari.
2177
2178 Una seconda funzione, \funcd{getgrouplist}, può invece essere usata per
2179 ottenere tutti i gruppi a cui appartiene utente identificato per nome; il suo
2180 prototipo è:
2181
2182 \begin{funcproto}{
2183 \fhead{grp.h}
2184 \fdecl{int getgrouplist(const char *user, gid\_t group, gid\_t *groups, int
2185   *ngroups)}
2186 \fdesc{Legge i gruppi cui appartiene un utente.}
2187 }
2188 {La funzione ritorna il numero di gruppi ottenuto in caso di successo e $-1$
2189   per un errore, che avviene solo quando il numero di gruppi è maggiore di
2190   quelli specificati con \param{ngroups}.}
2191 \end{funcproto}
2192
2193 La funzione esegue una scansione del database dei gruppi (si veda
2194 sez.~\ref{sec:sys_user_group}) per leggere i gruppi supplementari dell'utente
2195 specificato per nome (e non con un \acr{uid}) nella stringa passata con
2196 l'argomento \param{user}. Ritorna poi nel vettore \param{groups} la lista dei
2197 \acr{gid} dei gruppi a cui l'utente appartiene. Si noti che \param{ngroups},
2198 che in ingresso deve indicare la dimensione di \param{group}, è passato come
2199 \itindex{value~result~argument} \textit{value result argument} perché, qualora
2200 il valore specificato sia troppo piccolo, la funzione ritorna $-1$, passando
2201 comunque indietro il numero dei gruppi trovati, in modo da poter ripetere la
2202 chiamata con un vettore di dimensioni adeguate.
2203
2204 Infine per impostare i gruppi supplementari di un processo ci sono due
2205 funzioni, che possono essere usate solo se si hanno i privilegi di
2206 amministratore.\footnote{e più precisamente se si ha la \itindex{capability}
2207   \textit{capability} \macro{CAP\_SETGID}.} La prima delle due è
2208 \funcd{setgroups},\footnote{la funzione è definita in BSD e SRv4, ma a
2209   differenza di \func{getgroups} non è stata inclusa in POSIX.1-2001, per
2210   poterla utilizzare deve essere definita la macro \macro{\_BSD\_SOURCE}.} ed
2211 il suo prototipo è:
2212
2213 \begin{funcproto}{
2214 \fhead{grp.h}
2215 \fdecl{int setgroups(size\_t size, gid\_t *list)}
2216 \fdesc{Imposta i gruppi supplementari del processo.}
2217 }
2218 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2219 caso \var{errno} assumerà uno dei valori:
2220 \begin{errlist}
2221 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2222 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2223 \item[\errcode{EINVAL}] il valore di \param{size} è maggiore del valore
2224     massimo consentito di gruppi supplementari.
2225 \end{errlist}}
2226 \end{funcproto}
2227
2228 La funzione imposta i gruppi supplementari del processo corrente ai valori
2229 specificati nel vettore passato con l'argomento \param{list}, di dimensioni
2230 date dall'argomento \param{size}. Il numero massimo di gruppi supplementari
2231 che si possono impostare è un parametro di sistema, che può essere ricavato
2232 con le modalità spiegate in sez.~\ref{sec:sys_characteristics}.
2233
2234 Se invece si vogliono impostare i gruppi supplementari del processo a quelli di
2235 un utente specifico, si può usare \funcd{initgroups} il cui prototipo è:
2236
2237 \begin{funcproto}{
2238 \fhead{sys/types.h}
2239 \fhead{grp.h}
2240 \fdecl{int initgroups(const char *user, gid\_t group)}
2241 \fdesc{Inizializza la lista dei gruppi supplementari.}
2242 }
2243 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2244 caso \var{errno} assumerà uno dei valori:
2245 \begin{errlist}
2246 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2247 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare lo spazio per
2248   informazioni dei gruppi.
2249 \end{errlist}}
2250 \end{funcproto}
2251
2252 La funzione esegue la scansione del database dei gruppi (usualmente
2253 \conffile{/etc/group}) cercando i gruppi di cui è membro l'utente \param{user}
2254 (di nuovo specificato per nome e non per \acr{uid}) con cui costruisce una
2255 lista di gruppi supplementari, a cui aggiunge anche
2256 \param{group}, infine imposta questa lista per il processo corrente usando
2257 \func{setgroups}.  Si tenga presente che sia \func{setgroups} che
2258 \func{initgroups} non sono definite nello standard POSIX.1 e che pertanto non
2259 è possibile utilizzarle quando si definisce \macro{\_POSIX\_SOURCE} o si
2260 compila con il flag \cmd{-ansi}, è pertanto meglio evitarle se si vuole
2261 scrivere codice portabile.
2262
2263
2264 \section{La gestione della priorità dei processi}
2265 \label{sec:proc_priority}
2266
2267 In questa sezione tratteremo più approfonditamente i meccanismi con il quale
2268 lo \itindex{scheduler} \textit{scheduler} assegna la CPU ai vari processi
2269 attivi.  In particolare prenderemo in esame i vari meccanismi con cui viene
2270 gestita l'assegnazione del tempo di CPU, ed illustreremo le varie funzioni di
2271 gestione. Tratteremo infine anche le altre priorità dei processi (come quelle
2272 per l'accesso a disco) divenute disponibili con i kernel più recenti.
2273
2274
2275 \subsection{I meccanismi di \textit{scheduling}}
2276 \label{sec:proc_sched}
2277
2278 \itindbeg{scheduler}
2279
2280 La scelta di un meccanismo che sia in grado di distribuire in maniera efficace
2281 il tempo di CPU per l'esecuzione dei processi è sempre una questione delicata,
2282 ed oggetto di numerose ricerche; in generale essa dipende in maniera
2283 essenziale anche dal tipo di utilizzo che deve essere fatto del sistema, per
2284 cui non esiste un meccanismo che sia valido per tutti gli usi.
2285
2286 La caratteristica specifica di un sistema multitasking come Linux è quella del
2287 cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
2288   multitasking}: questo significa che al contrario di altri sistemi (che usano
2289 invece il cosiddetto \itindex{cooperative~multitasking} \textit{cooperative
2290   multitasking}) non sono i singoli processi, ma il kernel stesso a decidere
2291 quando la CPU deve essere passata ad un altro processo. Come accennato in
2292 sez.~\ref{sec:proc_hierarchy} questa scelta viene eseguita da una sezione
2293 apposita del kernel, lo \textit{scheduler}, il cui scopo è quello di
2294 distribuire al meglio il tempo di CPU fra i vari processi.
2295
2296 La cosa è resa ancora più complicata dal fatto che con le architetture
2297 multi-processore si deve anche scegliere quale sia la CPU più opportuna da
2298 utilizzare.\footnote{nei processori moderni la presenza di ampie cache può
2299   rendere poco efficiente trasferire l'esecuzione di un processo da una CPU ad
2300   un'altra, per cui effettuare la migliore scelta fra le diverse CPU non è
2301   banale.}  Tutto questo comunque appartiene alle sottigliezze
2302 dell'implementazione del kernel; dal punto di vista dei programmi che girano
2303 in \textit{user space}, anche quando si hanno più processori (e dei processi
2304 che sono eseguiti davvero in contemporanea), le politiche di
2305 \textit{scheduling} riguardano semplicemente l'allocazione della risorsa
2306 \textsl{tempo di esecuzione}, la cui assegnazione sarà governata dai
2307 meccanismi di scelta delle priorità che restano gli stessi indipendentemente
2308 dal numero di processori.
2309
2310 Si tenga conto poi che i processi non devono solo eseguire del codice: ad
2311 esempio molto spesso saranno impegnati in operazioni di I/O, o potranno
2312 venire bloccati da un comando dal terminale, o sospesi per un certo periodo di
2313 tempo.  In tutti questi casi la CPU diventa disponibile ed è compito dello
2314 kernel provvedere a mettere in esecuzione un altro processo.
2315
2316 Tutte queste possibilità sono caratterizzate da un diverso \textsl{stato} del
2317 processo, in Linux un processo può trovarsi in uno degli stati riportati in
2318 tab.~\ref{tab:proc_proc_states}; ma soltanto i processi che sono nello stato
2319 \textit{runnable} concorrono per l'esecuzione. Questo vuol dire che, qualunque
2320 sia la sua priorità, un processo non potrà mai essere messo in esecuzione
2321 fintanto che esso si trova in uno qualunque degli altri stati.
2322
2323 \begin{table}[htb]
2324   \footnotesize
2325   \centering
2326   \begin{tabular}[c]{|p{2.4cm}|c|p{9cm}|}
2327     \hline
2328     \textbf{Stato} & \texttt{STAT} & \textbf{Descrizione} \\
2329     \hline
2330     \hline
2331     \textit{runnable}& \texttt{R} & Il processo è in esecuzione o è pronto ad
2332                                     essere eseguito (cioè è in attesa che gli
2333                                     venga assegnata la CPU).\\
2334     \textit{sleep}   & \texttt{S} & Il processo  è in attesa di un
2335                                     risposta dal sistema, ma può essere
2336                                     interrotto da un segnale.\\
2337     \textit{uninterrutible sleep}& \texttt{D} & Il  processo è in
2338                                     attesa di un risposta dal sistema (in
2339                                     genere per I/O), e non può essere
2340                                     interrotto in nessuna circostanza.\\
2341     \textit{stopped} & \texttt{T} & Il processo è stato fermato con un
2342                                     \signal{SIGSTOP}, o è tracciato.\\
2343     \textit{zombie}\itindex{zombie}& \texttt{Z} & Il processo è terminato ma il
2344                                     suo stato di terminazione non è ancora
2345                                     stato letto dal padre.\\
2346     \textit{killable}& \texttt{D} & Un nuovo stato introdotto con il kernel
2347                                     2.6.25, sostanzialmente identico
2348                                     all'\textit{uninterrutible sleep} con la
2349                                     sola differenza che il processo può
2350                                     terminato con \signal{SIGKILL} (usato per
2351                                     lo più per NFS).\\
2352     \hline
2353   \end{tabular}
2354   \caption{Elenco dei possibili stati di un processo in Linux, nella colonna
2355     \texttt{STAT} si è riportata la corrispondente lettera usata dal comando
2356     \cmd{ps} nell'omonimo campo.}
2357   \label{tab:proc_proc_states}
2358 \end{table}
2359
2360 Si deve quindi tenere presente che l'utilizzo della CPU è soltanto una delle
2361 risorse che sono necessarie per l'esecuzione di un programma, e a seconda
2362 dello scopo del programma non è detto neanche che sia la più importante, dato
2363 che molti programmi dipendono in maniera molto più critica dall'I/O. Per
2364 questo motivo non è affatto detto che dare ad un programma la massima priorità
2365 di esecuzione abbia risultati significativi in termini di prestazioni.
2366
2367 Il meccanismo tradizionale di \textit{scheduling} di Unix (che tratteremo in
2368 sez.~\ref{sec:proc_sched_stand}) è sempre stato basato su delle
2369 \textsl{priorità dinamiche}, in modo da assicurare che tutti i processi, anche
2370 i meno importanti, potessero ricevere un po' di tempo di CPU. In sostanza
2371 quando un processo ottiene la CPU la sua priorità viene diminuita. In questo
2372 modo alla fine, anche un processo con priorità iniziale molto bassa, finisce
2373 per avere una priorità sufficiente per essere eseguito.
2374
2375 Lo standard POSIX.1b però ha introdotto il concetto di \textsl{priorità
2376   assoluta}, (chiamata anche \textsl{priorità statica}, in contrapposizione
2377 alla normale priorità dinamica), per tenere conto dei sistemi
2378 \textit{real-time},\footnote{per sistema \textit{real-time} si intende un
2379   sistema in grado di eseguire operazioni in un tempo ben determinato; in
2380   genere si tende a distinguere fra l'\textit{hard real-time} in cui è
2381   necessario che i tempi di esecuzione di un programma siano determinabili con
2382   certezza assoluta (come nel caso di meccanismi di controllo di macchine,
2383   dove uno sforamento dei tempi avrebbe conseguenze disastrose), e
2384   \textit{soft-real-time} in cui un occasionale sforamento è ritenuto
2385   accettabile.} in cui è vitale che i processi che devono essere eseguiti in
2386 un determinato momento non debbano aspettare la conclusione di altri che non
2387 hanno questa necessità.
2388
2389 Il concetto di priorità assoluta dice che quando due processi si contendono
2390 l'esecuzione, vince sempre quello con la priorità assoluta più alta.
2391 Ovviamente questo avviene solo per i processi che sono pronti per essere
2392 eseguiti (cioè nello stato \textit{runnable}).  La priorità assoluta viene in
2393 genere indicata con un numero intero, ed un valore più alto comporta una
2394 priorità maggiore. Su questa politica di \textit{scheduling} torneremo in
2395 sez.~\ref{sec:proc_real_time}.
2396
2397 In generale quello che succede in tutti gli Unix moderni è che ai processi
2398 normali viene sempre data una priorità assoluta pari a zero, e la decisione di
2399 assegnazione della CPU è fatta solo con il meccanismo tradizionale della
2400 priorità dinamica. In Linux tuttavia è possibile assegnare anche una priorità
2401 assoluta, nel qual caso un processo avrà la precedenza su tutti gli altri di
2402 priorità inferiore, che saranno eseguiti solo quando quest'ultimo non avrà
2403 bisogno della CPU.
2404
2405
2406 \subsection{Il meccanismo di \textit{scheduling} standard}
2407 \label{sec:proc_sched_stand}
2408
2409 A meno che non si abbiano esigenze specifiche,\footnote{per alcune delle quali
2410   sono state introdotte delle varianti specifiche.} l'unico meccanismo di
2411 \textit{scheduling} con il quale si avrà a che fare è quello tradizionale, che
2412 prevede solo priorità dinamiche. È di questo che, di norma, ci si dovrà
2413 preoccupare nella programmazione.  Come accennato in Linux i processi ordinari
2414 hanno tutti una priorità assoluta nulla; quello che determina quale, fra tutti
2415 i processi in attesa di esecuzione, sarà eseguito per primo, è la cosiddetta
2416 \textsl{priorità dinamica},\footnote{quella che viene mostrata nella colonna
2417   \texttt{PR} del comando \texttt{top}.} che è chiamata così proprio perché
2418 varia nel corso dell'esecuzione di un processo.
2419
2420 Il meccanismo usato da Linux è in realtà piuttosto complesso,\footnote{e
2421   dipende strettamente dalla versione di kernel; in particolare a partire
2422   dalla serie 2.6.x lo scheduler è stato riscritto completamente, con molte
2423   modifiche susseguitesi per migliorarne le prestazioni, per un certo periodo
2424   ed è stata anche introdotta la possibilità di usare diversi algoritmi,
2425   selezionabili sia in fase di compilazione, che, nelle versioni più recenti,
2426   all'avvio (addirittura è stato ideato un sistema modulare che permette di
2427   cambiare lo scheduler a sistema attivo).} ma a grandi linee si può dire che
2428 ad ogni processo è assegnata una \textit{time-slice}, cioè un intervallo di
2429 tempo (letteralmente una fetta) per il quale, a meno di eventi esterni, esso
2430 viene eseguito senza essere interrotto.  Inoltre la priorità dinamica viene
2431 calcolata dallo scheduler a partire da un valore iniziale che viene
2432 \textsl{diminuito} tutte le volte che un processo è in stato \textit{runnable}
2433 ma non viene posto in esecuzione.\footnote{in realtà il calcolo della priorità
2434   dinamica e la conseguente scelta di quale processo mettere in esecuzione
2435   avviene con un algoritmo molto più complicato, che tiene conto anche della
2436   \textsl{interattività} del processo, utilizzando diversi fattori, questa è
2437   una brutale semplificazione per rendere l'idea del funzionamento, per una
2438   trattazione più dettagliata, anche se non aggiornatissima, dei meccanismi di
2439   funzionamento dello scheduler si legga il quarto capitolo di
2440   \cite{LinKernDev}.} Lo scheduler infatti mette sempre in esecuzione, fra
2441 tutti i processi in stato \textit{runnable}, quello che ha il valore di
2442 priorità dinamica più basso.\footnote{con le priorità dinamiche il significato
2443   del valore numerico ad esse associato è infatti invertito, un valore più
2444   basso significa una priorità maggiore.} Il fatto che questo valore venga
2445 diminuito quando un processo non viene posto in esecuzione pur essendo pronto,
2446 significa che la priorità dei processi che non ottengono l'uso del processore
2447 viene progressivamente incrementata, così che anche questi alla fine hanno la
2448 possibilità di essere eseguiti.
2449
2450 Sia la dimensione della \textit{time-slice} che il valore di partenza della
2451 priorità dinamica sono determinate dalla cosiddetta \textit{nice} (o
2452 \textit{niceness}) del processo.\footnote{questa è una delle tante proprietà
2453   che ciascun processo si porta dietro, essa viene ereditata dai processi
2454   figli e mantenuta attraverso una \func{exec}; fino alla serie 2.4 essa era
2455   mantenuta nell'omonimo campo \texttt{nice} della \texttt{task\_struct}, con
2456   la riscrittura dello scheduler eseguita nel 2.6 viene mantenuta nel campo
2457   \texttt{static\_prio} come per le priorità statiche.} L'origine del nome di
2458 questo parametro sta nel fatto che generalmente questo viene usato per
2459 \textsl{diminuire} la priorità di un processo, come misura di cortesia nei
2460 confronti degli altri.  I processi infatti vengono creati dal sistema con un
2461 valore nullo e nessuno è privilegiato rispetto agli altri. Specificando un
2462 valore di \textit{nice} positivo si avrà una \textit{time-slice} più breve ed
2463 un valore di priorità dinamica iniziale più alto, mentre un valore negativo
2464 darà una \textit{time-slice} più lunga ed un valore di priorità dinamica
2465 iniziale più basso.
2466
2467 Esistono diverse funzioni che consentono di indicare un valore di
2468 \textit{nice} di un processo; la più semplice è \funcd{nice}, che opera sul
2469 processo corrente, il suo prototipo è:
2470
2471 \begin{funcproto}{
2472 \fhead{unistd.h}
2473 \fdecl{int nice(int inc)}
2474 \fdesc{Aumenta il valore di \textit{nice} del processo corrente.}
2475 }
2476 {La funzione ritorna il nuovo valore di \textit{nice} in caso di successo e
2477   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2478 \begin{errlist}
2479   \item[\errcode{EPERM}] non si ha il permesso di specificare un valore
2480     di \param{inc} negativo.
2481 \end{errlist}}
2482 \end{funcproto}
2483
2484 L'argomento \param{inc} indica l'incremento da effettuare rispetto al valore
2485 di \textit{nice} corrente, che può assumere valori compresi fra
2486 \const{PRIO\_MIN} e \const{PRIO\_MAX}; nel caso di Linux sono fra $-20$ e
2487 $19$,\footnote{in realtà l'intervallo varia a seconda delle versioni di
2488   kernel, ed è questo a partire dal kernel 1.3.43, anche se oggi si può avere
2489   anche l'intervallo fra $-20$ e $20$.} ma per \param{inc} si può specificare
2490 un valore qualunque, positivo o negativo, ed il sistema provvederà a troncare
2491 il risultato nell'intervallo consentito. Valori positivi comportano maggiore
2492 \textit{cortesia} e cioè una diminuzione della priorità, valori negativi
2493 comportano invece un aumento della priorità. Con i kernel precedenti il 2.6.12
2494 solo l'amministratore\footnote{o un processo con la \itindex{capabilities}
2495   \textit{capability} \const{CAP\_SYS\_NICE}, vedi
2496   sez.~\ref{sec:proc_capabilities}.} può specificare valori negativi
2497 di \param{inc} che permettono di aumentare la priorità di un processo, a
2498 partire da questa versione è consentito anche agli utenti normali alzare
2499 (entro certi limiti, che vedremo in sez.~\ref{sec:sys_resource_limit}) la
2500 priorità dei propri processi.
2501
2502 Gli standard SUSv2 e POSIX.1 prevedono che la funzione ritorni il nuovo valore
2503 di \textit{nice} del processo; tuttavia la \textit{system call} di Linux non
2504 segue questa convenzione e restituisce sempre $0$ in caso di successo e $-1$
2505 in caso di errore; questo perché $-1$ è anche un valore di \textit{nice}
2506 legittimo e questo comporta una confusione con una eventuale condizione di
2507 errore. La \textit{system call} originaria inoltre non consente, se non dotati
2508 di adeguati privilegi, di diminuire un valore di \textit{nice} precedentemente
2509 innalzato.
2510
2511 Fino alle \acr{glibc} 2.2.4 la funzione di libreria riportava direttamente il
2512 risultato dalla \textit{system call}, violando lo standard, per cui per
2513 ottenere il nuovo valore occorreva una successiva chiamata alla funzione
2514 \func{getpriority}. A partire dalla \acr{glibc} 2.2.4 \func{nice} è stata
2515 reimplementata e non viene più chiamata la omonima \textit{system call}, con
2516 questa versione viene restituito come valore di ritorno il valore di
2517 \textit{nice}, come richiesto dallo standard.\footnote{questo viene fatto
2518   chiamando al suo interno \func{setpriority}, che tratteremo a breve.}  In
2519 questo caso l'unico modo per rilevare in maniera affidabile una condizione di
2520 errore è quello di azzerare \var{errno} prima della chiamata della funzione e
2521 verificarne il valore quando \func{nice} restituisce $-1$.
2522
2523 Per leggere il valore di \textit{nice} di un processo occorre usare la
2524 funzione \funcd{getpriority}, derivata da BSD; il suo prototipo è:
2525
2526 \begin{funcproto}{
2527 \fhead{sys/time.h}
2528 \fhead{sys/resource.h}
2529 \fdecl{int getpriority(int which, int who)}
2530 \fdesc{Legge un valore di \textit{nice}.}
2531 }
2532 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2533 caso \var{errno} assumerà uno dei valori:
2534 \begin{errlist}
2535 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2536   \param{which} e \param{who}.
2537 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2538     elencati in tab.~\ref{tab:proc_getpriority}.
2539 \end{errlist}}
2540 \end{funcproto}
2541
2542 La funzione permette, a seconda di quanto specificato
2543 nell'argomento \param{which}, di leggere il valore di \textit{nice} di un
2544 processo, di un gruppo di processi (vedi sez.~\ref{sec:sess_proc_group}) o di
2545 un utente indicato dall'argomento \param{who}. Nelle vecchie versioni può
2546 essere necessario includere anche \code{sys/time.h}, questo non è più
2547 necessario con versioni recenti delle librerie, ma è comunque utile per
2548 portabilità.
2549
2550 I valori possibili per \param{which}, ed il tipo di valore che occorre usare
2551 in corrispondenza per \param{who} solo elencati nella legenda di
2552 tab.~\ref{tab:proc_getpriority} insieme ai relativi significati. Usare un
2553 valore nullo per \param{who} indica, a seconda della corrispondente
2554 indicazione usata per \param{which} il processo, il gruppo di processi o
2555 l'utente correnti.
2556
2557 \begin{table}[htb]
2558   \centering
2559   \footnotesize
2560   \begin{tabular}[c]{|c|c|l|}
2561     \hline
2562     \param{which} & \param{who} & \textbf{Significato} \\
2563     \hline
2564     \hline
2565     \const{PRIO\_PROCESS} & \type{pid\_t} & processo  \\
2566     \const{PRIO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
2567                                             \textit{process group}  \\
2568     \const{PRIO\_USER}    & \type{uid\_t} & utente \\
2569     \hline
2570   \end{tabular}
2571   \caption{Legenda del valore dell'argomento \param{which} e del tipo
2572     dell'argomento \param{who} delle funzioni \func{getpriority} e
2573     \func{setpriority} per le tre possibili scelte.}
2574   \label{tab:proc_getpriority}
2575 \end{table}
2576
2577 In caso di una indicazione che faccia riferimento a più processi, la funzione
2578 restituisce la priorità più alta (cioè il valore più basso) fra quelle dei
2579 processi corrispondenti. Come per \func{nice} $-1$ è un valore possibile
2580 corretto, per cui di nuovo per poter rilevare una condizione di errore è
2581 necessario cancellare sempre \var{errno} prima della chiamata alla funzione e
2582 quando si ottiene un valore di ritorno uguale a $-1$ per verificare che essa
2583 resti uguale a zero.
2584
2585 Analoga a \func{getpriority} è la funzione \funcd{setpriority} che permette di
2586 impostare la priorità di uno o più processi; il suo prototipo è:
2587
2588 \begin{funcproto}{
2589 \fhead{sys/time.h}
2590 \fhead{sys/resource.h}
2591 \fdecl{int setpriority(int which, int who, int prio)}
2592 \fdesc{Imposta un valore di \textit{nice}.}
2593 }
2594 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2595 caso \var{errno} assumerà uno dei valori:
2596 \begin{errlist}
2597 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2598   \param{which} e \param{who}.
2599 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2600     elencati in tab.~\ref{tab:proc_getpriority}.
2601   \item[\errcode{EACCES}] si è richiesto un aumento di priorità senza avere
2602     sufficienti privilegi.
2603   \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha
2604     cercato di modificare la priorità di un processo di un altro utente.
2605 \end{errlist}}
2606 \end{funcproto}
2607
2608 La funzione imposta la priorità dinamica al valore specificato da \param{prio}
2609 per tutti i processi indicati dagli argomenti \param{which} e \param{who}, per
2610 i quali valgono le stesse considerazioni fatte per \func{getpriority} e lo
2611 specchietto di tab.~\ref{tab:proc_getpriority}.
2612
2613 In questo caso come valore di \param{prio} deve essere specificato il valore
2614 di \textit{nice} da assegnare, e non un incremento (positivo o negativo) come
2615 nel caso di \func{nice}, nell'intervallo fra \const{PRIO\_MIN} ($-20$) e
2616 \const{PRIO\_MAX} ($19$). La funzione restituisce il valore di \textit{nice}
2617 assegnato in caso di successo e $-1$ in caso di errore, e come per \func{nice}
2618 anche in questo caso per rilevare un errore occorre sempre porre a zero
2619 \var{errno} prima della chiamata della funzione, essendo $-1$ un valore di
2620 \textit{nice} valido.
2621
2622 Si tenga presente che solo l'amministratore\footnote{o più precisamente un
2623   processo con la \itindex{capabilities} \textit{capability}
2624   \const{CAP\_SYS\_NICE}, vedi sez.~\ref{sec:proc_capabilities}.} ha la
2625 possibilità di modificare arbitrariamente le priorità di qualunque
2626 processo. Un utente normale infatti può modificare solo la priorità dei suoi
2627 processi ed in genere soltanto diminuirla.  Fino alla versione di kernel
2628 2.6.12 Linux ha seguito le specifiche dello standard SUSv3, e come per tutti i
2629 sistemi derivati da SysV veniva richiesto che l'\acr{uid} reale o quello
2630 effettivo del processo chiamante corrispondessero all'\acr{uid} reale (e solo
2631 a quello) del processo di cui si intendeva cambiare la priorità. A partire
2632 dalla versione 2.6.12 è stata adottata la semantica in uso presso i sistemi
2633 derivati da BSD (SunOS, Ultrix, *BSD), in cui la corrispondenza può essere
2634 anche con l'\acr{uid} effettivo.
2635
2636 Sempre a partire dal kernel 2.6.12 è divenuto possibile anche per gli utenti
2637 ordinari poter aumentare la priorità dei propri processi specificando un
2638 valore di \param{prio} negativo. Questa operazione non è possibile però in
2639 maniera indiscriminata, ed in particolare può essere effettuata solo
2640 nell'intervallo consentito dal valore del limite \const{RLIMIT\_NICE}
2641 (torneremo su questo in sez.~\ref{sec:sys_resource_limit}).
2642
2643 Infine nonostante i valori siano sempre rimasti gli stessi, il significato del
2644 valore di \textit{nice} è cambiato parecchio nelle progressive riscritture
2645 dello \textit{scheduler} di Linux, ed in particolare a partire dal kernel
2646 2.6.23 l'uso di diversi valori di \textit{nice} ha un impatto molto più forte
2647 nella distribuzione della CPU ai processi. Infatti se viene comunque calcolata
2648 una priorità dinamica per i processi che non ricevono la CPU così che anche
2649 essi possano essere messi in esecuzione, un alto valore di \textit{nice}
2650 corrisponde comunque ad una \textit{time-slice} molto piccola che non cresce
2651 comunque, per cui un processo a bassa priorità avra davvero scarse possibilità
2652 di essere eseguito in presenza di processi attivi a priorità più alta.
2653
2654
2655
2656 \subsection{Il meccanismo di \textit{scheduling real-time}}
2657 \label{sec:proc_real_time}
2658
2659 Come spiegato in sez.~\ref{sec:proc_sched} lo standard POSIX.1b ha introdotto
2660 le priorità assolute per permettere la gestione di processi real-time. In
2661 realtà nel caso di Linux non si tratta di un vero \textit{hard real-time}, in
2662 quanto in presenza di eventuali interrupt il kernel interrompe l'esecuzione di
2663 un processo qualsiasi sia la sua priorità,\footnote{questo a meno che non si
2664   siano installate le patch di RTLinux, RTAI o Adeos, con i quali è possibile
2665   ottenere un sistema effettivamente \textit{hard real-time}. In tal caso
2666   infatti gli interrupt vengono intercettati dall'interfaccia
2667   \textit{real-time} (o nel caso di Adeos gestiti dalle code del nano-kernel),
2668   in modo da poterli controllare direttamente qualora ci sia la necessità di
2669   avere un processo con priorità più elevata di un \textit{interrupt
2670     handler}.} mentre con l'incorrere in un \itindex{page~fault} \textit{page
2671   fault} si possono avere ritardi non previsti.  Se l'ultimo problema può
2672 essere aggirato attraverso l'uso delle funzioni di controllo della memoria
2673 virtuale (vedi sez.~\ref{sec:proc_mem_lock}), il primo non è superabile e può
2674 comportare ritardi non prevedibili riguardo ai tempi di esecuzione di
2675 qualunque processo.
2676
2677 Nonostante questo, ed in particolare con una serie di miglioramenti che sono
2678 stati introdotti nello sviluppo del kernel,\footnote{in particolare a partire
2679   dalla versione 2.6.18 sono stati inserite nel kernel una serie di modifiche
2680   che consentono di avvicinarsi sempre di più ad un vero e proprio sistema
2681   \textit{real-time} estendendo il concetto di \textit{preemption} alle
2682   operazioni dello stesso kernel; esistono vari livelli a cui questo può
2683   essere fatto, ottenibili attivando in fase di compilazione una fra le
2684   opzioni \texttt{CONFIG\_PREEMPT\_NONE}, \texttt{CONFIG\_PREEMPT\_VOLUNTARY}
2685   e \texttt{CONFIG\_PREEMPT\_DESKTOP}.} si può arrivare ad una ottima
2686 approssimazione di sistema \textit{real-time} usando le priorità assolute.
2687 Occorre farlo però con molta attenzione: se si dà ad un processo una priorità
2688 assoluta e questo finisce in un loop infinito, nessun altro processo potrà
2689 essere eseguito, ed esso sarà mantenuto in esecuzione permanentemente
2690 assorbendo tutta la CPU e senza nessuna possibilità di riottenere l'accesso al
2691 sistema. Per questo motivo è sempre opportuno, quando si lavora con processi
2692 che usano priorità assolute, tenere attiva una shell cui si sia assegnata la
2693 massima priorità assoluta, in modo da poter essere comunque in grado di
2694 rientrare nel sistema.
2695
2696 Quando c'è un processo con priorità assoluta lo \textit{scheduler} lo metterà
2697 in esecuzione prima di ogni processo normale. In caso di più processi sarà
2698 eseguito per primo quello con priorità assoluta più alta. Quando ci sono più
2699 processi con la stessa priorità assoluta questi vengono tenuti in una coda e
2700 tocca al kernel decidere quale deve essere eseguito.  Il meccanismo con cui
2701 vengono gestiti questi processi dipende dalla politica di \textit{scheduling}
2702 che si è scelta; lo standard ne prevede due:
2703 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
2704 \item[\textit{First In First Out} (FIFO)] Il processo viene eseguito
2705   fintanto che non cede volontariamente la CPU (con la funzione
2706   \func{sched\_yield}), si blocca, finisce o viene interrotto da un processo a
2707   priorità più alta. Se il processo viene interrotto da uno a priorità più
2708   alta esso resterà in cima alla lista e sarà il primo ad essere eseguito
2709   quando i processi a priorità più alta diverranno inattivi. Se invece lo si
2710   blocca volontariamente sarà posto in coda alla lista (ed altri processi con
2711   la stessa priorità potranno essere eseguiti).
2712 \item[\textit{Round Robin} (RR)] Il comportamento è del tutto analogo a quello
2713   precedente, con la sola differenza che ciascun processo viene eseguito al
2714   massimo per un certo periodo di tempo (la cosiddetta \textit{time-slice})
2715   dopo di che viene automaticamente posto in fondo alla coda dei processi con
2716   la stessa priorità. In questo modo si ha comunque una esecuzione a turno di
2717   tutti i processi, da cui il nome della politica. Solo i processi con la
2718   stessa priorità ed in stato \textit{runnable} entrano nel
2719   \textsl{girotondo}.
2720 \end{basedescript}
2721
2722 Lo standard POSIX.1-2001 prevede una funzione che consenta sia di modificare
2723 le politiche di \textit{scheduling}, passando da \textit{real-time} a
2724 ordinarie o viceversa, che di specificare, in caso di politiche
2725 \textit{real-time}, la eventuale priorità statica; la funzione è
2726 \funcd{sched\_setscheduler} ed il suo prototipo è:
2727
2728 \begin{funcproto}{
2729 \fhead{sched.h}
2730 \fdecl{int sched\_setscheduler(pid\_t pid, int policy, const struct
2731   sched\_param *p)}
2732 \fdesc{Imposta priorità e politica di \textit{scheduling}.}
2733 }
2734 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2735 caso \var{errno} assumerà uno dei valori:
2736 \begin{errlist}
2737     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2738     \item[\errcode{EINVAL}] il valore di \param{policy} non esiste o il
2739       relativo valore di \param{p} non è valido per la politica scelta.
2740     \item[\errcode{EPERM}] il processo non ha i privilegi per attivare la
2741       politica richiesta.
2742  \end{errlist}}
2743 \end{funcproto}
2744
2745 La funzione esegue l'impostazione per il processo specificato dall'argomento
2746 \param{pid}, un valore nullo di questo argomento esegue l'impostazione per il
2747 processo corrente.  La politica di \textit{scheduling} è specificata
2748 dall'argomento \param{policy} i cui possibili valori sono riportati in
2749 tab.~\ref{tab:proc_sched_policy}; la parte alta della tabella indica le
2750 politiche \textit{real-time}, quella bassa le politiche ordinarie. Un valore
2751 negativo per \param{policy} mantiene la politica di \textit{scheduling}
2752 corrente.
2753
2754 \begin{table}[htb]
2755   \centering
2756   \footnotesize
2757   \begin{tabular}[c]{|l|p{6cm}|}
2758     \hline
2759     \textbf{Politica}  & \textbf{Significato} \\
2760     \hline
2761     \hline
2762     \const{SCHED\_FIFO} & \textit{Scheduling real-time} con politica
2763                           \textit{FIFO}. \\
2764     \const{SCHED\_RR}   & \textit{Scheduling real-time} con politica
2765                           \textit{Round Robin}. \\
2766     \hline
2767     \const{SCHED\_OTHER}& \textit{Scheduling} ordinario.\\
2768     \const{SCHED\_BATCH}& \textit{Scheduling} ordinario con l'assunzione
2769                           ulteriore di lavoro \textit{CPU
2770                             intensive} (dal kernel 2.6.16)\\
2771     \const{SCHED\_IDLE} & \textit{Scheduling} di priorità estremamente
2772                           bassa (dal kernel 2.6.23)\\
2773     \hline
2774   \end{tabular}
2775   \caption{Valori dell'argomento \param{policy} per la funzione
2776     \func{sched\_setscheduler}.}
2777   \label{tab:proc_sched_policy}
2778 \end{table}
2779
2780 Con le versioni più recenti del kernel sono state introdotte anche delle
2781 varianti sulla politica di \textit{scheduling} tradizionale per alcuni carichi
2782 di lavoro specifici, queste due nuove politiche sono specifiche di Linux e non
2783 devono essere usate se si vogliono scrivere programmi portabili.
2784
2785 La politica \const{SCHED\_BATCH} è una variante della politica ordinaria con
2786 la sola differenza che i processi ad essa soggetti non ottengono, nel calcolo
2787 delle priorità dinamiche fatto dallo scheduler, il cosiddetto bonus di
2788 interattività che mira a favorire i processi che si svegliano dallo stato di
2789 \textit{sleep}.\footnote{cosa che accade con grande frequenza per i processi
2790   interattivi, dato che essi sono per la maggior parte del tempo in attesa di
2791   dati in ingresso da parte dell'utente.} La si usa pertanto, come indica il
2792 nome, per processi che usano molta CPU (come programmi di calcolo) che in
2793 questo modo sono leggermente sfavoriti rispetto ai processi interattivi che
2794 devono rispondere a dei dati in ingresso, pur non perdendo il loro valore di
2795 \textit{nice}.
2796
2797 La politica \const{SCHED\_IDLE} invece è una politica dedicata ai processi che
2798 si desidera siano eseguiti con la più bassa priorità possibile, ancora più
2799 bassa di un processo con il minimo valore di \textit{nice}. In sostanza la si
2800 può utilizzare per processi che devono essere eseguiti se non c'è niente altro
2801 da fare. Va comunque sottolineato che anche un processo \const{SCHED\_IDLE}
2802 avrà comunque una sua possibilità di utilizzo della CPU, sia pure in
2803 percentuale molto bassa.
2804
2805 Qualora si sia richiesta una politica \textit{real-time} il valore della
2806 priorità statica viene impostato attraverso la struttura
2807 \struct{sched\_param}, riportata in fig.~\ref{fig:sig_sched_param}, il cui
2808 solo campo attualmente definito è \var{sched\_priority}. Il campo deve
2809 contenere il valore della priorità statica da assegnare al processo; lo
2810 standard prevede che questo debba essere assegnato all'interno di un
2811 intervallo fra un massimo ed un minimo che nel caso di Linux sono
2812 rispettivamente 1 e 99.
2813
2814 \begin{figure}[!htbp]
2815   \footnotesize \centering
2816   \begin{minipage}[c]{\textwidth}
2817     \includestruct{listati/sched_param.c}
2818   \end{minipage}
2819   \normalsize
2820   \caption{La struttura \structd{sched\_param}.}
2821   \label{fig:sig_sched_param}
2822 \end{figure}
2823
2824 I processi con politica di \textit{scheduling} ordinaria devono sempre
2825 specificare un valore nullo di \var{sched\_priority} altrimenti si avrà un
2826 errore \errcode{EINVAL}, questo valore infatti non ha niente a che vedere con
2827 la priorità dinamica determinata dal valore di \textit{nice}, che deve essere
2828 impostato con le funzioni viste in precedenza.
2829
2830 Lo standard POSIX.1b prevede comunque che l'intervallo dei valori delle
2831 priorità statiche possa essere ottenuto tramite le due funzioni
2832 \funcd{sched\_get\_priority\_max} e \funcd{sched\_get\_priority\_min}, i cui
2833 prototipi sono:
2834
2835 \begin{funcproto}{
2836 \fhead{sched.h}
2837 \fdecl{int sched\_get\_priority\_max(int policy)}
2838 \fdesc{Legge il valore massimo di una priorità statica.}
2839 \fdecl{int sched\_get\_priority\_min(int policy)}
2840 \fdesc{Legge il valore minimo di una priorità statica.}
2841 }
2842 {Le funzioni ritornano il valore della priorità in caso di successo e $-1$ per
2843   un errore, nel qual caso \var{errno} assumerà il valore:
2844 \begin{errlist}
2845 \item[\errcode{EINVAL}] il valore di \param{policy} non è valido.
2846 \end{errlist}}
2847 \end{funcproto}
2848
2849 Le funzioni ritornano rispettivamente i due valori della massima e minima
2850 priorità statica possano essere ottenuti per una delle politiche di
2851 \textit{scheduling} \textit{real-time} indicata dall'argomento \param{policy}.
2852
2853 Si tenga presente che quando si imposta una politica di \textit{scheduling}
2854 real-time per un processo o se ne cambia la priorità statica questo viene
2855 messo in cima alla lista dei processi con la stessa priorità; questo comporta
2856 che verrà eseguito subito, interrompendo eventuali altri processi con la
2857 stessa priorità in quel momento in esecuzione.
2858
2859 Il kernel mantiene i processi con la stessa priorità assoluta in una lista, ed
2860 esegue sempre il primo della lista, mentre un nuovo processo che torna in
2861 stato \textit{runnable} viene sempre inserito in coda alla lista. Se la
2862 politica scelta è \const{SCHED\_FIFO} quando il processo viene eseguito viene
2863 automaticamente rimesso in coda alla lista, e la sua esecuzione continua
2864 fintanto che non viene bloccato da una richiesta di I/O, o non rilascia
2865 volontariamente la CPU (in tal caso, tornando nello stato \textbf{Runnable}
2866 sarà reinserito in coda alla lista); l'esecuzione viene ripresa subito solo
2867 nel caso che esso sia stato interrotto da un processo a priorità più alta.
2868
2869 Solo un processo con i privilegi di amministratore\footnote{più precisamente
2870   con la \itindex{capabilities} capacità \const{CAP\_SYS\_NICE}, vedi
2871   sez.~\ref{sec:proc_capabilities}.} può impostare senza restrizioni priorità
2872 assolute diverse da zero o politiche \const{SCHED\_FIFO} e
2873 \const{SCHED\_RR}. Un utente normale può modificare solo le priorità di
2874 processi che gli appartengono; è cioè richiesto che l'\acr{uid} effettivo del
2875 processo chiamante corrisponda all'\acr{uid} reale o effettivo del processo
2876 indicato con \param{pid}.
2877
2878 Fino al kernel 2.6.12 gli utenti normali non potevano impostare politiche
2879 \textit{real-time} o modificare la eventuale priorità statica di un loro
2880 processo. A partire da questa versione è divenuto possibile anche per gli
2881 utenti normali usare politiche \textit{real-time} fintanto che la priorità
2882 assoluta che si vuole impostare è inferiore al limite \const{RLIMIT\_RTPRIO}
2883 (vedi sez.~\ref{sec:sys_resource_limit}) ad essi assegnato.
2884
2885 Unica eccezione a questa possibilità sono i processi \const{SCHED\_IDLE}, che
2886 non possono cambiare politica di \textit{scheduling} indipendentemente dal
2887 valore di \const{RLIMIT\_RTPRIO}. Inoltre, in caso di processo già sottoposto
2888 ad una politica \textit{real-time}, un utente può sempre, indipendentemente
2889 dal valore di \const{RLIMIT\_RTPRIO}, diminuirne la priorità o portarlo ad una
2890 politica ordinaria.
2891
2892 Se si intende operare solo sulla priorità statica di un processo si possono
2893 usare le due funzioni \funcd{sched\_setparam} e \funcd{sched\_getparam} che
2894 consentono rispettivamente di impostarne e leggerne il valore, i loro
2895 prototipi sono:
2896
2897 \begin{funcproto}{
2898 \fhead{sched.h}
2899 \fdecl{int sched\_setparam(pid\_t pid, const struct sched\_param *param)}
2900 \fdesc{Imposta la priorità statica di un processo.}
2901 \fdecl{int sched\_getparam(pid\_t pid, struct sched\_param *param)}
2902 \fdesc{Legge la priorità statica di un processo.}
2903 }
2904 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2905 caso \var{errno} assumerà uno dei valori:
2906 \begin{errlist}
2907 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2908 \item[\errcode{EINVAL}] il valore di \param{param} non ha senso per la
2909   politica usata dal processo.
2910 \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2911   l'operazione.
2912 \end{errlist}}
2913 \end{funcproto}
2914
2915 Le funzioni richiedono di indicare nell'argomento \param{pid} il processo su
2916 cui operare e usano l'argomento \param{param} per mantenre il valore della
2917 priorità dinamica. Questo è ancora una struttura \struct{sched\_param} ed
2918 assume gli stessi valori già visti per \func{sched\_setscheduler}.
2919
2920 L'uso di \func{sched\_setparam}, compresi i controlli di accesso che vi si
2921 applicano, è del tutto equivalente a quello di \func{sched\_setscheduler} con
2922 argomento \param{policy} uguale a $-1$. Come per \func{sched\_setscheduler}
2923 specificando $0$ come valore dell'argomento \param{pid} si opera sul processo
2924 corrente. Benché la funzione sia utilizzabile anche con processi sottoposti a
2925 politica ordinaria essa ha senso soltanto per quelli \textit{real-time}, dato
2926 che per i primi la priorità statica può essere soltanto nulla.  La
2927 disponibilità di entrambe le funzioni può essere verificata controllando la
2928 macro \macro{\_POSIX\_PRIORITY\_SCHEDULING} che è definita nell'\textit{header
2929   file} \file{sched.h}.
2930
2931 Se invece si vuole sapere quale è politica di \textit{scheduling} di un
2932 processo si può usare la funzione \funcd{sched\_getscheduler}, il cui
2933 prototipo è:
2934
2935 \begin{funcproto}{
2936 \fhead{sched.h}
2937 \fdecl{int sched\_getscheduler(pid\_t pid)}
2938 \fdesc{Legge la politica di \textit{scheduling}.}
2939 }
2940 {La funzione ritorna la politica di \textit{scheduling}  in caso di successo e
2941   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2942 \begin{errlist}
2943     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2944     \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2945       l'operazione.
2946 \end{errlist}}
2947 \end{funcproto}
2948
2949 La funzione restituisce il valore, secondo quanto elencato in
2950 tab.~\ref{tab:proc_sched_policy}, della politica di \textit{scheduling} per il
2951 processo specificato dall'argomento \param{pid}, se questo è nullo viene
2952 restituito il valore relativo al processo chiamante.
2953
2954 L'ultima funzione che permette di leggere le informazioni relative ai processi
2955 real-time è \funcd{sched\_rr\_get\_interval}, che permette di ottenere la
2956 lunghezza della \textit{time-slice} usata dalla politica \textit{round robin};
2957 il suo prototipo è:
2958
2959 \begin{funcproto}{
2960 \fhead{sched.h}
2961 \fdecl{int sched\_rr\_get\_interval(pid\_t pid, struct timespec *tp)}
2962 \fdesc{Legge la durata della \textit{time-slice} per lo \textit{scheduling}
2963   \textit{round robin}.}
2964 }
2965 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2966 caso \var{errno} assumerà uno dei valori:
2967 \begin{errlist}
2968 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2969 \item[\errcode{EINVAL}] l'argomento \param{pid} non è valido.
2970 \item[\errcode{ENOSYS}] la \textit{system call} non è presente (solo per
2971   kernel arcaici).
2972 \end{errlist}
2973 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
2974 \end{funcproto}
2975
2976 La funzione restituisce nell'argomento \param{tp} come una struttura
2977 \struct{timespec}, (la cui definizione si può trovare in
2978 fig.~\ref{fig:sys_timeval_struct}) il valore dell'intervallo di tempo usato
2979 per la politica \textit{round robin} dal processo indicato da \acr{pid}. Il
2980 valore dipende dalla versione del kernel, a lungo infatti questo intervallo di
2981 tempo era prefissato e non modificabile ad un valore di 150 millisecondi,
2982 restituito indipendentemente dal \acr{pid} indicato.
2983
2984 Con kernel recenti però è possibile ottenere una variazione della
2985 \textit{time-slice}, modificando il valore di \textit{nice} del processo
2986 (anche se questo non incide assolutamente sulla priorità statica) che come
2987 accennato in precedenza modifica il valore assegnato alla \textit{time-slice}
2988 di un processo ordinario, che però viene usato anche dai processi
2989 \textit{real-time}.
2990
2991 Come accennato ogni processo può rilasciare volontariamente la CPU in modo da
2992 consentire agli altri processi di essere eseguiti; la funzione che consente di
2993 fare tutto ciò è \funcd{sched\_yield}, il cui prototipo è:
2994
2995 \begin{funcproto}{
2996 \fhead{sched.h}
2997 \fdecl{int sched\_yield(void)}
2998 \fdesc{Rilascia volontariamente l'esecuzione.}
2999 }
3000 {La funzione ritorna $0$ in caso di successo e teoricamente $-1$ per un
3001   errore, ma su Linux ha sempre successo.}
3002 \end{funcproto}
3003
3004
3005 Questa funzione ha un utilizzo effettivo soltanto quando si usa lo
3006 \textit{scheduling} \textit{real-time}, e serve a far sì che il processo
3007 corrente rilasci la CPU, in modo da essere rimesso in coda alla lista dei
3008 processi con la stessa priorità per permettere ad un altro di essere eseguito;
3009 se però il processo è l'unico ad essere presente sulla coda l'esecuzione non
3010 sarà interrotta. In genere usano questa funzione i processi con politica
3011 \const{SCHED\_FIFO}, per permettere l'esecuzione degli altri processi con pari
3012 priorità quando la sezione più urgente è finita.
3013
3014 La funzione può essere utilizzata anche con processi che usano lo
3015 \textit{scheduling} ordinario, ma in questo caso il comportamento non è ben
3016 definito, e dipende dall'implementazione. Fino al kernel 2.6.23 questo
3017 comportava che i processi venissero messi in fondo alla coda di quelli attivi,
3018 con la possibilità di essere rimessi in esecuzione entro breve tempo, con
3019 l'introduzione del \textit{Completely Fair Scheduler} questo comportamento è
3020 cambiato ed un processo che chiama la funzione viene inserito nella lista dei
3021 processi inattivo, con un tempo molto maggiore.\footnote{è comunque possibile
3022   ripristinare un comportamento analogo al precedente scrivendo il valore 1
3023   nel file \texttt{/proc/sys/kernel/sched\_compat\_yield}.}
3024
3025 L'uso delle funzione nella programmazione ordinaria può essere utile e
3026 migliorare le prestazioni generali del sistema quando si è appena rilasciata
3027 una risorsa contesa con altri processi, e si vuole dare agli altri una
3028 possibilità di approfittarne mettendoli in esecuzione, ma chiamarla senza
3029 necessità, specie se questo avviene ripetutamente all'interno di un qualche
3030 ciclo, può avere invece un forte impatto negativo per la generazione di
3031 \itindex{contest~switch} \textit{contest switch} inutili.
3032
3033
3034 \subsection{Il controllo dello \textit{scheduler} per i sistemi
3035   multiprocessore}
3036 \label{sec:proc_sched_multiprocess}
3037
3038 Con il supporto dei sistemi multiprocessore sono state introdotte delle
3039 funzioni che permettono di controllare in maniera più dettagliata la scelta di
3040 quale processore utilizzare per eseguire un certo programma. Uno dei problemi
3041 che si pongono nei sistemi multiprocessore è infatti quello del cosiddetto
3042 \index{effetto~ping-pong} \textsl{effetto ping-pong}. Può accadere cioè che lo
3043 \textit{scheduler}, quando riavvia un processo precedentemente interrotto
3044 scegliendo il primo processore disponibile, lo faccia eseguire da un
3045 processore diverso rispetto a quello su cui era stato eseguito in
3046 precedenza. Se il processo passa da un processore all'altro in questo modo,
3047 cosa che avveniva abbastanza di frequente con i kernel della seria 2.4.x, si
3048 ha l'\textsl{effetto ping-pong}.
3049
3050 Questo tipo di comportamento può generare dei seri problemi di prestazioni;
3051 infatti tutti i processori moderni utilizzano una memoria interna (la
3052 \textit{cache}) contenente i dati più usati, che permette di evitare di
3053 eseguire un accesso (molto più lento) alla memoria principale sulla scheda
3054 madre.  Chiaramente un processo sarà favorito se i suoi dati sono nella cache
3055 del processore, ma è ovvio che questo può essere vero solo per un processore
3056 alla volta, perché in presenza di più copie degli stessi dati su più
3057 processori, non si potrebbe determinare quale di questi ha la versione dei
3058 dati aggiornata rispetto alla memoria principale.
3059
3060 Questo comporta che quando un processore inserisce un dato nella sua cache,
3061 tutti gli altri processori che hanno lo stesso dato devono invalidarlo, e
3062 questa operazione è molto costosa in termini di prestazioni. Il problema
3063 diventa serio quando si verifica l'\textsl{effetto ping-pong}, in tal caso
3064 infatti un processo \textsl{rimbalza} continuamente da un processore all'altro
3065 e si ha una continua invalidazione della cache, che non diventa mai
3066 disponibile.
3067
3068 \itindbeg{CPU~affinity}
3069
3070 Per ovviare a questo tipo di problemi è nato il concetto di \textsl{affinità
3071   di processore} (o \textit{CPU affinity}); la possibilità cioè di far sì che
3072 un processo possa essere assegnato per l'esecuzione sempre allo stesso
3073 processore. Lo \textit{scheduler} dei kernel della serie 2.4.x aveva una
3074 scarsa \textit{CPU affinity}, e \index{effetto~ping-pong} l'effetto ping-pong
3075 era comune; con il nuovo \textit{scheduler} dei kernel della 2.6.x questo
3076 problema è stato risolto ed esso cerca di mantenere il più possibile ciascun
3077 processo sullo stesso processore.
3078
3079 In certi casi però resta l'esigenza di poter essere sicuri che un processo sia
3080 sempre eseguito dallo stesso processore,\footnote{quella che viene detta
3081   \textit{hard CPU affinity}, in contrasto con quella fornita dallo
3082   \textit{scheduler}, detta \textit{soft CPU affinity}, che di norma indica
3083   solo una preferenza, non un requisito assoluto.} e per poter risolvere
3084 questo tipo di problematiche nei nuovi kernel\footnote{le due \textit{system
3085     call} per la gestione della \textit{CPU affinity} sono state introdotte
3086   nel kernel 2.5.8, e le funzioni di libreria nelle \textsl{glibc} 2.3.} è
3087 stata introdotta l'opportuna infrastruttura ed una nuova \textit{system call}
3088 che permette di impostare su quali processori far eseguire un determinato
3089 processo attraverso una \textsl{maschera di affinità}. La corrispondente
3090 funzione di libreria è \funcd{sched\_setaffinity} ed il suo prototipo è:
3091
3092 \begin{funcproto}{
3093 \fhead{sched.h}
3094 \fdecl{int sched\_setaffinity (pid\_t pid, size\_t cpusetsize,
3095   cpu\_set\_t *mask)}
3096 \fdesc{Imposta la maschera di affinità di un processo.}
3097 }
3098 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3099 caso \var{errno} assumerà uno dei valori:
3100 \begin{errlist}
3101 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3102 \item[\errcode{EINVAL}] il valore di \param{mask} contiene riferimenti a
3103   processori non esistenti nel sistema o a cui non è consentito l'accesso.
3104 \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
3105   eseguire l'operazione.
3106 \end{errlist}
3107 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3108 \end{funcproto}
3109
3110 Questa funzione e la corrispondente \func{sched\_setaffinity} hanno una storia
3111 abbastanza complessa, la sottostante \textit{system call} infatti prevede
3112 l'uso di due soli argomenti (per il pid e l'indicazione della maschera dei
3113 processori), che corrispondono al fatto che l'implementazione effettiva usa
3114 una semplice maschera binaria. Quando le funzioni vennero incluse nelle
3115 \acr{glibc} assunsero invece un prototipo simile a quello mostrato però con il
3116 secondo argomento di tipo \ctyp{unsigned int}. A complicare la cosa si
3117 aggiunge il fatto che nella versione 2.3.3 delle \acr{glibc} detto argomento
3118 venne stato eliminato, per poi essere ripristinato nella versione 2.3.4 nella
3119 forma attuale.\footnote{pertanto se la vostra pagina di manuale non è
3120   aggiornata, o usate quella particolare versione delle \acr{glibc}, potrete
3121   trovare indicazioni diverse, il prototipo illustrato è quello riportato
3122   nella versione corrente (maggio 2008) delle pagine di manuale e
3123   corrispondente alla definizione presente in \file{sched.h}.}
3124
3125 La funzione imposta, con l'uso del valore contenuto all'indirizzo
3126 \param{mask}, l'insieme dei processori sui quali deve essere eseguito il
3127 processo identificato tramite il valore passato in \param{pid}. Come in
3128 precedenza il valore nullo di \param{pid} indica il processo corrente.  Per
3129 poter utilizzare questa funzione sono richiesti i privilegi di amministratore
3130 (è necessaria la capacità \const{CAP\_SYS\_NICE}) altrimenti essa fallirà con
3131 un errore di \errcode{EPERM}. Una volta impostata una maschera di affinità,
3132 questa viene ereditata attraverso una \func{fork}, in questo modo diventa
3133 possibile legare automaticamente un gruppo di processi ad un singolo
3134 processore.
3135
3136 Nell'uso comune, almeno con i kernel della serie 2.6.x, l'uso di questa
3137 funzione non è necessario, in quanto è lo scheduler stesso che provvede a
3138 mantenere al meglio l'affinità di processore. Esistono però esigenze
3139 particolari, ad esempio quando un processo (o un gruppo di processi) è
3140 utilizzato per un compito importante (ad esempio per applicazioni
3141 \textit{real-time} o la cui risposta è critica) e si vuole la massima
3142 velocità, e con questa interfaccia diventa possibile selezionare gruppi di
3143 processori utilizzabili in maniera esclusiva.  Lo stesso dicasi quando
3144 l'accesso a certe risorse (memoria o periferiche) può avere un costo diverso a
3145 seconda del processore, come avviene nelle architetture NUMA
3146 (\textit{Non-Uniform Memory Access}).
3147
3148 Infine se un gruppo di processi accede alle stesse risorse condivise (ad
3149 esempio una applicazione con più \itindex{thread} \textit{thread}) può avere
3150 senso usare lo stesso processore in modo da sfruttare meglio l'uso della sua
3151 cache; questo ovviamente riduce i benefici di un sistema multiprocessore
3152 nell'esecuzione contemporanea dei \itindex{thread} \textit{thread}, ma in
3153 certi casi (quando i \itindex{thread} \textit{thread} sono inerentemente
3154 serializzati nell'accesso ad una risorsa) possono esserci sufficienti vantaggi
3155 nell'evitare la perdita della cache da rendere conveniente l'uso dell'affinità
3156 di processore.
3157
3158 Per facilitare l'uso dell'argomento \param{mask} le \acr{glibc} hanno
3159 introdotto un apposito dato di tipo, \type{cpu\_set\_t},\footnote{questa è una
3160   estensione specifica delle \acr{glibc}, da attivare definendo la macro
3161   \macro{\_GNU\_SOURCE}, non esiste infatti una standardizzazione per questo
3162   tipo di interfaccia e POSIX al momento non prevede nulla al riguardo.} che
3163 permette di identificare un insieme di processori. Il dato è una maschera
3164 binaria: in generale è un intero a 32 bit in cui ogni bit corrisponde ad un
3165 processore, ma dato che per architetture particolari il numero di bit di un
3166 intero può non essere sufficiente, è stata creata questa che è una interfaccia
3167 generica che permette di usare a basso livello un tipo di dato qualunque
3168 rendendosi indipendenti dal numero di bit e dalla loro disposizione.
3169
3170 Questa interfaccia, oltre alla definizione del tipo di dato apposito, prevede
3171 anche una serie di macro di preprocessore per la manipolazione dello stesso,
3172 che consentono di svuotare un insieme, aggiungere o togliere un processore da
3173 esso o verificare se vi è già presente:
3174
3175 {\centering
3176 \vspace{3pt}
3177 \begin{funcbox}{
3178 \fhead{sched.h}
3179 \fdecl{void \macro{CPU\_ZERO}(cpu\_set\_t *set)}
3180 \fdesc{Inizializza l'insieme vuoto \param{set}.}
3181 \fdecl{void \macro{CPU\_SET}(int cpu, cpu\_set\_t *set)}
3182 \fdesc{Inserisce il processore \param{cpu} nell'insieme \param{set}.}
3183 \fdecl{void \macro{CPU\_CLR}(int cpu, cpu\_set\_t *set)}
3184 \fdesc{Rimuove il processore \param{cpu} nell'insieme \param{set}.}
3185 \fdecl{int \macro{CPU\_ISSET}(int cpu, cpu\_set\_t *set)}
3186 \fdesc{Controlla se il processore \param{cpu} è nell'insieme \param{set}.}
3187 }
3188 \end{funcbox}}
3189
3190 % TODO trattare le altre
3191
3192 Oltre a queste macro, simili alle analoghe usate per gli insiemi di
3193 \textit{file descriptor} (vedi sez.~\ref{sec:file_select}) è definita la
3194 costante \const{CPU\_SETSIZE} che indica il numero massimo di processori che
3195 possono far parte dell'insieme, e che costituisce un limite massimo al valore
3196 dell'argomento \param{cpu}.
3197
3198 In generale la maschera di affinità è preimpostata in modo che un processo
3199 possa essere eseguito su qualunque processore, se può comunque leggere il
3200 valore per un processo specifico usando la funzione
3201 \funcd{sched\_getaffinity}, il suo prototipo è:
3202
3203 \begin{funcproto}{
3204 \fhead{sched.h}
3205 \fdecl{int sched\_getaffinity (pid\_t pid, size\_t cpusetsize,
3206   cpu\_set\_t *mask)}
3207 \fdesc{Legge la maschera di affinità di un processo.}
3208 }
3209 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3210 caso \var{errno} assumerà uno dei valori:
3211 \begin{errlist}
3212 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3213 \item[\errcode{EINVAL}] \param{cpusetsize} è più piccolo delle dimensioni
3214   della maschera di affinità usata dal kernel.
3215 \end{errlist}
3216 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3217 \end{funcproto}
3218
3219 La funzione restituirà all'indirizzo specificato da \param{mask} il valore
3220 della maschera di affinità del processo indicato dall'argomento \param{pid}
3221 (al solito un valore nullo indica il processo corrente) così da poterla
3222 riutilizzare per una successiva reimpostazione. L'argomento \param{cpusetsize}
3223 indica la dimensione dell'argomento \param{mask} ed è in genere sufficiente
3224 passare il valore \code{sizeof(cpu\_set\_t)}.
3225
3226 È chiaro che queste funzioni per la gestione dell'affinità hanno significato
3227 soltanto su un sistema multiprocessore, esse possono comunque essere
3228 utilizzate anche in un sistema con un processore singolo, nel qual caso però
3229 non avranno alcun risultato effettivo.
3230
3231 % TODO trattare i cpuset, che attiene anche a NUMA, e che possono essere usati
3232 % per associare l'uso di gruppi di processori a gruppi di processi (vedi
3233 % manpage omonima)
3234 % TODO trattare getcpu, che attiene anche a NUMA
3235
3236 \itindend{scheduler}
3237 \itindend{CPU~affinity}
3238
3239
3240 \subsection{Le priorità per le operazioni di I/O}
3241 \label{sec:io_priority}
3242
3243 A lungo l'unica priorità usata per i processi è stata quella relativa
3244 all'assegnazione dell'uso del processore. Ma il processore non è l'unica
3245 risorsa che i processi devono contendersi, un'altra, altrettanto importante
3246 per le prestazioni, è quella dell'accesso a disco. Per questo motivo sono
3247 stati introdotti diversi \textit{I/O scheduler} in grado di distribuire in
3248 maniera opportuna questa risorsa ai vari processi. Fino al kernel 2.6.17 era
3249 possibile soltanto differenziare le politiche generali di gestione, scegliendo
3250 di usare un diverso \textit{I/O scheduler}; a partire da questa versione, con
3251 l'introduzione dello \textit{scheduler} CFQ (\textit{Completely Fair Queuing})
3252 è divenuto possibile, qualora si usi questo \textit{scheduler}, impostare
3253 anche delle diverse priorità di accesso per i singoli processi.\footnote{al
3254   momento (kernel 2.6.31), le priorità di I/O sono disponibili soltanto per
3255   questo \textit{scheduler}.}
3256
3257 La scelta dello \textit{scheduler} di I/O si può fare in maniera generica a
3258 livello di avvio del kernel assegnando il nome dello stesso al parametro
3259 \texttt{elevator}, mentre se ne può indicare uno per l'accesso al singolo
3260 disco scrivendo nel file \texttt{/sys/block/\textit{dev}/queue/scheduler}
3261 (dove \texttt{\textit{dev}} è il nome del dispositivo associato al disco); gli
3262 \textit{scheduler} disponibili sono mostrati dal contenuto dello stesso file
3263 che riporta fra parentesi quadre quello attivo, il default in tutti i kernel
3264 recenti è proprio il \texttt{cfq},\footnote{nome con cui si indica appunto lo
3265   \textit{scheduler} CFQ.} che supporta le priorità. Per i dettagli sulle
3266 caratteristiche specifiche degli altri \textit{scheduler}, la cui discussione
3267 attiene a problematiche di ambito sistemistico, si consulti la documentazione
3268 nella directory \texttt{Documentation/block/} dei sorgenti del kernel.
3269
3270 Una volta che si sia impostato lo \textit{scheduler} CFQ ci sono due
3271 specifiche system call, specifiche di Linux, che consentono di leggere ed
3272 impostare le priorità di I/O.\footnote{se usate in corrispondenza ad uno
3273   \textit{scheduler} diverso il loro utilizzo non avrà alcun effetto.} Dato
3274 che non esiste una interfaccia diretta nelle \acr{glibc} per queste due
3275 funzioni occorrerà invocarle tramite la funzione \func{syscall} (come
3276 illustrato in sez.~\ref{sec:proc_syscall}). Le due funzioni sono
3277 \funcd{ioprio\_get} ed \funcd{ioprio\_set}; i rispettivi prototipi sono:
3278
3279 \begin{funcproto}{
3280 \fhead{linux/ioprio.h}
3281 \fdecl{int ioprio\_get(int which, int who)}
3282 \fdesc{Legge la priorità di I/O di un processo.}
3283 \fdecl{int ioprio\_set(int which, int who, int ioprio)}
3284 \fdesc{Imposta la priorità di I/O di un processo.}
3285 }
3286 {Le funzioni ritornano rispettivamente un intero positivo o 0 in caso di
3287   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
3288   valori:
3289 \begin{errlist}
3290 \item[\errcode{ESRCH}] non esiste un processo corrisponente alle indicazioni.
3291 \item[\errcode{EINVAL}] i valori di \param{which} o di \param{iprio} non
3292   sono validi.
3293 \item[\errcode{EPERM}] non si hanno i privilegi per eseguire
3294   l'impostazione (solo per \func{ioprio\_set}).
3295 \end{errlist}}
3296 \end{funcproto}
3297
3298 Le funzioni leggono o impostano la priorità di I/O sulla base dell'indicazione
3299 dei due argomenti \param{which} e \param{who} che hanno lo stesso significato
3300 già visto per gli omonimi argomenti di \func{getpriority} e
3301 \func{setpriority}. Anche in questo caso si deve specificare il valore
3302 di \param{which} tramite le opportune costanti riportate in
3303 tab.~\ref{tab:ioprio_args} che consentono di indicare un singolo processo, i
3304 processi di un \textit{process group} (tratteremo questo argomento in
3305 sez.~\ref{sec:sess_proc_group}) o tutti i processi di un utente.
3306
3307 \begin{table}[htb]
3308   \centering
3309   \footnotesize
3310   \begin{tabular}[c]{|c|c|l|}
3311     \hline
3312     \param{which} & \param{who} & \textbf{Significato} \\
3313     \hline
3314     \hline
3315     \const{IPRIO\_WHO\_PROCESS} & \type{pid\_t} & processo\\
3316     \const{IPRIO\_WHO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
3317                                                   \textit{process group}\\
3318     \const{IPRIO\_WHO\_USER}    & \type{uid\_t} & utente\\
3319     \hline
3320   \end{tabular}
3321   \caption{Legenda del valore dell'argomento \param{which} e del tipo
3322     dell'argomento \param{who} delle funzioni \func{ioprio\_get} e
3323     \func{ioprio\_set} per le tre possibili scelte.}
3324   \label{tab:ioprio_args}
3325 \end{table}
3326
3327 In caso di successo \func{ioprio\_get} restituisce un intero positivo che
3328 esprime il valore della priorità di I/O, questo valore è una maschera binaria
3329 composta da due parti, una che esprime la \textsl{classe} di
3330 \textit{scheduling} di I/O del processo, l'altra che esprime, quando la classe
3331 di \textit{scheduling} lo prevede, la priorità del processo all'interno della
3332 classe stessa. Questo stesso formato viene utilizzato per indicare il valore
3333 della priorità da impostare con l'argomento \param{ioprio} di
3334 \func{ioprio\_set}.
3335
3336 Per la gestione dei valori che esprimono le priorità di I/O sono state
3337 definite delle opportune macro di preprocessore, riportate in
3338 tab.~\ref{tab:IOsched_class_macro}. I valori delle priorità si ottengono o si
3339 impostano usando queste macro.  Le prime due si usano con il valore restituito
3340 da \func{ioprio\_get} e per ottenere rispettivamente la classe di
3341 \textit{scheduling}\footnote{restituita dalla macro con i valori di
3342   tab.~\ref{tab:IOsched_class}.} e l'eventuale valore della priorità. La terza
3343 macro viene invece usata per creare un valore di priorità da usare come
3344 argomento di \func{ioprio\_set} per eseguire una impostazione.
3345
3346 \begin{table}[htb]
3347   \centering
3348   \footnotesize
3349   \begin{tabular}[c]{|l|p{8cm}|}
3350     \hline
3351     \textbf{Macro} & \textbf{Significato}\\
3352     \hline
3353     \hline
3354     \macro{IOPRIO\_PRIO\_CLASS}\texttt{(\textit{value})}
3355                                 & dato il valore di una priorità come
3356                                   restituito da \func{ioprio\_get} estrae il
3357                                   valore della classe.\\
3358     \macro{IOPRIO\_PRIO\_DATA}\texttt{(\textit{value})}
3359                                 & dato il valore di una priorità come
3360                                   restituito da \func{ioprio\_get} estrae il
3361                                   valore della priorità.\\
3362     \macro{IOPRIO\_PRIO\_VALUE}\texttt{(\textit{class},\textit{prio})}
3363                                 & dato un valore di priorità ed una classe
3364                                   ottiene il valore numerico da passare a
3365                                   \func{ioprio\_set}.\\
3366     \hline
3367   \end{tabular}
3368   \caption{Le macro per la gestione dei valori numerici .}
3369   \label{tab:IOsched_class_macro}
3370 \end{table}
3371
3372 Le classi di \textit{scheduling} previste dallo \textit{scheduler} CFQ sono
3373 tre, e ricalcano tre diverse modalità di distribuzione delle risorse analoghe
3374 a quelle già adottate anche nel funzionamento dello \textit{scheduler} del
3375 processore. Ciascuna di esse è identificata tramite una opportuna costante,
3376 secondo quanto riportato in tab.~\ref{tab:IOsched_class}.
3377
3378 \begin{table}[htb]
3379   \centering
3380   \footnotesize
3381   \begin{tabular}[c]{|l|l|}
3382     \hline
3383     \textbf{Classe}  & \textbf{Significato} \\
3384     \hline
3385     \hline
3386     \const{IOPRIO\_CLASS\_RT}  & \textit{Scheduling} di I/O \textit{real-time}.\\
3387     \const{IOPRIO\_CLASS\_BE}  & \textit{Scheduling} di I/O ordinario.\\
3388     \const{IOPRIO\_CLASS\_IDLE}& \textit{Scheduling} di I/O di priorità minima.\\
3389     \hline
3390   \end{tabular}
3391   \caption{Costanti che identificano le classi di \textit{scheduling} di I/O.}
3392   \label{tab:IOsched_class}
3393 \end{table}
3394
3395 La classe di priorità più bassa è \const{IOPRIO\_CLASS\_IDLE}; i processi in
3396 questa classe riescono ad accedere a disco soltanto quando nessun altro
3397 processo richiede l'accesso. Occorre pertanto usarla con molta attenzione,
3398 perché un processo in questa classe può venire completamente bloccato quando
3399 ci sono altri processi in una qualunque delle altre due classi che stanno
3400 accedendo al disco. Quando si usa questa classe non ha senso indicare un
3401 valore di priorità, dato che in questo caso non esiste nessuna gerarchia e la
3402 priorità è identica, la minima possibile, per tutti i processi.
3403
3404 La seconda classe di priorità di I/O è \const{IOPRIO\_CLASS\_BE} (il nome sta
3405 per \textit{best-effort}) che è quella usata ordinariamente da tutti
3406 processi. In questo caso esistono priorità diverse che consentono di
3407 assegnazione di una maggiore banda passante nell'accesso a disco ad un
3408 processo rispetto agli altri, con meccanismo simile a quello dei valori di
3409 \textit{nice} in cui si evita che un processo a priorità più alta possa
3410 bloccare indefinitamente quelli a priorità più bassa. In questo caso però le
3411 diverse priorità sono soltanto otto, indicate da un valore numerico fra 0 e 7
3412 e come per \textit{nice} anche in questo caso un valore più basso indica una
3413 priorità maggiore.
3414
3415
3416 Infine la classe di priorità di I/O \textit{real-time}
3417 \const{IOPRIO\_CLASS\_RT} ricalca le omonime priorità di processore: un
3418 processo in questa classe ha sempre la precedenza nell'accesso a disco
3419 rispetto a tutti i processi delle altre classi e di un processo nella stessa
3420 classe ma con priorità inferiore, ed è pertanto in grado di bloccare
3421 completamente tutti gli altri. Anche in questo caso ci sono 8 priorità diverse
3422 con un valore numerico fra 0 e 7, con una priorità più elevata per valori più
3423 bassi.
3424
3425 In generale nel funzionamento ordinario la priorità di I/O di un processo
3426 viene impostata in maniera automatica nella classe \const{IOPRIO\_CLASS\_BE}
3427 con un valore ottenuto a partire dal corrispondente valore di \textit{nice}
3428 tramite la formula: $\mathtt{\mathit{prio}}=(\mathtt{\mathit{nice}}+20)/5$. Un
3429 utente ordinario può modificare con \func{ioprio\_set} soltanto le priorità
3430 dei processi che gli appartengono,\footnote{per la modifica delle priorità di
3431   altri processi occorrono privilegi amministrativi, ed in particolare la
3432   capacità \const{CAP\_SYS\_NICE} (vedi sez.~\ref{sec:proc_capabilities}).}
3433 cioè quelli il cui \acr{uid} reale corrisponde all'\acr{uid} reale o effettivo
3434 del chiamante. Data la possibilità di ottenere un blocco totale del sistema,
3435 solo l'amministratore\footnote{o un processo con la capacità
3436   \const{CAP\_SYS\_ADMIN} (vedi sez.~\ref{sec:proc_capabilities}).} può
3437 impostare un processo ad una priorità di I/O nella classe
3438 \const{IOPRIO\_CLASS\_RT}, lo stesso privilegio era richiesto anche per la
3439 classe \const{IOPRIO\_CLASS\_IDLE} fino al kernel 2.6.24, ma dato che in
3440 questo caso non ci sono effetti sugli altri processi questo limite è stato
3441 rimosso a partire dal kernel 2.6.25.
3442
3443 %TODO verificare http://lwn.net/Articles/355987/
3444
3445 %TODO trattare le funzionalità per il NUMA
3446 % vedi man numa e, mbind, get_mempolicy, set_mempolicy,
3447 % le pagine di manuale relative
3448 % vedere anche dove metterle...
3449
3450
3451 \section{Funzioni di gestione avanzata}
3452 \label{sec:proc_advanced_control}
3453
3454 Nelle precedenti sezioni si sono trattate la gran parte delle funzioni che
3455 attengono alla gestione ordinaria dei processi e delle loro proprietà più
3456 comuni. Tratteremo qui alcune \textit{system call} dedicate alla gestione di
3457 funzionalità dei processi molto specifiche ed avanzate, il cui uso è in genere
3458 piuttosto ridotto. Trattandosi di problematiche abbastanza complesse, che
3459 spesso presuppongono la conoscenza di altri argomenti trattati nel seguito
3460 della guida, si può saltare questa sezione in una prima lettura, tornando su
3461 di essa in un secondo tempo.
3462
3463
3464 \subsection{La funzione \func{prctl}}
3465 \label{sec:process_prctl}
3466
3467 Benché la gestione ordinaria possa essere effettuata attraverso le funzioni
3468 che abbiamo già esaminato nelle sezioni precedenti, esistono una serie di
3469 proprietà e caratteristiche particolari dei processi non coperte da esse, per
3470 la cui gestione è stata predisposta una apposita \textit{system call} che
3471 fornisce una interfaccia generica per tutte le operazioni specialistiche. La
3472 funzione è \funcd{prctl} ed il suo prototipo è:\footnote{la funzione non è
3473   standardizzata ed è specifica di Linux, anche se ne esiste una analoga in
3474   IRIX; è stata introdotta con il kernel 2.1.57.}
3475
3476 \begin{funcproto}{
3477 \fhead{sys/prctl.h}
3478 \fdecl{int prctl(int option, unsigned long arg2, unsigned long arg3,
3479     unsigned long arg4, unsigned long arg5)}
3480 \fdesc{Esegue una operazione speciale sul processo corrente.}
3481 }
3482 {La funzione ritorna $0$ o un valore positivo dipendente dall'operazione in
3483   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
3484   valori diversi a seconda del tipo di operazione richiesta (in genere
3485   \errval{EINVAL} o \errval{EPERM}).}
3486 \end{funcproto}
3487
3488 La funzione ritorna un valore nullo o positivo in caso di successo e $-1$ in
3489 caso di errore; il significato degli argomenti della funzione successivi al
3490 primo, il valore di ritorno in caso di successo, il tipo di errore restituito
3491 in \var{errno} dipendono dall'operazione eseguita, indicata tramite il primo
3492 argomento, \param{option}. Questo è un valore intero che identifica
3493 l'operazione, e deve essere specificato con l'uso di una delle costanti
3494 predefinite del seguente elenco, che illustra quelle disponibili al momento:
3495
3496 \begin{basedescript}{\desclabelstyle{\pushlabel}}
3497 \item[\const{PR\_CAPBSET\_READ}] Controlla la disponibilità di una delle
3498   \textit{capabilities} (vedi sez.~\ref{sec:proc_capabilities}). La funzione
3499   ritorna 1 se la capacità specificata nell'argomento \param{arg2} (con una
3500   delle costanti di tab.~\ref{tab:proc_capabilities}) è presente nel
3501   \textit{capabilities bounding set} del processo e zero altrimenti,
3502   se \param{arg2} non è un valore valido si avrà un errore di \errval{EINVAL}.
3503   Introdotta a partire dal kernel 2.6.25.
3504 \item[\const{PR\_CAPBSET\_DROP}] Rimuove permanentemente una delle
3505   \textit{capabilities} (vedi sez.~\ref{sec:proc_capabilities}) dal processo e
3506   da tutti i suoi discendenti. La funzione cancella la capacità specificata
3507   nell'argomento \param{arg2} con una delle costanti di
3508   tab.~\ref{tab:proc_capabilities} dal \textit{capabilities bounding set} del
3509   processo. L'operazione richiede i privilegi di amministratore (la capacità
3510   \const{CAP\_SETPCAP}), altrimenti la chiamata fallirà con un errore di
3511   \errval{EPERM}; se il valore di \param{arg2} non è valido o se il supporto
3512   per le \textit{file capabilities} non è stato compilato nel kernel la
3513   chiamata fallirà con un errore di \errval{EINVAL}. Introdotta a partire dal
3514   kernel 2.6.25.
3515 \item[\const{PR\_SET\_DUMPABLE}] Imposta il flag che determina se la
3516   terminazione di un processo a causa di un segnale per il quale è prevista la
3517   generazione di un file di \itindex{core~dump} \textit{core dump} (vedi
3518   sez.~\ref{sec:sig_standard}) lo genera effettivamente. In genere questo flag
3519   viene attivato automaticamente, ma per evitare problemi di sicurezza (la
3520   generazione di un file da parte di processi privilegiati può essere usata
3521   per sovrascriverne altri) viene cancellato quando si mette in esecuzione un
3522   programma con i bit \acr{suid} e \acr{sgid} attivi (vedi
3523   sez.~\ref{sec:file_special_perm}) o con l'uso delle funzioni per la modifica
3524   degli \textit{user-ID} dei processi (vedi
3525   sez.~\ref{sec:proc_setuid}). L'operazione è stata introdotta a partire dal
3526   kernel 2.3.20, fino al kernel 2.6.12 e per i kernel successivi al 2.6.17 era
3527   possibile usare solo un valore 0 di \param{arg2} per disattivare il flag ed
3528   un valore 1 per attivarlo, nei kernel dal 2.6.13 al 2.6.17 è stato
3529   supportato anche il valore 2, che causava la generazione di un
3530   \itindex{core~dump} \textit{core dump} leggibile solo
3531   dall'amministratore.\footnote{la funzionalità è stata rimossa per motivi di
3532     sicurezza, in quanto consentiva ad un utente normale di creare un file di
3533     \textit{core dump} appartenente all'amministratore in directory dove
3534     l'utente avrebbe avuto permessi di accesso.}
3535 \item[\const{PR\_GET\_DUMPABLE}] Ottiene come valore di ritorno della funzione
3536   lo stato corrente del flag che controlla la effettiva generazione dei
3537   \itindex{core~dump} \textit{core dump}. Introdotta a partire dal kernel
3538   2.3.20.
3539 \item[\const{PR\_SET\_ENDIAN}] Imposta la \textit{endianness} del processo
3540   chiamante secondo il valore fornito in \param{arg2}. I valori possibili sono
3541   sono: \const{PR\_ENDIAN\_BIG} (\textit{big endian}),
3542   \const{PR\_ENDIAN\_LITTLE} (\textit{little endian}), e
3543   \const{PR\_ENDIAN\_PPC\_LITTLE} (lo pseudo \textit{little endian} del
3544   PowerPC). Introdotta a partire dal kernel 2.6.18, solo per architettura
3545   PowerPC.
3546 \item[\const{PR\_GET\_ENDIAN}] Ottiene il valore della \textit{endianness} del
3547   processo chiamante, salvato sulla variabile puntata da \param{arg2} che deve
3548   essere passata come di tipo \ctyp{(int *)}. Introdotta a partire dal kernel
3549   2.6.18, solo su PowerPC.
3550 \item[\const{PR\_SET\_FPEMU}] Imposta i bit di controllo per l'emulazione
3551   della virgola mobile su architettura ia64, secondo il valore
3552   di \param{arg2}, si deve passare \const{PR\_FPEMU\_NOPRINT} per emulare in
3553   maniera trasparente l'accesso alle operazioni in virgola mobile, o
3554   \const{PR\_FPEMU\_SIGFPE} per non emularle ed inviare il segnale
3555   \signal{SIGFPE} (vedi sez.~\ref{sec:sig_prog_error}). Introdotta a partire
3556   dal kernel 2.4.18, solo su ia64.
3557 \item[\const{PR\_GET\_FPEMU}] Ottiene il valore dei flag di controllo
3558   dell'emulazione della virgola mobile, salvato all'indirizzo puntato
3559   da \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta a
3560   partire dal kernel 2.4.18, solo su ia64.
3561 \item[\const{PR\_SET\_FPEXC}] Imposta la modalità delle eccezioni in virgola
3562   mobile (\textit{floating-point exception mode}) al valore di \param{arg2}.
3563   I valori possibili sono: \const{PR\_FP\_EXC\_SW\_ENABLE} per usare FPEXC per
3564   le eccezioni, \const{PR\_FP\_EXC\_DIV} per la divisione per zero in virgola
3565   mobile, \const{PR\_FP\_EXC\_OVF} per gli overflow, \const{PR\_FP\_EXC\_UND}
3566   per gli underflow, \const{PR\_FP\_EXC\_RES} per risultati non esatti,
3567   \const{PR\_FP\_EXC\_INV} per operazioni invalide,
3568   \const{PR\_FP\_EXC\_DISABLED} per disabilitare le eccezioni,
3569   \const{PR\_FP\_EXC\_NONRECOV} per utilizzare la modalità di eccezione
3570   asincrona non recuperabile, \const{PR\_FP\_EXC\_ASYNC} per utilizzare la
3571   modalità di eccezione asincrona recuperabile, \const{PR\_FP\_EXC\_PRECISE}
3572   per la modalità precisa di eccezione.\footnote{trattasi di gestione
3573     specialistica della gestione delle eccezioni dei calcoli in virgola mobile
3574     che, i cui dettagli al momento vanno al di là dello scopo di questo
3575     testo.} Introdotta a partire dal kernel 2.4.21, solo su PowerPC.
3576 \item[\const{PR\_GET\_FPEXC}] Ottiene il valore della modalità delle eccezioni
3577   delle operazioni in virgola mobile, salvata all'indirizzo
3578   puntato \param{arg2}, che deve essere di tipo \code{(int *)}.  Introdotta a
3579   partire dal kernel 2.4.21, solo su PowerPC.
3580 \item[\const{PR\_SET\_KEEPCAPS}] Consente di controllare quali
3581   \textit{capabilities} vengono cancellate quando si esegue un cambiamento di
3582   \textit{user-ID} del processo (per i dettagli si veda
3583   sez.~\ref{sec:proc_capabilities}, in particolare quanto illustrato a
3584   pag.~\pageref{sec:capability-uid-transition}). Un valore nullo (il default)
3585   per \param{arg2} comporta che vengano cancellate, il valore 1 che vengano
3586   mantenute, questo valore viene sempre cancellato attraverso una \func{exec}.
3587   L'uso di questo flag è stato sostituito, a partire dal kernel 2.6.26, dal
3588   flag \const{SECURE\_KEEP\_CAPS} dei \itindex{securebits} \textit{securebits}
3589   (vedi l'uso di \const{PR\_SET\_SECUREBITS} più avanti). Introdotta a partire
3590   dal kernel 2.2.18.
3591 \item[\const{PR\_GET\_KEEPCAPS}] Ottiene come valore di ritorno della funzione
3592   il valore del flag di controllo impostato con
3593   \const{PR\_SET\_KEEPCAPS}. Introdotta a partire dal kernel 2.2.18.
3594 \item[\const{PR\_SET\_NAME}] Imposta il nome del processo chiamante alla
3595   stringa puntata da \param{arg2}, che deve essere di tipo \code{(char *)}. Il
3596   nome può essere lungo al massimo 16 caratteri, e la stringa deve essere
3597   terminata da NUL se più corta.  Introdotta a partire dal kernel 2.6.9.
3598 \item[\const{PR\_GET\_NAME}] Ottiene il nome del processo chiamante nella
3599   stringa puntata da \param{arg2}, che deve essere di tipo \code{(char *)}; si
3600   devono allocare per questo almeno 16 byte, e il nome sarà terminato da NUL
3601   se più corto. Introdotta a partire dal kernel 2.6.9.
3602 \item[\const{PR\_SET\_PDEATHSIG}] Consente di richiedere l'emissione di un
3603   segnale, che sarà ricevuto dal processo chiamante, in occorrenza della
3604   terminazione del proprio processo padre; in sostanza consente di invertire
3605   il ruolo di \signal{SIGCHLD}. Il valore di \param{arg2} deve indicare il
3606   numero del segnale, o 0 per disabilitare l'emissione. Il valore viene
3607   automaticamente cancellato per un processo figlio creato con \func{fork}.
3608   Introdotta a partire dal kernel 2.1.57.
3609 \item[\const{PR\_GET\_PDEATHSIG}] Ottiene il valore dell'eventuale segnale
3610   emesso alla terminazione del padre, salvato all'indirizzo
3611   puntato \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta a
3612   partire dal kernel 2.3.15.
3613 \item[\const{PR\_SET\_SECCOMP}] Imposta il cosiddetto
3614   \itindex{secure~computing~mode} \textit{secure computing mode} per il
3615   processo corrente. Prevede come unica possibilità che \param{arg2} sia
3616   impostato ad 1. Una volta abilitato il \textit{secure computing mode} il
3617   processo potrà utilizzare soltanto un insieme estremamente limitato di
3618   \textit{system call}: \func{read}, \func{write}, \func{\_exit} e
3619   \func{sigreturn}, ogni altra \textit{system call} porterà all'emissione di
3620   un \func{SIGKILL} (vedi sez.~\ref{sec:sig_termination}).  Il \textit{secure
3621     computing mode} è stato ideato per fornire un supporto per l'esecuzione di
3622   codice esterno non fidato e non verificabile a scopo di calcolo;\footnote{lo
3623     scopo è quello di poter vendere la capacità di calcolo della proprio
3624     macchina ad un qualche servizio di calcolo distribuito senza
3625     comprometterne la sicurezza eseguendo codice non sotto il proprio
3626     controllo.} in genere i dati vengono letti o scritti grazie ad un socket o
3627   una pipe, e per evitare problemi di sicurezza non sono possibili altre
3628   operazioni se non quelle citate.  Introdotta a partire dal kernel 2.6.23,
3629   disponibile solo se si è abilitato il supporto nel kernel con
3630   \texttt{CONFIG\_SECCOMP}.
3631 \item[\const{PR\_GET\_SECCOMP}] Ottiene come valore di ritorno della funzione
3632   lo stato corrente del \textit{secure computing mode}, al momento attuale la
3633   funzione è totalmente inutile in quanto l'unico valore ottenibile è 0, dato
3634   che la chiamata di questa funzione in \textit{secure computing mode}
3635   comporterebbe l'emissione di \texttt{SIGKILL}, è stata comunque definita per
3636   eventuali estensioni future.  Introdotta a partire dal kernel 2.6.23.
3637 \item[\const{PR\_SET\_SECUREBITS}] Imposta i \itindex{securebits}
3638   \textit{securebits} per il processo chiamante al valore indicato
3639   da \param{arg2}; per i dettagli sul significato dei \textit{securebits} si
3640   veda sez.~\ref{sec:proc_capabilities}, ed in particolare i valori di
3641   tab.~\ref{tab:securebits_values} e la relativa trattazione. L'operazione
3642   richiede i privilegi di amministratore (la capacità \const{CAP\_SETPCAP}),
3643   altrimenti la chiamata fallirà con un errore di \errval{EPERM}. Introdotta a
3644   partire dal kernel 2.6.26.
3645 \item[\const{PR\_GET\_SECUREBITS}] Ottiene come valore di ritorno della
3646   funzione l'impostazione corrente per i \itindex{securebits}
3647   \textit{securebits}. Introdotta a partire dal kernel 2.6.26.
3648 \item[\const{PR\_SET\_TIMING}] Imposta il metodo di temporizzazione del
3649   processo da indicare con il valore di \param{arg2}, con
3650   \const{PR\_TIMING\_STATISTICAL} si usa il metodo statistico tradizionale,
3651   con \const{PR\_TIMING\_TIMESTAMP} il più accurato basato su dei
3652   \textit{timestamp}, quest'ultimo però non è ancora implementato ed il suo
3653   uso comporta la restituzione di un errore di \errval{EINVAL}. Introdotta a
3654   partire dal kernel 2.6.0-test4.
3655 \item[\const{PR\_GET\_TIMING}] Ottiene come valore di ritorno della funzione
3656   il metodo di temporizzazione del processo attualmente in uso. Introdotta a
3657   partire dal kernel 2.6.0-test4.
3658 \item[\const{PR\_SET\_TSC}] Imposta il flag che indica se il processo
3659   chiamante può leggere il registro di processore contenente il contatore dei
3660   \textit{timestamp} (TSC, o \textit{Time Stamp Counter}) da indicare con il
3661   valore di \param{arg2}. Si deve specificare \const{PR\_TSC\_ENABLE} per
3662   abilitare la lettura o \const{PR\_TSC\_SIGSEGV} per disabilitarla con la
3663   generazione di un segnale di \signal{SIGSEGV} (vedi
3664   sez.~\ref{sec:sig_prog_error}). La lettura viene automaticamente
3665   disabilitata se si attiva il \textit{secure computing mode}.  Introdotta a
3666   partire dal kernel 2.6.26, solo su x86.
3667 \item[\const{PR\_GET\_TSC}] Ottiene il valore del flag che controlla la
3668   lettura del contattore dei \textit{timestamp}, salvato all'indirizzo
3669   puntato \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta a
3670   partire dal kernel 2.6.26, solo su x86.
3671 % articoli sul TSC e relativi problemi: http://lwn.net/Articles/209101/,
3672 % http://blog.cr0.org/2009/05/time-stamp-counter-disabling-oddities.html,
3673 % http://en.wikipedia.org/wiki/Time_Stamp_Counter
3674 \item[\const{PR\_SET\_UNALIGN}] Imposta la modalità di controllo per l'accesso
3675   a indirizzi di memoria non allineati, che in varie architetture risultano
3676   illegali, da indicare con il valore di \param{arg2}. Si deve specificare il
3677   valore \const{PR\_UNALIGN\_NOPRINT} per ignorare gli accessi non allineati,
3678   ed il valore \const{PR\_UNALIGN\_SIGBUS} per generare un segnale di
3679   \signal{SIGBUS} (vedi sez.~\ref{sec:sig_prog_error}) in caso di accesso non
3680   allineato.  Introdotta con diverse versioni su diverse architetture.
3681 \item[\const{PR\_GET\_UNALIGN}] Ottiene il valore della modalità di controllo
3682   per l'accesso a indirizzi di memoria non allineati, salvato all'indirizzo
3683   puntato \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta con
3684   diverse versioni su diverse architetture.
3685 \item[\const{PR\_MCE\_KILL}] Imposta la politica di gestione degli errori
3686   dovuti a corruzione della memoria per problemi hardware. Questo tipo di
3687   errori vengono riportati dall'hardware di controllo della RAM e vengono
3688   gestiti dal kernel,\footnote{la funzionalità è disponibile solo sulle
3689     piattaforme più avanzate che hanno il supporto hardware per questo tipo di
3690     controlli.} ma devono essere opportunamente riportati ai processi che
3691   usano quella parte di RAM che presenta errori; nel caso specifico questo
3692   avviene attraverso l'emissione di un segnale di \signal{SIGBUS} (vedi
3693   sez.~\ref{sec:sig_prog_error}).\footnote{in particolare viene anche
3694     impostato il valore di \var{si\_code} in \struct{siginfo\_t} a
3695     \const{BUS\_MCEERR\_AO}; per il significato di tutto questo si faccia
3696     riferimento alla trattazione di sez.~\ref{sec:sig_sigaction}.}
3697
3698   Il comportamento di default prevede che per tutti i processi si applichi la
3699   politica generale di sistema definita nel file
3700   \procfile{/proc/sys/vm/memory\_failure\_early\_kill}, ma specificando
3701   per \param{arg2} il valore \const{PR\_MCE\_KILL\_SET} è possibile impostare
3702   con il contenuto di \param{arg3} una politica specifica del processo
3703   chiamante. Si può tornare alla politica di default del sistema utilizzando
3704   invece per \param{arg2} il valore \const{PR\_MCE\_KILL\_CLEAR}. In tutti i
3705   casi, per compatibilità con eventuali estensioni future, tutti i valori
3706   degli argomenti non utilizzati devono essere esplicitamente posti a zero,
3707   pena il fallimento della chiamata con un errore di \errval{EINVAL}.
3708
3709   In caso di impostazione di una politica specifica del processo con
3710   \const{PR\_MCE\_KILL\_SET} i valori di \param{arg3} possono essere soltanto
3711   due, che corrispondono anche al valore che si trova nell'impostazione
3712   generale di sistema di \texttt{memory\_failure\_early\_kill}, con
3713   \const{PR\_MCE\_KILL\_EARLY} si richiede l'emissione immediata di
3714   \signal{SIGBUS} non appena viene rilevato un errore, mentre con
3715   \const{PR\_MCE\_KILL\_LATE} il segnale verrà inviato solo quando il processo
3716   tenterà un accesso alla memoria corrotta. Questi due valori corrispondono
3717   rispettivamente ai valori 1 e 0 di
3718   \texttt{memory\_failure\_early\_kill}.\footnote{in sostanza nel primo caso
3719     viene immediatamente inviato il segnale a tutti i processi che hanno la
3720     memoria corrotta mappata all'interno del loro spazio degli indirizzi, nel
3721     secondo caso prima la pagina di memoria viene tolta dallo spazio degli
3722     indirizzi di ciascun processo, mentre il segnale viene inviato solo quei
3723     processi che tentano di accedervi.} Si può usare per \param{arg3} anche un
3724   terzo valore, \const{PR\_MCE\_KILL\_DEFAULT}, che corrisponde a impostare
3725   per il processo la politica di default.\footnote{si presume la politica di
3726     default corrente, in modo da non essere influenzati da un eventuale
3727     successivo cambiamento della stessa.} Introdotta a partire dal kernel
3728   2.6.32.
3729 \item[\const{PR\_MCE\_KILL\_GET}] Ottiene come valore di ritorno della
3730   funzione la politica di gestione degli errori dovuti a corruzione della
3731   memoria. Tutti gli argomenti non utilizzati (al momento tutti) devono essere
3732   nulli pena la ricezione di un errore di \errval{EINVAL}. Introdotta a
3733   partire dal kernel 2.6.32.
3734 \label{sec:prctl_operation}
3735 \end{basedescript}
3736
3737
3738 \subsection{La \textit{system call} \func{clone}}
3739 \label{sec:process_clone}
3740
3741 La funzione tradizionale con cui creare un nuovo processo in un sistema
3742 Unix-like, come illustrato in sez.~\ref{sec:proc_fork}, è \func{fork}, ma con
3743 l'introduzione del supporto del kernel per i \textit{thread} (vedi
3744 cap.~\ref{cha:threads}), si è avuta la necessità di una interfaccia che
3745 consentisse un maggiore controllo sulla modalità con cui vengono creati nuovi
3746 processi, che poi è stata utilizzata anche per fornire supporto per le
3747 tecnologie di virtualizzazione dei processi (i cosiddetti \textit{container}).
3748
3749 Per questo l'interfaccia per la creazione di un nuovo processo è stata
3750 delegata ad una nuova \textit{system call}, \func{sys\_clone}, che consente di
3751 reimplementare anche la tradizionale \func{fork}. In realtà in questo caso più
3752 che di nuovi processi si può parlare della creazioni di nuovi
3753 ``\textit{task}'' del kernel che possono assumere la veste sia di un processo
3754 classico come quelli trattati finora, che di un \textit{thread}, come quelli
3755 che vedremo in sez.~\ref{sec:linux_thread}, in cui la memoria viene condivisa
3756 fra il processo chiamante ed il nuovo processo creato. Per evitare confusione
3757 fra \textit{thread} e processi ordinari, abbiamo deciso di usare la
3758 nomenclatura \textit{task} per indicare la unità di esecuzione generica messa
3759 a disposizione del kernel che \texttt{sys\_clone} permette di creare.
3760
3761 Oltre a questo la funzione consente, ad uso delle nuove funzionalità di
3762 virtualizzazione dei processi, di creare nuovi \textit{namespace} per una
3763 serie di proprietà generali dei processi (come l'elenco dei PID, l'albero dei
3764 file, dei \textit{mount point}, della rete, ecc.), che consentono di creare
3765 gruppi di processi che vivono in una sorta di spazio separato dagli altri, che
3766 costituisce poi quello che viene chiamato un \textit{container}.
3767
3768 La \textit{system call} richiede soltanto due argomenti: il
3769 primo, \param{flags}, consente di controllare le modalità di creazione del
3770 nuovo \textit{task}, il secondo, \param{child\_stack}, imposta l'indirizzo
3771 dello \itindex{stack} \textit{stack} per il nuovo \textit{task}, e deve essere
3772 indicato quando si intende creare un \textit{thread}. L'esecuzione del
3773 programma creato da \func{sys\_clone} riprende, come per \func{fork}, da
3774 dopo l'esecuzione della stessa.
3775
3776 La necessità di avere uno \itindex{stack} \textit{stack} alternativo c'è solo
3777 quando si intende creare un \textit{thread}, in tal caso infatti il nuovo
3778 \textit{task} vede esattamente la stessa memoria del \textit{task}
3779 ``\textsl{padre}'',\footnote{in questo caso per padre si intende semplicemente
3780   il \textit{task} che ha eseguito \func{sys\_clone} rispetto al \textit{task}
3781   da essa creato, senza nessuna delle implicazioni che il concetto ha per i
3782   processi.} e nella sua esecuzione alla prima chiamata di una funzione
3783 andrebbe a scrivere sullo \textit{stack} usato anche dal padre (si ricordi
3784 quanto visto in sez.~\ref{sec:proc_mem_layout} riguardo all'uso dello
3785 \textit{stack}).
3786
3787 Per evitare di doversi garantire contro la evidente possibilità di
3788 \itindex{race~condition} \textit{race condition} che questa situazione
3789 comporta (vedi sez.~\ref{sec:proc_race_cond} per una spiegazione della
3790 problematica) è necessario che il chiamante allochi preventivamente un'area di
3791 memoria.  In genere lo si fa con una \func{malloc} che allochi un buffer che
3792 la funzione imposterà come \textit{stack} del nuovo processo, avendo
3793 ovviamente cura di non utilizzarlo direttamente nel processo chiamante.
3794
3795 In questo modo i due \textit{task} avranno degli \textit{stack} indipendenti e
3796 non si dovranno affrontare problematiche di \itindex{race~condition}
3797 \textit{race condition}.  Si tenga presente inoltre che in molte architetture
3798 di processore lo \textit{stack} cresce verso il basso, pertanto in tal caso
3799 non si dovrà specificare per \param{child\_stack} il puntatore restituito da
3800 \func{malloc}, ma un puntatore alla fine del buffer da essa allocato.
3801
3802 Dato che tutto ciò è necessario solo per i \textit{thread} che condividono la
3803 memoria, la \textit{system call}, a differenza della funzione di libreria che
3804 vedremo a breve, consente anche di passare per \param{child\_stack} il valore
3805 \val{NULL}, che non imposta un nuovo \textit{stack}. Se infatti si crea un
3806 processo, questo ottiene un suo nuovo spazio degli indirizzi,\footnote{è
3807   sottinteso cioè che non si stia usando il flag \const{CLONE\_VM} che vedremo
3808   a breve.} ed in questo caso si applica la semantica del
3809 \itindex{copy~on~write} \textit{copy on write} illustrata in
3810 sez.~\ref{sec:proc_fork}, per cui le pagine dello \textit{stack} verranno
3811 automaticamente copiate come le altre e il nuovo processo avrà un suo
3812 \textit{stack} totalmente indipendente da quello del padre.
3813
3814 Dato che l'uso principale della nuova \textit{system call} è quello relativo
3815 alla creazione dei \textit{thread}, le \acr{glibc} definiscono una funzione di
3816 libreria con una sintassi diversa, orientata a questo scopo, e la
3817 \textit{system call} resta accessibile solo se invocata esplicitamente come
3818 visto in sez.~\ref{sec:proc_syscall}.\footnote{ed inoltre per questa
3819   \textit{system call} non è disponibile la chiamata veloce con
3820   \texttt{vsyscall}.} La funzione di libreria si chiama semplicemente
3821 \funcd{clone} ed il suo prototipo è:
3822
3823 \begin{funcproto}{
3824 \fhead{sched.h}
3825 \fdecl{int clone(int (*fn)(void *), void *child\_stack, int flags, void *arg, ...    /* pid\_t *ptid, struct user\_desc *tls, pid\_t *ctid */)}
3826 \fdesc{Crea un nuovo processo o \textit{thread}.}
3827 }
3828 {La funzione ritorna il \textit{Thread ID} assegnato al nuovo processo in caso
3829   di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
3830   valori:
3831 \begin{errlist}
3832     \item[\errcode{EAGAIN}] sono già in esecuzione troppi processi.
3833     \item[\errcode{EINVAL}] si è usata una combinazione non valida di flag o
3834       un valore nullo per \param{child\_stack}.
3835     \item[\errcode{ENOMEM}] non c'è memoria sufficiente per creare una nuova
3836       \struct{task\_struct} o per copiare le parti del contesto del chiamante
3837       necessarie al nuovo \textit{task}.
3838     \item[\errcode{EPERM}] non si hanno i privilegi di amministratore
3839       richiesti dai flag indicati.
3840 \end{errlist}}
3841 \end{funcproto}
3842
3843 La funzione prende come primo argomento \param{fn} il puntatore alla funzione
3844 che verrà messa in esecuzione nel nuovo processo, che può avere un unico
3845 argomento di tipo puntatore a \ctyp{void}, il cui valore viene passato dal
3846 terzo argomento \param{arg}. Per quanto il precedente prototipo possa
3847 intimidire nella sua espressione, in realtà l'uso è molto semplice basterà
3848 definire una qualunque funzione \param{fn} che restitisce un intero ed ha come
3849 argomento un puntatore a \ctyp{vois}, e \code{fn(arg)} sarà eseguita in un
3850 nuovo processo.
3851
3852 Il nuovo processo resterà in esecuzione fintanto che la funzione \param{fn}
3853 non ritorna, o esegue \func{exit} o viene terminata da un segnale. Il valore
3854 di ritorno della funzione (o quello specificato con \func{exit}) verrà
3855 utilizzato come stato di uscita della funzione. I tre
3856 argomenti \param{ptid}, \param{tls} e \param{ctid} sono opzionali e sono
3857 presenti solo a partire dal kernel 2.6 ed usati principalmente per le funzioni
3858 di gestione dei \textit{thread} presenti nella \acr{glibc}.
3859
3860 Il comportamento di \func{clone}, che si riflette sulle caratteristiche del
3861 nuovo processo da essa creato, è controllato dall'argomento \param{flags},
3862
3863 \begin{basedescript}{\desclabelstyle{\pushlabel}}
3864
3865 \item[\const{CLONE\_CHILD\_CLEARTID}]
3866 \item[\const{CLONE\_CHILD\_SETTID}]
3867 \item[\const{CLONE\_FILES}]
3868 \item[\const{CLONE\_FS}]
3869 \item[\const{CLONE\_IO}]
3870 \item[\const{CLONE\_NEWIPC}]
3871 \item[\const{CLONE\_NEWNET}]
3872 \item[\const{CLONE\_NEWNS}]
3873 \item[\const{CLONE\_NEWPID}]
3874 \item[\const{CLONE\_NEWUTS}]
3875 \item[\const{CLONE\_PARENT}]
3876 \item[\const{CLONE\_PARENT\_SETTID}]
3877 \item[\const{CLONE\_PID}]
3878 \item[\const{CLONE\_PTRACE}]
3879 \item[\const{CLONE\_SETTLS}]
3880 \item[\const{CLONE\_SIGHAND}]
3881 \item[\const{CLONE\_STOPPED}]
3882 \item[\const{CLONE\_SYSVSEM}]
3883 \item[\const{CLONE\_THREAD}]
3884 \item[\const{CLONE\_UNTRACED}]
3885 \item[\const{CLONE\_VFORK}]
3886 \item[\const{CLONE\_VM}]
3887 \end{basedescript}
3888
3889
3890 \subsection{La funzione \func{ptrace}}
3891 \label{sec:process_ptrace}
3892
3893 Da fare
3894
3895 % TODO: trattare PTRACE_SEIZE, aggiunta con il kernel 3.1
3896
3897
3898 \subsection{La gestione delle operazioni in virgola mobile}
3899 \label{sec:process_fenv}
3900
3901 Da fare.
3902
3903 % TODO eccezioni ed arrotondamenti per la matematica in virgola mobile
3904 % consultare la manpage di fenv, math_error, fpclassify, matherr, isgreater,
3905 % isnan, nan, INFINITY
3906
3907
3908 \subsection{L'accesso alle porte di I/O}
3909 \label{sec:process_io_port}
3910
3911 %
3912 % TODO l'I/O sulle porte di I/O
3913 % consultare le manpage di ioperm, iopl e outb
3914
3915 Da fare
3916
3917 % TODO: funzioni varie sparse citate da qualche parte e da trattare forse in
3918 % una sezione a parte: sigreturn,
3919
3920
3921 \section{Problematiche di programmazione multitasking}
3922 \label{sec:proc_multi_prog}
3923
3924 Benché i processi siano strutturati in modo da apparire il più possibile come
3925 indipendenti l'uno dall'altro, nella programmazione in un sistema multitasking
3926 occorre tenere conto di una serie di problematiche che normalmente non
3927 esistono quando si ha a che fare con un sistema in cui viene eseguito un solo
3928 programma alla volta.
3929
3930 Pur essendo questo argomento di carattere generale, ci è parso opportuno
3931 introdurre sinteticamente queste problematiche, che ritroveremo a più riprese
3932 in capitoli successivi, in questa sezione conclusiva del capitolo in cui
3933 abbiamo affrontato la gestione dei processi.
3934
3935
3936 \subsection{Le operazioni atomiche}
3937 \label{sec:proc_atom_oper}
3938
3939 La nozione di \textsl{operazione atomica} deriva dal significato greco della
3940 parola atomo, cioè indivisibile; si dice infatti che un'operazione è atomica
3941 quando si ha la certezza che, qualora essa venga effettuata, tutti i passaggi
3942 che devono essere compiuti per realizzarla verranno eseguiti senza possibilità
3943 di interruzione in una fase intermedia.
3944
3945 In un ambiente multitasking il concetto è essenziale, dato che un processo può
3946 essere interrotto in qualunque momento dal kernel che mette in esecuzione un
3947 altro processo o dalla ricezione di un segnale; occorre pertanto essere
3948 accorti nei confronti delle possibili \itindex{race~condition} \textit{race
3949   condition} (vedi sez.~\ref{sec:proc_race_cond}) derivanti da operazioni
3950 interrotte in una fase in cui non erano ancora state completate.
3951
3952 Nel caso dell'interazione fra processi la situazione è molto più semplice, ed
3953 occorre preoccuparsi della atomicità delle operazioni solo quando si ha a che
3954 fare con meccanismi di intercomunicazione (che esamineremo in dettaglio in
3955 cap.~\ref{cha:IPC}) o nelle operazioni con i file (vedremo alcuni esempi in
3956 sez.~\ref{sec:file_atomic}). In questi casi in genere l'uso delle appropriate
3957 funzioni di libreria per compiere le operazioni necessarie è garanzia
3958 sufficiente di atomicità in quanto le \textit{system call} con cui esse sono
3959 realizzate non possono essere interrotte (o subire interferenze pericolose) da
3960 altri processi.
3961
3962 Nel caso dei segnali invece la situazione è molto più delicata, in quanto lo
3963 stesso processo, e pure alcune \textit{system call}, possono essere interrotti
3964 in qualunque momento, e le operazioni di un eventuale \textit{signal handler}
3965 sono compiute nello stesso spazio di indirizzi del processo. Per questo, anche
3966 il solo accesso o l'assegnazione di una variabile possono non essere più
3967 operazioni atomiche (torneremo su questi aspetti in
3968 sez.~\ref{sec:sig_adv_control}).
3969
3970 In questo caso il sistema provvede un tipo di dato, il \type{sig\_atomic\_t},
3971 il cui accesso è assicurato essere atomico.  In pratica comunque si può
3972 assumere che, in ogni piattaforma su cui è implementato Linux, il tipo
3973 \ctyp{int}, gli altri interi di dimensione inferiore ed i puntatori sono
3974 atomici. Non è affatto detto che lo stesso valga per interi di dimensioni
3975 maggiori (in cui l'accesso può comportare più istruzioni in assembler) o per
3976 le strutture. In tutti questi casi è anche opportuno marcare come
3977 \direct{volatile} le variabili che possono essere interessate ad accesso
3978 condiviso, onde evitare problemi con le ottimizzazioni del codice.
3979
3980
3981
3982 \subsection{Le \textit{race condition} ed i \textit{deadlock}}
3983 \label{sec:proc_race_cond}
3984
3985 \itindbeg{race~condition}
3986
3987 Si definiscono \textit{race condition} tutte quelle situazioni in cui processi
3988 diversi operano su una risorsa comune, ed in cui il risultato viene a
3989 dipendere dall'ordine in cui essi effettuano le loro operazioni. Il caso
3990 tipico è quello di un'operazione che viene eseguita da un processo in più
3991 passi, e può essere compromessa dall'intervento di un altro processo che
3992 accede alla stessa risorsa quando ancora non tutti i passi sono stati
3993 completati.
3994
3995 Dato che in un sistema multitasking ogni processo può essere interrotto in
3996 qualunque momento per farne subentrare un altro in esecuzione, niente può
3997 assicurare un preciso ordine di esecuzione fra processi diversi o che una
3998 sezione di un programma possa essere eseguita senza interruzioni da parte di
3999 altri. Queste situazioni comportano pertanto errori estremamente subdoli e
4000 difficili da tracciare, in quanto nella maggior parte dei casi tutto
4001 funzionerà regolarmente, e solo occasionalmente si avranno degli errori.
4002
4003 Per questo occorre essere ben consapevoli di queste problematiche, e del fatto
4004 che l'unico modo per evitarle è quello di riconoscerle come tali e prendere
4005 gli adeguati provvedimenti per far sì che non si verifichino. Casi tipici di
4006 \textit{race condition} si hanno quando diversi processi accedono allo stesso
4007 file, o nell'accesso a meccanismi di intercomunicazione come la memoria
4008 condivisa. In questi casi, se non si dispone della possibilità di eseguire
4009 atomicamente le operazioni necessarie, occorre che quelle parti di codice in
4010 cui si compiono le operazioni sulle risorse condivise (le cosiddette
4011 \index{sezione~critica} \textsl{sezioni critiche}) del programma, siano
4012 opportunamente protette da meccanismi di sincronizzazione (torneremo su queste
4013 problematiche di questo tipo in cap.~\ref{cha:IPC}).
4014
4015 \itindbeg{deadlock} Un caso particolare di \textit{race condition} sono poi i
4016 cosiddetti \textit{deadlock} (traducibile in \textsl{condizioni di stallo}),
4017 particolarmente gravi in quanto comportano spesso il blocco completo di un
4018 servizio, e non il fallimento di una singola operazione. Per definizione un
4019 \textit{deadlock} è una situazione in cui due o più processi non sono più in
4020 grado di proseguire perché ciascuno aspetta il risultato di una operazione che
4021 dovrebbe essere eseguita dall'altro.
4022
4023 L'esempio tipico di una situazione che può condurre ad un
4024 \textit{deadlock} è quello in cui un flag di
4025 ``\textsl{occupazione}'' viene rilasciato da un evento asincrono (come un
4026 segnale o un altro processo) fra il momento in cui lo si è controllato
4027 (trovandolo occupato) e la successiva operazione di attesa per lo sblocco. In
4028 questo caso, dato che l'evento di sblocco del flag è avvenuto senza che ce ne
4029 accorgessimo proprio fra il controllo e la messa in attesa, quest'ultima
4030 diventerà perpetua (da cui il nome di \textit{deadlock}).
4031
4032 In tutti questi casi è di fondamentale importanza il concetto di atomicità
4033 visto in sez.~\ref{sec:proc_atom_oper}; questi problemi infatti possono essere
4034 risolti soltanto assicurandosi, quando essa sia richiesta, che sia possibile
4035 eseguire in maniera atomica le operazioni necessarie.
4036 \itindend{race~condition}
4037 \itindend{deadlock}
4038
4039
4040 \subsection{Le funzioni rientranti}
4041 \label{sec:proc_reentrant}
4042
4043 \index{funzioni!rientranti|(}
4044
4045 Si dice \textsl{rientrante} una funzione che può essere interrotta in
4046 qualunque punto della sua esecuzione ed essere chiamata una seconda volta da
4047 un altro \itindex{thread} \textit{thread} di esecuzione senza che questo
4048 comporti nessun problema nell'esecuzione della stessa. La problematica è
4049 comune nella programmazione \itindex{thread} \textit{multi-thread}, ma si
4050 hanno gli stessi problemi quando si vogliono chiamare delle funzioni
4051 all'interno dei gestori dei segnali.
4052
4053 Fintanto che una funzione opera soltanto con le variabili locali è rientrante;
4054 queste infatti vengono allocate nello \itindex{stack} \textit{stack}, ed
4055 un'altra invocazione non fa altro che allocarne un'altra copia. Una funzione
4056 può non essere rientrante quando opera su memoria che non è nello
4057 \itindex{stack} \textit{stack}.  Ad esempio una funzione non è mai rientrante
4058 se usa una \index{variabili!globali} variabile globale o
4059 \index{variabili!statiche} statica.
4060
4061 Nel caso invece la funzione operi su un oggetto allocato dinamicamente, la
4062 cosa viene a dipendere da come avvengono le operazioni: se l'oggetto è creato
4063 ogni volta e ritornato indietro la funzione può essere rientrante, se invece
4064 esso viene individuato dalla funzione stessa due chiamate alla stessa funzione
4065 potranno interferire quando entrambe faranno riferimento allo stesso oggetto.
4066 Allo stesso modo una funzione può non essere rientrante se usa e modifica un
4067 oggetto che le viene fornito dal chiamante: due chiamate possono interferire
4068 se viene passato lo stesso oggetto; in tutti questi casi occorre molta cura da
4069 parte del programmatore.
4070
4071 In genere le funzioni di libreria non sono rientranti, molte di esse ad
4072 esempio utilizzano \index{variabili!statiche} variabili statiche, le
4073 \acr{glibc} però mettono a disposizione due macro di compilatore,\footnote{si
4074   ricordi quanto illustrato in sez.~\ref{sec:intro_gcc_glibc_std}.}
4075 \macro{\_REENTRANT} e \macro{\_THREAD\_SAFE}, la cui definizione attiva le
4076 versioni rientranti di varie funzioni di libreria, che sono identificate
4077 aggiungendo il suffisso \code{\_r} al nome della versione normale.
4078
4079 \index{funzioni!rientranti|)}
4080
4081
4082 % LocalWords:  multitasking like VMS child process identifier pid sez shell fig
4083 % LocalWords:  parent kernel init pstree keventd kswapd table struct linux call
4084 % LocalWords:  nell'header scheduler system interrupt timer HZ asm Hertz clock
4085 % LocalWords:  l'alpha tick fork wait waitpid exit exec image glibc int pgid ps
4086 % LocalWords:  sid thread Ingo Molnar ppid getpid getppid sys unistd LD threads
4087 % LocalWords:  void ForkTest tempnam pathname sibling cap errno EAGAIN ENOMEM
4088 % LocalWords:  stack read only copy write tab client spawn forktest sleep PATH
4089 % LocalWords:  source LIBRARY scheduling race condition printf descriptor dup
4090 % LocalWords:  close group session tms lock vfork execve BSD stream main abort
4091 % LocalWords:  SIGABRT SIGCHLD SIGHUP foreground SIGCONT termination signal ANY
4092 % LocalWords:  handler kill EINTR POSIX options WNOHANG ECHILD option WUNTRACED
4093 % LocalWords:  dump bits rusage getrusage heap const filename argv envp EACCES
4094 % LocalWords:  filesystem noexec EPERM suid sgid root nosuid ENOEXEC ENOENT ELF
4095 % LocalWords:  ETXTBSY EINVAL ELIBBAD BIG EFAULT EIO ENAMETOOLONG ELOOP ENOTDIR
4096 % LocalWords:  ENFILE EMFILE argc execl path execv execle execlp execvp vector
4097 % LocalWords:  list environ NULL umask pending utime cutime ustime fcntl linker
4098 % LocalWords:  opendir libc interpreter FreeBSD capabilities Mandatory Access
4099 % LocalWords:  Control MAC SELinux Security Modules LSM superuser uid gid saved
4100 % LocalWords:  effective euid egid dell' fsuid fsgid getuid geteuid getgid SVr
4101 % LocalWords:  getegid IDS NFS setuid setgid all' logout utmp screen xterm TODO
4102 % LocalWords:  setreuid setregid FIXME ruid rgid seteuid setegid setresuid size
4103 % LocalWords:  setresgid getresuid getresgid value result argument setfsuid DAC
4104 % LocalWords:  setfsgid NGROUPS sysconf getgroups getgrouplist groups ngroups
4105 % LocalWords:  setgroups initgroups patch LIDS CHOWN OVERRIDE Discrectionary PF
4106 % LocalWords:  SEARCH chattr sticky NOATIME socket domain immutable append mmap
4107 % LocalWords:  broadcast multicast multicasting memory locking mlock mlockall
4108 % LocalWords:  shmctl ioperm iopl chroot ptrace accounting swap reboot hangup
4109 % LocalWords:  vhangup mknod lease permitted inherited inheritable bounding AND
4110 % LocalWords:  capability capget capset header ESRCH undef version obj clear PT
4111 % LocalWords:  pag ssize length proc capgetp preemptive cache runnable
4112 % LocalWords:  SIGSTOP soft slice nice niceness counter which SC
4113 % LocalWords:  getpriority who setpriority RTLinux RTAI Adeos fault FIFO
4114 % LocalWords:  yield Robin setscheduler policy param OTHER priority setparam to
4115 % LocalWords:  min getparam getscheduler interval robin ENOSYS fifo ping long
4116 % LocalWords:  affinity setaffinity unsigned mask cpu NUMA CLR ISSET SETSIZE RR
4117 % LocalWords:  getaffinity assembler deadlock REENTRANT SAFE tgz MYPGRP l'OR rr
4118 % LocalWords:  WIFEXITED WEXITSTATUS WIFSIGNALED WTERMSIG WCOREDUMP WIFSTOPPED
4119 % LocalWords:  WSTOPSIG opt char INTERP arg SIG IGN DFL mascheck grp FOWNER RAW
4120 % LocalWords:  FSETID SETPCAP BIND SERVICE ADMIN PACKET IPC OWNER MODULE RAWIO
4121 % LocalWords:  PACCT RESOURCE TTY CONFIG SETFCAP hdrp datap libcap lcap text tp
4122 % LocalWords:  get ncap caps CapInh CapPrm fffffeff CapEff getcap STAT dall'I
4123 % LocalWords:  inc PRIO SUSv PRGR prio SysV SunOS Ultrix sched timespec len sig
4124 % LocalWords:  cpusetsize cpuset atomic tickless redirezione WCONTINUED stopped
4125 % LocalWords:  waitid NOCLDSTOP ENOCHLD WIFCONTINUED ifdef endif idtype siginfo
4126 % LocalWords:  infop ALL WEXITED WSTOPPED WNOWAIT signo CLD EXITED KILLED page
4127 % LocalWords:  CONTINUED sources forking Spawned successfully executing exiting
4128 % LocalWords:  next cat for COMMAND pts bash defunct TRAPPED DUMPED PR
4129 % LocalWords:  SIGKILL static RLIMIT preemption PREEMPT VOLUNTARY IDLE RTPRIO
4130 % LocalWords:  completely fair compat uniform CFQ queuing elevator dev cfq RT
4131 % LocalWords:  documentation block syscall ioprio IPRIO CLASS class best effort
4132 % LocalWords:  refresh semop dnotify MADV DONTFORK prctl WCLONE WALL big mount
4133 % LocalWords:  WNOTHREAD DUMPABLE KEEPCAPS IRIX CAPBSET endianness endian flags
4134 % LocalWords:  little PPC PowerPC FPEMU NOPRINT SIGFPE FPEXC point FP SW malloc
4135 % LocalWords:  exception EXC ENABLE OVF overflow UND underflow RES INV DISABLED
4136 % LocalWords:  NONRECOV ASYNC KEEP securebits NAME NUL PDEATHSIG SECCOMP VM FS
4137 % LocalWords:  secure computing sigreturn TIMING STATISTICAL TSC MCE conditions
4138 % LocalWords:  timestamp Stamp SIGSEGV UNALIGN SIGBUS MCEERR AO failure early
4139 % LocalWords:  namespace vsyscall SETTID FILES NEWIPC NEWNET NEWNS NEWPID ptid
4140 % LocalWords:  NEWUTS SETTLS SIGHAND SYSVSEM UNTRACED tls ctid CLEARTID panic
4141 % LocalWords:  loader EISDIR SIGTRAP uninterrutible killable
4142
4143 %%% Local Variables:
4144 %%% mode: latex
4145 %%% TeX-master: "gapil"
4146 %%% End: