prochand.tex

   1 %% prochand.tex
   2 %%
   3 %% Copyright (C) 2000-2013 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{La gestione dei processi}
  13 \label{cha:process_handling}
  14
  15 Come accennato nell'introduzione in un sistema unix-like tutte le operazioni
  16 vengono svolte tramite opportuni processi.  In sostanza questi ultimi vengono
  17 a costituire l'unità base per l'allocazione e l'uso delle risorse del sistema.
  18
  19 Nel precedente capitolo abbiamo esaminato il funzionamento di un processo come
  20 unità a se stante, in questo esamineremo il funzionamento dei processi
  21 all'interno del sistema. Saranno cioè affrontati i dettagli della creazione e
  22 della terminazione dei processi, della gestione dei loro attributi e
  23 privilegi, e di tutte le funzioni a questo connesse. Infine nella sezione
  24 finale introdurremo alcune problematiche generiche della programmazione in
  25 ambiente multitasking.
  26
  27
  28 \section{Le funzioni di base della gestione dei processi}
  29 \label{sec:proc_handling}
  30
  31 In questa sezione tratteremo le problematiche della gestione dei processi
  32 all'interno del sistema, illustrandone tutti i dettagli.  Inizieremo con una
  33 panoramica dell'architettura dei processi, tratteremo poi le funzioni
  34 elementari che permettono di leggerne gli identificatori, per poi passare alla
  35 spiegazione delle funzioni base che si usano per la creazione e la
  36 terminazione dei processi, e per la messa in esecuzione degli altri programmi.
  37
  38
  39 \subsection{L'architettura della gestione dei processi}
  40 \label{sec:proc_hierarchy}
  41
  42 A differenza di quanto avviene in altri sistemi, ad esempio nel VMS la
  43 generazione di nuovi processi è un'operazione privilegiata, una delle
  44 caratteristiche fondanti di Unix, che esamineremo in dettaglio più avanti, è
  45 che qualunque processo può a sua volta generarne altri. Ogni processo è
  46 identificato presso il sistema da un numero univoco, il cosiddetto
  47 \itindex{Process~ID~(PID)} \textit{Process ID} o, più brevemente, \ids{PID},
  48 assegnato in forma progressiva (vedi sez.~\ref{sec:proc_pid}) quando il
  49 processo viene creato.
  50
  51 Una seconda caratteristica di un sistema unix-like è che la generazione di un
  52 processo è un'operazione separata rispetto al lancio di un programma. In
  53 genere la sequenza è sempre quella di creare un nuovo processo, il quale
  54 eseguirà, in un passo successivo, il programma desiderato: questo è ad esempio
  55 quello che fa la shell quando mette in esecuzione il programma che gli
  56 indichiamo nella linea di comando.
  57
  58 Una terza caratteristica del sistema è che ogni processo è sempre stato
  59 generato da un altro processo, il processo generato viene chiamato
  60 \textit{processo figlio} (\textit{child process}) mentre quello che lo ha
  61 viene chiamato \textsl{processo padre} (\textit{parent process}). Questo vale
  62 per tutti i processi, con una sola eccezione, dato che ci deve essere un punto
  63 di partenza esiste un processo speciale (che normalmente è \cmd{/sbin/init}),
  64 che come abbiamo accennato in sez.~\ref{sec:intro_kern_and_sys} viene lanciato
  65 dal kernel alla conclusione della fase di avvio. Essendo questo il primo
  66 processo lanciato dal sistema ha sempre il \ids{PID} uguale a 1 e non è figlio
  67 di nessun altro processo.
  68
  69 Ovviamente \cmd{init} è un processo speciale che in genere si occupa di far
  70 partire tutti gli altri processi necessari al funzionamento del sistema,
  71 inoltre \cmd{init} è essenziale per svolgere una serie di compiti
  72 amministrativi nelle operazioni ordinarie del sistema (torneremo su alcuni di
  73 essi in sez.~\ref{sec:proc_termination}) e non può mai essere terminato. La
  74 struttura del sistema comunque consente di lanciare al posto di \cmd{init}
  75 qualunque altro programma, e in casi di emergenza (ad esempio se il file di
  76 \cmd{init} si fosse corrotto) è ad esempio possibile lanciare una shell al suo
  77 posto.\footnote{la cosa si fa passando la riga \cmd{init=/bin/sh} come
  78   parametro di avvio del kernel, l'argomento è di natura sistemistica e
  79   trattato in sez.~5.3 di \cite{AGL}.}
  80
  81 \begin{figure}[!htb]
  82   \footnotesize
  83 \begin{Console}
  84 [piccardi@gont piccardi]$ \textbf{pstree -n}
  85 init-+-keventd
  86      |-kapm-idled
  87      |-kreiserfsd
  88      |-portmap
  89      |-syslogd
  90      |-klogd
  91      |-named
  92      |-rpc.statd
  93      |-gpm
  94      |-inetd
  95      |-junkbuster
  96      |-master-+-qmgr
  97      |        `-pickup
  98      |-sshd
  99      |-xfs
 100      |-cron
 101      |-bash---startx---xinit-+-XFree86
 102      |                       `-WindowMaker-+-ssh-agent
 103      |                                     |-wmtime
 104      |                                     |-wmmon
 105      |                                     |-wmmount
 106      |                                     |-wmppp
 107      |                                     |-wmcube
 108      |                                     |-wmmixer
 109      |                                     |-wmgtemp
 110      |                                     |-wterm---bash---pstree
 111      |                                     `-wterm---bash-+-emacs
 112      |                                                    `-man---pager
 113      |-5*[getty]
 114      |-snort
 115      `-wwwoffled
 116 \end{Console}
 117 %$
 118   \caption{L'albero dei processi, così come riportato dal comando
 119     \cmd{pstree}.}
 120   \label{fig:proc_tree}
 121 \end{figure}
 122
 123 Dato che tutti i processi attivi nel sistema sono comunque generati da
 124 \cmd{init} o da uno dei suoi figli si possono classificare i processi con la
 125 relazione padre/figlio in un'organizzazione gerarchica ad albero. In
 126 fig.~\ref{fig:proc_tree} si è mostrato il risultato del comando \cmd{pstree}
 127 che permette di visualizzare questa struttura, alla cui base c'è \cmd{init}
 128 che è progenitore di tutti gli altri processi.\footnote{in realtà questo non è
 129   del tutto vero, in Linux, specialmente nelle versioni più recenti del
 130   kernel, ci sono alcuni processi speciali (come \cmd{keventd}, \cmd{kswapd},
 131   ecc.) che pur comparendo nei comandi come figli di \cmd{init}, o con
 132   \ids{PID} successivi ad uno, sono in realtà processi interni al kernel e che
 133   non rientrano in questa classificazione.}
 134
 135 Il kernel mantiene una tabella dei processi attivi, la cosiddetta
 136 \itindex{process~table} \textit{process table}. Per ciascun processo viene
 137 mantenuta una voce in questa tabella, costituita da una struttura
 138 \kstruct{task\_struct}, che contiene tutte le informazioni rilevanti per quel
 139 processo. Tutte le strutture usate a questo scopo sono dichiarate
 140 nell'\textit{header file} \file{linux/sched.h}, ed uno schema semplificato,
 141 che riporta la struttura delle principali informazioni contenute nella
 142 \struct{task\_struct} (che in seguito incontreremo a più riprese), è mostrato
 143 in fig.~\ref{fig:proc_task_struct}.
 144
 145 \begin{figure}[!htb]
 146   \centering \includegraphics[width=14cm]{img/task_struct}
 147   \caption{Schema semplificato dell'architettura delle strutture usate dal
 148     kernel nella gestione dei processi.}
 149   \label{fig:proc_task_struct}
 150 \end{figure}
 151
 152 % TODO la task_struct è cambiata per qualche dettaglio vedi anche
 153 % http://www.ibm.com/developerworks/linux/library/l-linux-process-management/
 154 % TODO completare la parte su quando viene chiamato lo scheduler.
 155
 156 Come accennato in sez.~\ref{sec:intro_unix_struct} è lo \itindex{scheduler}
 157 \textit{scheduler} che decide quale processo mettere in esecuzione; esso viene
 158 eseguito in occasione di dell'invocazione di ogni \textit{system call} ed per
 159 ogni interrupt dall'hardware oltre che in una serie di altre occasioni, e può
 160 essere anche attivato esplicitamente. Il timer di sistema provvede comunque a
 161 che esso sia invocato periodicamente, generando un interrupt periodico secondo
 162 una frequenza predeterminata, specificata dalla costante \const{HZ} del kernel
 163 (torneremo su questo argomento in sez.~\ref{sec:sys_unix_time}), che assicura
 164 che lo \textit{scheduler} scheduler venga comunque eseguito ad intervalli
 165 regolari e possa prendere le sue decisioni.
 166
 167
 168 A partire dal kernel 2.6.21 è stato introdotto anche un meccanismo
 169 completamente diverso, detto \textit{tickless}, in cui non c'è più una
 170 interruzione periodica con frequenza prefissata, ma ad ogni chiamata del timer
 171 viene programmata l'interruzione successiva sulla base di una stima; in questo
 172 modo si evita di dover eseguire un migliaio di interruzioni al secondo anche
 173 su macchine che non stanno facendo nulla, con un forte risparmio nell'uso
 174 dell'energia da parte del processore che può essere messo in stato di
 175 sospensione anche per lunghi periodi di tempo.
 176
 177 Indipendentemente dalle motivazioni per cui questo avviene, ogni volta che
 178 viene eseguito lo \itindex{scheduler} \textit{scheduler} effettua il calcolo
 179 delle priorità dei vari processi attivi (torneremo su questo in
 180 sez.~\ref{sec:proc_priority}) e stabilisce quale di essi debba essere posto in
 181 esecuzione fino alla successiva invocazione.
 182
 183
 184 \subsection{Gli identificatori dei processi}
 185 \label{sec:proc_pid}
 186
 187 Come accennato nella sezione precedente ogni processo viene identificato dal
 188 sistema da un numero identificativo univoco, il \textit{process ID} o
 189 \ids{PID}. Questo è un tipo di dato standard, \type{pid\_t} che in genere è un
 190 intero con segno (nel caso di Linux e della \acr{glibc} il tipo usato è
 191 \ctyp{int}).
 192
 193 Il \ids{PID} viene assegnato in forma progressiva ogni volta che un nuovo
 194 processo viene creato,\footnote{in genere viene assegnato il numero successivo
 195   a quello usato per l'ultimo processo creato, a meno che questo numero non
 196   sia già utilizzato per un altro \ids{PID}, \acr{pgid} o \acr{sid} (vedi
 197   sez.~\ref{sec:sess_proc_group}).} fino ad un limite che, essendo il
 198 tradizionalmente il \ids{PID} un numero positivo memorizzato in un intero a 16
 199 bit, arriva ad un massimo di 32768.  Oltre questo valore l'assegnazione
 200 riparte dal numero più basso disponibile a partire da un minimo di
 201 300,\footnote{questi valori, fino al kernel 2.4.x, erano definiti dalla macro
 202   \const{PID\_MAX} nei file \file{threads.h} e \file{fork.c} dei sorgenti del
 203   kernel, con il 2.6.x e la nuova interfaccia per i \itindex{thread}
 204   \textit{thread} anche il meccanismo di allocazione dei \ids{PID} è stato
 205   modificato ed il valore massimo è impostabile attraverso il file
 206   \sysctlfile{kernel/pid\_max} e di default vale 32768.} che serve a
 207 riservare i \ids{PID} più bassi ai processi eseguiti direttamente dal kernel.
 208 Per questo motivo, come visto in sez.~\ref{sec:proc_hierarchy}, il processo di
 209 avvio (\cmd{init}) ha sempre il \ids{PID} uguale a uno.
 210
 211 Tutti i processi inoltre memorizzano anche il \ids{PID} del genitore da cui
 212 sono stati creati, questo viene chiamato in genere \ids{PPID} (da
 213 \itindex{Parent~Process~ID~(PPID)} \textit{Parent Process ID}).  Questi due
 214 identificativi possono essere ottenuti usando le due funzioni di sistema
 215 \funcd{getpid} e \funcd{getppid}, i cui prototipi sono:
 216
 217 \begin{funcproto}{
 218 \fhead{sys/types.h}
 219 \fhead{unistd.h}
 220 \fdecl{pid\_t getpid(void)}
 221 \fdesc{Restituisce il \ids{PID} del processo corrente..}
 222 \fdecl{pid\_t getppid(void)}
 223 \fdesc{Restituisce il \ids{PID} del padre del processo corrente.}
 224 }
 225 {Entrambe le funzioni non riportano condizioni di errore.}
 226 \end{funcproto}
 227
 228 \noindent esempi dell'uso di queste funzioni sono riportati in
 229 fig.~\ref{fig:proc_fork_code}, nel programma \file{fork\_test.c}.
 230
 231 Il fatto che il \ids{PID} sia un numero univoco per il sistema lo rende un
 232 candidato per generare ulteriori indicatori associati al processo di cui
 233 diventa possibile garantire l'unicità: ad esempio in alcune implementazioni la
 234 funzione \func{tempnam} (si veda sez.~\ref{sec:file_temp_file}) usa il
 235 \ids{PID} per generare un \textit{pathname} univoco, che non potrà essere
 236 replicato da un altro processo che usi la stessa funzione. Questo utilizzo
 237 però può risultare pericoloso, un \ids{PID} infatti è univoco solo fintanto
 238 che un processo è attivo, una volta terminato esso potrà essere riutilizzato
 239 da un processo completamente diverso, e di questo bisogna essere ben
 240 consapevoli.
 241
 242 Tutti i processi figli dello stesso processo padre sono detti
 243 \textit{sibling}, questa è una delle relazioni usate nel \textsl{controllo di
 244   sessione}, in cui si raggruppano i processi creati su uno stesso terminale,
 245 o relativi allo stesso login. Torneremo su questo argomento in dettaglio in
 246 cap.~\ref{cha:session}, dove esamineremo gli altri identificativi associati ad
 247 un processo e le varie relazioni fra processi utilizzate per definire una
 248 sessione.
 249
 250 Oltre al \ids{PID} e al \ids{PPID}, e a quelli che vedremo in
 251 sez.~\ref{sec:sess_proc_group}, relativi al controllo di sessione, ad ogni
 252 processo vengono associati degli ulteriori identificatori ed in particolare
 253 quelli che vengono usati per il controllo di accesso.  Questi servono per
 254 determinare se un processo può eseguire o meno le operazioni richieste, a
 255 seconda dei privilegi e dell'identità di chi lo ha posto in esecuzione;
 256 l'argomento è complesso e sarà affrontato in dettaglio in
 257 sez.~\ref{sec:proc_perms}.
 258
 259
 260 \subsection{La funzione \func{fork} e le funzioni di creazione dei processi}
 261 \label{sec:proc_fork}
 262
 263 La funzione di sistema \funcd{fork} è la funzione fondamentale della gestione
 264 dei processi: come si è detto tradizionalmente l'unico modo di creare un nuovo
 265 processo era attraverso l'uso di questa funzione,\footnote{in realtà oggi la
 266   \textit{system call} usata da Linux per creare nuovi processi è \func{clone}
 267   (vedi \ref{sec:process_clone}), anche perché a partire dalla \acr{glibc}
 268   2.3.3 non viene più usata la \textit{system call} originale, ma la stessa
 269   \func{fork} viene implementata tramite \func{clone}, cosa che consente una
 270   migliore interazione coi \textit{thread}.} essa quindi riveste un ruolo
 271 centrale tutte le volte che si devono scrivere programmi che usano il
 272 multitasking.\footnote{oggi questa rilevanza, con la diffusione dell'uso dei
 273   \textit{thread} che tratteremo al cap.~\ref{cha:threads}, è in parte minore,
 274   ma \func{fork} resta comunque la funzione principale per la creazione di
 275   processi.} Il prototipo della funzione è:
 276
 277 \begin{funcproto}{
 278 \fhead{unistd.h}
 279 \fdecl{pid\_t fork(void)}
 280 \fdesc{Crea un nuovo processo.}
 281 }
 282 {La funzione ritorna il \ids{PID} del figlio al padre e $0$ al figlio in caso
 283   di successo e $-1$ al padre senza creare il figlio per un errore,
 284   nel qual caso \var{errno} assumerà uno dei valori:
 285   \begin{errlist}
 286   \item[\errcode{EAGAIN}] non ci sono risorse sufficienti per creare un altro
 287     processo (per allocare la tabella delle pagine e le strutture del task) o
 288     si è esaurito il numero di processi disponibili.
 289   \item[\errcode{ENOMEM}] non è stato possibile allocare la memoria per le
 290     strutture necessarie al kernel per creare il nuovo processo.
 291   \end{errlist}}
 292 \end{funcproto}
 293
 294 Dopo il successo dell'esecuzione di una \func{fork} sia il processo padre che
 295 il processo figlio continuano ad essere eseguiti normalmente a partire
 296 dall'istruzione successiva alla \func{fork}. Il processo figlio è una copia del
 297 padre, e riceve una copia dei \index{segmento!testo} segmenti di testo,
 298 \index{segmento!dati} dati e dello \itindex{stack} \textit{stack} (vedi
 299 sez.~\ref{sec:proc_mem_layout}), ed esegue esattamente lo stesso codice del
 300 padre. Si tenga presente però che la memoria è copiata e non condivisa,
 301 pertanto padre e figlio vedranno variabili diverse e le eventuali modifiche
 302 saranno totalmente indipendenti.
 303
 304 Per quanto riguarda la gestione della memoria, in generale il
 305 \index{segmento!testo} segmento di testo, che è identico per i due processi, è
 306 condiviso e tenuto in sola lettura per il padre e per i figli. Per gli altri
 307 segmenti Linux utilizza la tecnica del \itindex{copy~on~write} \textit{copy on
 308   write}. Questa tecnica comporta che una pagina di memoria viene
 309 effettivamente copiata per il nuovo processo solo quando ci viene effettuata
 310 sopra una scrittura, e si ha quindi una reale differenza fra padre e figlio.
 311 In questo modo si rende molto più efficiente il meccanismo della creazione di
 312 un nuovo processo, non essendo più necessaria la copia di tutto lo spazio
 313 degli indirizzi virtuali del padre, ma solo delle pagine di memoria che sono
 314 state modificate, e solo al momento della modifica stessa.
 315
 316 La differenza che si ha nei due processi è che nel processo padre il valore di
 317 ritorno della funzione \func{fork} è il \ids{PID} del processo figlio, mentre
 318 nel figlio è zero; in questo modo il programma può identificare se viene
 319 eseguito dal padre o dal figlio.  Si noti come la funzione \func{fork} ritorni
 320 due volte, una nel padre e una nel figlio.
 321
 322 La scelta di questi valori di ritorno non è casuale, un processo infatti può
 323 avere più figli, ed il valore di ritorno di \func{fork} è l'unico modo che gli
 324 permette di identificare quello appena creato. Al contrario un figlio ha
 325 sempre un solo padre, il cui \ids{PID} può sempre essere ottenuto con
 326 \func{getppid}, come spiegato in sez.~\ref{sec:proc_pid}, per cui si usa il
 327 valore nullo, che non è il \ids{PID} di nessun processo.
 328
 329 Normalmente la chiamata a \func{fork} può fallire solo per due ragioni: o ci
 330 sono già troppi processi nel sistema, il che di solito è sintomo che
 331 qualcos'altro non sta andando per il verso giusto, o si è ecceduto il limite
 332 sul numero totale di processi permessi all'utente, argomento che tratteremo in
 333 dettaglio in sez.~\ref{sec:sys_resource_limit}.
 334
 335 L'uso di \func{fork} avviene secondo due modalità principali; la prima è
 336 quella in cui all'interno di un programma si creano processi figli cui viene
 337 affidata l'esecuzione di una certa sezione di codice, mentre il processo padre
 338 ne esegue un'altra. È il caso tipico dei programmi server (il modello
 339 \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}) in cui il
 340 padre riceve ed accetta le richieste da parte dei programmi client, per
 341 ciascuna delle quali pone in esecuzione un figlio che è incaricato di fornire
 342 il servizio.
 343
 344 La seconda modalità è quella in cui il processo vuole eseguire un altro
 345 programma; questo è ad esempio il caso della shell. In questo caso il processo
 346 crea un figlio la cui unica operazione è quella di fare una \func{exec} (di
 347 cui parleremo in sez.~\ref{sec:proc_exec}) subito dopo la \func{fork}.
 348
 349 Alcuni sistemi operativi (il VMS ad esempio) combinano le operazioni di questa
 350 seconda modalità (una \func{fork} seguita da una \func{exec}) in un'unica
 351 operazione che viene chiamata \textit{spawn}. Nei sistemi unix-like è stato
 352 scelto di mantenere questa separazione, dato che, come per la prima modalità
 353 d'uso, esistono numerosi scenari in cui si può usare una \func{fork} senza
 354 aver bisogno di eseguire una \func{exec}.
 355
 356 Inoltre, anche nel caso della seconda modalità d'uso, avere le due funzioni
 357 separate permette al figlio di cambiare alcune caratteristiche del processo
 358 (maschera dei segnali, redirezione dell'output, utente per conto del cui viene
 359 eseguito, e molto altro su cui torneremo in seguito) prima della \func{exec},
 360 rendendo così relativamente facile intervenire sulle le modalità di esecuzione
 361 del nuovo programma.
 362
 363 \begin{figure}[!htb]
 364   \footnotesize \centering
 365   \begin{minipage}[c]{\codesamplewidth}
 366   \includecodesample{listati/fork_test.c}
 367   \end{minipage}
 368   \normalsize
 369   \caption{Esempio di codice per la creazione di nuovi processi (da
 370     \file{fork\_test.c}).}
 371   \label{fig:proc_fork_code}
 372 \end{figure}
 373
 374 In fig.~\ref{fig:proc_fork_code} è riportato il corpo del codice del programma
 375 di esempio \cmd{forktest}, che permette di illustrare molte caratteristiche
 376 dell'uso della funzione \func{fork}. Il programma crea un numero di figli
 377 specificato da linea di comando, e prende anche alcune opzioni per indicare
 378 degli eventuali tempi di attesa in secondi (eseguiti tramite la funzione
 379 \func{sleep}) per il padre ed il figlio (con \cmd{forktest -h} si ottiene la
 380 descrizione delle opzioni). Il codice completo, compresa la parte che gestisce
 381 le opzioni a riga di comando, è disponibile nel file \file{fork\_test.c},
 382 distribuito insieme agli altri sorgenti degli esempi su
 383 \url{http://gapil.truelite.it/gapil_source.tgz}.
 384
 385 Decifrato il numero di figli da creare, il ciclo principale del programma
 386 (\texttt{\small 24--40}) esegue in successione la creazione dei processi figli
 387 controllando il successo della chiamata a \func{fork} (\texttt{\small
 388   25--29}); ciascun figlio (\texttt{\small 31--34}) si limita a stampare il
 389 suo numero di successione, eventualmente attendere il numero di secondi
 390 specificato e scrivere un messaggio prima di uscire. Il processo padre invece
 391 (\texttt{\small 36--38}) stampa un messaggio di creazione, eventualmente
 392 attende il numero di secondi specificato, e procede nell'esecuzione del ciclo;
 393 alla conclusione del ciclo, prima di uscire, può essere specificato un altro
 394 periodo di attesa.
 395
 396 Se eseguiamo il comando, che è preceduto dall'istruzione \code{export
 397   LD\_LIBRARY\_PATH=./} per permettere l'uso delle librerie dinamiche, senza
 398 specificare attese (come si può notare in (\texttt{\small 17--19}) i valori
 399 predefiniti specificano di non attendere), otterremo come risultato sul
 400 terminale:
 401 \begin{Console}
 402 [piccardi@selidor sources]$ \textbf{export LD_LIBRARY_PATH=./; ./forktest 3}
 403 Process 1963: forking 3 child
 404 Spawned 1 child, pid 1964
 405 Child 1 successfully executing
 406 Child 1, parent 1963, exiting
 407 Go to next child
 408 Spawned 2 child, pid 1965
 409 Child 2 successfully executing
 410 Child 2, parent 1963, exiting
 411 Go to next child
 412 Child 3 successfully executing
 413 Child 3, parent 1963, exiting
 414 Spawned 3 child, pid 1966
 415 Go to next child
 416 \end{Console}
 417 %$
 418
 419 Esaminiamo questo risultato: una prima conclusione che si può trarre è che non
 420 si può dire quale processo fra il padre ed il figlio venga eseguito per primo
 421 dopo la chiamata a \func{fork}; dall'esempio si può notare infatti come nei
 422 primi due cicli sia stato eseguito per primo il padre (con la stampa del
 423 \ids{PID} del nuovo processo) per poi passare all'esecuzione del figlio
 424 (completata con i due avvisi di esecuzione ed uscita), e tornare
 425 all'esecuzione del padre (con la stampa del passaggio al ciclo successivo),
 426 mentre la terza volta è stato prima eseguito il figlio (fino alla conclusione)
 427 e poi il padre.
 428
 429 In generale l'ordine di esecuzione dipenderà, oltre che dall'algoritmo di
 430 \itindex{scheduler} \textit{scheduling} usato dal kernel, dalla particolare
 431 situazione in cui si trova la macchina al momento della chiamata, risultando
 432 del tutto impredicibile.  Eseguendo più volte il programma di prova e
 433 producendo un numero diverso di figli, si sono ottenute situazioni
 434 completamente diverse, compreso il caso in cui il processo padre ha eseguito
 435 più di una \func{fork} prima che uno dei figli venisse messo in esecuzione.
 436
 437 Pertanto non si può fare nessuna assunzione sulla sequenza di esecuzione delle
 438 istruzioni del codice fra padre e figli, né sull'ordine in cui questi potranno
 439 essere messi in esecuzione. Se è necessaria una qualche forma di precedenza
 440 occorrerà provvedere ad espliciti meccanismi di sincronizzazione, pena il
 441 rischio di incorrere nelle cosiddette \itindex{race~condition} \textit{race
 442   condition} (vedi sez.~\ref{sec:proc_race_cond}).
 443
 444 In realtà con l'introduzione dei kernel della serie 2.6 lo \itindex{scheduler}
 445 \textit{scheduler} è stato modificato per eseguire sempre per primo il
 446 figlio.\footnote{i risultati precedenti infatti sono stati ottenuti usando un
 447   kernel della serie 2.4.}  Questa è una ottimizzazione adottata per evitare
 448 che il padre, effettuando per primo una operazione di scrittura in memoria,
 449 attivasse il meccanismo del \itindex{copy~on~write} \textit{copy on write},
 450 operazione inutile qualora il figlio venga creato solo per eseguire una
 451 \func{exec} su altro programma che scarta completamente lo spazio degli
 452 indirizzi e rende superflua la copia della memoria modificata dal
 453 padre. Eseguendo sempre per primo il figlio la \func{exec} verrebbe effettuata
 454 subito, con la certezza di utilizzare \itindex{copy~on~write} \textit{copy on
 455   write} solo quando necessario.
 456
 457 Con il kernel 2.6.32 però il comportamento è stato nuovamente cambiato,
 458 stavolta facendo eseguire per primo sempre il padre. Si è realizzato infatti
 459 che l'eventualità prospettata per la scelta precedente era comunque molto
 460 improbabile, mentre l'esecuzione immediata del padre presenta sempre il
 461 vantaggio di poter utilizzare immediatamente tutti i dati che sono nella cache
 462 della CPU e nella unità di gestione della memoria virtuale senza doverli
 463 invalidare, cosa che per i processori moderni, che hanno linee di cache
 464 interne molto profonde, avrebbe un forte impatto sulle prestazioni.
 465
 466 Allora anche se quanto detto in precedenza vale come comportamento effettivo
 467 dei programmi soltanto per i kernel fino alla serie 2.4, per mantenere la
 468 portabilità con altri kernel unix-like, e con i diversi comportamenti adottati
 469 dalle Linux nelle versioni successive, è opportuno non fare affidamento su
 470 nessun tipo comportamento predefinito e non dare per assunta l'esecuzione
 471 preventiva del padre o del figlio.
 472
 473 Si noti poi come dopo la \func{fork}, essendo i segmenti di memoria utilizzati
 474 dai singoli processi completamente indipendenti, le modifiche delle variabili
 475 nei processi figli, come l'incremento di \var{i} in (\texttt{\small 31}), sono
 476 visibili solo a loro, (ogni processo vede solo la propria copia della
 477 memoria), e non hanno alcun effetto sul valore che le stesse variabili hanno
 478 nel processo padre ed in eventuali altri processi figli che eseguano lo stesso
 479 codice.
 480
 481 Un secondo aspetto molto importante nella creazione dei processi figli è
 482 quello dell'interazione dei vari processi con i file. Ne parleremo qui anche
 483 se buona parte dei concetti relativi ai file verranno trattati più avanti
 484 (principalmente in sez.~\ref{sec:file_unix_interface}). Per illustrare meglio
 485 quello che avviene si può redirigere su un file l'output del programma di
 486 test, quello che otterremo è:
 487 \begin{Console}
 488 [piccardi@selidor sources]$ \textbf{./forktest 3 > output}
 489 [piccardi@selidor sources]$ \textbf{cat output}
 490 Process 1967: forking 3 child
 491 Child 1 successfully executing
 492 Child 1, parent 1967, exiting
 493 Test for forking 3 child
 494 Spawned 1 child, pid 1968
 495 Go to next child
 496 Child 2 successfully executing
 497 Child 2, parent 1967, exiting
 498 Test for forking 3 child
 499 Spawned 1 child, pid 1968
 500 Go to next child
 501 Spawned 2 child, pid 1969
 502 Go to next child
 503 Child 3 successfully executing
 504 Child 3, parent 1967, exiting
 505 Test for forking 3 child
 506 Spawned 1 child, pid 1968
 507 Go to next child
 508 Spawned 2 child, pid 1969
 509 Go to next child
 510 Spawned 3 child, pid 1970
 511 Go to next child
 512 \end{Console}
 513 che come si vede è completamente diverso da quanto ottenevamo sul terminale.
 514
 515 Il comportamento delle varie funzioni di interfaccia con i file è analizzato
 516 in gran dettaglio in sez.~\ref{sec:file_unix_interface} per l'interfaccia
 517 nativa Unix ed in sez.~\ref{sec:files_std_interface} per la standardizzazione
 518 adottata nelle librerie del linguaggio C e valida per qualunque sistema
 519 operativo. Qui basta accennare che si sono usate le funzioni standard della
 520 libreria del C che prevedono l'output bufferizzato. Il punto è che questa
 521 bufferizzazione (che tratteremo in dettaglio in sez.~\ref{sec:file_buffering})
 522 varia a seconda che si tratti di un file su disco, in cui il buffer viene
 523 scaricato su disco solo quando necessario, o di un terminale, in cui il buffer
 524 viene scaricato ad ogni carattere di a capo.
 525
 526 Nel primo esempio allora avevamo che, essendovi un a capo nella stringa
 527 stampata, ad ogni chiamata a \func{printf} il buffer veniva scaricato, per cui
 528 le singole righe comparivano a video subito dopo l'esecuzione della
 529 \func{printf}. Ma con la redirezione su file la scrittura non avviene più alla
 530 fine di ogni riga e l'output resta nel buffer. Dato che ogni figlio riceve una
 531 copia della memoria del padre, esso riceverà anche quanto c'è nel buffer delle
 532 funzioni di I/O, comprese le linee scritte dal padre fino allora. Così quando
 533 il buffer viene scritto su disco all'uscita del figlio, troveremo nel file
 534 anche tutto quello che il processo padre aveva scritto prima della sua
 535 creazione. E alla fine del file (dato che in questo caso il padre esce per
 536 ultimo) troveremo anche l'output completo del padre.
 537
 538 L'esempio ci mostra un altro aspetto fondamentale dell'interazione con i file,
 539 valido anche per l'esempio precedente, ma meno evidente: il fatto cioè che non
 540 solo processi diversi possono scrivere in contemporanea sullo stesso file
 541 (l'argomento dell'accesso concorrente ai file è trattato in dettaglio in
 542 sez.~\ref{sec:file_shared_access}), ma anche che, a differenza di quanto
 543 avviene per le variabili in memoria, la posizione corrente sul file è
 544 condivisa fra il padre e tutti i processi figli.
 545
 546 Quello che succede è che quando lo \textit{standard output}\footnote{si chiama
 547   così il file su cui un programma scrive i suoi dati in uscita, tratteremo
 548   l'argomento in dettaglio in sez.~\ref{sec:file_fd}.} del padre viene
 549 rediretto come si è fatto nell'esempio, lo stesso avviene anche per tutti i
 550 figli. La funzione \func{fork} infatti ha la caratteristica di duplicare nei
 551 processi figli tutti i \textit{file descriptor} (vedi sez.~\ref{sec:file_fd})
 552 dei file aperti nel processo padre (allo stesso modo in cui lo fa la funzione
 553 \func{dup}, trattata in sez.~\ref{sec:file_dup}), il che comporta che padre e
 554 figli condividono le stesse voci della \itindex{file~table} \textit{file
 555   table} (tratteremo in dettaglio questi termini in
 556 sez.~\ref{sec:file_shared_access}) fra cui c'è anche la posizione corrente nel
 557 file.
 558
 559 In questo modo se un processo scrive su un file aggiornerà la posizione
 560 corrente sulla \itindex{file~table} \textit{file table}, e tutti gli altri
 561 processi, che vedono la stessa \itindex{file~table} \textit{file table},
 562 vedranno il nuovo valore. In questo modo si evita, in casi come quello appena
 563 mostrato in cui diversi processi scrivono sullo stesso file, che l'output
 564 successivo di un processo vada a sovrapporsi a quello dei precedenti: l'output
 565 potrà risultare mescolato, ma non ci saranno parti perdute per via di una
 566 sovrascrittura.
 567
 568 Questo tipo di comportamento è essenziale in tutti quei casi in cui il padre
 569 crea un figlio e attende la sua conclusione per proseguire, ed entrambi
 570 scrivono sullo stesso file. Un caso tipico di questo comportamento è la shell
 571 quando lancia un programma.  In questo modo, anche se lo standard output viene
 572 rediretto, il padre potrà sempre continuare a scrivere in coda a quanto
 573 scritto dal figlio in maniera automatica; se così non fosse ottenere questo
 574 comportamento sarebbe estremamente complesso necessitando di una qualche forma
 575 di comunicazione fra i due processi per far riprendere al padre la scrittura
 576 al punto giusto.
 577
 578 In generale comunque non è buona norma far scrivere più processi sullo stesso
 579 file senza una qualche forma di sincronizzazione in quanto, come visto anche
 580 con il nostro esempio, le varie scritture risulteranno mescolate fra loro in
 581 una sequenza impredicibile. Per questo le modalità con cui in genere si usano
 582 i file dopo una \func{fork} sono sostanzialmente due:
 583 \begin{enumerate*}
 584 \item Il processo padre aspetta la conclusione del figlio. In questo caso non
 585   è necessaria nessuna azione riguardo ai file, in quanto la sincronizzazione
 586   della posizione corrente dopo eventuali operazioni di lettura e scrittura
 587   effettuate dal figlio è automatica.
 588 \item L'esecuzione di padre e figlio procede indipendentemente. In questo caso
 589   ciascuno dei due processi deve chiudere i file che non gli servono una volta
 590   che la \func{fork} è stata eseguita, per evitare ogni forma di interferenza.
 591 \end{enumerate*}
 592
 593 Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
 594 proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
 595 comune dopo l'esecuzione di una \func{fork} è la seguente:
 596 \begin{itemize*}
 597 \item i file aperti e gli eventuali flag di \itindex{close-on-exec}
 598   \textit{close-on-exec} impostati (vedi sez.~\ref{sec:proc_exec} e
 599   sez.~\ref{sec:file_fcntl_ioctl});
 600 \item gli identificatori per il controllo di accesso: l'\textsl{user-ID
 601     reale}, il \textsl{group-ID reale}, l'\textsl{user-ID effettivo}, il
 602   \textsl{group-ID effettivo} ed i \textit{group-ID supplementari} (vedi
 603   sez.~\ref{sec:proc_access_id});
 604 \item gli identificatori per il controllo di sessione: il
 605   \itindex{process~group} \textit{process group-ID} e il \textit{session id}
 606   ed il terminale di controllo (vedi sez.~\ref{sec:sess_proc_group});
 607 \item la \index{directory~di~lavoro} directory di lavoro e la directory radice
 608   (vedi sez.~\ref{sec:file_work_dir} e sez.~\ref{sec:file_chroot});
 609 \item la maschera dei permessi di creazione dei file (vedi
 610   sez.~\ref{sec:file_perm_management});
 611 \item la \index{maschera~dei~segnali} maschera dei segnali bloccati (vedi
 612   sez.~\ref{sec:sig_sigmask}) e le azioni installate (vedi
 613   sez.~\ref{sec:sig_gen_beha});
 614 \item i segmenti di memoria condivisa agganciati al processo (vedi
 615   sez.~\ref{sec:ipc_sysv_shm});
 616 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
 617 \item il valori di \textit{nice}, le priorità real-time e le affinità di
 618   processore (vedi sez.~\ref{sec:proc_sched_stand},
 619   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
 620 \item le variabili di ambiente (vedi sez.~\ref{sec:proc_environ}).
 621 \item l'insieme dei descrittori associati alle code di messaggi POSIX (vedi
 622   sez.~\ref{sec:ipc_posix_mq}) che vengono copiate come i \textit{file
 623     descriptor}, questo significa che entrambi condivideranno gli stessi flag.
 624 \end{itemize*}
 625
 626 Oltre a quelle relative ad un diverso spazio degli indirizzi (e una memoria
 627 totalmente indipendente) le differenze fra padre e figlio dopo l'esecuzione di
 628 una \func{fork} invece sono:\footnote{a parte le ultime quattro, relative a
 629   funzionalità specifiche di Linux, le altre sono esplicitamente menzionate
 630   dallo standard POSIX.1-2001.}
 631 \begin{itemize*}
 632 \item il valore di ritorno di \func{fork};
 633 \item il \ids{PID} (\textit{process id}), quello del figlio viene assegnato ad
 634   un nuovo valore univoco;
 635 \item il \ids{PPID} (\textit{parent process id}), quello del figlio viene
 636   impostato al \ids{PID} del padre;
 637 \item i valori dei tempi di esecuzione (vedi sez.~\ref{sec:sys_cpu_times}) e
 638   delle risorse usate (vedi sez.~\ref{sec:sys_resource_use}), che nel figlio
 639   sono posti a zero;
 640 \item i \textit{lock} sui file (vedi sez.~\ref{sec:file_locking}) e sulla
 641   memoria (vedi sez.~\ref{sec:proc_mem_lock}), che non vengono ereditati dal
 642   figlio;
 643 \item gli allarmi, i timer (vedi sez.~\ref{sec:sig_alarm_abort}) ed i segnali
 644   pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che per il figlio vengono
 645   cancellati.
 646 \item le operazioni di I/O asincrono in corso (vedi
 647   sez.~\ref{sec:file_asyncronous_io}) che non vengono ereditate dal figlio;
 648 \item gli aggiustamenti fatti dal padre ai semafori con \func{semop} (vedi
 649   sez.~\ref{sec:ipc_sysv_sem}).
 650 \item le notifiche sui cambiamenti delle directory con \textit{dnotify} (vedi
 651   sez.~\ref{sec:sig_notification}), che non vengono ereditate dal figlio;
 652 \item le mappature di memoria marcate come \const{MADV\_DONTFORK} (vedi
 653   sez.~\ref{sec:file_memory_map}) che non vengono ereditate dal figlio;
 654 \item l'impostazione con \func{prctl} (vedi sez.~\ref{sec:process_prctl}) che
 655   notifica al figlio la terminazione del padre viene cancellata se presente
 656   nel padre;
 657 \item il segnale di terminazione del figlio è sempre \signal{SIGCHLD} anche
 658   qualora nel padre fosse stato modificato (vedi sez.~\ref{sec:process_clone}).
 659 \end{itemize*}
 660
 661 Una seconda funzione storica usata per la creazione di un nuovo processo è
 662 \funcm{vfork}, che è esattamente identica a \func{fork} ed ha la stessa
 663 semantica e gli stessi errori; la sola differenza è che non viene creata la
 664 tabella delle pagine né la struttura dei task per il nuovo processo. Il
 665 processo padre è posto in attesa fintanto che il figlio non ha eseguito una
 666 \func{execve} o non è uscito con una \func{\_exit}. Il figlio condivide la
 667 memoria del padre (e modifiche possono avere effetti imprevedibili) e non deve
 668 ritornare o uscire con \func{exit} ma usare esplicitamente \func{\_exit}.
 669
 670 Questa funzione è un rimasuglio dei vecchi tempi in cui eseguire una
 671 \func{fork} comportava anche la copia completa del segmento dati del processo
 672 padre, che costituiva un inutile appesantimento in tutti quei casi in cui la
 673 \func{fork} veniva fatta solo per poi eseguire una \func{exec}. La funzione
 674 venne introdotta in BSD per migliorare le prestazioni.
 675
 676 Dato che Linux supporta il \itindex{copy~on~write} \textit{copy on write} la
 677 perdita di prestazioni è assolutamente trascurabile, e l'uso di questa
 678 funzione, che resta un caso speciale della \textit{system call} \func{clone}
 679 (che tratteremo in dettaglio in sez.~\ref{sec:process_clone}) è deprecato; per
 680 questo eviteremo di trattarla ulteriormente.
 681
 682
 683 \subsection{La conclusione di un processo}
 684 \label{sec:proc_termination}
 685
 686 In sez.~\ref{sec:proc_conclusion} abbiamo già affrontato le modalità con cui
 687 chiudere un programma, ma dall'interno del programma stesso. Avendo a che fare
 688 con un sistema \textit{multitasking} resta da affrontare l'argomento dal punto
 689 di vista di come il sistema gestisce la conclusione dei processi.
 690
 691 Abbiamo visto in sez.~\ref{sec:proc_conclusion} le tre modalità con cui un
 692 programma viene terminato in maniera normale: la chiamata di \func{exit}, che
 693 esegue le funzioni registrate per l'uscita e chiude gli \textit{stream} e poi
 694 esegue \func{\_exit}, il ritorno dalla funzione \code{main} equivalente alla
 695 chiamata di \func{exit}, e la chiamata diretta a \func{\_exit}, che passa
 696 direttamente alle operazioni di terminazione del processo da parte del kernel.
 697
 698 Ma abbiamo accennato che oltre alla conclusione normale esistono anche delle
 699 modalità di conclusione anomala. Queste sono in sostanza due: il programma può
 700 chiamare la funzione \func{abort} (vedi sez.~\ref{sec:sig_alarm_abort}) per
 701 invocare una chiusura anomala, o essere terminato da un segnale (torneremo sui
 702 segnali in cap.~\ref{cha:signals}).  In realtà anche la prima modalità si
 703 riconduce alla seconda, dato che \func{abort} si limita a generare il segnale
 704 \signal{SIGABRT}.
 705
 706 Qualunque sia la modalità di conclusione di un processo, il kernel esegue
 707 comunque una serie di operazioni di terminazione: chiude tutti i file aperti,
 708 rilascia la memoria che stava usando, e così via; l'elenco completo delle
 709 operazioni eseguite alla chiusura di un processo è il seguente:
 710 \begin{itemize*}
 711 \item tutti i \textit{file descriptor} (vedi sez.~\ref{sec:file_fd}) sono
 712   chiusi;
 713 \item viene memorizzato lo stato di terminazione del processo;
 714 \item ad ogni processo figlio viene assegnato un nuovo padre (in genere
 715   \cmd{init});
 716 \item viene inviato il segnale \signal{SIGCHLD} al processo padre (vedi
 717   sez.~\ref{sec:sig_sigchld});
 718 \item se il processo è un leader di sessione ed il suo terminale di controllo
 719   è quello della sessione viene mandato un segnale di \signal{SIGHUP} a tutti i
 720   processi del gruppo di \textit{foreground} e il terminale di controllo viene
 721   disconnesso (vedi sez.~\ref{sec:sess_ctrl_term});
 722 \item se la conclusione di un processo rende orfano un \textit{process
 723     group} ciascun membro del gruppo viene bloccato, e poi gli vengono
 724   inviati in successione i segnali \signal{SIGHUP} e \signal{SIGCONT}
 725   (vedi ancora sez.~\ref{sec:sess_ctrl_term}).
 726 \end{itemize*}
 727
 728 \itindbeg{termination~status}
 729
 730 Oltre queste operazioni è però necessario poter disporre di un meccanismo
 731 ulteriore che consenta di sapere come la terminazione è avvenuta: dato che in
 732 un sistema unix-like tutto viene gestito attraverso i processi, il meccanismo
 733 scelto consiste nel riportare lo \itindex{termination~status} \textsl{stato di
 734   terminazione} (il cosiddetto \textit{termination status}) al processo padre.
 735
 736 Nel caso di conclusione normale, abbiamo visto in
 737 sez.~\ref{sec:proc_conclusion} che lo stato di uscita del processo viene
 738 caratterizzato tramite il valore del cosiddetto \textit{exit status}, cioè il
 739 valore passato come argomento alle funzioni \func{exit} o \func{\_exit} o il
 740 valore di ritorno per \code{main}.  Ma se il processo viene concluso in
 741 maniera anomala il programma non può specificare nessun \textit{exit status},
 742 ed è il kernel che deve generare autonomamente il \textit{termination status}
 743 per indicare le ragioni della conclusione anomala.
 744
 745 Si noti la distinzione fra \textit{exit status} e \textit{termination status}:
 746 quello che contraddistingue lo stato di chiusura del processo e viene
 747 riportato attraverso le funzioni \func{wait} o \func{waitpid} (vedi
 748 sez.~\ref{sec:proc_wait}) è sempre quest'ultimo; in caso di conclusione
 749 normale il kernel usa il primo (nel codice eseguito da \func{\_exit}) per
 750 produrre il secondo.
 751
 752 La scelta di riportare al padre lo stato di terminazione dei figli, pur
 753 essendo l'unica possibile, comporta comunque alcune complicazioni: infatti se
 754 alla sua creazione è scontato che ogni nuovo processo abbia un padre, non è
 755 detto che sia così alla sua conclusione, dato che il padre potrebbe essere già
 756 terminato; si potrebbe avere cioè quello che si chiama un processo
 757 \textsl{orfano}.
 758
 759 Questa complicazione viene superata facendo in modo che il processo orfano
 760 venga \textsl{adottato} da \cmd{init}, o meglio dal processo con \ids{PID} 1,
 761 cioè quello lanciato direttamente dal kernel all'avvio, che sta alla base
 762 dell'albero dei processi visto in sez.~\ref{sec:proc_hierarchy} e che anche
 763 per questo motivo ha un ruolo essenziale nel sistema e non può mai
 764 terminare.\footnote{almeno non senza un blocco completo del sistema, in caso
 765   di terminazione o di non esecuzione di \cmd{init} infatti il kernel si
 766   blocca con un cosiddetto \textit{kernel panic}, dato che questo è un errore
 767   fatale.}
 768
 769 Come già accennato quando un processo termina, il kernel controlla se è il
 770 padre di altri processi in esecuzione: in caso positivo allora il \ids{PPID}
 771 di tutti questi processi verrà sostituito dal kernel con il \ids{PID} di
 772 \cmd{init}, cioè con 1. In questo modo ogni processo avrà sempre un padre (nel
 773 caso possiamo parlare di un padre \textsl{adottivo}) cui riportare il suo
 774 stato di terminazione.
 775
 776 Come verifica di questo comportamento possiamo eseguire il nostro programma
 777 \cmd{forktest} imponendo a ciascun processo figlio due secondi di attesa prima
 778 di uscire, il risultato è:
 779 \begin{Console}
 780 [piccardi@selidor sources]$ \textbf{./forktest -c2 3}
 781 Process 1972: forking 3 child
 782 Spawned 1 child, pid 1973
 783 Child 1 successfully executing
 784 Go to next child
 785 Spawned 2 child, pid 1974
 786 Child 2 successfully executing
 787 Go to next child
 788 Child 3 successfully executing
 789 Spawned 3 child, pid 1975
 790 Go to next child
 791
 792 [piccardi@selidor sources]$ Child 3, parent 1, exiting
 793 Child 2, parent 1, exiting
 794 Child 1, parent 1, exiting
 795 \end{Console}
 796 come si può notare in questo caso il processo padre si conclude prima dei
 797 figli, tornando alla shell, che stampa il prompt sul terminale: circa due
 798 secondi dopo viene stampato a video anche l'output dei tre figli che
 799 terminano, e come si può notare in questo caso, al contrario di quanto visto
 800 in precedenza, essi riportano 1 come \ids{PPID}.
 801
 802 Altrettanto rilevante è il caso in cui il figlio termina prima del padre,
 803 perché non è detto che il padre possa ricevere immediatamente lo stato di
 804 terminazione, quindi il kernel deve comunque conservare una certa quantità di
 805 informazioni riguardo ai processi che sta terminando.
 806
 807 Questo viene fatto mantenendo attiva la voce nella tabella dei processi, e
 808 memorizzando alcuni dati essenziali, come il \ids{PID}, i tempi di CPU usati
 809 dal processo (vedi sez.~\ref{sec:sys_unix_time}) e lo stato di terminazione,
 810 mentre la memoria in uso ed i file aperti vengono rilasciati immediatamente.
 811
 812 I processi che sono terminati, ma il cui stato di terminazione non è stato
 813 ancora ricevuto dal padre sono chiamati \itindex{zombie} \textit{zombie}, essi
 814 restano presenti nella tabella dei processi ed in genere possono essere
 815 identificati dall'output di \cmd{ps} per la presenza di una \texttt{Z} nella
 816 colonna che ne indica lo stato (vedi tab.~\ref{tab:proc_proc_states}). Quando
 817 il padre effettuerà la lettura dello stato di terminazione anche questa
 818 informazione, non più necessaria, verrà scartata ed il processo potrà
 819 considerarsi completamente concluso.
 820
 821 Possiamo utilizzare il nostro programma di prova per analizzare anche questa
 822 condizione: lanciamo il comando \cmd{forktest} in \textit{background} (vedi
 823 sez.~\ref{sec:sess_job_control}), indicando al processo padre di aspettare 10
 824 secondi prima di uscire. In questo caso, usando \cmd{ps} sullo stesso
 825 terminale (prima dello scadere dei 10 secondi) otterremo:
 826 \begin{Console}
 827 [piccardi@selidor sources]$ \textbf{ps T}
 828   PID TTY      STAT   TIME COMMAND
 829   419 pts/0    S      0:00 bash
 830   568 pts/0    S      0:00 ./forktest -e10 3
 831   569 pts/0    Z      0:00 [forktest <defunct>]
 832   570 pts/0    Z      0:00 [forktest <defunct>]
 833   571 pts/0    Z      0:00 [forktest <defunct>]
 834   572 pts/0    R      0:00 ps T
 835 \end{Console}
 836 %$
 837 e come si vede, dato che non si è fatto nulla per riceverne lo stato di
 838 terminazione, i tre processi figli sono ancora presenti pur essendosi
 839 conclusi, con lo stato di \itindex{zombie} \textit{zombie} e l'indicazione che
 840 sono terminati (la scritta \texttt{defunct}).
 841
 842 La possibilità di avere degli \itindex{zombie} \textit{zombie} deve essere
 843 tenuta sempre presente quando si scrive un programma che deve essere mantenuto
 844 in esecuzione a lungo e creare molti figli. In questo caso si deve sempre
 845 avere cura di far leggere l'eventuale stato di uscita di tutti i figli. In
 846 genere questo si fa attraverso un apposito \textit{signal handler}, che chiama
 847 la funzione \func{wait}, (vedi sez.~\ref{sec:sig_sigchld} e
 848 sez.~\ref{sec:proc_wait}) di cui vedremo un esempio in
 849 fig.~\ref{fig:sig_sigchld_handl}.
 850
 851 Questa operazione è necessaria perché anche se gli \itindex{zombie}
 852 \textit{zombie} non consumano risorse di memoria o processore, occupano
 853 comunque una voce nella tabella dei processi e se li si lascia accumulare a
 854 lungo quest'ultima potrebbe riempirsi, con l'impossibilità di lanciare nuovi
 855 processi.
 856
 857 Si noti tuttavia che quando un processo adottato da \cmd{init} termina, non
 858 diviene mai uno \itindex{zombie} \textit{zombie}. Questo perché una delle
 859 funzioni di \cmd{init} è appunto quella di chiamare la funzione \func{wait}
 860 per i processi a cui fa da padre, completandone la terminazione. Questo è
 861 quanto avviene anche quando, come nel caso del precedente esempio con
 862 \cmd{forktest}, il padre termina con dei figli in stato di \itindex{zombie}
 863 \textit{zombie}. Questi scompaiono quando, alla terminazione del padre dopo i
 864 secondi programmati, tutti figli che avevamo generato, e che erano diventati
 865 \itindex{zombie} \textit{zombie}, vengono adottati da \cmd{init}, il quale
 866 provvede a completarne la terminazione.
 867
 868 Si tenga presente infine che siccome gli \itindex{zombie} \textit{zombie} sono
 869 processi già terminati, non c'è modo di eliminarli con il comando \cmd{kill} o
 870 inviandogli un qualunque segnale di terminazione (l'argomento è trattato in
 871 sez.~\ref{sec:sig_termination}). L'unica possibilità di cancellarli dalla
 872 tabella dei processi è quella di terminare il processo che li ha generati, in
 873 modo che \cmd{init} possa adottarli e concluderne la terminazione.
 874
 875 \subsection{Le funzioni di attesa e ricezione degli stati di uscita}
 876 \label{sec:proc_wait}
 877
 878 Uno degli usi più comuni delle capacità multitasking di un sistema unix-like
 879 consiste nella creazione di programmi di tipo server, in cui un processo
 880 principale attende le richieste che vengono poi soddisfatte da una serie di
 881 processi figli.
 882
 883 Si è già sottolineato al paragrafo precedente come in questo caso diventi
 884 necessario gestire esplicitamente la conclusione dei figli onde evitare di
 885 riempire di \itindex{zombie} \textit{zombie} la tabella dei
 886 processi. Tratteremo in questa sezione le funzioni di sistema deputate a
 887 questo compito; la prima è \funcd{wait} ed il suo prototipo è:
 888
 889 \begin{funcproto}{
 890 \fhead{sys/types.h}
 891 \fhead{sys/wait.h}
 892 \fdecl{pid\_t wait(int *status)}
 893 \fdesc{Attende la terminazione di un processo.}
 894 }
 895 {La funzione ritorna il \ids{PID} del figlio in caso di successo e $-1$ per un
 896   errore, nel qual caso \var{errno} assumerà uno dei valori:
 897   \begin{errlist}
 898   \item[\errcode{ECHILD}] il processo non ha nessun figlio di cui attendere
 899     uno stato di terminazione.
 900   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
 901   \end{errlist}}
 902 \end{funcproto}
 903
 904 Questa funzione è presente fin dalle prime versioni di Unix ed è quella usata
 905 tradizionalmente per attendere la terminazione dei figli. La funzione sospende
 906 l'esecuzione del processo corrente e ritorna non appena un qualunque processo
 907 figlio termina. Se un figlio è già terminato prima della sua chiamata la
 908 funzione ritorna immediatamente, se più processi figli sono già terminati
 909 occorrerà continuare a chiamare la funzione più volte fintanto che non si è
 910 recuperato lo stato di terminazione di tutti quanti.
 911
 912 Al ritorno della funzione lo stato di terminazione del figlio viene salvato
 913 (come \itindex{value~result~argument} \textit{value result argument}) nella
 914 variabile puntata da \param{status} e tutte le risorse del kernel relative al
 915 processo (vedi sez.~\ref{sec:proc_termination}) vengono rilasciate.  Nel caso
 916 un processo abbia più figli il valore di ritorno della funzione sarà impostato
 917 al \ids{PID} del processo di cui si è ricevuto lo stato di terminazione, cosa
 918 che permette di identificare qual è il figlio che è terminato.
 919
 920 \itindend{termination~status}
 921
 922 Questa funzione ha il difetto di essere poco flessibile, in quanto ritorna
 923 all'uscita di un qualunque processo figlio. Nelle occasioni in cui è
 924 necessario attendere la conclusione di uno specifico processo fra tutti quelli
 925 esistenti occorre predisporre un meccanismo che tenga conto di tutti processi
 926 che sono terminati, e provveda a ripetere la chiamata alla funzione nel caso
 927 il processo cercato non risulti fra questi. Se infatti il processo cercato è
 928 già terminato e se è già ricevuto lo stato di uscita senza registrarlo, la
 929 funzione non ha modo di accorgersene, e si continuerà a chiamarla senza
 930 accorgersi che quanto interessava è già accaduto.
 931
 932 Per questo motivo lo standard POSIX.1 ha introdotto una seconda funzione che
 933 effettua lo stesso servizio, ma dispone di una serie di funzionalità più
 934 ampie, legate anche al controllo di sessione (si veda
 935 sez.~\ref{sec:sess_job_control}).  Dato che è possibile ottenere lo stesso
 936 comportamento di \func{wait}\footnote{in effetti il codice
 937   \code{wait(\&status)} è del tutto equivalente a \code{waitpid(WAIT\_ANY,
 938     \&status, 0)}.} si consiglia di utilizzare sempre questa nuova funzione di
 939 sistema, \funcd{waitpid}, il cui prototipo è:
 940
 941 \begin{funcproto}{
 942 \fhead{sys/types.h}
 943 \fhead{sys/wait.h}
 944 \fdecl{pid\_t waitpid(pid\_t pid, int *status, int options)}
 945 \fdesc{Attende il cambiamento di stato di un processo figlio.}
 946 }
 947 {La funzione ritorna il \ids{PID} del processo che ha cambiato stato in caso
 948   di successo, o 0 se è stata specificata l'opzione \const{WNOHANG} e il
 949   processo non è uscito e $-1$ per un errore, nel qual caso \var{errno}
 950   assumerà uno dei valori:
 951   \begin{errlist}
 952   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
 953     non è figlio del processo chiamante.
 954   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
 955     la funzione è stata interrotta da un segnale.
 956   \item[\errcode{EINVAL}] si è specificato un valore non valido per
 957     l'argomento \param{options}.
 958   \end{errlist}}
 959 \end{funcproto}
 960
 961 La prima differenza fra le due funzioni è che con \func{waitpid} si può
 962 specificare in maniera flessibile quale processo attendere, sulla base del
 963 valore fornito dall'argomento \param{pid}, questo può assumere diversi valori,
 964 secondo lo specchietto riportato in tab.~\ref{tab:proc_waidpid_pid}, dove si
 965 sono riportate anche le costanti definite per indicare alcuni di essi.
 966
 967 \begin{table}[!htb]
 968   \centering
 969   \footnotesize
 970   \begin{tabular}[c]{|c|c|p{8cm}|}
 971     \hline
 972     \textbf{Valore} & \textbf{Costante} &\textbf{Significato}\\
 973     \hline
 974     \hline
 975     $<-1$& --               & Attende per un figlio il cui
 976                               \itindex{process~group} \textit{process group}
 977                               (vedi sez.~\ref{sec:sess_proc_group}) è uguale
 978                               al valore assoluto di \param{pid}.\\
 979     $-1$&\const{WAIT\_ANY}  & Attende per un figlio qualsiasi, usata in
 980                               questa maniera senza specificare nessuna opzione
 981                               è equivalente a \func{wait}.\\
 982     $ 0$&\const{WAIT\_MYPGRP}&Attende per un figlio il cui
 983                               \itindex{process~group} \textit{process group}
 984                               (vedi sez.~\ref{sec:sess_proc_group}) è
 985                               uguale a quello del processo chiamante.\\
 986     $>0$& --                & Attende per un figlio il cui \ids{PID} è uguale
 987                               al valore di \param{pid}.\\
 988     \hline
 989   \end{tabular}
 990   \caption{Significato dei valori dell'argomento \param{pid} della funzione
 991     \func{waitpid}.}
 992   \label{tab:proc_waidpid_pid}
 993 \end{table}
 994
 995 Il comportamento di \func{waitpid} può inoltre essere modificato passando alla
 996 funzione delle opportune opzioni tramite l'argomento \param{options}; questo
 997 deve essere specificato come maschera binaria delle costanti riportati nella
 998 prima parte in tab.~\ref{tab:proc_waitpid_options} che possono essere
 999 combinate fra loro con un OR aritmetico. Nella seconda parte della stessa
1000 tabella si sono riportati anche alcune opzioni non standard specifiche di
1001 Linux, che consentono un controllo più dettagliato per i processi creati con
1002 la \textit{system call} generica \func{clone} (vedi
1003 sez.~\ref{sec:process_clone}) e che vengono usati principalmente per la
1004 gestione della terminazione dei \itindex{thread} \textit{thread} (vedi
1005 sez.~\ref{sec:thread_xxx}).
1006
1007 \begin{table}[!htb]
1008   \centering
1009   \footnotesize
1010   \begin{tabular}[c]{|l|p{8cm}|}
1011     \hline
1012     \textbf{Costante} & \textbf{Descrizione}\\
1013     \hline
1014     \hline
1015     \const{WNOHANG}   & La funzione ritorna immediatamente anche se non è
1016                         terminato nessun processo figlio.\\
1017     \const{WUNTRACED} & Ritorna anche quando un processo figlio è stato
1018                         fermato.\\
1019     \const{WCONTINUED}& Ritorna anche quando un processo figlio che era stato
1020                         fermato ha ripreso l'esecuzione (disponibile solo a
1021                         partire dal kernel 2.6.10).\\
1022     \hline
1023     \const{\_\_WCLONE}& Attende solo per i figli creati con \func{clone}
1024                         (vedi sez.~\ref{sec:process_clone}), vale a dire
1025                         processi che non emettono nessun segnale
1026                         o emettono un segnale diverso da \signal{SIGCHLD} alla
1027                         terminazione, il default è attendere soltanto i
1028                         processi figli ordinari ignorando quelli creati da
1029                         \func{clone}.\\
1030     \const{\_\_WALL}  & Attende per qualunque figlio, sia ordinario che creato
1031                         con  \func{clone}, se specificata insieme a
1032                         \const{\_\_WCLONE} quest'ultima viene ignorata. \\
1033     \const{\_\_WNOTHREAD}& Non attende per i figli di altri \textit{thread}
1034                         dello stesso \textit{thread group}, questo era il
1035                         comportamento di default del kernel 2.4 che non
1036                         supportava la possibilità, divenuta il default a
1037                         partire dal 2.6, di attendere un qualunque figlio
1038                         appartenente allo stesso \textit{thread group}. \\
1039     \hline
1040   \end{tabular}
1041   \caption{Costanti che identificano i bit dell'argomento \param{options}
1042     della funzione \func{waitpid}.}
1043   \label{tab:proc_waitpid_options}
1044 \end{table}
1045
1046
1047 L'uso dell'opzione \const{WNOHANG} consente di prevenire il blocco della
1048 funzione qualora nessun figlio sia uscito o non si siano verificate le altre
1049 condizioni per l'uscita della funzione. in tal caso. In tal caso la funzione,
1050 invece di restituire il \ids{PID} del processo (che è sempre un intero
1051 positivo) ritornerà un valore nullo.
1052
1053 Le altre due opzioni, \const{WUNTRACED} e \const{WCONTINUED}, consentono
1054 rispettivamente di tracciare non la terminazione di un processo, ma il fatto
1055 che esso sia stato fermato, o fatto ripartire, e sono utilizzate per la
1056 gestione del controllo di sessione (vedi sez.~\ref{sec:sess_job_control}).
1057
1058 Nel caso di \const{WUNTRACED} la funzione ritorna, restituendone il \ids{PID},
1059 quando un processo figlio entra nello stato \textit{stopped}\footnote{in
1060   realtà viene notificato soltanto il caso in cui il processo è stato fermato
1061   da un segnale di stop (vedi sez.~\ref{sec:sess_ctrl_term}), e non quello in
1062   cui lo stato \textit{stopped} è dovuto all'uso di \func{ptrace} (vedi
1063   sez.~\ref{sec:process_ptrace}).} (vedi tab.~\ref{tab:proc_proc_states}),
1064 mentre con \const{WCONTINUED} la funzione ritorna quando un processo in stato
1065 \textit{stopped} riprende l'esecuzione per la ricezione del segnale
1066 \signal{SIGCONT} (l'uso di questi segnali per il controllo di sessione è
1067 trattato in sez.~\ref{sec:sess_ctrl_term}).
1068
1069 La terminazione di un processo figlio (così come gli altri eventi osservabili
1070 con \func{waitpid}) è chiaramente un evento asincrono rispetto all'esecuzione
1071 di un programma e può avvenire in un qualunque momento. Per questo motivo,
1072 come accennato nella sezione precedente, una delle azioni prese dal kernel
1073 alla conclusione di un processo è quella di mandare un segnale di
1074 \signal{SIGCHLD} al padre. L'azione predefinita (si veda
1075 sez.~\ref{sec:sig_base}) per questo segnale è di essere ignorato, ma la sua
1076 generazione costituisce il meccanismo di comunicazione asincrona con cui il
1077 kernel avverte il processo padre che uno dei suoi figli è terminato.
1078
1079 Il comportamento delle funzioni è però cambiato nel passaggio dal kernel 2.4
1080 al kernel 2.6, quest'ultimo infatti si è adeguato alle prescrizioni dello
1081 standard POSIX.1-2001 e come da esso richiesto se \signal{SIGCHLD} viene
1082 ignorato, o se si imposta il flag di \const{SA\_NOCLDSTOP} nella ricezione
1083 dello stesso (si veda sez.~\ref{sec:sig_sigaction}) i processi figli che
1084 terminano non diventano \textit{zombie} e sia \func{wait} che \func{waitpid}
1085 si bloccano fintanto che tutti i processi figli non sono terminati, dopo di
1086 che falliscono con un errore di \errcode{ENOCHLD}.\footnote{questo è anche il
1087   motivo per cui le opzioni \const{WUNTRACED} e \const{WCONTINUED} sono
1088   utilizzabili soltanto qualora non si sia impostato il flag di
1089   \const{SA\_NOCLDSTOP} per il segnale \signal{SIGCHLD}.}
1090
1091 Con i kernel della serie 2.4 e tutti i kernel delle serie precedenti entrambe
1092 le funzioni di attesa ignorano questa prescrizione e si comportano sempre
1093 nello stesso modo,\footnote{lo standard POSIX.1 originale infatti lascia
1094   indefinito il comportamento di queste funzioni quando \signal{SIGCHLD} viene
1095   ignorato.} indipendentemente dal fatto \signal{SIGCHLD} sia ignorato o meno:
1096 attendono la terminazione di un processo figlio e ritornano il relativo
1097 \ids{PID} e lo stato di terminazione nell'argomento \param{status}.
1098
1099 In generale in un programma non si vuole essere forzati ad attendere la
1100 conclusione di un processo figlio per proseguire l'esecuzione, specie se tutto
1101 questo serve solo per leggerne lo stato di chiusura (ed evitare eventualmente
1102 la presenza di \itindex{zombie} \textit{zombie}).  Per questo la modalità più
1103 comune di chiamare queste funzioni è quella di utilizzarle all'interno di un
1104 \textit{signal handler} (vedremo un esempio di come gestire \signal{SIGCHLD}
1105 con i segnali in sez.~\ref{sec:sig_example}). In questo caso infatti, dato che
1106 il segnale è generato dalla terminazione di un figlio, avremo la certezza che
1107 la chiamata a \func{waitpid} non si bloccherà.
1108
1109 Come accennato sia \func{wait} che \func{waitpid} restituiscono lo stato di
1110 terminazione del processo tramite il puntatore \param{status}, e se non
1111 interessa memorizzare lo stato si può passare un puntatore nullo. Il valore
1112 restituito da entrambe le funzioni dipende dall'implementazione, ma
1113 tradizionalmente gli 8 bit meno significativi sono riservati per memorizzare
1114 lo \itindex{exit~status} stato di uscita del processo, e gli altri per
1115 indicare il segnale che ha causato la terminazione (in caso di conclusione
1116 anomala), uno per indicare se è stato generato un \itindex{core~dump}
1117 \textit{core dump} (vedi sez.~\ref{sec:sig_standard}), ecc.\footnote{le
1118   definizioni esatte si possono trovare in \file{<bits/waitstatus.h>} ma
1119   questo file non deve mai essere usato direttamente, esso viene incluso
1120   attraverso \file{<sys/wait.h>}.}
1121
1122 \begin{table}[!htb]
1123   \centering
1124   \footnotesize
1125   \begin{tabular}[c]{|l|p{10cm}|}
1126     \hline
1127     \textbf{Macro} & \textbf{Descrizione}\\
1128     \hline
1129     \hline
1130     \macro{WIFEXITED}\texttt{(s)}   & Condizione vera (valore non nullo) per
1131                                       un processo figlio che sia terminato
1132                                       normalmente. \\
1133     \macro{WEXITSTATUS}\texttt{(s)} & Restituisce gli otto bit meno
1134                                       significativi dello stato di uscita del
1135                                       processo (passato attraverso
1136                                       \func{\_exit}, \func{exit} o come valore
1137                                       di ritorno di \code{main}); può essere
1138                                       valutata solo se \val{WIFEXITED} ha
1139                                       restituito un valore non nullo.\\
1140     \macro{WIFSIGNALED}\texttt{(s)} & Condizione vera se il processo figlio è
1141                                       terminato in maniera anomala a causa di
1142                                       un segnale che non è stato catturato
1143                                       (vedi sez.~\ref{sec:sig_notification}).\\
1144     \macro{WTERMSIG}\texttt{(s)}    & Restituisce il numero del segnale che ha
1145                                       causato la terminazione anomala del
1146                                       processo; può essere valutata solo se
1147                                       \val{WIFSIGNALED} ha restituito un
1148                                       valore non nullo.\\
1149     \macro{WCOREDUMP}\texttt{(s)}   & Vera se il processo terminato ha
1150                                       generato un file di \itindex{core~dump}
1151                                       \textit{core dump}; può essere valutata
1152                                       solo se \val{WIFSIGNALED} ha restituito
1153                                       un valore non nullo.\footnotemark \\
1154     \macro{WIFSTOPPED}\texttt{(s)}  & Vera se il processo che ha causato il
1155                                       ritorno di \func{waitpid} è bloccato;
1156                                       l'uso è possibile solo con
1157                                       \func{waitpid} avendo specificato
1158                                       l'opzione \const{WUNTRACED}.\\
1159     \macro{WSTOPSIG}\texttt{(s)}    & Restituisce il numero del segnale che ha
1160                                       bloccato il processo; può essere
1161                                       valutata solo se \val{WIFSTOPPED} ha
1162                                       restituito un valore non nullo. \\
1163     \macro{WIFCONTINUED}\texttt{(s)}& Vera se il processo che ha causato il
1164                                       ritorno è stato riavviato da un
1165                                       \signal{SIGCONT} (disponibile solo a
1166                                       partire dal kernel 2.6.10).\\
1167     \hline
1168   \end{tabular}
1169   \caption{Descrizione delle varie macro di preprocessore utilizzabili per
1170     verificare lo stato di terminazione \var{s} di un processo.}
1171   \label{tab:proc_status_macro}
1172 \end{table}
1173
1174 \footnotetext{questa macro non è definita dallo standard POSIX.1-2001, ma è
1175   presente come estensione sia in Linux che in altri Unix, deve essere
1176   pertanto utilizzata con attenzione (ad esempio è il caso di usarla in un
1177   blocco \texttt{\#ifdef WCOREDUMP ... \#endif}.}
1178
1179 Lo standard POSIX.1 definisce una serie di macro di preprocessore da usare per
1180 analizzare lo stato di uscita. Esse sono definite sempre in
1181 \file{<sys/wait.h>} ed elencate in tab.~\ref{tab:proc_status_macro}. Si tenga
1182 presente che queste macro prevedono che gli si passi come parametro la
1183 variabile di tipo \ctyp{int} puntata dall'argomento \param{status} restituito
1184 da \func{wait} o \func{waitpid}.
1185
1186 Si tenga conto che nel caso di conclusione anomala il valore restituito da
1187 \val{WTERMSIG} può essere confrontato con le costanti che identificano i
1188 segnali definite in \headfile{signal.h} ed elencate in
1189 tab.~\ref{tab:sig_signal_list}, e stampato usando le apposite funzioni
1190 trattate in sez.~\ref{sec:sig_strsignal}.
1191
1192 A partire dal kernel 2.6.9, sempre in conformità allo standard POSIX.1-2001, è
1193 stata introdotta una nuova funzione di attesa che consente di avere un
1194 controllo molto più preciso sui possibili cambiamenti di stato dei processi
1195 figli e più dettagli sullo stato di uscita; la funzione di sistema è
1196 \funcd{waitid} ed il suo prototipo è:
1197
1198 \begin{funcproto}{
1199 \fhead{sys/types.h}
1200 \fhead{sys/wait.h}
1201 \fdecl{int waitid(idtype\_t idtype, id\_t id, siginfo\_t *infop, int options)}
1202 \fdesc{Attende il cambiamento di stato di un processo figlio.}
1203 }
1204 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1205   caso \var{errno} assumerà uno dei valori:
1206   \begin{errlist}
1207   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
1208     non è figlio del processo chiamante.
1209   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
1210     la funzione è stata interrotta da un segnale.
1211   \item[\errcode{EINVAL}] si è specificato un valore non valido per
1212     l'argomento \param{options}.
1213   \end{errlist}}
1214 \end{funcproto}
1215
1216 La funzione prevede che si specifichi quali processi si intendono osservare
1217 usando i due argomenti \param{idtype} ed \param{id}; il primo indica se ci si
1218 vuole porre in attesa su un singolo processo, un gruppo di processi o un
1219 processo qualsiasi, e deve essere specificato secondo uno dei valori di
1220 tab.~\ref{tab:proc_waitid_idtype}; il secondo indica, a seconda del valore del
1221 primo, quale processo o quale gruppo di processi selezionare.
1222
1223 \begin{table}[!htb]
1224   \centering
1225   \footnotesize
1226   \begin{tabular}[c]{|l|p{8cm}|}
1227     \hline
1228     \textbf{Valore} & \textbf{Descrizione}\\
1229     \hline
1230     \hline
1231     \const{P\_PID} & Indica la richiesta di attendere per un processo figlio
1232                      il cui \ids{PID} corrisponda al valore dell'argomento
1233                      \param{id}.\\
1234     \const{P\_PGID}& Indica la richiesta di attendere per un processo figlio
1235                      appartenente al \textit{process group} (vedi
1236                      sez.~\ref{sec:sess_proc_group}) il cui \acr{pgid}
1237                      corrisponda al valore dell'argomento \param{id}.\\
1238     \const{P\_ALL} & Indica la richiesta di attendere per un processo figlio
1239                      generico, il valore dell'argomento \param{id} viene
1240                      ignorato.\\
1241     \hline
1242   \end{tabular}
1243   \caption{Costanti per i valori dell'argomento \param{idtype} della funzione
1244     \func{waitid}.}
1245   \label{tab:proc_waitid_idtype}
1246 \end{table}
1247
1248 Come per \func{waitpid} anche il comportamento di \func{waitid} è
1249 controllato dall'argomento \param{options}, da specificare come maschera
1250 binaria dei valori riportati in tab.~\ref{tab:proc_waitid_options}. Benché
1251 alcuni di questi siano identici come significato ed effetto ai precedenti di
1252 tab.~\ref{tab:proc_waitpid_options}, ci sono delle differenze significative:
1253 in questo caso si dovrà specificare esplicitamente l'attesa della terminazione
1254 di un processo impostando l'opzione \const{WEXITED}, mentre il precedente
1255 \const{WUNTRACED} è sostituito da \const{WSTOPPED}.  Infine è stata aggiunta
1256 l'opzione \const{WNOWAIT} che consente una lettura dello stato mantenendo il
1257 processo in attesa di ricezione, così che una successiva chiamata possa di
1258 nuovo riceverne lo stato.
1259
1260 \begin{table}[!htb]
1261   \centering
1262   \footnotesize
1263   \begin{tabular}[c]{|l|p{8cm}|}
1264     \hline
1265     \textbf{Valore} & \textbf{Descrizione}\\
1266     \hline
1267     \hline
1268     \const{WEXITED}   & Ritorna quando un processo figlio è terminato.\\
1269     \const{WNOHANG}   & Ritorna immediatamente anche se non c'è niente da
1270                         notificare.\\
1271     \const{WSTOPPED} &  Ritorna quando un processo figlio è stato fermato.\\
1272     \const{WCONTINUED}& Ritorna quando un processo figlio che era stato
1273                         fermato ha ripreso l'esecuzione.\\
1274     \const{WNOWAIT}   & Lascia il processo ancora in attesa di ricezione, così
1275                         che una successiva chiamata possa di nuovo riceverne
1276                         lo stato.\\
1277     \hline
1278   \end{tabular}
1279   \caption{Costanti che identificano i bit dell'argomento \param{options}
1280     della funzione \func{waitid}.}
1281   \label{tab:proc_waitid_options}
1282 \end{table}
1283
1284 La funzione \func{waitid} restituisce un valore nullo in caso di successo, e
1285 $-1$ in caso di errore; viene restituito un valore nullo anche se è stata
1286 specificata l'opzione \const{WNOHANG} e la funzione è ritornata immediatamente
1287 senza che nessun figlio sia terminato. Pertanto per verificare il motivo del
1288 ritorno della funzione occorre analizzare le informazioni che essa
1289 restituisce; queste, al contrario delle precedenti \func{wait} e
1290 \func{waitpid} che usavano un semplice valore numerico, sono ritornate in una
1291 struttura di tipo \struct{siginfo\_t} (vedi fig.~\ref{fig:sig_siginfo_t})
1292 all'indirizzo puntato dall'argomento \param{infop}.
1293
1294 Tratteremo nei dettagli la struttura \struct{siginfo\_t} ed il significato dei
1295 suoi vari campi in sez.~\ref{sec:sig_sigaction}, per quanto ci interessa qui
1296 basta dire che al ritorno di \func{waitid} verranno avvalorati i seguenti
1297 campi:
1298 \begin{basedescript}{\desclabelwidth{2.0cm}}
1299 \item[\var{si\_pid}] con il \ids{PID} del figlio.
1300 \item[\var{si\_uid}] con l'\textsl{user-ID reale} (vedi
1301   sez.~\ref{sec:proc_perms}) del figlio.
1302 \item[\var{si\_signo}] con \signal{SIGCHLD}.
1303 \item[\var{si\_status}] con lo stato di uscita del figlio o con il segnale che
1304   lo ha terminato, fermato o riavviato.
1305 \item[\var{si\_code}] con uno fra \const{CLD\_EXITED}, \const{CLD\_KILLED},
1306   \const{CLD\_STOPPED}, \const{CLD\_CONTINUED}, \const{CLD\_TRAPPED} e
1307   \const{CLD\_DUMPED} a indicare la ragione del ritorno della funzione, il cui
1308   significato è, nell'ordine: uscita normale, terminazione da segnale,
1309   processo fermato, processo riavviato, processo terminato in
1310   \itindex{core~dump} \textit{core dump} (vedi sez.~\ref{sec:sig_standard}).
1311 \end{basedescript}
1312
1313 Infine Linux, seguendo un'estensione di BSD, supporta altre due funzioni per
1314 la lettura dello stato di terminazione di un processo, analoghe alle
1315 precedenti ma che prevedono un ulteriore argomento attraverso il quale il
1316 kernel può restituire al padre informazioni sulle risorse (vedi
1317 sez.~\ref{sec:sys_res_limits}) usate dal processo terminato e dai vari figli.
1318 Le due funzioni di sistema sono \funcd{wait3} e \funcd{wait4}, che diventano
1319 accessibili definendo la macro \macro{\_USE\_BSD}, i loro prototipi sono:
1320
1321 \begin{funcproto}{
1322 \fhead{sys/types.h}
1323 \fhead{sys/times.h}
1324 \fhead{sys/resource.h}
1325 \fhead{sys/wait.h}
1326 \fdecl{int wait3(int *status, int options, struct rusage *rusage)}
1327 \fdecl{int wait4(pid\_t pid, int *status, int options, struct rusage *rusage)}
1328 \fdesc{Attende il cambiamento di stato di un processo figlio, riportando l'uso
1329   delle risorse.}
1330 }
1331 {La funzione ha gli stessi valori di ritorno e codici di errore di
1332   \func{waitpid}. }
1333 \end{funcproto}
1334
1335 La funzione \func{wait4} è identica \func{waitpid} sia nel comportamento che
1336 per i valori dei primi tre argomenti, ma in più restituisce nell'argomento
1337 aggiuntivo \param{rusage} un sommario delle risorse usate dal processo. Questo
1338 argomento è una struttura di tipo \struct{rusage} definita in
1339 \headfile{sys/resource.h}, che viene utilizzata anche dalla funzione
1340 \func{getrusage} per ottenere le risorse di sistema usate da un processo. La
1341 sua definizione è riportata in fig.~\ref{fig:sys_rusage_struct} e ne
1342 tratteremo in dettaglio il significato sez.~\ref{sec:sys_resource_use}. La
1343 funzione \func{wait3} è semplicemente un caso particolare di (e con Linux
1344 viene realizzata con la stessa \textit{system call}), ed è equivalente a
1345 chiamare \code{wait4(-1, \&status, opt, rusage)}, per questo motivo è ormai
1346 deprecata in favore di \func{wait4}.
1347
1348
1349
1350 \subsection{La famiglia delle funzioni \func{exec} per l'esecuzione dei
1351   programmi}
1352 \label{sec:proc_exec}
1353
1354 Abbiamo già detto che una delle modalità principali con cui si utilizzano i
1355 processi in Unix è quella di usarli per lanciare nuovi programmi: questo viene
1356 fatto attraverso una delle funzioni della famiglia \func{exec}. Quando un
1357 processo chiama una di queste funzioni esso viene completamente sostituito dal
1358 nuovo programma, il \ids{PID} del processo non cambia, dato che non viene
1359 creato un nuovo processo, la funzione semplicemente rimpiazza lo
1360 \itindex{stack} \textit{stack}, i \index{segmento!dati} dati ed il
1361 \index{segmento!testo} testo del processo corrente con un nuovo programma
1362 letto da disco, eseguendo il \itindex{link-loader} \textit{link-loader} con
1363 gli effetti illustrati in sez.~\ref{sec:proc_main}.
1364
1365 Ci sono sei diverse versioni di \func{exec} (per questo la si è chiamata
1366 famiglia di funzioni) che possono essere usate per questo compito, in realtà
1367 (come mostrato in fig.~\ref{fig:proc_exec_relat}), tutte queste funzioni sono
1368 tutte varianti che consentono di invocare in modi diversi, semplificando il
1369 passaggio degli argomenti, la funzione di sistema \funcd{execve}, il cui
1370 prototipo è:
1371
1372 \begin{funcproto}{
1373 \fhead{unistd.h}
1374 \fdecl{int execve(const char *filename, char *const argv[], char *const envp[])}
1375 \fdesc{Esegue un programma.}
1376 }
1377 {La funzione ritorna solo in caso di errore, restituendo $-1$, nel qual
1378  caso \var{errno} assumerà uno dei valori:
1379 \begin{errlist}
1380   \item[\errcode{EACCES}] il file o l'interprete non file ordinari, o non sono
1381     eseguibili, o il file è su un filesystem montato con l'opzione
1382     \cmd{noexec}, o manca  il permesso di attraversamento di una delle
1383     directory del \textit{pathname}.
1384   \item[\errcode{EINVAL}] l'eseguibile ELF ha più di un segmento
1385     \const{PF\_INTERP}, cioè chiede di essere eseguito da più di un
1386     interprete.
1387   \item[\errcode{ELIBBAD}] un interprete ELF non è in un formato
1388     riconoscibile.
1389   \item[\errcode{ENOEXEC}] il file è in un formato non eseguibile o non
1390     riconosciuto come tale, o compilato per un'altra architettura.
1391   \item[\errcode{ENOENT}] il file o una delle librerie dinamiche o l'interprete
1392     necessari per eseguirlo non esistono.
1393   \item[\errcode{EPERM}] il file ha i bit \itindex{suid~bit} \acr{suid} o
1394     \itindex{sgid~bit} \acr{sgid} e l'utente non è root, ed il processo viene
1395     tracciato, oppure il filesystem è montato con l'opzione \cmd{nosuid}.
1396   \item[\errcode{ETXTBSY}] l'eseguibile è aperto in scrittura da uno o più
1397     processi.
1398   \item[\errcode{E2BIG}] la lista degli argomenti è troppo grande.
1399   \end{errlist}
1400   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{EISDIR}, \errval{ELOOP},
1401   \errval{EMFILE}, \errval{ENAMETOOLONG}, \errval{ENFILE}, \errval{ENOMEM},
1402   \errval{ENOTDIR} nel loro significato generico.  }
1403 \end{funcproto}
1404
1405 La funzione \func{execve} esegue il programma o lo script indicato dal
1406 \textit{pathname} \param{filename}, passandogli la lista di argomenti indicata
1407 da \param{argv} e come ambiente la lista di stringhe indicata
1408 da \param{envp}. Entrambe le liste devono essere terminate da un puntatore
1409 nullo. I vettori degli argomenti e dell'ambiente possono essere acceduti dal
1410 nuovo programma quando la sua funzione \code{main} è dichiarata nella forma
1411 \code{main(int argc, char *argv[], char *envp[])}. Si tenga presente per il
1412 passaggio degli argomenti e dell'ambiente esistono comunque dei limiti, su cui
1413 torneremo in sez.~\ref{sec:sys_res_limits}).
1414 % TODO aggiungere la parte sul numero massimo di argomenti, da man execve
1415
1416 In caso di successo la funzione non ritorna, in quanto al posto del programma
1417 chiamante viene eseguito il nuovo programma indicato da \param{filename}. Se
1418 il processo corrente è tracciato con \func{ptrace} (vedi
1419 sez.~\ref{sec:process_ptrace}) in caso di successo viene emesso il segnale
1420 \signal{SIGTRAP}.
1421
1422 Le altre funzioni della famiglia (\funcd{execl}, \funcd{execv},
1423 \funcd{execle}, \funcd{execlp}, \funcd{execvp}) servono per fornire all'utente
1424 una serie di possibili diverse interfacce nelle modalità di passaggio degli
1425 argomenti all'esecuzione del nuovo programma. I loro prototipi sono:
1426
1427 \begin{funcproto}{
1428 \fhead{unistd.h}
1429 \fdecl{int execl(const char *path, const char *arg, ...)}
1430 \fdecl{int execv(const char *path, char *const argv[])}
1431 \fdecl{int execle(const char *path, const char *arg, ..., char * const envp[])}
1432 \fdecl{int execlp(const char *file, const char *arg, ...)}
1433 \fdecl{int execvp(const char *file, char *const argv[])}
1434 \fdesc{Eseguono un programma.}
1435 }
1436 {Le funzioni ritornano solo in caso di errore, restituendo $-1$, i codici di
1437   errore sono gli stessi di \func{execve}.
1438 }
1439 \end{funcproto}
1440
1441 Tutte le funzioni mettono in esecuzione nel processo corrente il programma
1442 indicati nel primo argomento. Gli argomenti successivi consentono di
1443 specificare gli argomenti e l'ambiente che saranno ricevuti dal nuovo
1444 processo. Per capire meglio le differenze fra le funzioni della famiglia si può
1445 fare riferimento allo specchietto riportato in
1446 tab.~\ref{tab:proc_exec_scheme}. La relazione fra le funzioni è invece
1447 illustrata in fig.~\ref{fig:proc_exec_relat}.
1448
1449 \begin{table}[!htb]
1450   \footnotesize
1451   \centering
1452   \begin{tabular}[c]{|l|c|c|c||c|c|c|}
1453     \hline
1454     \multicolumn{1}{|c|}{\textbf{Caratteristiche}} &
1455     \multicolumn{6}{|c|}{\textbf{Funzioni}} \\
1456     \hline
1457     &\func{execl}\texttt{ }&\func{execlp}&\func{execle}
1458     &\func{execv}\texttt{ }& \func{execvp}& \func{execve} \\
1459     \hline
1460     \hline
1461     argomenti a lista    &$\bullet$&$\bullet$&$\bullet$&&& \\
1462     argomenti a vettore  &&&&$\bullet$&$\bullet$&$\bullet$\\
1463     \hline
1464     filename completo     &$\bullet$&&$\bullet$&$\bullet$&&$\bullet$\\
1465     ricerca su \var{PATH} &&$\bullet$&&&$\bullet$& \\
1466     \hline
1467     ambiente a vettore   &&&$\bullet$&&&$\bullet$ \\
1468     uso di \var{environ} &$\bullet$&$\bullet$&&$\bullet$&$\bullet$& \\
1469     \hline
1470   \end{tabular}
1471   \caption{Confronto delle caratteristiche delle varie funzioni della
1472     famiglia \func{exec}.}
1473   \label{tab:proc_exec_scheme}
1474 \end{table}
1475
1476 La prima differenza fra le funzioni riguarda le modalità di passaggio dei
1477 valori che poi andranno a costituire gli argomenti a linea di comando (cioè i
1478 valori di \param{argv} e \param{argc} visti dalla funzione \code{main} del
1479 programma chiamato). Queste modalità sono due e sono riassunte dagli mnemonici
1480 ``\texttt{v}'' e ``\texttt{l}'' che stanno rispettivamente per \textit{vector}
1481 e \textit{list}.
1482
1483 Nel primo caso gli argomenti sono passati tramite il vettore di puntatori
1484 \var{argv[]} a stringhe terminate con zero che costituiranno gli argomenti a
1485 riga di comando, questo vettore \emph{deve} essere terminato da un puntatore
1486 nullo. Nel secondo caso le stringhe degli argomenti sono passate alla funzione
1487 come lista di puntatori, nella forma:
1488 \includecodesnip{listati/char_list.c}
1489 che deve essere terminata da un puntatore nullo.  In entrambi i casi vale la
1490 convenzione che il primo argomento (\var{arg0} o \var{argv[0]}) viene usato
1491 per indicare il nome del file che contiene il programma che verrà eseguito.
1492
1493 \begin{figure}[!htb]
1494   \centering \includegraphics[width=10cm]{img/exec_rel}
1495   \caption{La interrelazione fra le sei funzioni della famiglia \func{exec}.}
1496   \label{fig:proc_exec_relat}
1497 \end{figure}
1498
1499 La seconda differenza fra le funzioni riguarda le modalità con cui si
1500 specifica il programma che si vuole eseguire. Con lo mnemonico ``\texttt{p}''
1501 si indicano le due funzioni che replicano il comportamento della shell nello
1502 specificare il comando da eseguire; quando l'argomento \param{file} non
1503 contiene una ``\texttt{/}'' esso viene considerato come un nome di programma,
1504 e viene eseguita automaticamente una ricerca fra i file presenti nella lista
1505 di directory specificate dalla variabile di ambiente \envvar{PATH}. Il file
1506 che viene posto in esecuzione è il primo che viene trovato. Se si ha un errore
1507 relativo a permessi di accesso insufficienti (cioè l'esecuzione della
1508 sottostante \func{execve} ritorna un \errcode{EACCES}), la ricerca viene
1509 proseguita nelle eventuali ulteriori directory indicate in \envvar{PATH}; solo
1510 se non viene trovato nessun altro file viene finalmente restituito
1511 \errcode{EACCES}.  Le altre quattro funzioni si limitano invece a cercare di
1512 eseguire il file indicato dall'argomento \param{path}, che viene interpretato
1513 come il \textit{pathname} del programma.
1514
1515 La terza differenza è come viene passata la lista delle variabili di ambiente.
1516 Con lo mnemonico ``\texttt{e}'' vengono indicate quelle funzioni che
1517 necessitano di un vettore di parametri \var{envp[]} analogo a quello usato per
1518 gli argomenti a riga di comando (terminato quindi da un \val{NULL}), le altre
1519 usano il valore della variabile \var{environ} (vedi
1520 sez.~\ref{sec:proc_environ}) del processo di partenza per costruire
1521 l'ambiente.
1522
1523 Oltre a mantenere lo stesso \ids{PID}, il nuovo programma fatto partire da una
1524 delle funzioni della famiglia \func{exec} mantiene la gran parte delle
1525 proprietà del processo chiamante; una lista delle più significative è la
1526 seguente:
1527 \begin{itemize*}
1528 \item il \textit{process id} (\ids{PID}) ed il \textit{parent process id}
1529   (\ids{PPID});
1530 \item l'\textsl{user-ID reale}, il \textit{group-ID reale} ed i
1531   \textsl{group-ID supplementari} (vedi sez.~\ref{sec:proc_access_id});
1532 \item la directory radice e la \index{directory~di~lavoro} directory di lavoro
1533   corrente (vedi sez.~\ref{sec:file_work_dir});
1534 \item la maschera di creazione dei file \itindex{umask} (\textit{umask}, vedi
1535   sez.~\ref{sec:file_perm_management}) ed i \textit{lock} sui file (vedi
1536   sez.~\ref{sec:file_locking});
1537 \item il valori di \textit{nice}, le priorità real-time e le affinità di
1538   processore (vedi sez.~\ref{sec:proc_sched_stand};
1539   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
1540 \item il \textit{session ID} (\acr{sid}) ed il \itindex{process~group}
1541   \textit{process group ID} (\acr{pgid}), vedi sez.~\ref{sec:sess_proc_group};
1542 \item il terminale di controllo (vedi sez.~\ref{sec:sess_ctrl_term});
1543 \item il tempo restante ad un allarme (vedi sez.~\ref{sec:sig_alarm_abort});
1544 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
1545 \item i valori delle variabili \var{tms\_utime}, \var{tms\_stime};
1546   \var{tms\_cutime}, \var{tms\_ustime} (vedi sez.~\ref{sec:sys_cpu_times});
1547 % TODO ===========Importante=============
1548 % TODO questo sotto è incerto, verificare
1549 % TODO ===========Importante=============
1550 \item la \index{maschera~dei~segnali} maschera dei segnali (si veda
1551   sez.~\ref{sec:sig_sigmask}).
1552 \end{itemize*}
1553
1554 Una serie di proprietà del processo originale, che non avrebbe senso mantenere
1555 in un programma che esegue un codice completamente diverso in uno spazio di
1556 indirizzi totalmente indipendente e ricreato da zero, vengono perse con
1557 l'esecuzione di una \func{exec}. Lo standard POSIX.1-2001 prevede che le
1558 seguenti proprietà non vengano preservate:
1559 \begin{itemize*}
1560 \item l'insieme dei segnali pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che
1561   viene cancellato;
1562 \item gli eventuali stack alternativi per i segnali (vedi
1563   sez.~\ref{sec:sig_specific_features});
1564 \item i \textit{directory stream} (vedi sez.~\ref{sec:file_dir_read}), che
1565   vengono chiusi;
1566 \item le mappature dei file in memoria (vedi sez.~\ref{sec:file_memory_map});
1567 \item i segmenti di memoria condivisa SysV (vedi sez.~\ref{sec:ipc_sysv_shm})
1568   e POSIX (vedi sez.~\ref{sec:ipc_posix_shm});
1569 \item i \itindex{memory~locking} \textit{memory lock} (vedi
1570   sez.~\ref{sec:proc_mem_lock});
1571 \item le funzioni registrate all'uscita (vedi sez.~\ref{sec:proc_atexit});
1572 \item i semafori e le code di messaggi POSIX (vedi
1573   sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq});
1574 \item i timer POSIX (vedi sez.~\ref{sec:sig_timer_adv}).
1575 \end{itemize*}
1576
1577 Inoltre i segnali che sono stati impostati per essere ignorati nel processo
1578 chiamante mantengono la stessa impostazione pure nel nuovo programma, ma tutti
1579 gli altri segnali, ed in particolare quelli per i quali è stato installato un
1580 gestore vengono impostati alla loro azione predefinita (vedi
1581 sez.~\ref{sec:sig_gen_beha}). Un caso speciale è il segnale \signal{SIGCHLD}
1582 che, quando impostato a \const{SIG\_IGN}, potrebbe anche essere reimpostato a
1583 \const{SIG\_DFL}. Lo standard POSIX.1-2001 prevede che questo comportamento
1584 sia deciso dalla singola implementazione, quella di Linux è di non modificare
1585 l'impostazione precedente.
1586
1587 Oltre alle precedenti, che sono completamente generali e disponibili anche su
1588 altri sistemi unix-like, esistono altre proprietà dei processi, attinenti alle
1589 caratteristiche specifiche di Linux, che non vengono preservate
1590 nell'esecuzione della funzione \func{exec}, queste sono:
1591 \begin{itemize*}
1592 \item le operazioni di I/O asincrono (vedi sez.~\ref{sec:file_asyncronous_io})
1593   pendenti vengono cancellate;
1594 \item le \itindex{capabilities} \textit{capabilities} vengono modificate come
1595   illustrato in sez.~\ref{sec:proc_capabilities};
1596 \item tutti i \itindex{thread} \textit{thread} tranne il chiamante (vedi
1597   sez.~\ref{sec:thread_xxx}) sono cancellati e tutti gli oggetti ad essi
1598   relativi (vedi sez.~\ref{sec:thread_xxx}) rimossi;
1599 \item viene impostato il flag \const{PR\_SET\_DUMPABLE} di \func{prctl} (vedi
1600   sez.~\ref{sec:process_prctl}) a meno che il programma da eseguire non sia
1601   \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} (vedi
1602   sez.~\ref{sec:proc_access_id});
1603 \item il flag \const{PR\_SET\_KEEPCAPS} di \func{prctl} (vedi
1604   sez.~\ref{sec:process_prctl}) viene cancellato;
1605 \item il nome del processo viene impostato al nome del file contenente il
1606   programma messo in esecuzione;
1607 \item il segnale di terminazione viene reimpostato a \signal{SIGCHLD};
1608 \item l'ambiente viene reinizializzato impostando le variabili attinenti alla
1609   localizzazione al valore di default POSIX.
1610 \end{itemize*}
1611
1612 La gestione dei file aperti nel passaggio al nuovo programma lanciato con
1613 \func{exec} dipende dal valore che ha il flag di \itindex{close-on-exec}
1614 \textit{close-on-exec} (vedi sez.~\ref{sec:file_fcntl_ioctl}) per ciascun
1615 \textit{file descriptor}. I file per cui è impostato vengono chiusi, tutti gli
1616 altri file restano aperti. Questo significa che il comportamento predefinito è
1617 che i file restano aperti attraverso una \func{exec}, a meno di una chiamata
1618 esplicita a \func{fcntl} che imposti il suddetto flag.  Per le directory, lo
1619 standard POSIX.1 richiede che esse vengano chiuse attraverso una \func{exec},
1620 in genere questo è fatto dalla funzione \func{opendir} (vedi
1621 sez.~\ref{sec:file_dir_read}) che effettua da sola l'impostazione del flag di
1622 \itindex{close-on-exec} \textit{close-on-exec} sulle directory che apre, in
1623 maniera trasparente all'utente.
1624
1625 Il comportamento della funzione in relazione agli identificatori relativi al
1626 controllo di accesso verrà trattato in dettaglio in sez.~\ref{sec:proc_perms},
1627 qui è sufficiente anticipare (si faccia riferimento a
1628 sez.~\ref{sec:proc_access_id} per la definizione di questi identificatori)
1629 come l'\textsl{user-ID reale} ed il \textsl{group-ID reale} restano sempre gli
1630 stessi, mentre l'\textsl{user-ID salvato} ed il \textsl{group-ID salvato}
1631 vengono impostati rispettivamente all'\textsl{user-ID effettivo} ed il
1632 \textsl{group-ID effettivo}. Questi ultimi normalmente non vengono modificati,
1633 a meno che il file di cui viene chiesta l'esecuzione non abbia o il
1634 \itindex{suid~bit} \acr{suid} bit o lo \itindex{sgid~bit} \acr{sgid} bit
1635 impostato, in questo caso l'\textsl{user-ID effettivo} ed il \textsl{group-ID
1636   effettivo} vengono impostati rispettivamente all'utente o al gruppo cui il
1637 file appartiene.
1638
1639 Se il file da eseguire è in formato \emph{a.out} e necessita di librerie
1640 condivise, viene lanciato il \textit{linker} dinamico \cmd{/lib/ld.so} prima
1641 del programma per caricare le librerie necessarie ed effettuare il link
1642 dell'eseguibile.\footnote{il formato è ormai in completo disuso, per cui è
1643   molto probabile che non il relativo supporto non sia disponibile.} Se il
1644 programma è in formato ELF per caricare le librerie dinamiche viene usato
1645 l'interprete indicato nel segmento \const{PT\_INTERP} previsto dal formato
1646 stesso, in genere questo è \sysfile{/lib/ld-linux.so.1} per programmi
1647 collegati con la \acr{libc5}, e \sysfile{/lib/ld-linux.so.2} per programmi
1648 collegati con la \acr{glibc}.
1649
1650 Infine nel caso il programma che si vuole eseguire sia uno script e non un
1651 binario, questo deve essere un file di testo che deve iniziare con una linea
1652 nella forma:
1653 \begin{Example}
1654 #!/path/to/interpreter [argomenti]
1655 \end{Example}
1656 dove l'interprete indicato deve essere un eseguibile binario e non un altro
1657 script, che verrà chiamato come se si fosse eseguito il comando
1658 \cmd{interpreter [argomenti] filename}.
1659
1660 Si tenga presente che con Linux quanto viene scritto come \texttt{argomenti}
1661 viene passato all'interprete come un unico argomento con una unica stringa di
1662 lunghezza massima di 127 caratteri e se questa dimensione viene ecceduta la
1663 stringa viene troncata; altri Unix hanno dimensioni massime diverse, e diversi
1664 comportamenti, ad esempio FreeBSD esegue la scansione della riga e la divide
1665 nei vari argomenti e se è troppo lunga restituisce un errore di
1666 \const{ENAMETOOLONG}.\footnote{una comparazione dei vari comportamenti sui
1667   diversi sistemi unix-like si trova su
1668   \url{http://www.in-ulm.de/~mascheck/various/shebang/}.}
1669
1670 Con la famiglia delle \func{exec} si chiude il novero delle funzioni su cui è
1671 basata la gestione tradizionale dei processi in Unix: con \func{fork} si crea
1672 un nuovo processo, con \func{exec} si lancia un nuovo programma, con
1673 \func{exit} e \func{wait} si effettua e verifica la conclusione dei
1674 processi. Tutte le altre funzioni sono ausiliarie e servono per la lettura e
1675 l'impostazione dei vari parametri connessi ai processi.
1676
1677
1678
1679 \section{Il controllo di accesso}
1680 \label{sec:proc_perms}
1681
1682 In questa sezione esamineremo le problematiche relative al controllo di
1683 accesso dal punto di vista dei processi; vedremo quali sono gli identificatori
1684 usati, come questi possono essere modificati nella creazione e nel lancio di
1685 nuovi processi, le varie funzioni per la loro manipolazione diretta e tutte le
1686 problematiche connesse ad una gestione accorta dei privilegi.
1687
1688
1689 \subsection{Gli identificatori del controllo di accesso}
1690 \label{sec:proc_access_id}
1691
1692 Come accennato in sez.~\ref{sec:intro_multiuser} il modello base\footnote{in
1693   realtà già esistono estensioni di questo modello base, che lo rendono più
1694   flessibile e controllabile, come le \itindex{capabilities}
1695   \textit{capabilities} illustrate in sez.~\ref{sec:proc_capabilities}, le ACL
1696   per i file (vedi sez.~\ref{sec:file_ACL}) o il
1697   \itindex{Mandatory~Access~Control~(MAC)} \textit{Mandatory Access Control}
1698   di \index{SELinux} SELinux; inoltre basandosi sul lavoro effettuato con
1699   SELinux, a partire dal kernel 2.5.x, è iniziato lo sviluppo di una
1700   infrastruttura di sicurezza, i \itindex{Linux~Security~Modules}
1701   \textit{Linux Security Modules}, o LSM, in grado di fornire diversi agganci
1702   a livello del kernel per modularizzare tutti i possibili controlli di
1703   accesso, cosa che ha permesso di realizzare diverse alternative a
1704   \index{SELinux} SELinux.} di sicurezza di un sistema unix-like è fondato sui
1705 concetti di utente e gruppo, e sulla separazione fra l'amministratore
1706 (\textsl{root}, detto spesso anche \textit{superuser}) che non è sottoposto a
1707 restrizioni, ed il resto degli utenti, per i quali invece vengono effettuati i
1708 vari controlli di accesso.
1709
1710 Abbiamo già accennato come il sistema associ ad ogni utente e gruppo due
1711 identificatori univoci, lo \itindex{User~ID~(PID)} \textsl{User-ID}
1712 (abbreviato in \ids{UID}) ed il \itindex{Group~ID~(PID)} \textsl{Group-ID}
1713 (abbreviato in \ids{GID}). Questi servono al kernel per identificare uno
1714 specifico utente o un gruppo di utenti, per poi poter controllare che essi
1715 siano autorizzati a compiere le operazioni richieste.  Ad esempio in
1716 sez.~\ref{sec:file_access_control} vedremo come ad ogni file vengano associati
1717 un utente ed un gruppo (i suoi \textsl{proprietari}, indicati appunto tramite
1718 un \ids{UID} ed un \ids{GID}) che vengono controllati dal kernel nella
1719 gestione dei permessi di accesso.
1720
1721 Dato che tutte le operazioni del sistema vengono compiute dai processi, è
1722 evidente che per poter implementare un controllo sulle operazioni occorre
1723 anche poter identificare chi è che ha lanciato un certo programma, e pertanto
1724 anche a ciascun processo dovrà essere associato un utente e un gruppo.
1725
1726 Un semplice controllo di una corrispondenza fra identificativi non garantisce
1727 però sufficiente flessibilità per tutti quei casi in cui è necessario poter
1728 disporre di privilegi diversi, o dover impersonare un altro utente per un
1729 limitato insieme di operazioni. Per questo motivo in generale tutti i sistemi
1730 unix-like prevedono che i processi abbiano almeno due gruppi di
1731 identificatori, chiamati rispettivamente \textit{real} ed \textit{effective}
1732 (cioè \textsl{reali} ed \textsl{effettivi}). Nel caso di Linux si aggiungono
1733 poi altri due gruppi, il \textit{saved} (\textsl{salvati}) ed il
1734 \textit{filesystem} (\textsl{di filesystem}), secondo la situazione illustrata
1735 in tab.~\ref{tab:proc_uid_gid}.
1736
1737 \begin{table}[htb]
1738   \footnotesize
1739   \centering
1740   \begin{tabular}[c]{|c|c|l|p{7cm}|}
1741     \hline
1742     \textbf{Suffisso} & \textbf{Gruppo} & \textbf{Denominazione}
1743                                         & \textbf{Significato} \\
1744     \hline
1745     \hline
1746     \texttt{uid} & \textit{real} & \textsl{user-ID reale}
1747                  & Indica l'utente che ha lanciato il programma.\\
1748     \texttt{gid} & '' &\textsl{group-ID reale}
1749                  & Indica il gruppo principale dell'utente che ha lanciato
1750                    il programma.\\
1751     \hline
1752     \texttt{euid}& \textit{effective} &\textsl{user-ID effettivo}
1753                  & Indica l'utente usato nel controllo di accesso.\\
1754     \texttt{egid}& '' & \textsl{group-ID effettivo}
1755                  & Indica il gruppo usato nel controllo di accesso.\\
1756     --           & -- & \textsl{group-ID supplementari}
1757                  & Indicano gli ulteriori gruppi cui l'utente appartiene.\\
1758     \hline
1759     --           & \textit{saved} & \textsl{user-ID salvato}
1760                  & Mantiene una copia dell'\acr{euid} iniziale.\\
1761     --           & '' & \textsl{group-ID salvato}
1762                  & Mantiene una copia dell'\acr{egid} iniziale.\\
1763     \hline
1764     \texttt{fsuid}& \textit{filesystem} &\textsl{user-ID di filesystem}
1765                  & Indica l'utente effettivo per l'accesso al filesystem. \\
1766     \texttt{fsgid}& '' & \textsl{group-ID di filesystem}
1767                  & Indica il gruppo effettivo per l'accesso al filesystem.\\
1768     \hline
1769   \end{tabular}
1770   \caption{Identificatori di utente e gruppo associati a ciascun processo con
1771     indicazione dei suffissi usati dalle varie funzioni di manipolazione.}
1772   \label{tab:proc_uid_gid}
1773 \end{table}
1774
1775 Al primo gruppo appartengono l'\ids{UID} \textsl{reale} ed il \ids{GID}
1776 \textsl{reale}: questi vengono impostati al login ai valori corrispondenti
1777 all'utente con cui si accede al sistema (e relativo gruppo principale).
1778 Servono per l'identificazione dell'utente e normalmente non vengono mai
1779 cambiati. In realtà vedremo (in sez.~\ref{sec:proc_setuid}) che è possibile
1780 modificarli, ma solo ad un processo che abbia i privilegi di amministratore;
1781 questa possibilità è usata proprio dal programma \cmd{login} che, una volta
1782 completata la procedura di autenticazione, lancia una shell per la quale
1783 imposta questi identificatori ai valori corrispondenti all'utente che entra
1784 nel sistema.
1785
1786 Al secondo gruppo appartengono l'\ids{UID} \textsl{effettivo} e il \ids{GID}
1787 \textsl{effettivo}, a cui si aggiungono gli eventuali \ids{GID}
1788 \textsl{supplementari} dei gruppi dei quali l'utente fa parte.  Questi sono
1789 invece gli identificatori usati nelle verifiche dei permessi del processo e
1790 per il controllo di accesso ai file (argomento affrontato in dettaglio in
1791 sez.~\ref{sec:file_perm_overview}).
1792
1793 Questi identificatori normalmente sono identici ai corrispondenti del gruppo
1794 \textit{real} tranne nel caso in cui, come accennato in
1795 sez.~\ref{sec:proc_exec}, il programma che si è posto in esecuzione abbia i
1796 bit \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} impostati
1797 (il significato di questi bit è affrontato in dettaglio in
1798 sez.~\ref{sec:file_special_perm}). In questo caso essi saranno impostati
1799 all'utente e al gruppo proprietari del file. Questo consente, per programmi in
1800 cui ci sia questa necessità, di dare a qualunque utente i privilegi o i
1801 permessi di un altro, compreso l'amministratore.
1802
1803 Come nel caso del \ids{PID} e del \ids{PPID}, anche tutti questi
1804 identificatori possono essere ottenuti da un programma attraverso altrettante
1805 funzioni di sistema dedicate alla loro lettura, queste sono \funcd{getuid},
1806 \funcd{geteuid}, \funcd{getgid} e \funcd{getegid}, ed i loro prototipi sono:
1807
1808 \begin{funcproto}{
1809 \fhead{unistd.h}
1810 \fhead{sys/types.h}
1811 \fdecl{uid\_t getuid(void)}
1812 \fdesc{Legge l'\ids{UID} reale del processo corrente.}
1813 \fdecl{uid\_t geteuid(void)}
1814 \fdesc{Legge l'\ids{UID} effettivo del processo corrente.}
1815 \fdecl{gid\_t getgid(void)}
1816 \fdesc{Legge il \ids{GID} reale del processo corrente.}
1817 \fdecl{gid\_t getegid(void)}
1818 \fdesc{Legge il \ids{GID} effettivo del processo corrente.}
1819 }
1820 {Le funzioni ritornano i rispettivi identificativi del processo corrente, e
1821   non sono previste condizioni di errore.}
1822 \end{funcproto}
1823
1824 In generale l'uso di privilegi superiori, ottenibile con un \ids{UID}
1825 \textsl{effettivo} diverso da quello reale, deve essere limitato il più
1826 possibile, per evitare abusi e problemi di sicurezza, per questo occorre anche
1827 un meccanismo che consenta ad un programma di rilasciare gli eventuali
1828 maggiori privilegi necessari, una volta che si siano effettuate le operazioni
1829 per i quali erano richiesti, e a poterli eventualmente recuperare in caso
1830 servano di nuovo.
1831
1832 Questo in Linux viene fatto usando altri due gruppi di identificatori, il
1833 \textit{saved} ed il \textit{filesystem}. Il primo gruppo è lo stesso usato in
1834 SVr4, e previsto dallo standard POSIX quando è definita la costante
1835 \macro{\_POSIX\_SAVED\_IDS},\footnote{in caso si abbia a cuore la portabilità
1836   del programma su altri Unix è buona norma controllare sempre la
1837   disponibilità di queste funzioni controllando se questa costante è
1838   definita.} il secondo gruppo è specifico di Linux e viene usato per
1839 migliorare la sicurezza con NFS (il \textit{Network File System}, protocollo
1840 che consente di accedere ai file via rete).
1841
1842 L'\ids{UID} \textsl{salvato} ed il \ids{GID} \textsl{salvato} sono copie
1843 dell'\ids{UID} \textsl{effettivo} e del \ids{GID} \textsl{effettivo} del
1844 processo padre, e vengono impostati dalla funzione \func{exec} all'avvio del
1845 processo, come copie dell'\ids{UID} \textsl{effettivo} e del \ids{GID}
1846 \textsl{effettivo} dopo che questi sono stati impostati tenendo conto di
1847 eventuali \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid}.  Essi
1848 quindi consentono di tenere traccia di quale fossero utente e gruppo effettivi
1849 all'inizio dell'esecuzione di un nuovo programma.
1850
1851 L'\ids{UID} \textsl{di filesystem} e il \ids{GID} \textsl{di filesystem} sono
1852 un'estensione introdotta in Linux per rendere più sicuro l'uso di NFS
1853 (torneremo sull'argomento in sez.~\ref{sec:proc_setuid}). Essi sono una
1854 replica dei corrispondenti identificatori del gruppo \textit{effective}, ai
1855 quali si sostituiscono per tutte le operazioni di verifica dei permessi
1856 relativi ai file (trattate in sez.~\ref{sec:file_perm_overview}).  Ogni
1857 cambiamento effettuato sugli identificatori effettivi viene automaticamente
1858 riportato su di essi, per cui in condizioni normali si può tranquillamente
1859 ignorarne l'esistenza, in quanto saranno del tutto equivalenti ai precedenti.
1860
1861
1862 \subsection{Le funzioni di gestione degli identificatori dei processi}
1863 \label{sec:proc_setuid}
1864
1865 Le funzioni di sistema più comuni che vengono usate per cambiare identità
1866 (cioè utente e gruppo di appartenenza) ad un processo, e che come accennato in
1867 sez.~\ref{sec:proc_access_id} seguono la semantica POSIX che prevede
1868 l'esistenza dell'\ids{UID} salvato e del \ids{GID} salvato, sono
1869 rispettivamente \funcd{setuid} e \funcd{setgid}; i loro prototipi sono:
1870
1871 \begin{funcproto}{
1872 \fhead{unistd.h}
1873 \fhead{sys/types.h}
1874 \fdecl{int setuid(uid\_t uid)}
1875 \fdesc{Imposta l'\ids{UID} del processo corrente.}
1876 \fdecl{int setgid(gid\_t gid)}
1877 \fdesc{Imposta il \ids{GID} del processo corrente.}
1878 }
1879 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1880 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
1881 }
1882 \end{funcproto}
1883
1884 Il funzionamento di queste due funzioni è analogo, per cui considereremo solo
1885 la prima, la seconda si comporta esattamente allo stesso modo facendo
1886 riferimento al \ids{GID} invece che all'\ids{UID}.  Gli eventuali \ids{GID}
1887 supplementari non vengono modificati.
1888
1889 L'effetto della chiamata è diverso a seconda dei privilegi del processo; se
1890 l'\ids{UID} effettivo è zero (cioè è quello dell'amministratore di sistema)
1891 allora tutti gli identificatori (\textit{real}, \textit{effective} e
1892 \textit{saved}) vengono impostati al valore specificato da \param{uid},
1893 altrimenti viene impostato solo l'\ids{UID} effettivo, e soltanto se il valore
1894 specificato corrisponde o all'\ids{UID} reale o all'\ids{UID} salvato. Negli
1895 altri casi viene segnalato un errore con \errcode{EPERM}.
1896
1897 Come accennato l'uso principale di queste funzioni è quello di poter
1898 consentire ad un programma con i bit \itindex{suid~bit} \acr{suid} o
1899 \itindex{sgid~bit} \acr{sgid} impostati (vedi
1900 sez.~\ref{sec:file_special_perm}) di riportare l'\ids{UID} effettivo a quello
1901 dell'utente che ha lanciato il programma, effettuare il lavoro che non
1902 necessita di privilegi aggiuntivi, ed eventualmente tornare indietro.
1903
1904 Come esempio per chiarire l'uso di queste funzioni prendiamo quello con cui
1905 viene gestito l'accesso al file \sysfile{/var/run/utmp}.  In questo file viene
1906 registrato chi sta usando il sistema al momento corrente; chiaramente non può
1907 essere lasciato aperto in scrittura a qualunque utente, che potrebbe
1908 falsificare la registrazione. Per questo motivo questo file (e l'analogo
1909 \sysfile{/var/log/wtmp} su cui vengono registrati login e logout) appartengono
1910 ad un gruppo dedicato (in genere \acr{utmp}) ed i programmi che devono
1911 accedervi (ad esempio tutti i programmi di terminale in X, o il programma
1912 \cmd{screen} che crea terminali multipli su una console) appartengono a questo
1913 gruppo ed hanno il bit \acr{sgid} impostato.
1914
1915 Quando uno di questi programmi (ad esempio \cmd{xterm}) viene lanciato, la
1916 situazione degli identificatori è la seguente:
1917 \begin{eqnarray*}
1918   \label{eq:1}
1919   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (del chiamante)} \\
1920   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1921   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp}}
1922 \end{eqnarray*}
1923 in questo modo, dato che il \textsl{group-ID effettivo} è quello giusto, il
1924 programma può accedere a \sysfile{/var/run/utmp} in scrittura ed aggiornarlo.
1925 A questo punto il programma può eseguire una \code{setgid(getgid())} per
1926 impostare il \textsl{group-ID effettivo} a quello dell'utente (e dato che il
1927 \textsl{group-ID reale} corrisponde la funzione avrà successo), in questo modo
1928 non sarà possibile lanciare dal terminale programmi che modificano detto file,
1929 in tal caso infatti la situazione degli identificatori sarebbe:
1930 \begin{eqnarray*}
1931   \label{eq:2}
1932   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (invariato)}  \\
1933   \textsl{group-ID effettivo}  &=& \textrm{\ids{GID}} \\
1934   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1935 \end{eqnarray*}
1936 e ogni processo lanciato dal terminale avrebbe comunque \ids{GID} come
1937 \textsl{group-ID effettivo}. All'uscita dal terminale, per poter di nuovo
1938 aggiornare lo stato di \sysfile{/var/run/utmp} il programma eseguirà una
1939 \code{setgid(utmp)} (dove \var{utmp} è il valore numerico associato al gruppo
1940 \acr{utmp}, ottenuto ad esempio con una precedente \func{getegid}), dato che
1941 in questo caso il valore richiesto corrisponde al \textsl{group-ID salvato} la
1942 funzione avrà successo e riporterà la situazione a:
1943 \begin{eqnarray*}
1944   \label{eq:3}
1945   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (invariato)}  \\
1946   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1947   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1948 \end{eqnarray*}
1949 consentendo l'accesso a \sysfile{/var/run/utmp}.
1950
1951 Occorre però tenere conto che tutto questo non è possibile con un processo con
1952 i privilegi di amministratore, in tal caso infatti l'esecuzione di una
1953 \func{setuid} comporta il cambiamento di tutti gli identificatori associati al
1954 processo, rendendo impossibile riguadagnare i privilegi di amministratore.
1955 Questo comportamento è corretto per l'uso che ne fa \cmd{login} una volta che
1956 crea una nuova shell per l'utente, ma quando si vuole cambiare soltanto
1957 l'\ids{UID} effettivo del processo per cedere i privilegi occorre
1958 ricorrere ad altre funzioni.
1959
1960 Le due funzioni di sistema \funcd{setreuid} e \funcd{setregid} derivano da BSD
1961 che, non supportando (almeno fino alla versione 4.3+BSD) gli identificatori
1962 del gruppo \textit{saved}, le usa per poter scambiare fra di loro
1963 \textit{effective} e \textit{real}; i rispettivi prototipi sono:
1964
1965 \begin{funcproto}{
1966 \fhead{unistd.h}
1967 \fhead{sys/types.h}
1968 \fdecl{int setreuid(uid\_t ruid, uid\_t euid)}
1969 \fdesc{Imposta \ids{UID} reale e \ids{UID} effettivo del processo corrente.}
1970 \fdecl{int setregid(gid\_t rgid, gid\_t egid)}
1971 \fdesc{Imposta \ids{GID} reale e \ids{GID} effettivo del processo corrente.}
1972 }
1973 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1974 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
1975 }
1976 \end{funcproto}
1977
1978 Le due funzioni sono identiche, quanto diremo per la prima riguardo gli
1979 \ids{UID} si applica alla seconda per i \ids{GID}.  La funzione
1980 \func{setreuid} imposta rispettivamente l'\ids{UID} reale e l'\ids{UID}
1981 effettivo del processo corrente ai valori specificati da \param{ruid}
1982 e \param{euid}.  I processi non privilegiati possono impostare solo valori che
1983 corrispondano o al loro \ids{UID} effettivo o a quello reale o a quello
1984 salvato, valori diversi comportano il fallimento della chiamata.
1985 L'amministratore invece può specificare un valore qualunque.  Specificando un
1986 argomento di valore $-1$ l'identificatore corrispondente verrà lasciato
1987 inalterato.
1988
1989 Con queste funzioni si possono scambiare fra loro gli \ids{UID} reale ed
1990 effettivo, e pertanto è possibile implementare un comportamento simile a
1991 quello visto in precedenza per \func{setgid}, cedendo i privilegi con un primo
1992 scambio, e recuperandoli, una volta eseguito il lavoro non privilegiato, con
1993 un secondo scambio.
1994
1995 In questo caso però occorre porre molta attenzione quando si creano nuovi
1996 processi nella fase intermedia in cui si sono scambiati gli identificatori, in
1997 questo caso infatti essi avranno un \ids{UID} reale privilegiato, che dovrà
1998 essere esplicitamente eliminato prima di porre in esecuzione un nuovo
1999 programma, occorrerà cioè eseguire un'altra chiamata dopo la \func{fork} e
2000 prima della \func{exec} per uniformare l'\ids{UID} reale a quello effettivo,
2001 perché in caso contrario il nuovo programma potrebbe a sua volta effettuare
2002 uno scambio e riottenere dei privilegi non previsti.
2003
2004 Lo stesso problema di propagazione dei privilegi ad eventuali processi figli
2005 si pone anche per l'\ids{UID} salvato. Ma la funzione \func{setreuid} deriva
2006 da un'implementazione di sistema che non ne prevede la presenza, e quindi non
2007 è possibile usarla per correggere la situazione come nel caso precedente. Per
2008 questo motivo in Linux tutte le volte che si imposta un qualunque valore
2009 diverso da quello dall'\ids{UID} reale corrente, l'\ids{UID} salvato viene
2010 automaticamente uniformato al valore dell'\ids{UID} effettivo.
2011
2012 Altre due funzioni di sistema, \funcd{seteuid} e \funcd{setegid}, sono
2013 un'estensione dello standard POSIX.1, ma sono comunque supportate dalla
2014 maggior parte degli Unix, esse vengono usate per cambiare gli identificatori
2015 del gruppo \textit{effective} ed i loro prototipi sono:
2016
2017 \begin{funcproto}{
2018 \fhead{unistd.h}
2019 \fhead{sys/types.h}
2020 \fdecl{int seteuid(uid\_t uid)}
2021 \fdesc{Imposta l'\ids{UID} effettivo del processo corrente.}
2022 \fdecl{int setegid(gid\_t gid)}
2023 \fdesc{Imposta il \ids{GID} effettivo del processo corrente.}
2024 }
2025 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2026 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
2027 }
2028 \end{funcproto}
2029
2030 Ancora una volta le due funzioni sono identiche, e quanto diremo per la prima
2031 riguardo gli \ids{UID} si applica allo stesso modo alla seconda per i
2032 \ids{GID}. Con \func{seteuid} gli utenti normali possono impostare l'\ids{UID}
2033 effettivo solo al valore dell'\ids{UID} reale o dell'\ids{UID} salvato,
2034 l'amministratore può specificare qualunque valore. Queste funzioni sono usate
2035 per permettere all'amministratore di impostare solo l'\ids{UID} effettivo,
2036 dato che l'uso normale di \func{setuid} comporta l'impostazione di tutti gli
2037 identificatori.
2038
2039 Le due funzioni di sistema \funcd{setresuid} e \funcd{setresgid} sono invece
2040 un'estensione introdotta in Linux (a partire dal kernel 2.1.44) e permettono
2041 un completo controllo su tutti e tre i gruppi di identificatori
2042 (\textit{real}, \textit{effective} e \textit{saved}), i loro prototipi sono:
2043
2044 \begin{funcproto}{
2045 \fhead{unistd.h}
2046 \fhead{sys/types.h}
2047 \fdecl{int setresuid(uid\_t ruid, uid\_t euid, uid\_t suid)}
2048 \fdesc{Imposta l'\ids{UID} reale, effettivo e salvato del processo corrente.}
2049 \fdecl{int setresgid(gid\_t rgid, gid\_t egid, gid\_t sgid)}
2050 \fdesc{Imposta il \ids{GID} reale, effettivo e salvato del processo corrente.}
2051 }
2052 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2053 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
2054 }
2055 \end{funcproto}
2056
2057 Di nuovo le due funzioni sono identiche e quanto detto per la prima riguardo
2058 gli \ids{UID} si applica alla seconda per i \ids{GID}.  La funzione
2059 \func{setresuid} imposta l'\ids{UID} reale, l'\ids{UID} effettivo e
2060 l'\ids{UID} salvato del processo corrente ai valori specificati
2061 rispettivamente dagli argomenti \param{ruid}, \param{euid} e \param{suid}.  I
2062 processi non privilegiati possono cambiare uno qualunque degli\ids{UID} solo
2063 ad un valore corrispondente o all'\ids{UID} reale, o a quello effettivo o a
2064 quello salvato, l'amministratore può specificare i valori che vuole. Un valore
2065 di $-1$ per un qualunque argomento lascia inalterato l'identificatore
2066 corrispondente.
2067
2068 Per queste funzioni di sistema esistono anche due controparti,
2069 \funcd{getresuid} e \funcd{getresgid},\footnote{le funzioni non sono standard,
2070   anche se appaiono in altri kernel, su Linux sono presenti dal kernel 2.1.44
2071   e con le versioni della \acr{glibc} a partire dalla 2.3.2, definendo la
2072   macro \macro{\_GNU\_SOURCE}.} che permettono di leggere in blocco i vari
2073 identificatori; i loro prototipi sono:
2074
2075 \begin{funcproto}{
2076 \fhead{unistd.h}
2077 \fhead{sys/types.h}
2078 \fdecl{int getresuid(uid\_t *ruid, uid\_t *euid, uid\_t *suid)}
2079 \fdesc{Legge l'\ids{UID} reale, effettivo e salvato del processo corrente.}
2080 \fdecl{int getresgid(gid\_t *rgid, gid\_t *egid, gid\_t *sgid)}
2081 \fdesc{Legge il \ids{GID} reale, effettivo e salvato del processo corrente.}
2082 }
2083 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2084   caso \var{errno} può assumere solo il valore \errcode{EFAULT} se gli
2085   indirizzi delle variabili di ritorno non sono validi.  }
2086 \end{funcproto}
2087
2088 Anche queste funzioni sono un'estensione specifica di Linux, e non richiedono
2089 nessun privilegio. I valori sono restituiti negli argomenti, che vanno
2090 specificati come puntatori (è un altro esempio di
2091 \itindex{value~result~argument} \textit{value result argument}). Si noti che
2092 queste funzioni sono le uniche in grado di leggere gli identificatori del
2093 gruppo \textit{saved}.
2094
2095 Infine le funzioni \func{setfsuid} e \func{setfsgid} servono per impostare gli
2096 identificatori del gruppo \textit{filesystem} che sono usati da Linux per il
2097 controllo dell'accesso ai file.  Come già accennato in
2098 sez.~\ref{sec:proc_access_id} Linux definisce questo ulteriore gruppo di
2099 identificatori, che in circostanze normali sono assolutamente equivalenti a
2100 quelli del gruppo \textit{effective}, dato che ogni cambiamento di questi
2101 ultimi viene immediatamente riportato su di essi.
2102
2103 C'è un solo caso in cui si ha necessità di introdurre una differenza fra gli
2104 identificatori dei gruppi \textit{effective} e \textit{filesystem}, ed è per
2105 ovviare ad un problema di sicurezza che si presenta quando si deve
2106 implementare un server NFS.
2107
2108 Il server NFS infatti deve poter cambiare l'identificatore con cui accede ai
2109 file per assumere l'identità del singolo utente remoto, ma se questo viene
2110 fatto cambiando l'\ids{UID} effettivo o l'\ids{UID} reale il server si espone
2111 alla ricezione di eventuali segnali ostili da parte dell'utente di cui ha
2112 temporaneamente assunto l'identità.  Cambiando solo l'\ids{UID} di filesystem
2113 si ottengono i privilegi necessari per accedere ai file, mantenendo quelli
2114 originari per quanto riguarda tutti gli altri controlli di accesso, così che
2115 l'utente non possa inviare segnali al server NFS.
2116
2117 Le due funzioni di sistema usate per cambiare questi identificatori sono
2118 \funcd{setfsuid} e \funcd{setfsgid}, ed ovviamente sono specifiche di Linux e
2119 non devono essere usate se si intendono scrivere programmi portabili; i loro
2120 prototipi sono:
2121
2122 \begin{funcproto}{
2123 \fhead{sys/fsuid.h}
2124 \fdecl{int setfsuid(uid\_t fsuid)}
2125 \fdesc{Imposta l'\ids{UID} di filesystem del processo corrente.}
2126 \fdecl{int setfsgid(gid\_t fsgid)}
2127 \fdesc{Legge il \ids{GID} di filesystem del processo corrente.}
2128 }
2129 {Le funzioni restituiscono il nuovo valore dell'identificativo in caso di
2130   successo e quello corrente per un errore, in questo caso non viene però
2131   impostato nessun codice di errore in \var{errno}.}
2132 \end{funcproto}
2133
2134 Le due funzioni sono analoghe ed usano il valore passato come argomento per
2135 effettuare l'impostazione dell'identificativo.  Le funzioni hanno successo
2136 solo se il processo chiamante ha i privilegi di amministratore o, per gli
2137 altri utenti, se il valore specificato coincide con uno dei di quelli del
2138 gruppo \textit{real}, \textit{effective} o \textit{saved}.
2139
2140
2141 \subsection{Le funzioni per la gestione dei gruppi associati a un processo}
2142 \label{sec:proc_setgroups}
2143
2144 Le ultime funzioni che esamineremo sono quelle che permettono di operare sui
2145 gruppi supplementari cui un utente può appartenere. Ogni processo può avere
2146 almeno \const{NGROUPS\_MAX} gruppi supplementari\footnote{il numero massimo di
2147   gruppi secondari può essere ottenuto con \func{sysconf} (vedi
2148   sez.~\ref{sec:sys_limits}), leggendo il parametro
2149   \texttt{\_SC\_NGROUPS\_MAX}.} in aggiunta al gruppo primario; questi vengono
2150 ereditati dal processo padre e possono essere cambiati con queste funzioni.
2151
2152 La funzione di sistema che permette di leggere i gruppi supplementari
2153 associati ad un processo è \funcd{getgroups}; questa funzione è definita nello
2154 standard POSIX.1, ed il suo prototipo è:
2155
2156 \begin{funcproto}{
2157 \fhead{sys/types.h}
2158 \fhead{unistd.h}
2159 \fdecl{int getgroups(int size, gid\_t list[])}
2160 \fdesc{Legge gli identificatori dei gruppi supplementari.}
2161 }
2162 {La funzione ritorna il numero di gruppi letti in caso di successo e $-1$ per
2163   un errore, nel qual caso \var{errno} assumerà uno dei valori:
2164 \begin{errlist}
2165 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2166 \item[\errcode{EINVAL}] il valore di \param{size} è diverso da zero ma
2167   minore del numero di gruppi supplementari del processo.
2168 \end{errlist}}
2169 \end{funcproto}
2170
2171 La funzione legge gli identificatori dei gruppi supplementari del processo sul
2172 vettore \param{list} che deve essere di dimensione pari a \param{size}. Non è
2173 specificato se la funzione inserisca o meno nella lista il \ids{GID} effettivo
2174 del processo. Se si specifica un valore di \param{size} uguale a $0$ allora
2175 l'argomento \param{list} non viene modificato, ma si ottiene il numero di
2176 gruppi supplementari.
2177
2178 Una seconda funzione, \funcd{getgrouplist}, può invece essere usata per
2179 ottenere tutti i gruppi a cui appartiene utente identificato per nome; il suo
2180 prototipo è:
2181
2182 \begin{funcproto}{
2183 \fhead{grp.h}
2184 \fdecl{int getgrouplist(const char *user, gid\_t group, gid\_t *groups, int
2185   *ngroups)}
2186 \fdesc{Legge i gruppi cui appartiene un utente.}
2187 }
2188 {La funzione ritorna il numero di gruppi ottenuto in caso di successo e $-1$
2189   per un errore, che avviene solo quando il numero di gruppi è maggiore di
2190   quelli specificati con \param{ngroups}.}
2191 \end{funcproto}
2192
2193 La funzione esegue una scansione del database dei gruppi (si veda
2194 sez.~\ref{sec:sys_user_group}) per leggere i gruppi supplementari dell'utente
2195 specificato per nome (e non con un \ids{UID}) nella stringa passata con
2196 l'argomento \param{user}. Ritorna poi nel vettore \param{groups} la lista dei
2197 \ids{GID} dei gruppi a cui l'utente appartiene. Si noti che \param{ngroups},
2198 che in ingresso deve indicare la dimensione di \param{group}, è passato come
2199 \itindex{value~result~argument} \textit{value result argument} perché, qualora
2200 il valore specificato sia troppo piccolo, la funzione ritorna $-1$, passando
2201 comunque indietro il numero dei gruppi trovati, in modo da poter ripetere la
2202 chiamata con un vettore di dimensioni adeguate.
2203
2204 Infine per impostare i gruppi supplementari di un processo ci sono due
2205 funzioni, che possono essere usate solo se si hanno i privilegi di
2206 amministratore.\footnote{e più precisamente se si ha la \itindex{capabilities}
2207   \textit{capability} \macro{CAP\_SETGID}.} La prima delle due è la funzione
2208 di sistema \funcd{setgroups},\footnote{la funzione è definita in BSD e SRv4,
2209   ma a differenza di \func{getgroups} non è stata inclusa in POSIX.1-2001, per
2210   poterla utilizzare deve essere definita la macro \macro{\_BSD\_SOURCE}.} ed
2211 il suo prototipo è:
2212
2213 \begin{funcproto}{
2214 \fhead{grp.h}
2215 \fdecl{int setgroups(size\_t size, gid\_t *list)}
2216 \fdesc{Imposta i gruppi supplementari del processo.}
2217 }
2218 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2219 caso \var{errno} assumerà uno dei valori:
2220 \begin{errlist}
2221 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2222 \item[\errcode{EINVAL}] il valore di \param{size} è maggiore del valore
2223     massimo consentito di gruppi supplementari.
2224 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2225 \end{errlist}}
2226 \end{funcproto}
2227
2228 La funzione imposta i gruppi supplementari del processo corrente ai valori
2229 specificati nel vettore passato con l'argomento \param{list}, di dimensioni
2230 date dall'argomento \param{size}. Il numero massimo di gruppi supplementari
2231 che si possono impostare è un parametro di sistema, che può essere ricavato
2232 con le modalità spiegate in sez.~\ref{sec:sys_characteristics}.
2233
2234 Se invece si vogliono impostare i gruppi supplementari del processo a quelli
2235 di un utente specifico, si può usare la funzione \funcd{initgroups} il cui
2236 prototipo è:
2237
2238 \begin{funcproto}{
2239 \fhead{sys/types.h}
2240 \fhead{grp.h}
2241 \fdecl{int initgroups(const char *user, gid\_t group)}
2242 \fdesc{Inizializza la lista dei gruppi supplementari.}
2243 }
2244 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2245 caso \var{errno} assumerà uno dei valori:
2246 \begin{errlist}
2247 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare lo spazio per
2248   informazioni dei gruppi.
2249 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2250 \end{errlist}}
2251 \end{funcproto}
2252
2253 La funzione esegue la scansione del database dei gruppi (usualmente
2254 \conffile{/etc/group}) cercando i gruppi di cui è membro l'utente \param{user}
2255 (di nuovo specificato per nome e non per \ids{UID}) con cui costruisce una
2256 lista di gruppi supplementari, a cui aggiunge anche
2257 \param{group}, infine imposta questa lista per il processo corrente usando
2258 \func{setgroups}.  Si tenga presente che sia \func{setgroups} che
2259 \func{initgroups} non sono definite nello standard POSIX.1 e che pertanto non
2260 è possibile utilizzarle quando si definisce \macro{\_POSIX\_SOURCE} o si
2261 compila con il flag \cmd{-ansi}, è pertanto meglio evitarle se si vuole
2262 scrivere codice portabile.
2263
2264
2265 \section{La gestione della priorità dei processi}
2266 \label{sec:proc_priority}
2267
2268 In questa sezione tratteremo più approfonditamente i meccanismi con il quale
2269 lo \itindex{scheduler} \textit{scheduler} assegna la CPU ai vari processi
2270 attivi.  In particolare prenderemo in esame i vari meccanismi con cui viene
2271 gestita l'assegnazione del tempo di CPU, ed illustreremo le varie funzioni di
2272 gestione. Tratteremo infine anche le altre priorità dei processi (come quelle
2273 per l'accesso a disco) divenute disponibili con i kernel più recenti.
2274
2275
2276 \subsection{I meccanismi di \textit{scheduling}}
2277 \label{sec:proc_sched}
2278
2279 \itindbeg{scheduler}
2280
2281 La scelta di un meccanismo che sia in grado di distribuire in maniera efficace
2282 il tempo di CPU per l'esecuzione dei processi è sempre una questione delicata,
2283 ed oggetto di numerose ricerche; in generale essa dipende in maniera
2284 essenziale anche dal tipo di utilizzo che deve essere fatto del sistema, per
2285 cui non esiste un meccanismo che sia valido per tutti gli usi.
2286
2287 La caratteristica specifica di un sistema multitasking come Linux è quella del
2288 cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
2289   multitasking}: questo significa che al contrario di altri sistemi (che usano
2290 invece il cosiddetto \itindex{cooperative~multitasking} \textit{cooperative
2291   multitasking}) non sono i singoli processi, ma il kernel stesso a decidere
2292 quando la CPU deve essere passata ad un altro processo. Come accennato in
2293 sez.~\ref{sec:proc_hierarchy} questa scelta viene eseguita da una sezione
2294 apposita del kernel, lo \textit{scheduler}, il cui scopo è quello di
2295 distribuire al meglio il tempo di CPU fra i vari processi.
2296
2297 La cosa è resa ancora più complicata dal fatto che con le architetture
2298 multi-processore si deve anche scegliere quale sia la CPU più opportuna da
2299 utilizzare.\footnote{nei processori moderni la presenza di ampie cache può
2300   rendere poco efficiente trasferire l'esecuzione di un processo da una CPU ad
2301   un'altra, per cui effettuare la migliore scelta fra le diverse CPU non è
2302   banale.}  Tutto questo comunque appartiene alle sottigliezze
2303 dell'implementazione del kernel; dal punto di vista dei programmi che girano
2304 in \textit{user space}, anche quando si hanno più processori (e dei processi
2305 che sono eseguiti davvero in contemporanea), le politiche di
2306 \textit{scheduling} riguardano semplicemente l'allocazione della risorsa
2307 \textsl{tempo di esecuzione}, la cui assegnazione sarà governata dai
2308 meccanismi di scelta delle priorità che restano gli stessi indipendentemente
2309 dal numero di processori.
2310
2311 Si tenga conto poi che i processi non devono solo eseguire del codice: ad
2312 esempio molto spesso saranno impegnati in operazioni di I/O, o potranno
2313 venire bloccati da un comando dal terminale, o sospesi per un certo periodo di
2314 tempo.  In tutti questi casi la CPU diventa disponibile ed è compito dello
2315 kernel provvedere a mettere in esecuzione un altro processo.
2316
2317 Tutte queste possibilità sono caratterizzate da un diverso \textsl{stato} del
2318 processo, in Linux un processo può trovarsi in uno degli stati riportati in
2319 tab.~\ref{tab:proc_proc_states}; ma soltanto i processi che sono nello stato
2320 \textit{runnable} concorrono per l'esecuzione. Questo vuol dire che, qualunque
2321 sia la sua priorità, un processo non potrà mai essere messo in esecuzione
2322 fintanto che esso si trova in uno qualunque degli altri stati.
2323
2324 \begin{table}[htb]
2325   \footnotesize
2326   \centering
2327   \begin{tabular}[c]{|p{2.4cm}|c|p{9cm}|}
2328     \hline
2329     \textbf{Stato} & \texttt{STAT} & \textbf{Descrizione} \\
2330     \hline
2331     \hline
2332     \textit{runnable}& \texttt{R} & Il processo è in esecuzione o è pronto ad
2333                                     essere eseguito (cioè è in attesa che gli
2334                                     venga assegnata la CPU).\\
2335     \textit{sleep}   & \texttt{S} & Il processo  è in attesa di un
2336                                     risposta dal sistema, ma può essere
2337                                     interrotto da un segnale.\\
2338     \textit{uninterrutible sleep}& \texttt{D} & Il  processo è in
2339                                     attesa di un risposta dal sistema (in
2340                                     genere per I/O), e non può essere
2341                                     interrotto in nessuna circostanza.\\
2342     \textit{stopped} & \texttt{T} & Il processo è stato fermato con un
2343                                     \signal{SIGSTOP}, o è tracciato.\\
2344     \textit{zombie}\itindex{zombie}& \texttt{Z} & Il processo è terminato ma il
2345                                     suo stato di terminazione non è ancora
2346                                     stato letto dal padre.\\
2347     \textit{killable}& \texttt{D} & Un nuovo stato introdotto con il kernel
2348                                     2.6.25, sostanzialmente identico
2349                                     all'\textit{uninterrutible sleep} con la
2350                                     sola differenza che il processo può
2351                                     terminato con \signal{SIGKILL} (usato per
2352                                     lo più per NFS).\\
2353     \hline
2354   \end{tabular}
2355   \caption{Elenco dei possibili stati di un processo in Linux, nella colonna
2356     \texttt{STAT} si è riportata la corrispondente lettera usata dal comando
2357     \cmd{ps} nell'omonimo campo.}
2358   \label{tab:proc_proc_states}
2359 \end{table}
2360
2361 Si deve quindi tenere presente che l'utilizzo della CPU è soltanto una delle
2362 risorse che sono necessarie per l'esecuzione di un programma, e a seconda
2363 dello scopo del programma non è detto neanche che sia la più importante, dato
2364 che molti programmi dipendono in maniera molto più critica dall'I/O. Per
2365 questo motivo non è affatto detto che dare ad un programma la massima priorità
2366 di esecuzione abbia risultati significativi in termini di prestazioni.
2367
2368 Il meccanismo tradizionale di \textit{scheduling} di Unix (che tratteremo in
2369 sez.~\ref{sec:proc_sched_stand}) è sempre stato basato su delle
2370 \textsl{priorità dinamiche}, in modo da assicurare che tutti i processi, anche
2371 i meno importanti, potessero ricevere un po' di tempo di CPU. In sostanza
2372 quando un processo ottiene la CPU la sua priorità viene diminuita. In questo
2373 modo alla fine, anche un processo con priorità iniziale molto bassa, finisce
2374 per avere una priorità sufficiente per essere eseguito.
2375
2376 Lo standard POSIX.1b però ha introdotto il concetto di \textsl{priorità
2377   assoluta}, (chiamata anche \textsl{priorità statica}, in contrapposizione
2378 alla normale priorità dinamica), per tenere conto dei sistemi
2379 \textit{real-time},\footnote{per sistema \textit{real-time} si intende un
2380   sistema in grado di eseguire operazioni in un tempo ben determinato; in
2381   genere si tende a distinguere fra l'\textit{hard real-time} in cui è
2382   necessario che i tempi di esecuzione di un programma siano determinabili con
2383   certezza assoluta (come nel caso di meccanismi di controllo di macchine,
2384   dove uno sforamento dei tempi avrebbe conseguenze disastrose), e
2385   \textit{soft-real-time} in cui un occasionale sforamento è ritenuto
2386   accettabile.} in cui è vitale che i processi che devono essere eseguiti in
2387 un determinato momento non debbano aspettare la conclusione di altri che non
2388 hanno questa necessità.
2389
2390 Il concetto di priorità assoluta dice che quando due processi si contendono
2391 l'esecuzione, vince sempre quello con la priorità assoluta più alta.
2392 Ovviamente questo avviene solo per i processi che sono pronti per essere
2393 eseguiti (cioè nello stato \textit{runnable}).  La priorità assoluta viene in
2394 genere indicata con un numero intero, ed un valore più alto comporta una
2395 priorità maggiore. Su questa politica di \textit{scheduling} torneremo in
2396 sez.~\ref{sec:proc_real_time}.
2397
2398 In generale quello che succede in tutti gli Unix moderni è che ai processi
2399 normali viene sempre data una priorità assoluta pari a zero, e la decisione di
2400 assegnazione della CPU è fatta solo con il meccanismo tradizionale della
2401 priorità dinamica. In Linux tuttavia è possibile assegnare anche una priorità
2402 assoluta, nel qual caso un processo avrà la precedenza su tutti gli altri di
2403 priorità inferiore, che saranno eseguiti solo quando quest'ultimo non avrà
2404 bisogno della CPU.
2405
2406
2407 \subsection{Il meccanismo di \textit{scheduling} standard}
2408 \label{sec:proc_sched_stand}
2409
2410 A meno che non si abbiano esigenze specifiche,\footnote{per alcune delle quali
2411   sono state introdotte delle varianti specifiche.} l'unico meccanismo di
2412 \textit{scheduling} con il quale si avrà a che fare è quello tradizionale, che
2413 prevede solo priorità dinamiche. È di questo che, di norma, ci si dovrà
2414 preoccupare nella programmazione.  Come accennato in Linux i processi ordinari
2415 hanno tutti una priorità assoluta nulla; quello che determina quale, fra tutti
2416 i processi in attesa di esecuzione, sarà eseguito per primo, è la cosiddetta
2417 \textsl{priorità dinamica},\footnote{quella che viene mostrata nella colonna
2418   \texttt{PR} del comando \texttt{top}.} che è chiamata così proprio perché
2419 varia nel corso dell'esecuzione di un processo.
2420
2421 Il meccanismo usato da Linux è in realtà piuttosto complesso,\footnote{e
2422   dipende strettamente dalla versione di kernel; in particolare a partire
2423   dalla serie 2.6.x lo scheduler è stato riscritto completamente, con molte
2424   modifiche susseguitesi per migliorarne le prestazioni, per un certo periodo
2425   ed è stata anche introdotta la possibilità di usare diversi algoritmi,
2426   selezionabili sia in fase di compilazione, che, nelle versioni più recenti,
2427   all'avvio (addirittura è stato ideato un sistema modulare che permette di
2428   cambiare lo scheduler a sistema attivo).} ma a grandi linee si può dire che
2429 ad ogni processo è assegnata una \textit{time-slice}, cioè un intervallo di
2430 tempo (letteralmente una fetta) per il quale, a meno di eventi esterni, esso
2431 viene eseguito senza essere interrotto.  Inoltre la priorità dinamica viene
2432 calcolata dallo scheduler a partire da un valore iniziale che viene
2433 \textsl{diminuito} tutte le volte che un processo è in stato \textit{runnable}
2434 ma non viene posto in esecuzione.\footnote{in realtà il calcolo della priorità
2435   dinamica e la conseguente scelta di quale processo mettere in esecuzione
2436   avviene con un algoritmo molto più complicato, che tiene conto anche della
2437   \textsl{interattività} del processo, utilizzando diversi fattori, questa è
2438   una brutale semplificazione per rendere l'idea del funzionamento, per una
2439   trattazione più dettagliata, anche se non aggiornatissima, dei meccanismi di
2440   funzionamento dello scheduler si legga il quarto capitolo di
2441   \cite{LinKernDev}.} Lo scheduler infatti mette sempre in esecuzione, fra
2442 tutti i processi in stato \textit{runnable}, quello che ha il valore di
2443 priorità dinamica più basso.\footnote{con le priorità dinamiche il significato
2444   del valore numerico ad esse associato è infatti invertito, un valore più
2445   basso significa una priorità maggiore.} Il fatto che questo valore venga
2446 diminuito quando un processo non viene posto in esecuzione pur essendo pronto,
2447 significa che la priorità dei processi che non ottengono l'uso del processore
2448 viene progressivamente incrementata, così che anche questi alla fine hanno la
2449 possibilità di essere eseguiti.
2450
2451 Sia la dimensione della \textit{time-slice} che il valore di partenza della
2452 priorità dinamica sono determinate dalla cosiddetta \textit{nice} (o
2453 \textit{niceness}) del processo.\footnote{questa è una delle tante proprietà
2454   che ciascun processo si porta dietro, essa viene ereditata dai processi
2455   figli e mantenuta attraverso una \func{exec}; fino alla serie 2.4 essa era
2456   mantenuta nell'omonimo campo \texttt{nice} della \texttt{task\_struct}, con
2457   la riscrittura dello scheduler eseguita nel 2.6 viene mantenuta nel campo
2458   \texttt{static\_prio} come per le priorità statiche.} L'origine del nome di
2459 questo parametro sta nel fatto che generalmente questo viene usato per
2460 \textsl{diminuire} la priorità di un processo, come misura di cortesia nei
2461 confronti degli altri.  I processi infatti vengono creati dal sistema con un
2462 valore nullo e nessuno è privilegiato rispetto agli altri. Specificando un
2463 valore di \textit{nice} positivo si avrà una \textit{time-slice} più breve ed
2464 un valore di priorità dinamica iniziale più alto, mentre un valore negativo
2465 darà una \textit{time-slice} più lunga ed un valore di priorità dinamica
2466 iniziale più basso.
2467
2468 Esistono diverse funzioni che consentono di indicare un valore di
2469 \textit{nice} di un processo; la più semplice è \funcd{nice}, che opera sul
2470 processo corrente, il suo prototipo è:
2471
2472 \begin{funcproto}{
2473 \fhead{unistd.h}
2474 \fdecl{int nice(int inc)}
2475 \fdesc{Aumenta il valore di \textit{nice} del processo corrente.}
2476 }
2477 {La funzione ritorna il nuovo valore di \textit{nice} in caso di successo e
2478   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2479 \begin{errlist}
2480   \item[\errcode{EPERM}] non si ha il permesso di specificare un valore
2481     di \param{inc} negativo.
2482 \end{errlist}}
2483 \end{funcproto}
2484
2485 L'argomento \param{inc} indica l'incremento da effettuare rispetto al valore
2486 di \textit{nice} corrente, che può assumere valori compresi fra
2487 \const{PRIO\_MIN} e \const{PRIO\_MAX}; nel caso di Linux sono fra $-20$ e
2488 $19$,\footnote{in realtà l'intervallo varia a seconda delle versioni di
2489   kernel, ed è questo a partire dal kernel 1.3.43, anche se oggi si può avere
2490   anche l'intervallo fra $-20$ e $20$.} ma per \param{inc} si può specificare
2491 un valore qualunque, positivo o negativo, ed il sistema provvederà a troncare
2492 il risultato nell'intervallo consentito. Valori positivi comportano maggiore
2493 \textit{cortesia} e cioè una diminuzione della priorità, valori negativi
2494 comportano invece un aumento della priorità. Con i kernel precedenti il 2.6.12
2495 solo l'amministratore\footnote{o un processo con la \itindex{capabilities}
2496   \textit{capability} \const{CAP\_SYS\_NICE}, vedi
2497   sez.~\ref{sec:proc_capabilities}.} può specificare valori negativi
2498 di \param{inc} che permettono di aumentare la priorità di un processo, a
2499 partire da questa versione è consentito anche agli utenti normali alzare
2500 (entro certi limiti, che vedremo in sez.~\ref{sec:sys_resource_limit}) la
2501 priorità dei propri processi.
2502
2503 Gli standard SUSv2 e POSIX.1 prevedono che la funzione ritorni il nuovo valore
2504 di \textit{nice} del processo; tuttavia la \textit{system call} di Linux non
2505 segue questa convenzione e restituisce sempre $0$ in caso di successo e $-1$
2506 in caso di errore; questo perché $-1$ è anche un valore di \textit{nice}
2507 legittimo e questo comporta una confusione con una eventuale condizione di
2508 errore. La \textit{system call} originaria inoltre non consente, se non dotati
2509 di adeguati privilegi, di diminuire un valore di \textit{nice} precedentemente
2510 innalzato.
2511
2512 Fino alla \acr{glibc} 2.2.4 la funzione di libreria riportava direttamente il
2513 risultato dalla \textit{system call}, violando lo standard, per cui per
2514 ottenere il nuovo valore occorreva una successiva chiamata alla funzione
2515 \func{getpriority}. A partire dalla \acr{glibc} 2.2.4 \func{nice} è stata
2516 reimplementata e non viene più chiamata la omonima \textit{system call}, con
2517 questa versione viene restituito come valore di ritorno il valore di
2518 \textit{nice}, come richiesto dallo standard.\footnote{questo viene fatto
2519   chiamando al suo interno \func{setpriority}, che tratteremo a breve.}  In
2520 questo caso l'unico modo per rilevare in maniera affidabile una condizione di
2521 errore è quello di azzerare \var{errno} prima della chiamata della funzione e
2522 verificarne il valore quando \func{nice} restituisce $-1$.
2523
2524 Per leggere il valore di \textit{nice} di un processo occorre usare la
2525 funzione di sistema \funcd{getpriority}, derivata da BSD; il suo prototipo è:
2526
2527 \begin{funcproto}{
2528 \fhead{sys/time.h}
2529 \fhead{sys/resource.h}
2530 \fdecl{int getpriority(int which, int who)}
2531 \fdesc{Legge un valore di \textit{nice}.}
2532 }
2533 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2534 caso \var{errno} assumerà uno dei valori:
2535 \begin{errlist}
2536 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2537     elencati in tab.~\ref{tab:proc_getpriority}.
2538 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2539   \param{which} e \param{who}.
2540 \end{errlist}}
2541 \end{funcproto}
2542
2543 La funzione permette, a seconda di quanto specificato
2544 nell'argomento \param{which}, di leggere il valore di \textit{nice} di un
2545 processo, di un gruppo di processi (vedi sez.~\ref{sec:sess_proc_group}) o di
2546 un utente indicato dall'argomento \param{who}. Nelle vecchie versioni può
2547 essere necessario includere anche \headfile{sys/time.h}, questo non è più
2548 necessario con versioni recenti delle librerie, ma è comunque utile per
2549 portabilità.
2550
2551 I valori possibili per \param{which}, ed il tipo di valore che occorre usare
2552 in corrispondenza per \param{who} solo elencati nella legenda di
2553 tab.~\ref{tab:proc_getpriority} insieme ai relativi significati. Usare un
2554 valore nullo per \param{who} indica, a seconda della corrispondente
2555 indicazione usata per \param{which} il processo, il gruppo di processi o
2556 l'utente correnti.
2557
2558 \begin{table}[htb]
2559   \centering
2560   \footnotesize
2561   \begin{tabular}[c]{|c|c|l|}
2562     \hline
2563     \param{which} & \param{who} & \textbf{Significato} \\
2564     \hline
2565     \hline
2566     \const{PRIO\_PROCESS} & \type{pid\_t} & processo  \\
2567     \const{PRIO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
2568                                             \textit{process group}\\
2569     \const{PRIO\_USER}    & \type{uid\_t} & utente \\
2570     \hline
2571   \end{tabular}
2572   \caption{Legenda del valore dell'argomento \param{which} e del tipo
2573     dell'argomento \param{who} delle funzioni \func{getpriority} e
2574     \func{setpriority} per le tre possibili scelte.}
2575   \label{tab:proc_getpriority}
2576 \end{table}
2577
2578 In caso di una indicazione che faccia riferimento a più processi, la funzione
2579 restituisce la priorità più alta (cioè il valore più basso) fra quelle dei
2580 processi corrispondenti. Come per \func{nice} $-1$ è un valore possibile
2581 corretto, per cui di nuovo per poter rilevare una condizione di errore è
2582 necessario cancellare sempre \var{errno} prima della chiamata alla funzione e
2583 quando si ottiene un valore di ritorno uguale a $-1$ per verificare che essa
2584 resti uguale a zero.
2585
2586 Analoga a \func{getpriority} è la funzione di sistema \funcd{setpriority} che
2587 permette di impostare la priorità di uno o più processi; il suo prototipo è:
2588
2589 \begin{funcproto}{
2590 \fhead{sys/time.h}
2591 \fhead{sys/resource.h}
2592 \fdecl{int setpriority(int which, int who, int prio)}
2593 \fdesc{Imposta un valore di \textit{nice}.}
2594 }
2595 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2596 caso \var{errno} assumerà uno dei valori:
2597 \begin{errlist}
2598 \item[\errcode{EACCES}] si è richiesto un aumento di priorità senza avere
2599   sufficienti privilegi.
2600 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2601   elencati in tab.~\ref{tab:proc_getpriority}.
2602 \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha
2603   cercato di modificare la priorità di un processo di un altro utente.
2604 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2605   \param{which} e \param{who}.
2606 \end{errlist}}
2607 \end{funcproto}
2608
2609 La funzione imposta la priorità dinamica al valore specificato da \param{prio}
2610 per tutti i processi indicati dagli argomenti \param{which} e \param{who}, per
2611 i quali valgono le stesse considerazioni fatte per \func{getpriority} e lo
2612 specchietto di tab.~\ref{tab:proc_getpriority}.
2613
2614 In questo caso come valore di \param{prio} deve essere specificato il valore
2615 di \textit{nice} da assegnare, e non un incremento (positivo o negativo) come
2616 nel caso di \func{nice}, nell'intervallo fra \const{PRIO\_MIN} ($-20$) e
2617 \const{PRIO\_MAX} ($19$). La funzione restituisce il valore di \textit{nice}
2618 assegnato in caso di successo e $-1$ in caso di errore, e come per \func{nice}
2619 anche in questo caso per rilevare un errore occorre sempre porre a zero
2620 \var{errno} prima della chiamata della funzione, essendo $-1$ un valore di
2621 \textit{nice} valido.
2622
2623 Si tenga presente che solo l'amministratore\footnote{o più precisamente un
2624   processo con la \itindex{capabilities} \textit{capability}
2625   \const{CAP\_SYS\_NICE}, vedi sez.~\ref{sec:proc_capabilities}.} ha la
2626 possibilità di modificare arbitrariamente le priorità di qualunque
2627 processo. Un utente normale infatti può modificare solo la priorità dei suoi
2628 processi ed in genere soltanto diminuirla.  Fino alla versione di kernel
2629 2.6.12 Linux ha seguito le specifiche dello standard SUSv3, e come per tutti i
2630 sistemi derivati da SysV veniva richiesto che l'\ids{UID} reale o quello
2631 effettivo del processo chiamante corrispondessero all'\ids{UID} reale (e solo
2632 a quello) del processo di cui si intendeva cambiare la priorità. A partire
2633 dalla versione 2.6.12 è stata adottata la semantica in uso presso i sistemi
2634 derivati da BSD (SunOS, Ultrix, *BSD), in cui la corrispondenza può essere
2635 anche con l'\ids{UID} effettivo.
2636
2637 Sempre a partire dal kernel 2.6.12 è divenuto possibile anche per gli utenti
2638 ordinari poter aumentare la priorità dei propri processi specificando un
2639 valore di \param{prio} negativo. Questa operazione non è possibile però in
2640 maniera indiscriminata, ed in particolare può essere effettuata solo
2641 nell'intervallo consentito dal valore del limite \const{RLIMIT\_NICE}
2642 (torneremo su questo in sez.~\ref{sec:sys_resource_limit}).
2643
2644 Infine nonostante i valori siano sempre rimasti gli stessi, il significato del
2645 valore di \textit{nice} è cambiato parecchio nelle progressive riscritture
2646 dello \textit{scheduler} di Linux, ed in particolare a partire dal kernel
2647 2.6.23 l'uso di diversi valori di \textit{nice} ha un impatto molto più forte
2648 nella distribuzione della CPU ai processi. Infatti se viene comunque calcolata
2649 una priorità dinamica per i processi che non ricevono la CPU così che anche
2650 essi possano essere messi in esecuzione, un alto valore di \textit{nice}
2651 corrisponde comunque ad una \textit{time-slice} molto piccola che non cresce
2652 comunque, per cui un processo a bassa priorità avrà davvero scarse possibilità
2653 di essere eseguito in presenza di processi attivi a priorità più alta.
2654
2655
2656
2657 \subsection{Il meccanismo di \textit{scheduling real-time}}
2658 \label{sec:proc_real_time}
2659
2660 Come spiegato in sez.~\ref{sec:proc_sched} lo standard POSIX.1b ha introdotto
2661 le priorità assolute per permettere la gestione di processi real-time. In
2662 realtà nel caso di Linux non si tratta di un vero \textit{hard real-time}, in
2663 quanto in presenza di eventuali interrupt il kernel interrompe l'esecuzione di
2664 un processo qualsiasi sia la sua priorità,\footnote{questo a meno che non si
2665   siano installate le patch di RTLinux, RTAI o Adeos, con i quali è possibile
2666   ottenere un sistema effettivamente \textit{hard real-time}. In tal caso
2667   infatti gli interrupt vengono intercettati dall'interfaccia
2668   \textit{real-time} (o nel caso di Adeos gestiti dalle code del nano-kernel),
2669   in modo da poterli controllare direttamente qualora ci sia la necessità di
2670   avere un processo con priorità più elevata di un \textit{interrupt
2671     handler}.} mentre con l'incorrere in un \itindex{page~fault} \textit{page
2672   fault} si possono avere ritardi non previsti.  Se l'ultimo problema può
2673 essere aggirato attraverso l'uso delle funzioni di controllo della memoria
2674 virtuale (vedi sez.~\ref{sec:proc_mem_lock}), il primo non è superabile e può
2675 comportare ritardi non prevedibili riguardo ai tempi di esecuzione di
2676 qualunque processo.
2677
2678 Nonostante questo, ed in particolare con una serie di miglioramenti che sono
2679 stati introdotti nello sviluppo del kernel,\footnote{in particolare a partire
2680   dalla versione 2.6.18 sono stati inserite nel kernel una serie di modifiche
2681   che consentono di avvicinarsi sempre di più ad un vero e proprio sistema
2682   \textit{real-time} estendendo il concetto di \textit{preemption} alle
2683   operazioni dello stesso kernel; esistono vari livelli a cui questo può
2684   essere fatto, ottenibili attivando in fase di compilazione una fra le
2685   opzioni \texttt{CONFIG\_PREEMPT\_NONE}, \texttt{CONFIG\_PREEMPT\_VOLUNTARY}
2686   e \texttt{CONFIG\_PREEMPT\_DESKTOP}.} si può arrivare ad una ottima
2687 approssimazione di sistema \textit{real-time} usando le priorità assolute.
2688 Occorre farlo però con molta attenzione: se si dà ad un processo una priorità
2689 assoluta e questo finisce in un loop infinito, nessun altro processo potrà
2690 essere eseguito, ed esso sarà mantenuto in esecuzione permanentemente
2691 assorbendo tutta la CPU e senza nessuna possibilità di riottenere l'accesso al
2692 sistema. Per questo motivo è sempre opportuno, quando si lavora con processi
2693 che usano priorità assolute, tenere attiva una shell cui si sia assegnata la
2694 massima priorità assoluta, in modo da poter essere comunque in grado di
2695 rientrare nel sistema.
2696
2697 Quando c'è un processo con priorità assoluta lo \textit{scheduler} lo metterà
2698 in esecuzione prima di ogni processo normale. In caso di più processi sarà
2699 eseguito per primo quello con priorità assoluta più alta. Quando ci sono più
2700 processi con la stessa priorità assoluta questi vengono tenuti in una coda e
2701 tocca al kernel decidere quale deve essere eseguito.  Il meccanismo con cui
2702 vengono gestiti questi processi dipende dalla politica di \textit{scheduling}
2703 che si è scelta; lo standard ne prevede due:
2704 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
2705 \item[\textit{First In First Out} (FIFO)] Il processo viene eseguito
2706   fintanto che non cede volontariamente la CPU (con la funzione
2707   \func{sched\_yield}), si blocca, finisce o viene interrotto da un processo a
2708   priorità più alta. Se il processo viene interrotto da uno a priorità più
2709   alta esso resterà in cima alla lista e sarà il primo ad essere eseguito
2710   quando i processi a priorità più alta diverranno inattivi. Se invece lo si
2711   blocca volontariamente sarà posto in coda alla lista (ed altri processi con
2712   la stessa priorità potranno essere eseguiti).
2713 \item[\textit{Round Robin} (RR)] Il comportamento è del tutto analogo a quello
2714   precedente, con la sola differenza che ciascun processo viene eseguito al
2715   massimo per un certo periodo di tempo (la cosiddetta \textit{time-slice})
2716   dopo di che viene automaticamente posto in fondo alla coda dei processi con
2717   la stessa priorità. In questo modo si ha comunque una esecuzione a turno di
2718   tutti i processi, da cui il nome della politica. Solo i processi con la
2719   stessa priorità ed in stato \textit{runnable} entrano nel
2720   \textsl{girotondo}.
2721 \end{basedescript}
2722
2723 Lo standard POSIX.1-2001 prevede una funzione che consenta sia di modificare
2724 le politiche di \textit{scheduling}, passando da \textit{real-time} a
2725 ordinarie o viceversa, che di specificare, in caso di politiche
2726 \textit{real-time}, la eventuale priorità statica; la funzione di sistema è
2727 \funcd{sched\_setscheduler} ed il suo prototipo è:
2728
2729 \begin{funcproto}{
2730 \fhead{sched.h}
2731 \fdecl{int sched\_setscheduler(pid\_t pid, int policy, const struct
2732   sched\_param *p)}
2733 \fdesc{Imposta priorità e politica di \textit{scheduling}.}
2734 }
2735 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2736 caso \var{errno} assumerà uno dei valori:
2737 \begin{errlist}
2738     \item[\errcode{EINVAL}] il valore di \param{policy} non esiste o il
2739       relativo valore di \param{p} non è valido per la politica scelta.
2740     \item[\errcode{EPERM}] il processo non ha i privilegi per attivare la
2741       politica richiesta.
2742     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2743  \end{errlist}}
2744 \end{funcproto}
2745
2746 La funzione esegue l'impostazione per il processo specificato dall'argomento
2747 \param{pid}, un valore nullo di questo argomento esegue l'impostazione per il
2748 processo corrente.  La politica di \textit{scheduling} è specificata
2749 dall'argomento \param{policy} i cui possibili valori sono riportati in
2750 tab.~\ref{tab:proc_sched_policy}; la parte alta della tabella indica le
2751 politiche \textit{real-time}, quella bassa le politiche ordinarie. Un valore
2752 negativo per \param{policy} mantiene la politica di \textit{scheduling}
2753 corrente.
2754
2755 \begin{table}[htb]
2756   \centering
2757   \footnotesize
2758   \begin{tabular}[c]{|l|p{6cm}|}
2759     \hline
2760     \textbf{Politica}  & \textbf{Significato} \\
2761     \hline
2762     \hline
2763     \const{SCHED\_FIFO} & \textit{Scheduling real-time} con politica
2764                           \textit{FIFO}. \\
2765     \const{SCHED\_RR}   & \textit{Scheduling real-time} con politica
2766                           \textit{Round Robin}. \\
2767     \hline
2768     \const{SCHED\_OTHER}& \textit{Scheduling} ordinario.\\
2769     \const{SCHED\_BATCH}& \textit{Scheduling} ordinario con l'assunzione
2770                           ulteriore di lavoro \textit{CPU
2771                             intensive} (dal kernel 2.6.16).\\
2772     \const{SCHED\_IDLE} & \textit{Scheduling} di priorità estremamente
2773                           bassa (dal kernel 2.6.23).\\
2774     \hline
2775   \end{tabular}
2776   \caption{Valori dell'argomento \param{policy} per la funzione
2777     \func{sched\_setscheduler}.}
2778   \label{tab:proc_sched_policy}
2779 \end{table}
2780
2781 Con le versioni più recenti del kernel sono state introdotte anche delle
2782 varianti sulla politica di \textit{scheduling} tradizionale per alcuni carichi
2783 di lavoro specifici, queste due nuove politiche sono specifiche di Linux e non
2784 devono essere usate se si vogliono scrivere programmi portabili.
2785
2786 La politica \const{SCHED\_BATCH} è una variante della politica ordinaria con
2787 la sola differenza che i processi ad essa soggetti non ottengono, nel calcolo
2788 delle priorità dinamiche fatto dallo scheduler, il cosiddetto bonus di
2789 interattività che mira a favorire i processi che si svegliano dallo stato di
2790 \textit{sleep}.\footnote{cosa che accade con grande frequenza per i processi
2791   interattivi, dato che essi sono per la maggior parte del tempo in attesa di
2792   dati in ingresso da parte dell'utente.} La si usa pertanto, come indica il
2793 nome, per processi che usano molta CPU (come programmi di calcolo) che in
2794 questo modo sono leggermente sfavoriti rispetto ai processi interattivi che
2795 devono rispondere a dei dati in ingresso, pur non perdendo il loro valore di
2796 \textit{nice}.
2797
2798 La politica \const{SCHED\_IDLE} invece è una politica dedicata ai processi che
2799 si desidera siano eseguiti con la più bassa priorità possibile, ancora più
2800 bassa di un processo con il minimo valore di \textit{nice}. In sostanza la si
2801 può utilizzare per processi che devono essere eseguiti se non c'è niente altro
2802 da fare. Va comunque sottolineato che anche un processo \const{SCHED\_IDLE}
2803 avrà comunque una sua possibilità di utilizzo della CPU, sia pure in
2804 percentuale molto bassa.
2805
2806 Qualora si sia richiesta una politica \textit{real-time} il valore della
2807 priorità statica viene impostato attraverso la struttura
2808 \struct{sched\_param}, riportata in fig.~\ref{fig:sig_sched_param}, il cui
2809 solo campo attualmente definito è \var{sched\_priority}. Il campo deve
2810 contenere il valore della priorità statica da assegnare al processo; lo
2811 standard prevede che questo debba essere assegnato all'interno di un
2812 intervallo fra un massimo ed un minimo che nel caso di Linux sono
2813 rispettivamente 1 e 99.
2814
2815 \begin{figure}[!htbp]
2816   \footnotesize \centering
2817   \begin{minipage}[c]{0.5\textwidth}
2818     \includestruct{listati/sched_param.c}
2819   \end{minipage}
2820   \normalsize
2821   \caption{La struttura \structd{sched\_param}.}
2822   \label{fig:sig_sched_param}
2823 \end{figure}
2824
2825 I processi con politica di \textit{scheduling} ordinaria devono sempre
2826 specificare un valore nullo di \var{sched\_priority} altrimenti si avrà un
2827 errore \errcode{EINVAL}, questo valore infatti non ha niente a che vedere con
2828 la priorità dinamica determinata dal valore di \textit{nice}, che deve essere
2829 impostato con le funzioni viste in precedenza.
2830
2831 Lo standard POSIX.1b prevede inoltre che l'intervallo dei valori delle
2832 priorità statiche possa essere ottenuto con le funzioni di sistema
2833 \funcd{sched\_get\_priority\_max} e \funcd{sched\_get\_priority\_min}, i cui
2834 prototipi sono:
2835
2836 \begin{funcproto}{
2837 \fhead{sched.h}
2838 \fdecl{int sched\_get\_priority\_max(int policy)}
2839 \fdesc{Legge il valore massimo di una priorità statica.}
2840 \fdecl{int sched\_get\_priority\_min(int policy)}
2841 \fdesc{Legge il valore minimo di una priorità statica.}
2842 }
2843 {Le funzioni ritornano il valore della priorità in caso di successo e $-1$ per
2844   un errore, nel qual caso \var{errno} assumerà il valore:
2845 \begin{errlist}
2846 \item[\errcode{EINVAL}] il valore di \param{policy} non è valido.
2847 \end{errlist}}
2848 \end{funcproto}
2849
2850 Le funzioni ritornano rispettivamente i due valori della massima e minima
2851 priorità statica possano essere ottenuti per una delle politiche di
2852 \textit{scheduling} \textit{real-time} indicata dall'argomento \param{policy}.
2853
2854 Si tenga presente che quando si imposta una politica di \textit{scheduling}
2855 real-time per un processo o se ne cambia la priorità statica questo viene
2856 messo in cima alla lista dei processi con la stessa priorità; questo comporta
2857 che verrà eseguito subito, interrompendo eventuali altri processi con la
2858 stessa priorità in quel momento in esecuzione.
2859
2860 Il kernel mantiene i processi con la stessa priorità assoluta in una lista, ed
2861 esegue sempre il primo della lista, mentre un nuovo processo che torna in
2862 stato \textit{runnable} viene sempre inserito in coda alla lista. Se la
2863 politica scelta è \const{SCHED\_FIFO} quando il processo viene eseguito viene
2864 automaticamente rimesso in coda alla lista, e la sua esecuzione continua
2865 fintanto che non viene bloccato da una richiesta di I/O, o non rilascia
2866 volontariamente la CPU (in tal caso, tornando nello stato \textit{runnable}
2867 sarà reinserito in coda alla lista); l'esecuzione viene ripresa subito solo
2868 nel caso che esso sia stato interrotto da un processo a priorità più alta.
2869
2870 Solo un processo con i privilegi di amministratore\footnote{più precisamente
2871   con la \itindex{capabilities} capacità \const{CAP\_SYS\_NICE}, vedi
2872   sez.~\ref{sec:proc_capabilities}.} può impostare senza restrizioni priorità
2873 assolute diverse da zero o politiche \const{SCHED\_FIFO} e
2874 \const{SCHED\_RR}. Un utente normale può modificare solo le priorità di
2875 processi che gli appartengono; è cioè richiesto che l'\ids{UID} effettivo del
2876 processo chiamante corrisponda all'\ids{UID} reale o effettivo del processo
2877 indicato con \param{pid}.
2878
2879 Fino al kernel 2.6.12 gli utenti normali non potevano impostare politiche
2880 \textit{real-time} o modificare la eventuale priorità statica di un loro
2881 processo. A partire da questa versione è divenuto possibile anche per gli
2882 utenti normali usare politiche \textit{real-time} fintanto che la priorità
2883 assoluta che si vuole impostare è inferiore al limite \const{RLIMIT\_RTPRIO}
2884 (vedi sez.~\ref{sec:sys_resource_limit}) ad essi assegnato.
2885
2886 Unica eccezione a questa possibilità sono i processi \const{SCHED\_IDLE}, che
2887 non possono cambiare politica di \textit{scheduling} indipendentemente dal
2888 valore di \const{RLIMIT\_RTPRIO}. Inoltre, in caso di processo già sottoposto
2889 ad una politica \textit{real-time}, un utente può sempre, indipendentemente
2890 dal valore di \const{RLIMIT\_RTPRIO}, diminuirne la priorità o portarlo ad una
2891 politica ordinaria.
2892
2893 Se si intende operare solo sulla priorità statica di un processo si possono
2894 usare le due funzioni di sistema \funcd{sched\_setparam} e
2895 \funcd{sched\_getparam} che consentono rispettivamente di impostarne e
2896 leggerne il valore, i loro prototipi sono:
2897
2898 \begin{funcproto}{
2899 \fhead{sched.h}
2900 \fdecl{int sched\_setparam(pid\_t pid, const struct sched\_param *param)}
2901 \fdesc{Imposta la priorità statica di un processo.}
2902 \fdecl{int sched\_getparam(pid\_t pid, struct sched\_param *param)}
2903 \fdesc{Legge la priorità statica di un processo.}
2904 }
2905 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2906 caso \var{errno} assumerà uno dei valori:
2907 \begin{errlist}
2908 \item[\errcode{EINVAL}] il valore di \param{param} non ha senso per la
2909   politica usata dal processo.
2910 \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2911   l'operazione.
2912 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2913 \end{errlist}}
2914 \end{funcproto}
2915
2916 Le funzioni richiedono di indicare nell'argomento \param{pid} il processo su
2917 cui operare e usano l'argomento \param{param} per mantenere il valore della
2918 priorità dinamica. Questo è ancora una struttura \struct{sched\_param} ed
2919 assume gli stessi valori già visti per \func{sched\_setscheduler}.
2920
2921 L'uso di \func{sched\_setparam}, compresi i controlli di accesso che vi si
2922 applicano, è del tutto equivalente a quello di \func{sched\_setscheduler} con
2923 argomento \param{policy} uguale a $-1$. Come per \func{sched\_setscheduler}
2924 specificando $0$ come valore dell'argomento \param{pid} si opera sul processo
2925 corrente. Benché la funzione sia utilizzabile anche con processi sottoposti a
2926 politica ordinaria essa ha senso soltanto per quelli \textit{real-time}, dato
2927 che per i primi la priorità statica può essere soltanto nulla.  La
2928 disponibilità di entrambe le funzioni può essere verificata controllando la
2929 macro \macro{\_POSIX\_PRIORITY\_SCHEDULING} che è definita nell'\textit{header
2930   file} \headfile{sched.h}.
2931
2932 Se invece si vuole sapere quale è politica di \textit{scheduling} di un
2933 processo si può usare la funzione di sistema \funcd{sched\_getscheduler}, il
2934 cui prototipo è:
2935
2936 \begin{funcproto}{
2937 \fhead{sched.h}
2938 \fdecl{int sched\_getscheduler(pid\_t pid)}
2939 \fdesc{Legge la politica di \textit{scheduling}.}
2940 }
2941 {La funzione ritorna la politica di \textit{scheduling}  in caso di successo e
2942   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2943 \begin{errlist}
2944     \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2945       l'operazione.
2946     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2947 \end{errlist}}
2948 \end{funcproto}
2949
2950 La funzione restituisce il valore, secondo quanto elencato in
2951 tab.~\ref{tab:proc_sched_policy}, della politica di \textit{scheduling} per il
2952 processo specificato dall'argomento \param{pid}, se questo è nullo viene
2953 restituito il valore relativo al processo chiamante.
2954
2955 L'ultima funzione di sistema che permette di leggere le informazioni relative
2956 ai processi real-time è \funcd{sched\_rr\_get\_interval}, che permette di
2957 ottenere la lunghezza della \textit{time-slice} usata dalla politica
2958 \textit{round robin}; il suo prototipo è:
2959
2960 \begin{funcproto}{
2961 \fhead{sched.h}
2962 \fdecl{int sched\_rr\_get\_interval(pid\_t pid, struct timespec *tp)}
2963 \fdesc{Legge la durata della \textit{time-slice} per lo \textit{scheduling}
2964   \textit{round robin}.}
2965 }
2966 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2967 caso \var{errno} assumerà uno dei valori:
2968 \begin{errlist}
2969 \item[\errcode{EINVAL}] l'argomento \param{pid} non è valido.
2970 \item[\errcode{ENOSYS}] la \textit{system call} non è presente (solo per
2971   kernel arcaici).
2972 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2973 \end{errlist}
2974 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
2975 \end{funcproto}
2976
2977 La funzione restituisce nell'argomento \param{tp} come una struttura
2978 \struct{timespec}, (la cui definizione si può trovare in
2979 fig.~\ref{fig:sys_timeval_struct}) il valore dell'intervallo di tempo usato
2980 per la politica \textit{round robin} dal processo indicato da \ids{PID}. Il
2981 valore dipende dalla versione del kernel, a lungo infatti questo intervallo di
2982 tempo era prefissato e non modificabile ad un valore di 150 millisecondi,
2983 restituito indipendentemente dal \ids{PID} indicato.
2984
2985 Con kernel recenti però è possibile ottenere una variazione della
2986 \textit{time-slice}, modificando il valore di \textit{nice} del processo
2987 (anche se questo non incide assolutamente sulla priorità statica) che come
2988 accennato in precedenza modifica il valore assegnato alla \textit{time-slice}
2989 di un processo ordinario, che però viene usato anche dai processi
2990 \textit{real-time}.
2991
2992 Come accennato ogni processo può rilasciare volontariamente la CPU in modo da
2993 consentire agli altri processi di essere eseguiti; la funzione di sistema che
2994 consente di fare tutto questo è \funcd{sched\_yield}, il cui prototipo è:
2995
2996 \begin{funcproto}{
2997 \fhead{sched.h}
2998 \fdecl{int sched\_yield(void)}
2999 \fdesc{Rilascia volontariamente l'esecuzione.}
3000 }
3001 {La funzione ritorna $0$ in caso di successo e teoricamente $-1$ per un
3002   errore, ma su Linux ha sempre successo.}
3003 \end{funcproto}
3004
3005
3006 Questa funzione ha un utilizzo effettivo soltanto quando si usa lo
3007 \textit{scheduling} \textit{real-time}, e serve a far sì che il processo
3008 corrente rilasci la CPU, in modo da essere rimesso in coda alla lista dei
3009 processi con la stessa priorità per permettere ad un altro di essere eseguito;
3010 se però il processo è l'unico ad essere presente sulla coda l'esecuzione non
3011 sarà interrotta. In genere usano questa funzione i processi con politica
3012 \const{SCHED\_FIFO}, per permettere l'esecuzione degli altri processi con pari
3013 priorità quando la sezione più urgente è finita.
3014
3015 La funzione può essere utilizzata anche con processi che usano lo
3016 \textit{scheduling} ordinario, ma in questo caso il comportamento non è ben
3017 definito, e dipende dall'implementazione. Fino al kernel 2.6.23 questo
3018 comportava che i processi venissero messi in fondo alla coda di quelli attivi,
3019 con la possibilità di essere rimessi in esecuzione entro breve tempo, con
3020 l'introduzione del \textit{Completely Fair Scheduler} questo comportamento è
3021 cambiato ed un processo che chiama la funzione viene inserito nella lista dei
3022 processi inattivo, con un tempo molto maggiore.\footnote{è comunque possibile
3023   ripristinare un comportamento analogo al precedente scrivendo il valore 1
3024   nel file \sysctlfile{kernel/sched\_compat\_yield}.}
3025
3026 L'uso delle funzione nella programmazione ordinaria può essere utile e
3027 migliorare le prestazioni generali del sistema quando si è appena rilasciata
3028 una risorsa contesa con altri processi, e si vuole dare agli altri una
3029 possibilità di approfittarne mettendoli in esecuzione, ma chiamarla senza
3030 necessità, specie se questo avviene ripetutamente all'interno di un qualche
3031 ciclo, può avere invece un forte impatto negativo per la generazione di
3032 \itindex{contest~switch} \textit{contest switch} inutili.
3033
3034
3035 \subsection{Il controllo dello \textit{scheduler} per i sistemi
3036   multiprocessore}
3037 \label{sec:proc_sched_multiprocess}
3038
3039 Con il supporto dei sistemi multiprocessore sono state introdotte delle
3040 funzioni che permettono di controllare in maniera più dettagliata la scelta di
3041 quale processore utilizzare per eseguire un certo programma. Uno dei problemi
3042 che si pongono nei sistemi multiprocessore è infatti quello del cosiddetto
3043 \index{effetto~ping-pong} \textsl{effetto ping-pong}. Può accadere cioè che lo
3044 \textit{scheduler}, quando riavvia un processo precedentemente interrotto
3045 scegliendo il primo processore disponibile, lo faccia eseguire da un
3046 processore diverso rispetto a quello su cui era stato eseguito in
3047 precedenza. Se il processo passa da un processore all'altro in questo modo,
3048 cosa che avveniva abbastanza di frequente con i kernel della seria 2.4.x, si
3049 ha l'\textsl{effetto ping-pong}.
3050
3051 Questo tipo di comportamento può generare dei seri problemi di prestazioni;
3052 infatti tutti i processori moderni utilizzano una memoria interna (la
3053 \textit{cache}) contenente i dati più usati, che permette di evitare di
3054 eseguire un accesso (molto più lento) alla memoria principale sulla scheda
3055 madre.  Chiaramente un processo sarà favorito se i suoi dati sono nella cache
3056 del processore, ma è ovvio che questo può essere vero solo per un processore
3057 alla volta, perché in presenza di più copie degli stessi dati su più
3058 processori, non si potrebbe determinare quale di questi ha la versione dei
3059 dati aggiornata rispetto alla memoria principale.
3060
3061 Questo comporta che quando un processore inserisce un dato nella sua cache,
3062 tutti gli altri processori che hanno lo stesso dato devono invalidarlo, e
3063 questa operazione è molto costosa in termini di prestazioni. Il problema
3064 diventa serio quando si verifica l'\textsl{effetto ping-pong}, in tal caso
3065 infatti un processo \textsl{rimbalza} continuamente da un processore all'altro
3066 e si ha una continua invalidazione della cache, che non diventa mai
3067 disponibile.
3068
3069 \itindbeg{CPU~affinity}
3070
3071 Per ovviare a questo tipo di problemi è nato il concetto di \textsl{affinità
3072   di processore} (o \textit{CPU affinity}); la possibilità cioè di far sì che
3073 un processo possa essere assegnato per l'esecuzione sempre allo stesso
3074 processore. Lo \textit{scheduler} dei kernel della serie 2.4.x aveva una
3075 scarsa \textit{CPU affinity}, e \index{effetto~ping-pong} l'effetto ping-pong
3076 era comune; con il nuovo \textit{scheduler} dei kernel della 2.6.x questo
3077 problema è stato risolto ed esso cerca di mantenere il più possibile ciascun
3078 processo sullo stesso processore.
3079
3080 In certi casi però resta l'esigenza di poter essere sicuri che un processo sia
3081 sempre eseguito dallo stesso processore,\footnote{quella che viene detta
3082   \textit{hard CPU affinity}, in contrasto con quella fornita dallo
3083   \textit{scheduler}, detta \textit{soft CPU affinity}, che di norma indica
3084   solo una preferenza, non un requisito assoluto.} e per poter risolvere
3085 questo tipo di problematiche nei nuovi kernel\footnote{le due \textit{system
3086     call} per la gestione della \textit{CPU affinity} sono state introdotte
3087   nel kernel 2.5.8, e le corrispondenti funzioni di sistema nella
3088   \textsl{glibc} 2.3.} è stata introdotta l'opportuna infrastruttura ed una
3089 nuova \textit{system call} che permette di impostare su quali processori far
3090 eseguire un determinato processo attraverso una \textsl{maschera di
3091   affinità}. La corrispondente funzione di sistema è
3092 \funcd{sched\_setaffinity} ed il suo prototipo è:
3093
3094 \index{insieme~di~processori|(}
3095
3096 \begin{funcproto}{
3097 \fhead{sched.h}
3098 \fdecl{int sched\_setaffinity(pid\_t pid, size\_t setsize,
3099   cpu\_set\_t *mask)}
3100 \fdesc{Imposta la maschera di affinità di un processo.}
3101 }
3102 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3103 caso \var{errno} assumerà uno dei valori:
3104 \begin{errlist}
3105 \item[\errcode{EINVAL}] il valore di \param{mask} contiene riferimenti a
3106   processori non esistenti nel sistema o a cui non è consentito l'accesso.
3107 \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
3108   eseguire l'operazione.
3109 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3110 \end{errlist}
3111 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3112 \end{funcproto}
3113
3114 Questa funzione e la corrispondente \func{sched\_getaffinity} hanno una storia
3115 abbastanza complessa, la sottostante \textit{system call} infatti prevede
3116 l'uso di due soli argomenti (per il pid e l'indicazione della maschera dei
3117 processori), che corrispondono al fatto che l'implementazione effettiva usa
3118 una semplice maschera binaria. Quando le funzioni vennero incluse nella
3119 \acr{glibc} assunsero invece un prototipo simile a quello mostrato però con il
3120 secondo argomento di tipo \ctyp{unsigned int}. A complicare la cosa si
3121 aggiunge il fatto che nella versione 2.3.3 della \acr{glibc} detto argomento
3122 venne stato eliminato, per poi essere ripristinato nella versione 2.3.4 nella
3123 forma attuale.\footnote{pertanto se la vostra pagina di manuale non è
3124   aggiornata, o usate quella particolare versione della \acr{glibc}, potrete
3125   trovare indicazioni diverse, il prototipo illustrato è quello riportato
3126   nella versione corrente (maggio 2008) delle pagine di manuale e
3127   corrispondente alla definizione presente in \headfile{sched.h}.}
3128
3129 La funzione imposta, con l'uso del valore contenuto all'indirizzo
3130 \param{mask}, l'insieme dei processori sui quali deve essere eseguito il
3131 processo identificato tramite il valore passato in \param{pid}. Come in
3132 precedenza il valore nullo di \param{pid} indica il processo corrente.  Per
3133 poter utilizzare questa funzione sono richiesti i privilegi di amministratore
3134 (è necessaria la capacità \const{CAP\_SYS\_NICE}) altrimenti essa fallirà con
3135 un errore di \errcode{EPERM}. Una volta impostata una maschera di affinità,
3136 questa viene ereditata attraverso una \func{fork}, in questo modo diventa
3137 possibile legare automaticamente un gruppo di processi ad un singolo
3138 processore.
3139
3140 Nell'uso comune, almeno con i kernel successivi alla serie 2.6.x, l'uso di
3141 questa funzione non è necessario, in quanto è lo scheduler stesso che provvede
3142 a mantenere al meglio l'affinità di processore. Esistono però esigenze
3143 particolari, ad esempio quando un processo (o un gruppo di processi) è
3144 utilizzato per un compito importante (ad esempio per applicazioni
3145 \textit{real-time} o la cui risposta è critica) e si vuole la massima
3146 velocità, e con questa interfaccia diventa possibile selezionare gruppi di
3147 processori utilizzabili in maniera esclusiva.  Lo stesso dicasi quando
3148 l'accesso a certe risorse (memoria o periferiche) può avere un costo diverso a
3149 seconda del processore, come avviene nelle architetture NUMA
3150 (\textit{Non-Uniform Memory Access}).
3151
3152 Infine se un gruppo di processi accede alle stesse risorse condivise (ad
3153 esempio una applicazione con più \itindex{thread} \textit{thread}) può avere
3154 senso usare lo stesso processore in modo da sfruttare meglio l'uso della sua
3155 cache; questo ovviamente riduce i benefici di un sistema multiprocessore
3156 nell'esecuzione contemporanea dei \itindex{thread} \textit{thread}, ma in
3157 certi casi (quando i \itindex{thread} \textit{thread} sono inerentemente
3158 serializzati nell'accesso ad una risorsa) possono esserci sufficienti vantaggi
3159 nell'evitare la perdita della cache da rendere conveniente l'uso dell'affinità
3160 di processore.
3161
3162 Dato che il numero di processori può variare a seconda delle architetture, per
3163 semplificare l'uso dell'argomento \param{mask} la \acr{glibc} ha introdotto un
3164 apposito dato di tipo, \type{cpu\_set\_t},\footnote{questa è una estensione
3165   specifica della \acr{glibc}, da attivare definendo la macro
3166   \macro{\_GNU\_SOURCE}, non esiste infatti una standardizzazione per questo
3167   tipo di interfaccia e POSIX al momento non prevede nulla al riguardo.} che
3168 permette di identificare un insieme di processori. Il dato è normalmente una
3169 maschera binaria: nei casi più comuni potrebbe bastare un intero a 32 bit, in
3170 cui ogni bit corrisponde ad un processore, ma oggi esistono architetture in
3171 cui questo numero può non essere sufficiente, e per questo è stato creato
3172 questo \index{tipo!opaco} tipo opaco e una interfaccia di gestione che
3173 permette di usare a basso livello un tipo di dato qualunque rendendosi
3174 indipendenti dal numero di bit e dalla loro disposizione.  Per questo le
3175 funzioni richiedono anche che oltre all'insieme di processori si indichi anche
3176 la dimensione dello stesso con l'argomento \param{setsize}, per il quale, se
3177 non si usa l'allocazione dinamica che vedremo a breve, ed è in genere
3178 sufficiente passare il valore \code{sizeof(cpu\_set\_t)}.
3179
3180 L'interfaccia di gestione degli insiemi di processori, oltre alla definizione
3181 del tipo \type{cpu\_set\_t}, prevede una serie di macro di preprocessore per
3182 la manipolazione degli stessi. Quelle di base, che consentono rispettivamente
3183 di svuotare un insieme, di aggiungere o togliere un processore o di verificare
3184 se esso è già presente in un insieme, sono le seguenti:
3185
3186 {\centering
3187 \vspace{3pt}
3188 \begin{funcbox}{
3189 \fhead{sched.h}
3190 \fdecl{void \macro{CPU\_ZERO}(cpu\_set\_t *set)}
3191 \fdesc{Inizializza un insieme di processori vuoto \param{set}.}
3192 \fdecl{void \macro{CPU\_SET}(int cpu, cpu\_set\_t *set)}
3193 \fdesc{Inserisce il processore \param{cpu} nell'insieme di processori \param{set}.}
3194 \fdecl{void \macro{CPU\_CLR}(int cpu, cpu\_set\_t *set)}
3195 \fdesc{Rimuove il processore \param{cpu} nell'insieme di processori \param{set}.}
3196 \fdecl{int \macro{CPU\_ISSET}(int cpu, cpu\_set\_t *set)}
3197 \fdesc{Controlla se il processore \param{cpu} è nell'insieme di processori \param{set}.}
3198 }
3199 \end{funcbox}}
3200
3201 Queste macro che sono ispirate dalle analoghe usate per gli insiemi di
3202 \textit{file descriptor} (vedi sez.~\ref{sec:file_select}) e sono state
3203 introdotte con la versione 2.3.3 della \acr{glibc}. Tutte richiedono che si
3204 specifichi il numero di una CPU nell'argomento \param{cpu}, ed un insieme su
3205 cui operare. L'unica che ritorna un risultato è \macro{CPU\_ISSET}, che
3206 restituisce un intero da usare come valore logico (zero se la CPU non è
3207 presente, diverso da zero se è presente).
3208
3209 Si tenga presente che trattandosi di macro l'argomento \param{cpu} può essere
3210 valutato più volte. Questo significa ad esempio che non si può usare al suo
3211 posto una funzione o un'altra macro, altrimenti queste verrebbero eseguite più
3212 volte, l'argomento cioè non deve avere \textsl{effetti collaterali} (in gergo
3213 \itindex{side~effects} \textit{side effects}).\footnote{nel linguaggio C si
3214   parla appunto di \textit{side effects} quando si usano istruzioni la cui
3215   valutazione comporta effetti al di fuori dell'istruzione stessa, come il
3216   caso indicato in cui si passa una funzione ad una macro che usa l'argomento
3217   al suo interno più volte, o si scrivono espressioni come \code{a=a++} in cui
3218   non è chiaro se prima avvenga l'incremento e poi l'assegnazione, ed il cui
3219   risultato dipende dall'implementazione del compilatore.}
3220
3221 Le CPU sono numerate da zero (che indica la prima disponibile) fino ad
3222 un numero massimo che dipende dalla architettura hardware. La costante
3223 \const{CPU\_SETSIZE} indica il numero massimo di processori che possono far
3224 parte di un insieme (al momento vale sempre 1024), e costituisce un limite
3225 massimo al valore dell'argomento \param{cpu}.
3226 Dalla versione 2.6 della \acr{glibc} alle precedenti macro è stata aggiunta,
3227 per contare il numero di processori in un insieme, l'ulteriore:
3228
3229 {\centering
3230 \vspace{3pt}
3231 \begin{funcbox}{
3232 \fhead{sched.h}
3233 \fdecl{int \macro{CPU\_COUNT}(cpu\_set\_t *set)}
3234 \fdesc{Conta il numero di processori presenti nell'insieme \param{set}.}
3235 }
3236 \end{funcbox}}
3237
3238 A partire dalla versione 2.7 della \acr{glibc} sono state introdotte altre
3239 macro che consentono ulteriori manipolazioni, in particolare si possono
3240 compiere delle operazioni logiche sugli insiemi di processori con:
3241
3242 {\centering
3243 \vspace{3pt}
3244 \begin{funcbox}{
3245 \fhead{sched.h}
3246 \fdecl{void \macro{CPU\_AND}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3247 \fdesc{Esegue l'AND logico di due insiemi di processori.}
3248 \fdecl{void \macro{CPU\_OR}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3249 \fdesc{Esegue l'OR logico di due insiemi di processori.}
3250 \fdecl{void \macro{CPU\_XOR}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3251 \fdesc{Esegue lo XOR logico di due insiemi di processori.}
3252 \fdecl{int \macro{CPU\_EQUAL}(cpu\_set\_t *set1, cpu\_set\_t *set2)}
3253 \fdesc{Verifica se due insiemi di processori sono uguali.}
3254 }
3255 \end{funcbox}}
3256
3257 Le prime tre macro richiedono due insiemi di partenza, \param{srcset1}
3258 e \param{srcset2} e forniscono in un terzo insieme \param{destset} (che può
3259 essere anche lo stesso di uno dei precedenti) il risultato della rispettiva
3260 operazione logica sui contenuti degli stessi. In sostanza con \macro{CPU\_AND}
3261 si otterrà come risultato l'insieme che contiene le CPU presenti in entrambi
3262 gli insiemi di partenza, con \macro{CPU\_OR} l'insieme che contiene le CPU
3263 presenti in uno qualunque dei due insiemi di partenza, e con \macro{CPU\_XOR}
3264 l'insieme che contiene le CPU presenti presenti in uno solo dei due insiemi di
3265 partenza. Infine \macro{CPU\_EQUAL} confronta due insiemi ed è l'unica che
3266 restituisce un intero, da usare come valore logico che indica se sono
3267 identici o meno.
3268
3269 Inoltre, sempre a partire dalla versione 2.7 della \acr{glibc}, è stata
3270 introdotta la possibilità di una allocazione dinamica degli insiemi di
3271 processori, per poterli avere di dimensioni corrispondenti al numero di CPU
3272 effettivamente in gioco, senza dover fare riferimento necessariamente alla
3273 precedente dimensione preimpostata di 1024. Per questo motivo sono state
3274 definite tre ulteriori macro, che consentono rispettivamente di allocare,
3275 disallocare ed ottenere la dimensione in byte di un insieme di processori:
3276
3277 {\centering
3278 \vspace{3pt}
3279 \begin{funcbox}{
3280 \fhead{sched.h}
3281 \fdecl{cpu\_set\_t * \macro{CPU\_ALLOC}(num\_cpus)}
3282 \fdesc{Alloca dinamicamente un insieme di processori di dimensione voluta.}
3283 \fdecl{void \macro{CPU\_FREE}(cpu\_set\_t *set)}
3284 \fdesc{Disalloca un insieme di processori allocato dinamicamente.}
3285 \fdecl{size\_t \macro{CPU\_ALLOC\_SIZE}(num\_cpus)}
3286 \fdesc{Ritorna la dimensione di un insieme di processori allocato dinamicamente.}
3287 }
3288 \end{funcbox}}
3289
3290 La prima macro, \macro{CPU\_ALLOC}, restituisce il puntatore ad un insieme di
3291 processori in grado di contenere almeno \param{num\_cpus} che viene allocato
3292 dinamicamente. Ogni insieme così allocato dovrà essere disallocato con
3293 \macro{CPU\_FREE} passandogli un puntatore ottenuto da una precedente
3294 \macro{CPU\_ALLOC}. La terza macro, \macro{CPU\_ALLOC\_SIZE}, consente di
3295 ottenere la dimensione in byte di un insieme allocato dinamicamente che
3296 contenga \param{num\_cpus} processori.
3297
3298 Dato che le dimensioni effettive possono essere diverse le macro di gestione e
3299 manipolazione che abbiamo trattato in precedenza non si applicano agli insiemi
3300 allocati dinamicamente, per i quali dovranno sono state definite altrettante
3301 macro equivalenti contraddistinte dal suffisso \texttt{\_S}, che effettuano le
3302 stesse operazioni, ma richiedono in più un argomento
3303 aggiuntivo \param{setsize} che deve essere assegnato al valore ottenuto con
3304 \macro{CPU\_ALLOC\_SIZE}. Questo stesso valore deve essere usato per l'omonimo
3305 argomento delle funzioni \func{sched\_setaffinity} o \func{sched\_getaffinity}
3306 quando si vuole usare per l'argomento che indica la maschera di affinità un
3307 insieme di processori allocato dinamicamente.
3308
3309 \index{insieme~di~processori|)}
3310
3311 A meno di non aver utilizzato \func{sched\_setaffinity}, in condizioni
3312 ordinarie la maschera di affinità di un processo è preimpostata dal sistema in
3313 modo che esso possa essere eseguito su qualunque processore. Se ne può
3314 comunque ottenere il valore corrente usando la funzione di sistema
3315 \funcd{sched\_getaffinity}, il cui prototipo è:
3316
3317 \begin{funcproto}{
3318 \fhead{sched.h}
3319 \fdecl{int sched\_getaffinity (pid\_t pid, size\_t setsize,
3320   cpu\_set\_t *mask)}
3321 \fdesc{Legge la maschera di affinità di un processo.}
3322 }
3323 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3324 caso \var{errno} assumerà uno dei valori:
3325 \begin{errlist}
3326 \item[\errcode{EINVAL}] \param{setsize} è più piccolo delle dimensioni
3327   della maschera di affinità usata dal kernel.
3328 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3329 \end{errlist}
3330 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3331 \end{funcproto}
3332
3333 La funzione restituirà all'indirizzo specificato da \param{mask} il valore
3334 della maschera di affinità del processo indicato dall'argomento \param{pid}
3335 (al solito un valore nullo indica il processo corrente) così da poterla
3336 riutilizzare per una successiva reimpostazione.
3337
3338 È chiaro che queste funzioni per la gestione dell'affinità hanno significato
3339 soltanto su un sistema multiprocessore, esse possono comunque essere
3340 utilizzate anche in un sistema con un processore singolo, nel qual caso però
3341 non avranno alcun risultato effettivo.
3342
3343
3344 \itindend{scheduler}
3345 \itindend{CPU~affinity}
3346
3347
3348 \subsection{Le priorità per le operazioni di I/O}
3349 \label{sec:io_priority}
3350
3351 A lungo l'unica priorità usata per i processi è stata quella relativa
3352 all'assegnazione dell'uso del processore. Ma il processore non è l'unica
3353 risorsa che i processi devono contendersi, un'altra, altrettanto importante
3354 per le prestazioni, è quella dell'accesso a disco. Per questo motivo nello
3355 sviluppo del kernel sono stati introdotti diversi \textit{I/O scheduler} in
3356 grado di distribuire in maniera opportuna questa risorsa ai vari processi.
3357
3358 Fino al kernel 2.6.17 era possibile soltanto differenziare le politiche
3359 generali di gestione, scegliendo di usare un diverso \textit{I/O scheduler}. A
3360 partire da questa versione, con l'introduzione dello \textit{scheduler} CFQ
3361 (\textit{Completely Fair Queuing}) è divenuto possibile, qualora si usi questo
3362 \textit{scheduler}, impostare anche delle diverse priorità di accesso per i
3363 singoli processi.\footnote{al momento (kernel 2.6.31), le priorità di I/O sono
3364   disponibili soltanto per questo \textit{scheduler}.}
3365
3366 La scelta di uno \textit{scheduler} di I/O si può fare in maniera generica per
3367 tutto il sistema all'avvio del kernel con il parametro di avvio
3368 \texttt{elevator},\footnote{per la trattazione dei parametri di avvio del
3369   kernel si rimanda al solito alla sez.~5.3 di \cite{AGL}.} cui assegnare il
3370 nome dello \textit{scheduler}, ma se ne può anche indicare uno specifico per
3371 l'accesso al singolo disco scrivendo nel file
3372 \texttt{/sys/block/\textit{<dev>}/queue/scheduler} (dove
3373 \texttt{\textit{<dev>}} è il nome del dispositivo associato al disco).
3374
3375 Gli \textit{scheduler} disponibili sono mostrati dal contenuto dello stesso
3376 file che riporta fra parentesi quadre quello attivo, il default in tutti i
3377 kernel recenti è proprio il \texttt{cfq},\footnote{nome con cui si indica
3378   appunto lo \textit{scheduler} CFQ.} che supporta le priorità. Per i dettagli
3379 sulle caratteristiche specifiche degli altri \textit{scheduler}, la cui
3380 discussione attiene a problematiche di ambito sistemistico, si consulti la
3381 documentazione nella directory \texttt{Documentation/block/} dei sorgenti del
3382 kernel.
3383
3384 Una volta che si sia impostato lo \textit{scheduler} CFQ ci sono due
3385 specifiche \textit{system call}, specifiche di Linux, che consentono di
3386 leggere ed impostare le priorità di I/O.\footnote{se usate in corrispondenza
3387   ad uno \textit{scheduler} diverso il loro utilizzo non avrà alcun effetto.}
3388 Dato che non esiste una interfaccia diretta nella \acr{glibc} per queste due
3389 funzioni\footnote{almeno al momento della scrittura di questa sezione, con la
3390   versione 2.11 della \acr{glibc}.} occorrerà invocarle tramite la funzione
3391 \func{syscall} (come illustrato in sez.~\ref{sec:proc_syscall}). Le due
3392 \textit{system call} sono \funcd{ioprio\_get} ed \funcd{ioprio\_set}; i
3393 rispettivi prototipi sono:
3394
3395 \begin{funcproto}{
3396 \fhead{linux/ioprio.h}
3397 \fdecl{int ioprio\_get(int which, int who)}
3398 \fdesc{Legge la priorità di I/O di un processo.}
3399 \fdecl{int ioprio\_set(int which, int who, int ioprio)}
3400 \fdesc{Imposta la priorità di I/O di un processo.}
3401 }
3402 {Le funzioni ritornano rispettivamente un intero positivo o 0 in caso di
3403   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
3404   valori:
3405 \begin{errlist}
3406 \item[\errcode{EINVAL}] i valori di \param{which} o di \param{ioprio} non
3407   sono validi.
3408 \item[\errcode{EPERM}] non si hanno i privilegi per eseguire
3409   l'impostazione (solo per \func{ioprio\_set}).
3410 \item[\errcode{ESRCH}] non esiste un processo corrispondente alle indicazioni.
3411 \end{errlist}}
3412 \end{funcproto}
3413
3414 Le funzioni leggono o impostano la priorità di I/O sulla base dell'indicazione
3415 dei due argomenti \param{which} e \param{who} che hanno lo stesso significato
3416 già visto per gli omonimi argomenti di \func{getpriority} e
3417 \func{setpriority}. Anche in questo caso si deve specificare il valore
3418 di \param{which} tramite le opportune costanti riportate in
3419 tab.~\ref{tab:ioprio_args} che consentono di indicare un singolo processo, i
3420 processi di un \textit{process group} (tratteremo questo argomento in
3421 sez.~\ref{sec:sess_proc_group}) o tutti i processi di un utente.
3422
3423 \begin{table}[htb]
3424   \centering
3425   \footnotesize
3426   \begin{tabular}[c]{|c|c|l|}
3427     \hline
3428     \param{which} & \param{who} & \textbf{Significato} \\
3429     \hline
3430     \hline
3431     \const{IPRIO\_WHO\_PROCESS} & \type{pid\_t} & processo\\
3432     \const{IPRIO\_WHO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
3433                                                   \textit{process group}\\
3434     \const{IPRIO\_WHO\_USER}    & \type{uid\_t} & utente\\
3435     \hline
3436   \end{tabular}
3437   \caption{Legenda del valore dell'argomento \param{which} e del tipo
3438     dell'argomento \param{who} delle funzioni \func{ioprio\_get} e
3439     \func{ioprio\_set} per le tre possibili scelte.}
3440   \label{tab:ioprio_args}
3441 \end{table}
3442
3443 In caso di successo \func{ioprio\_get} restituisce un intero positivo che
3444 esprime il valore della priorità di I/O, questo valore è una maschera binaria
3445 composta da due parti, una che esprime la \textsl{classe} di
3446 \textit{scheduling} di I/O del processo, l'altra che esprime, quando la classe
3447 di \textit{scheduling} lo prevede, la priorità del processo all'interno della
3448 classe stessa. Questo stesso formato viene utilizzato per indicare il valore
3449 della priorità da impostare con l'argomento \param{ioprio} di
3450 \func{ioprio\_set}.
3451 \begin{table}[htb]
3452   \centering
3453   \footnotesize
3454   \begin{tabular}[c]{|l|p{8cm}|}
3455     \hline
3456     \textbf{Macro} & \textbf{Significato}\\
3457     \hline
3458     \hline
3459     \macro{IOPRIO\_PRIO\_CLASS}\texttt{(\textit{value})}
3460                                 & Dato il valore di una priorità come
3461                                   restituito da \func{ioprio\_get} estrae il
3462                                   valore della classe.\\
3463     \macro{IOPRIO\_PRIO\_DATA}\texttt{(\textit{value})}
3464                                 & Dato il valore di una priorità come
3465                                   restituito da \func{ioprio\_get} estrae il
3466                                   valore della priorità.\\
3467     \macro{IOPRIO\_PRIO\_VALUE}\texttt{(\textit{class},\textit{prio})}
3468                                 & Dato un valore di priorità ed una classe
3469                                   ottiene il valore numerico da passare a
3470                                   \func{ioprio\_set}.\\
3471     \hline
3472   \end{tabular}
3473   \caption{Le macro per la gestione dei valori numerici .}
3474   \label{tab:IOsched_class_macro}
3475 \end{table}
3476
3477
3478 Per la gestione dei valori che esprimono le priorità di I/O sono state
3479 definite delle opportune macro di preprocessore, riportate in
3480 tab.~\ref{tab:IOsched_class_macro}. I valori delle priorità si ottengono o si
3481 impostano usando queste macro.  Le prime due si usano con il valore restituito
3482 da \func{ioprio\_get} e per ottenere rispettivamente la classe di
3483 \textit{scheduling}\footnote{restituita dalla macro con i valori di
3484   tab.~\ref{tab:IOsched_class}.} e l'eventuale valore della priorità. La terza
3485 macro viene invece usata per creare un valore di priorità da usare come
3486 argomento di \func{ioprio\_set} per eseguire una impostazione.
3487
3488 \begin{table}[htb]
3489   \centering
3490   \footnotesize
3491   \begin{tabular}[c]{|l|l|}
3492     \hline
3493     \textbf{Classe}  & \textbf{Significato} \\
3494     \hline
3495     \hline
3496     \const{IOPRIO\_CLASS\_RT}  & \textit{Scheduling} di I/O \textit{real-time}.\\
3497     \const{IOPRIO\_CLASS\_BE}  & \textit{Scheduling} di I/O ordinario.\\
3498     \const{IOPRIO\_CLASS\_IDLE}& \textit{Scheduling} di I/O di priorità minima.\\
3499     \hline
3500   \end{tabular}
3501   \caption{Costanti che identificano le classi di \textit{scheduling} di I/O.}
3502   \label{tab:IOsched_class}
3503 \end{table}
3504
3505 Le classi di \textit{scheduling} previste dallo \textit{scheduler} CFQ sono
3506 tre, e ricalcano tre diverse modalità di distribuzione delle risorse analoghe
3507 a quelle già adottate anche nel funzionamento dello \textit{scheduler} del
3508 processore. Ciascuna di esse è identificata tramite una opportuna costante,
3509 secondo quanto riportato in tab.~\ref{tab:IOsched_class}.
3510
3511 La classe di priorità più bassa è \const{IOPRIO\_CLASS\_IDLE}; i processi in
3512 questa classe riescono ad accedere a disco soltanto quando nessun altro
3513 processo richiede l'accesso. Occorre pertanto usarla con molta attenzione,
3514 perché un processo in questa classe può venire completamente bloccato quando
3515 ci sono altri processi in una qualunque delle altre due classi che stanno
3516 accedendo al disco. Quando si usa questa classe non ha senso indicare un
3517 valore di priorità, dato che in questo caso non esiste nessuna gerarchia e la
3518 priorità è identica, la minima possibile, per tutti i processi.
3519
3520 La seconda classe di priorità di I/O è \const{IOPRIO\_CLASS\_BE} (il nome sta
3521 per \textit{best-effort}) che è quella usata ordinariamente da tutti
3522 processi. In questo caso esistono priorità diverse che consentono di
3523 assegnazione di una maggiore banda passante nell'accesso a disco ad un
3524 processo rispetto agli altri, con meccanismo simile a quello dei valori di
3525 \textit{nice} in cui si evita che un processo a priorità più alta possa
3526 bloccare indefinitamente quelli a priorità più bassa. In questo caso però le
3527 diverse priorità sono soltanto otto, indicate da un valore numerico fra 0 e 7
3528 e come per \textit{nice} anche in questo caso un valore più basso indica una
3529 priorità maggiore.
3530
3531
3532 Infine la classe di priorità di I/O \textit{real-time}
3533 \const{IOPRIO\_CLASS\_RT} ricalca le omonime priorità di processore: un
3534 processo in questa classe ha sempre la precedenza nell'accesso a disco
3535 rispetto a tutti i processi delle altre classi e di un processo nella stessa
3536 classe ma con priorità inferiore, ed è pertanto in grado di bloccare
3537 completamente tutti gli altri. Anche in questo caso ci sono 8 priorità diverse
3538 con un valore numerico fra 0 e 7, con una priorità più elevata per valori più
3539 bassi.
3540
3541 In generale nel funzionamento ordinario la priorità di I/O di un processo
3542 viene impostata in maniera automatica nella classe \const{IOPRIO\_CLASS\_BE}
3543 con un valore ottenuto a partire dal corrispondente valore di \textit{nice}
3544 tramite la formula: $\mathtt{\mathit{prio}}=(\mathtt{\mathit{nice}}+20)/5$. Un
3545 utente ordinario può modificare con \func{ioprio\_set} soltanto le priorità
3546 dei processi che gli appartengono,\footnote{per la modifica delle priorità di
3547   altri processi occorrono privilegi amministrativi, ed in particolare la
3548   capacità \const{CAP\_SYS\_NICE} (vedi sez.~\ref{sec:proc_capabilities}).}
3549 cioè quelli il cui \ids{UID} reale corrisponde all'\ids{UID} reale o effettivo
3550 del chiamante. Data la possibilità di ottenere un blocco totale del sistema,
3551 solo l'amministratore\footnote{o un processo con la capacità
3552   \const{CAP\_SYS\_ADMIN} (vedi sez.~\ref{sec:proc_capabilities}).} può
3553 impostare un processo ad una priorità di I/O nella classe
3554 \const{IOPRIO\_CLASS\_RT}, lo stesso privilegio era richiesto anche per la
3555 classe \const{IOPRIO\_CLASS\_IDLE} fino al kernel 2.6.24, ma dato che in
3556 questo caso non ci sono effetti sugli altri processi questo limite è stato
3557 rimosso a partire dal kernel 2.6.25.
3558
3559 %TODO verificare http://lwn.net/Articles/355987/
3560 \section{Funzioni di gestione avanzata}
3561 \label{sec:proc_advanced_control}
3562
3563 Nelle precedenti sezioni si sono trattate la gran parte delle funzioni che
3564 attengono alla gestione ordinaria dei processi e delle loro proprietà più
3565 comuni. Tratteremo qui alcune \textit{system call} dedicate alla gestione di
3566 funzionalità dei processi molto specifiche ed avanzate, il cui uso è in genere
3567 piuttosto ridotto. Trattandosi di problematiche abbastanza complesse, che
3568 spesso presuppongono la conoscenza di altri argomenti trattati nel seguito
3569 della guida, si può saltare questa sezione in una prima lettura, tornando su
3570 di essa in un secondo tempo.
3571
3572
3573 \subsection{La funzione \func{prctl}}
3574 \label{sec:process_prctl}
3575
3576 Benché la gestione ordinaria possa essere effettuata attraverso le funzioni
3577 che abbiamo già esaminato nelle sezioni precedenti, esistono una serie di
3578 proprietà e caratteristiche particolari dei processi non coperte da esse, per
3579 la cui gestione è stata predisposta una apposita \textit{system call} che
3580 fornisce una interfaccia generica per tutte le operazioni specialistiche. La
3581 funzione di sistema è \funcd{prctl} ed il suo prototipo è:\footnote{la
3582   funzione non è standardizzata ed è specifica di Linux, anche se ne esiste
3583   una analoga in IRIX; è stata introdotta con il kernel 2.1.57.}
3584
3585 \begin{funcproto}{
3586 \fhead{sys/prctl.h}
3587 \fdecl{int prctl(int option, unsigned long arg2, unsigned long arg3, unsigned
3588   long arg4, \\
3589 \phantom{int prctl(}unsigned long arg5)}
3590 \fdesc{Esegue una operazione speciale sul processo corrente.}
3591 }
3592 {La funzione ritorna $0$ o un valore positivo dipendente dall'operazione in
3593   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
3594   valori diversi a seconda del tipo di operazione richiesta (in genere
3595   \errval{EINVAL} o \errval{EPERM}).}
3596 \end{funcproto}
3597
3598 La funzione ritorna un valore nullo o positivo in caso di successo e $-1$ in
3599 caso di errore; il significato degli argomenti della funzione successivi al
3600 primo, il valore di ritorno in caso di successo, il tipo di errore restituito
3601 in \var{errno} dipendono dall'operazione eseguita, indicata tramite il primo
3602 argomento, \param{option}. Questo è un valore intero che identifica
3603 l'operazione, e deve essere specificato con l'uso di una delle costanti
3604 predefinite del seguente elenco, che illustra quelle disponibili al
3605 momento:\footnote{alla stesura di questa sezione, cioè con il kernel 3.2.}
3606
3607 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
3608 \item[\const{PR\_CAPBSET\_READ}] Controlla la disponibilità di una delle
3609   \itindex{capabilities} \textit{capabilities} (vedi
3610   sez.~\ref{sec:proc_capabilities}). La funzione ritorna 1 se la capacità
3611   specificata nell'argomento \param{arg2} (con una delle costanti di
3612   tab.~\ref{tab:proc_capabilities}) è presente nel \textit{capabilities
3613     bounding set} del processo e zero altrimenti, se \param{arg2} non è un
3614   valore valido si avrà un errore di \errval{EINVAL}.  Introdotta a partire
3615   dal kernel 2.6.25.
3616
3617 \item[\const{PR\_CAPBSET\_DROP}] Rimuove permanentemente una delle
3618   \itindex{capabilities} \textit{capabilities} (vedi
3619   sez.~\ref{sec:proc_capabilities}) dal processo e da tutti i suoi
3620   discendenti. La funzione cancella la capacità specificata
3621   nell'argomento \param{arg2} con una delle costanti di
3622   tab.~\ref{tab:proc_capabilities} dal \textit{capabilities bounding set}
3623   \itindex{capabilities~bounding~set} del processo. L'operazione richiede i
3624   privilegi di amministratore (la capacità \const{CAP\_SETPCAP}), altrimenti
3625   la chiamata fallirà con un errore di \errcode{EPERM}; se il valore
3626   di \param{arg2} non è valido o se il supporto per le \textit{file
3627     capabilities} non è stato compilato nel kernel la chiamata fallirà con un
3628   errore di \errval{EINVAL}. Introdotta a partire dal kernel 2.6.25.
3629
3630 \item[\const{PR\_SET\_DUMPABLE}] Imposta il flag che determina se la
3631   terminazione di un processo a causa di un segnale per il quale è prevista la
3632   generazione di un file di \itindex{core~dump} \textit{core dump} (vedi
3633   sez.~\ref{sec:sig_standard}) lo genera effettivamente. In genere questo flag
3634   viene attivato automaticamente, ma per evitare problemi di sicurezza (la
3635   generazione di un file da parte di processi privilegiati può essere usata
3636   per sovrascriverne altri) viene cancellato quando si mette in esecuzione un
3637   programma con i bit \acr{suid} e \acr{sgid} attivi (vedi
3638   sez.~\ref{sec:file_special_perm}) o con l'uso delle funzioni per la modifica
3639   degli \ids{UID} dei processi (vedi sez.~\ref{sec:proc_setuid}).
3640
3641   L'operazione è stata introdotta a partire dal kernel 2.3.20, fino al kernel
3642   2.6.12 e per i kernel successivi al 2.6.17 era possibile usare solo un
3643   valore 0 di \param{arg2} per disattivare il flag ed un valore 1 per
3644   attivarlo. Nei kernel dal 2.6.13 al 2.6.17 è stato supportato anche il
3645   valore 2, che causava la generazione di un \itindex{core~dump} \textit{core
3646     dump} leggibile solo dall'amministratore, ma questa funzionalità è stata
3647   rimossa per motivi di sicurezza, in quanto consentiva ad un utente normale
3648   di creare un file di \textit{core dump} appartenente all'amministratore in
3649   directory dove l'utente avrebbe avuto permessi di accesso.
3650
3651 \item[\const{PR\_GET\_DUMPABLE}] Ottiene come valore di ritorno della funzione
3652   lo stato corrente del flag che controlla la effettiva generazione dei
3653   \itindex{core~dump} \textit{core dump}. Introdotta a partire dal kernel
3654   2.3.20.
3655
3656 \item[\const{PR\_SET\_ENDIAN}] Imposta la \itindex{endianness}
3657   \textit{endianness} del processo chiamante secondo il valore fornito
3658   in \param{arg2}. I valori possibili sono sono: \const{PR\_ENDIAN\_BIG}
3659   (\textit{big endian}), \const{PR\_ENDIAN\_LITTLE} (\textit{little endian}),
3660   e \const{PR\_ENDIAN\_PPC\_LITTLE} (lo pseudo \textit{little endian} del
3661   PowerPC). Introdotta a partire dal kernel 2.6.18, solo per architettura
3662   PowerPC.
3663
3664 \item[\const{PR\_GET\_ENDIAN}] Ottiene il valore della \itindex{endianness}
3665   \textit{endianness} del processo chiamante, salvato sulla variabile puntata
3666   da \param{arg2} che deve essere passata come di tipo ``\ctyp{int
3667     *}''. Introdotta a partire dal kernel 2.6.18, solo su PowerPC.
3668
3669 \item[\const{PR\_SET\_FPEMU}] Imposta i bit di controllo per l'emulazione
3670   della virgola mobile su architettura ia64, secondo il valore
3671   di \param{arg2}, si deve passare \const{PR\_FPEMU\_NOPRINT} per emulare in
3672   maniera trasparente l'accesso alle operazioni in virgola mobile, o
3673   \const{PR\_FPEMU\_SIGFPE} per non emularle ed inviare il segnale
3674   \signal{SIGFPE} (vedi sez.~\ref{sec:sig_prog_error}). Introdotta a partire
3675   dal kernel 2.4.18, solo su architettura ia64.
3676
3677 \item[\const{PR\_GET\_FPEMU}] Ottiene il valore dei flag di controllo
3678   dell'emulazione della virgola mobile, salvato all'indirizzo puntato
3679   da \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3680   partire dal kernel 2.4.18, solo su architettura ia64.
3681
3682 \item[\const{PR\_SET\_FPEXC}] Imposta la modalità delle eccezioni in virgola
3683   mobile (\textit{floating-point exception mode}) al valore di \param{arg2}.
3684   I valori possibili sono:
3685   \begin{itemize*}
3686   \item \const{PR\_FP\_EXC\_SW\_ENABLE} per usare FPEXC per le eccezioni,
3687   \item \const{PR\_FP\_EXC\_DIV} per la divisione per zero in virgola mobile,
3688   \item \const{PR\_FP\_EXC\_OVF} per gli overflow,
3689   \item \const{PR\_FP\_EXC\_UND} per gli underflow,
3690   \item \const{PR\_FP\_EXC\_RES} per risultati non esatti,
3691   \item \const{PR\_FP\_EXC\_INV} per operazioni invalide,
3692   \item \const{PR\_FP\_EXC\_DISABLED} per disabilitare le eccezioni,
3693   \item \const{PR\_FP\_EXC\_NONRECOV} per usare la modalità di eccezione
3694     asincrona non recuperabile,
3695   \item \const{PR\_FP\_EXC\_ASYNC} per usare la modalità di eccezione
3696     asincrona recuperabile,
3697   \item \const{PR\_FP\_EXC\_PRECISE} per la modalità precisa di
3698     eccezione.\footnote{trattasi di gestione specialistica della gestione
3699       delle eccezioni dei calcoli in virgola mobile che, i cui dettagli al
3700       momento vanno al di là dello scopo di questo testo.}
3701   \end{itemize*}
3702 Introdotta a partire dal kernel 2.4.21, solo su PowerPC.
3703
3704 \item[\const{PR\_GET\_FPEXC}] Ottiene il valore della modalità delle eccezioni
3705   delle operazioni in virgola mobile, salvata all'indirizzo
3706   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''.  Introdotta
3707   a partire dal kernel 2.4.21, solo su PowerPC.
3708
3709 \item[\const{PR\_SET\_KEEPCAPS}] Consente di controllare quali
3710   \itindex{capabilities} \textit{capabilities} vengono cancellate quando si
3711   esegue un cambiamento di \ids{UID} del processo (per i dettagli si veda
3712   sez.~\ref{sec:proc_capabilities}, in particolare quanto illustrato a
3713   pag.~\pageref{sec:capability-uid-transition}). Un valore nullo (il default)
3714   per \param{arg2} comporta che vengano cancellate, il valore 1 che vengano
3715   mantenute, questo valore viene sempre cancellato attraverso una \func{exec}.
3716   L'uso di questo flag è stato sostituito, a partire dal kernel 2.6.26, dal
3717   flag \const{SECURE\_KEEP\_CAPS} dei \itindex{securebits} \textit{securebits}
3718   (vedi l'uso di \const{PR\_SET\_SECUREBITS} più avanti). Introdotta a partire
3719   dal kernel 2.2.18.
3720
3721 \item[\const{PR\_GET\_KEEPCAPS}] Ottiene come valore di ritorno della funzione
3722   il valore del flag di controllo delle \itindex{capabilities}
3723   \textit{capabilities} impostato con \const{PR\_SET\_KEEPCAPS}. Introdotta a
3724   partire dal kernel 2.2.18.
3725
3726 \item[\const{PR\_SET\_NAME}] Imposta il nome del processo chiamante alla
3727   stringa puntata da \param{arg2}, che deve essere di tipo ``\ctyp{char *}''. Il
3728   nome può essere lungo al massimo 16 caratteri, e la stringa deve essere
3729   terminata da NUL se più corta.  Introdotta a partire dal kernel 2.6.9.
3730
3731 \item[\const{PR\_GET\_NAME}] Ottiene il nome del processo chiamante nella
3732   stringa puntata da \param{arg2}, che deve essere di tipo ``\ctyp{char *}'';
3733   si devono allocare per questo almeno 16 byte, e il nome sarà terminato da
3734   NUL se più corto. Introdotta a partire dal kernel 2.6.9.
3735
3736 \item[\const{PR\_SET\_PDEATHSIG}] Consente di richiedere l'emissione di un
3737   segnale, che sarà ricevuto dal processo chiamante, in occorrenza della
3738   terminazione del proprio processo padre; in sostanza consente di invertire
3739   il ruolo di \signal{SIGCHLD}. Il valore di \param{arg2} deve indicare il
3740   numero del segnale, o 0 per disabilitare l'emissione. Il valore viene
3741   automaticamente cancellato per un processo figlio creato con \func{fork}.
3742   Introdotta a partire dal kernel 2.1.57.
3743
3744 \item[\const{PR\_GET\_PDEATHSIG}] Ottiene il valore dell'eventuale segnale
3745   emesso alla terminazione del padre, salvato all'indirizzo
3746   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3747   partire dal kernel 2.3.15.
3748
3749 \item[\const{PR\_SET\_SECCOMP}] Imposta il cosiddetto
3750   \itindex{secure~computing~mode} \textit{secure computing mode} per il
3751   processo corrente. Prevede come unica possibilità che \param{arg2} sia
3752   impostato ad 1. Una volta abilitato il \itindex{secure~computing~mode}
3753   \textit{secure computing mode} il processo potrà utilizzare soltanto un
3754   insieme estremamente limitato di \textit{system call}: \func{read},
3755   \func{write}, \func{\_exit} e \funcm{sigreturn}. Ogni altra \textit{system
3756     call} porterà all'emissione di un \signal{SIGKILL} (vedi
3757   sez.~\ref{sec:sig_termination}).  Il \textit{secure computing mode} è stato
3758   ideato per fornire un supporto per l'esecuzione di codice esterno non fidato
3759   e non verificabile a scopo di calcolo;\footnote{lo scopo è quello di poter
3760     vendere la capacità di calcolo della proprio macchina ad un qualche
3761     servizio di calcolo distribuito senza comprometterne la sicurezza
3762     eseguendo codice non sotto il proprio controllo.} in genere i dati vengono
3763   letti o scritti grazie ad un socket o una pipe, e per evitare problemi di
3764   sicurezza non sono possibili altre operazioni se non quelle citate.
3765   Introdotta a partire dal kernel 2.6.23, disponibile solo se si è abilitato
3766   il supporto nel kernel con \texttt{CONFIG\_SECCOMP}.
3767
3768 % TODO a partire dal kernel 3.5 è stato introdotto la possibilità di usare un
3769 % terzo argomento se il secondo è SECCOMP_MODE_FILTER, vedi
3770 % Documentation/prctl/seccomp_filter.txt
3771
3772
3773 \item[\const{PR\_GET\_SECCOMP}] Ottiene come valore di ritorno della funzione
3774   lo stato corrente del \textit{secure computing mode}, al momento attuale la
3775   funzione è totalmente inutile in quanto l'unico valore ottenibile è 0, dato
3776   che la chiamata di questa funzione in \itindex{secure~computing~mode}
3777   \textit{secure computing mode} comporterebbe l'emissione di
3778   \signal{SIGKILL}, è stata comunque definita per eventuali estensioni future.
3779   Introdotta a partire dal kernel 2.6.23.
3780
3781 \item[\const{PR\_SET\_SECUREBITS}] Imposta i \itindex{securebits}
3782   \textit{securebits} per il processo chiamante al valore indicato
3783   da \param{arg2}; per i dettagli sul significato dei \textit{securebits} si
3784   veda sez.~\ref{sec:proc_capabilities}, ed in particolare i valori di
3785   tab.~\ref{tab:securebits_values} e la relativa trattazione. L'operazione
3786   richiede i privilegi di amministratore (la \itindex{capabilities} capacità
3787   \const{CAP\_SETPCAP}), altrimenti la chiamata fallirà con un errore di
3788   \errval{EPERM}. Introdotta a partire dal kernel 2.6.26.
3789
3790 \item[\const{PR\_GET\_SECUREBITS}] Ottiene come valore di ritorno della
3791   funzione l'impostazione corrente per i \itindex{securebits}
3792   \textit{securebits}. Introdotta a partire dal kernel 2.6.26.
3793
3794 \item[\const{PR\_SET\_TIMING}] Imposta il metodo di temporizzazione del
3795   processo da indicare con il valore di \param{arg2}, attualmente i valori
3796   possibili sono due, con \const{PR\_TIMING\_STATISTICAL} si usa il metodo
3797   statistico tradizionale, con \const{PR\_TIMING\_TIMESTAMP} il più accurato
3798   basato su dei \textit{timestamp}, quest'ultimo però non è ancora
3799   implementato ed il suo uso comporta la restituzione di un errore di
3800   \errval{EINVAL}. Introdotta a partire dal kernel 2.6.0-test4.
3801
3802 \item[\const{PR\_GET\_TIMING}] Ottiene come valore di ritorno della funzione
3803   il metodo di temporizzazione del processo attualmente in uso (uno dei due
3804   valori citati per \const{PR\_SET\_TIMING}). Introdotta a partire dal kernel
3805   2.6.0-test4.
3806
3807 \item[\const{PR\_SET\_TSC}] Imposta il flag che indica se il processo
3808   chiamante può leggere il registro di processore contenente il contatore dei
3809   \textit{timestamp} (TSC, o \textit{Time Stamp Counter}) da indicare con il
3810   valore di \param{arg2}. Si deve specificare \const{PR\_TSC\_ENABLE} per
3811   abilitare la lettura o \const{PR\_TSC\_SIGSEGV} per disabilitarla con la
3812   generazione di un segnale di \signal{SIGSEGV} (vedi
3813   sez.~\ref{sec:sig_prog_error}). La lettura viene automaticamente
3814   disabilitata se si attiva il \itindex{secure~computing~mode} \textit{secure
3815     computing mode}.  Introdotta a partire dal kernel 2.6.26, solo su x86.
3816
3817 \item[\const{PR\_GET\_TSC}] Ottiene il valore del flag che controlla la
3818   lettura del contattore dei \textit{timestamp}, salvato all'indirizzo
3819   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3820   partire dal kernel 2.6.26, solo su x86.
3821 % articoli sul TSC e relativi problemi: http://lwn.net/Articles/209101/,
3822 % http://blog.cr0.org/2009/05/time-stamp-counter-disabling-oddities.html,
3823 % http://en.wikipedia.org/wiki/Time_Stamp_Counter
3824
3825 \item[\const{PR\_SET\_UNALIGN}] Imposta la modalità di controllo per l'accesso
3826   a indirizzi di memoria non allineati, che in varie architetture risultano
3827   illegali, da indicare con il valore di \param{arg2}. Si deve specificare il
3828   valore \const{PR\_UNALIGN\_NOPRINT} per ignorare gli accessi non allineati,
3829   ed il valore \const{PR\_UNALIGN\_SIGBUS} per generare un segnale di
3830   \signal{SIGBUS} (vedi sez.~\ref{sec:sig_prog_error}) in caso di accesso non
3831   allineato.  Introdotta con diverse versioni su diverse architetture.
3832
3833 \item[\const{PR\_GET\_UNALIGN}] Ottiene il valore della modalità di controllo
3834   per l'accesso a indirizzi di memoria non allineati, salvato all'indirizzo
3835   puntato \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta con
3836   diverse versioni su diverse architetture.
3837 \item[\const{PR\_MCE\_KILL}] Imposta la politica di gestione degli errori
3838   dovuti a corruzione della memoria per problemi hardware. Questo tipo di
3839   errori vengono riportati dall'hardware di controllo della RAM e vengono
3840   gestiti dal kernel,\footnote{la funzionalità è disponibile solo sulle
3841     piattaforme più avanzate che hanno il supporto hardware per questo tipo di
3842     controlli.} ma devono essere opportunamente riportati ai processi che
3843   usano quella parte di RAM che presenta errori; nel caso specifico questo
3844   avviene attraverso l'emissione di un segnale di \signal{SIGBUS} (vedi
3845   sez.~\ref{sec:sig_prog_error}).\footnote{in particolare viene anche
3846     impostato il valore di \var{si\_code} in \struct{siginfo\_t} a
3847     \const{BUS\_MCEERR\_AO}; per il significato di tutto questo si faccia
3848     riferimento alla trattazione di sez.~\ref{sec:sig_sigaction}.}
3849
3850   Il comportamento di default prevede che per tutti i processi si applichi la
3851   politica generale di sistema definita nel file
3852   \sysctlfile{vm/memory\_failure\_early\_kill}, ma specificando
3853   per \param{arg2} il valore \const{PR\_MCE\_KILL\_SET} è possibile impostare
3854   con il contenuto di \param{arg3} una politica specifica del processo
3855   chiamante. Si può tornare alla politica di default del sistema utilizzando
3856   invece per \param{arg2} il valore \const{PR\_MCE\_KILL\_CLEAR}. In tutti i
3857   casi, per compatibilità con eventuali estensioni future, tutti i valori
3858   degli argomenti non utilizzati devono essere esplicitamente posti a zero,
3859   pena il fallimento della chiamata con un errore di \errval{EINVAL}.
3860
3861   In caso di impostazione di una politica specifica del processo con
3862   \const{PR\_MCE\_KILL\_SET} i valori di \param{arg3} possono essere soltanto
3863   due, che corrispondono anche al valore che si trova nell'impostazione
3864   generale di sistema di \texttt{memory\_failure\_early\_kill}, con
3865   \const{PR\_MCE\_KILL\_EARLY} si richiede l'emissione immediata di
3866   \signal{SIGBUS} non appena viene rilevato un errore, mentre con
3867   \const{PR\_MCE\_KILL\_LATE} il segnale verrà inviato solo quando il processo
3868   tenterà un accesso alla memoria corrotta. Questi due valori corrispondono
3869   rispettivamente ai valori 1 e 0 di
3870   \texttt{memory\_failure\_early\_kill}.\footnote{in sostanza nel primo caso
3871     viene immediatamente inviato il segnale a tutti i processi che hanno la
3872     memoria corrotta mappata all'interno del loro spazio degli indirizzi, nel
3873     secondo caso prima la pagina di memoria viene tolta dallo spazio degli
3874     indirizzi di ciascun processo, mentre il segnale viene inviato solo quei
3875     processi che tentano di accedervi.} Si può usare per \param{arg3} anche un
3876   terzo valore, \const{PR\_MCE\_KILL\_DEFAULT}, che corrisponde a impostare
3877   per il processo la politica di default.\footnote{si presume la politica di
3878     default corrente, in modo da non essere influenzati da un eventuale
3879     successivo cambiamento della stessa.} Introdotta a partire dal kernel
3880   2.6.32.
3881 \item[\const{PR\_MCE\_KILL\_GET}] Ottiene come valore di ritorno della
3882   funzione la politica di gestione degli errori dovuti a corruzione della
3883   memoria. Tutti gli argomenti non utilizzati (al momento tutti) devono essere
3884   nulli pena la ricezione di un errore di \errval{EINVAL}. Introdotta a
3885   partire dal kernel 2.6.32.
3886 % TODO: verificare questa parte
3887 \item[\const{PR\_SET\_CHILD\_SUBREAPER}] Imposta il processo indicato con il
3888   \ids{PID} specificato da \param{arg2} come nuovo ``\textsl{genitore
3889     adottivo}'' per tutti i processi discendenti del chiamante che
3890   diventeranno orfani, sostituendo in questo ruolo \cmd{init} (si ricordi
3891   quanto illustrato in sez.~\ref{sec:proc_termination}). Introdotta a partire
3892   dal kernel 3.4.
3893 \item[\const{PR\_GET\_CHILD\_SUBREAPER}] Ottiene il \ids{PID} del processo a
3894   cui vengono assegnati come figli gli orfani del processo
3895   corrente. Introdotta a partire dal kernel 3.4.
3896   % TODO documentare PR_SET_SECCOMP introdotto a partire dal kernel 3.5. Vedi:
3897   % * Documentation/prctl/seccomp_filter.txt
3898   % * http://lwn.net/Articles/475043/
3899
3900 \label{sec:prctl_operation}
3901 \end{basedescript}
3902
3903
3904
3905 \subsection{La \textit{system call} \func{clone}}
3906 \label{sec:process_clone}
3907
3908 La funzione tradizionale con cui creare un nuovo processo in un sistema
3909 Unix-like, come illustrato in sez.~\ref{sec:proc_fork}, è \func{fork}, ma con
3910 l'introduzione del supporto del kernel per i \textit{thread} (vedi
3911 cap.~\ref{cha:threads}), si è avuta la necessità di una interfaccia che
3912 consentisse un maggiore controllo sulla modalità con cui vengono creati nuovi
3913 processi, che poi è stata utilizzata anche per fornire supporto per le
3914 tecnologie di virtualizzazione dei processi (i cosiddetti \textit{container}).
3915
3916 Per questo l'interfaccia per la creazione di un nuovo processo è stata
3917 delegata ad una nuova \textit{system call}, \funcm{sys\_clone}, che consente
3918 di reimplementare anche la tradizionale \func{fork}. In realtà in questo caso
3919 più che di nuovi processi si può parlare della creazioni di nuovi
3920 ``\textit{task}'' del kernel che possono assumere la veste sia di un processo
3921 classico isolato dagli altri come quelli trattati finora, che di un
3922 \textit{thread} in cui la memoria viene condivisa fra il processo chiamante ed
3923 il nuovo processo creato, come quelli che vedremo in
3924 sez.~\ref{sec:linux_thread}. Per evitare confusione fra \textit{thread} e
3925 processi ordinari, abbiamo deciso di usare la nomenclatura \textit{task} per
3926 indicare la unità di esecuzione generica messa a disposizione del kernel che
3927 \texttt{sys\_clone} permette di creare.
3928
3929 Oltre a questo la funzione consente, ad uso delle nuove funzionalità di
3930 virtualizzazione dei processi, di creare nuovi \textit{namespace} per una
3931 serie di proprietà generali dei processi (come l'elenco dei \ids{PID},
3932 l'albero dei file, i \itindex{mount~point} \textit{mount point}, la rete,
3933 ecc.), che consentono di creare gruppi di processi che vivono in una sorta di
3934 spazio separato dagli altri, che costituisce poi quello che viene chiamato un
3935 \textit{container}.
3936
3937 La \textit{system call} richiede soltanto due argomenti: il
3938 primo, \param{flags}, consente di controllare le modalità di creazione del
3939 nuovo \textit{task}, il secondo, \param{child\_stack}, imposta l'indirizzo
3940 dello \itindex{stack} \textit{stack} per il nuovo \textit{task}, e deve essere
3941 indicato quando si intende creare un \textit{thread}. L'esecuzione del
3942 programma creato da \func{sys\_clone} riprende, come per \func{fork}, da
3943 dopo l'esecuzione della stessa.
3944
3945 La necessità di avere uno \itindex{stack} \textit{stack} alternativo c'è solo
3946 quando si intende creare un \textit{thread}, in tal caso infatti il nuovo
3947 \textit{task} vede esattamente la stessa memoria del \textit{task}
3948 ``\textsl{padre}'',\footnote{in questo caso per padre si intende semplicemente
3949   il \textit{task} che ha eseguito \func{sys\_clone} rispetto al \textit{task}
3950   da essa creato, senza nessuna delle implicazioni che il concetto ha per i
3951   processi.} e nella sua esecuzione alla prima chiamata di una funzione
3952 andrebbe a scrivere sullo \textit{stack} usato anche dal padre (si ricordi
3953 quanto visto in sez.~\ref{sec:proc_mem_layout} riguardo all'uso dello
3954 \textit{stack}).
3955
3956 Per evitare di doversi garantire contro la evidente possibilità di
3957 \itindex{race~condition} \textit{race condition} che questa situazione
3958 comporta (vedi sez.~\ref{sec:proc_race_cond} per una spiegazione della
3959 problematica) è necessario che il chiamante allochi preventivamente un'area di
3960 memoria.  In genere lo si fa con una \func{malloc} che allochi un buffer che
3961 la funzione imposterà come \textit{stack} del nuovo processo, avendo
3962 ovviamente cura di non utilizzarlo direttamente nel processo chiamante.
3963
3964 In questo modo i due \textit{task} avranno degli \textit{stack} indipendenti e
3965 non si dovranno affrontare problematiche di \itindex{race~condition}
3966 \textit{race condition}.  Si tenga presente inoltre che in molte architetture
3967 di processore lo \textit{stack} cresce verso il basso, pertanto in tal caso
3968 non si dovrà specificare per \param{child\_stack} il puntatore restituito da
3969 \func{malloc}, ma un puntatore alla fine del buffer da essa allocato.
3970
3971 Dato che tutto ciò è necessario solo per i \textit{thread} che condividono la
3972 memoria, la \textit{system call}, a differenza della funzione di libreria che
3973 vedremo a breve, consente anche di passare per \param{child\_stack} il valore
3974 \val{NULL}, che non imposta un nuovo \textit{stack}. Se infatti si crea un
3975 processo, questo ottiene un suo nuovo spazio degli indirizzi (è sottinteso
3976 cioè che non si stia usando il flag \const{CLONE\_VM} che vedremo a breve) ed
3977 in questo caso si applica la semantica del \itindex{copy~on~write}
3978 \textit{copy on write} illustrata in sez.~\ref{sec:proc_fork}, per cui le
3979 pagine dello \textit{stack} verranno automaticamente copiate come le altre e
3980 il nuovo processo avrà un suo \textit{stack} totalmente indipendente da quello
3981 del padre.
3982
3983 Dato che l'uso principale della nuova \textit{system call} è quello relativo
3984 alla creazione dei \textit{thread}, la \acr{glibc} definisce una funzione di
3985 libreria con una sintassi diversa, orientata a questo scopo, e la
3986 \textit{system call} resta accessibile solo se invocata esplicitamente come
3987 visto in sez.~\ref{sec:proc_syscall}.\footnote{ed inoltre per questa
3988   \textit{system call} non è disponibile la chiamata veloce con
3989   \texttt{vsyscall}.} La funzione di libreria si chiama semplicemente
3990 \funcd{clone} ed il suo prototipo è:
3991
3992 \begin{funcproto}{
3993 \fhead{sched.h}
3994 \fdecl{int clone(int (*fn)(void *), void *child\_stack, int flags, void *arg,
3995   ...  \\
3996 \phantom{int clone(}/* pid\_t *ptid, struct user\_desc *tls, pid\_t *ctid */ )}
3997 \fdesc{Crea un nuovo processo o \textit{thread}.}
3998 }
3999 {La funzione ritorna il \textit{Thread ID} assegnato al nuovo processo in caso
4000   di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
4001   valori:
4002 \begin{errlist}
4003     \item[\errcode{EAGAIN}] sono già in esecuzione troppi processi.
4004     \item[\errcode{EINVAL}] si è usata una combinazione non valida di flag o
4005       un valore nullo per \param{child\_stack}.
4006     \item[\errcode{ENOMEM}] non c'è memoria sufficiente per creare una nuova
4007       \struct{task\_struct} o per copiare le parti del contesto del chiamante
4008       necessarie al nuovo \textit{task}.
4009     \item[\errcode{EPERM}] non si hanno i privilegi di amministratore
4010       richiesti dai flag indicati.
4011 \end{errlist}}
4012 \end{funcproto}
4013
4014 % NOTE: una pagina con la descrizione degli argomenti:
4015 % * http://www.lindevdoc.org/wiki/Clone
4016
4017 La funzione prende come primo argomento \param{fn} il puntatore alla funzione
4018 che verrà messa in esecuzione nel nuovo processo, che può avere un unico
4019 argomento di tipo puntatore a \ctyp{void}, il cui valore viene passato dal
4020 terzo argomento \param{arg}. Per quanto il precedente prototipo possa
4021 intimidire nella sua espressione, in realtà l'uso è molto semplice basterà
4022 definire una qualunque funzione \param{fn} che restituisce un intero ed ha
4023 come argomento un puntatore a \ctyp{void}, e \code{fn(arg)} sarà eseguita in
4024 un nuovo processo.
4025
4026 Il nuovo processo resterà in esecuzione fintanto che la funzione \param{fn}
4027 non ritorna, o esegue \func{exit} o viene terminata da un segnale. Il valore
4028 di ritorno della funzione (o quello specificato con \func{exit}) verrà
4029 utilizzato come stato di uscita della funzione. I tre
4030 argomenti \param{ptid}, \param{tls} e \param{ctid} sono opzionali e sono
4031 presenti solo a partire dal kernel 2.6 e sono stati aggiunti come supporto per
4032 le funzioni di gestione dei \textit{thread} (la \textit{Native Thread Posix
4033   Library}, vedi sez.~\ref{sec:linux_ntpl}) nella \acr{glibc}, essi vengono
4034 utilizzati soltanto se si sono specificati rispettivamente i flag
4035 \const{CLONE\_PARENT\_SETTID}, \const{CLONE\_SETTLS} e
4036 \const{CLONE\_CHILD\_SETTID}.
4037
4038 La funzione ritorna un l'identificatore del nuovo \textit{task}, denominato
4039 \texttt{Thread ID} (da qui in avanti \ids{TID}) il cui significato è analogo
4040 al \ids{PID} dei normali processi e che a questo corrisponde qualora si crei
4041 un processo ordinario e non un \textit{thread}.
4042
4043 Il comportamento di \func{clone}, che si riflette sulle caratteristiche del
4044 nuovo processo da essa creato, è controllato principalmente
4045 dall'argomento \param{flags}, che deve essere specificato come maschera
4046 binaria, ottenuta con un OR aritmetico di una delle costanti del seguente
4047 elenco, che illustra quelle attualmente disponibili:\footnote{si fa
4048   riferimento al momento della stesura di questa sezione, cioè con il kernel
4049   3.2.}
4050
4051 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
4052
4053 \item[\const{CLONE\_CHILD\_CLEARTID}] cancella il valore del \ids{TID}
4054   all'indirizzo dato dall'argomento \param{ctid}, eseguendo un riattivazione
4055   del \textit{futex} (vedi sez.~\ref{sec:xxx_futex}) a quell'indirizzo; questo
4056   flag viene utilizzato dalla librerie di gestione dei \textit{thread}.
4057 \item[\const{CLONE\_CHILD\_SETTID}] scrive il \ids{TID} del \textit{thread}
4058   figlio all'indirizzo dato dall'argomento \param{ctid}. Questo flag viene
4059   utilizzato dalla librerie di gestione dei \textit{thread}.
4060 \item[\const{CLONE\_FILES}] se impostato il nuovo processo condividerà con il
4061   padre la \itindex{file~descriptor~table} \textit{file descriptor table}
4062   (vedi sez.~\ref{sec:file_fd}), questo significa che ogni \textit{file
4063     descriptor} aperto da un processo verrà visto anche dall'altro e che ogni
4064   chiusura o cambiamento dei \textit{file descriptor flag} di un \textit{file
4065     descriptor} verrà per entrambi.
4066
4067   Se non viene impostato il processo figlio eredita una copia della
4068   \itindex{file~descriptor~table} \textit{file descriptor table} del padre e
4069   vale la semantica classica della gestione dei \textit{file descriptor}, che
4070   costituisce il comportamento ordinario di un sistema unix-like e che
4071   illustreremo in dettaglio in sez.~\ref{sec:file_shared_access}.
4072
4073 \item[\const{CLONE\_FS}] se questo flag viene impostato il nuovo processo
4074   condividerà con il padre le informazioni
4075
4076 \item[\const{CLONE\_IO}]
4077 \item[\const{CLONE\_NEWIPC}]
4078 \item[\const{CLONE\_NEWNET}]
4079 \item[\const{CLONE\_NEWNS}]
4080 \item[\const{CLONE\_NEWPID}]
4081 \item[\const{CLONE\_NEWUTS}]
4082 \item[\const{CLONE\_PARENT}]
4083 \item[\const{CLONE\_PARENT\_SETTID}]
4084 \item[\const{CLONE\_PID}]
4085 \item[\const{CLONE\_PTRACE}]
4086 \item[\const{CLONE\_SETTLS}]
4087 \item[\const{CLONE\_SIGHAND}]
4088 \item[\const{CLONE\_STOPPED}]
4089 \item[\const{CLONE\_SYSVSEM}]
4090 \item[\const{CLONE\_THREAD}]
4091 \item[\const{CLONE\_UNTRACED}]
4092 \item[\const{CLONE\_VFORK}]
4093 \item[\const{CLONE\_VM}]
4094 \end{basedescript}
4095
4096
4097 %TODO trattare unshare, vedi anche http://lwn.net/Articles/532748/
4098
4099
4100 %TODO trattare kcmp aggiunta con il kernel 3.5, vedi
4101 % https://lwn.net/Articles/478111/
4102
4103 \subsection{La funzione \func{ptrace}}
4104 \label{sec:process_ptrace}
4105
4106 Da fare
4107
4108 % TODO: trattare PTRACE_SEIZE, aggiunta con il kernel 3.1
4109 % TODO: trattare PTRACE_O_EXITKILL, aggiunta con il kernel 3.8 (vedi
4110 % http://lwn.net/Articles/529060/)
4111
4112
4113
4114 \subsection{La gestione delle operazioni in virgola mobile}
4115 \label{sec:process_fenv}
4116
4117 Da fare.
4118
4119 % TODO eccezioni ed arrotondamenti per la matematica in virgola mobile
4120 % consultare la manpage di fenv, math_error, fpclassify, matherr, isgreater,
4121 % isnan, nan, INFINITY
4122
4123
4124 \subsection{L'accesso alle porte di I/O}
4125 \label{sec:process_io_port}
4126
4127 %
4128 % TODO l'I/O sulle porte di I/O
4129 % consultare le manpage di ioperm, iopl e outb
4130 % non c'entra nulla qui, va trovato un altro posto (altri meccanismi di I/O in
4131 % fileintro ?)
4132
4133 Da fare
4134
4135
4136 %\subsection{La gestione di architetture a nodi multipli}
4137 %\label{sec:process_NUMA}
4138
4139 % TODO trattare i cpuset, che attiene anche a NUMA, e che possono essere usati
4140 % per associare l'uso di gruppi di processori a gruppi di processi (vedi
4141 % manpage omonima)
4142 % TODO trattare getcpu, che attiene anche a NUMA, mettere qui anche
4143 % sched_getcpu, che potrebbe essere indipendente ma richiama getcpu
4144
4145 %TODO trattare le funzionalità per il NUMA
4146 % vedi man numa e, mbind, get_mempolicy, set_mempolicy,
4147 % le pagine di manuale relative
4148 % vedere anche dove metterle...
4149
4150 % \subsection{La gestione dei moduli}
4151 % \label{sec:kernel_modules}
4152
4153 % da fare
4154
4155 %TODO trattare init_module e finit_module (quest'ultima introdotta con il
4156 %kernel 3.8)
4157
4158
4159
4160 \section{Problematiche di programmazione multitasking}
4161 \label{sec:proc_multi_prog}
4162
4163 Benché i processi siano strutturati in modo da apparire il più possibile come
4164 indipendenti l'uno dall'altro, nella programmazione in un sistema multitasking
4165 occorre tenere conto di una serie di problematiche che normalmente non
4166 esistono quando si ha a che fare con un sistema in cui viene eseguito un solo
4167 programma alla volta.
4168
4169 Per questo motivo, essendo questo argomento di carattere generale, ci è parso
4170 opportuno introdurre sinteticamente queste problematiche, che ritroveremo a
4171 più riprese in capitoli successivi, in questa sezione conclusiva del capitolo
4172 in cui abbiamo affrontato la gestione dei processi, sottolineando come esse
4173 diventino cogenti quando invece si usano i \textit{thread}.
4174
4175
4176 \subsection{Le operazioni atomiche}
4177 \label{sec:proc_atom_oper}
4178
4179 La nozione di \textsl{operazione atomica} deriva dal significato greco della
4180 parola atomo, cioè indivisibile; si dice infatti che un'operazione è atomica
4181 quando si ha la certezza che, qualora essa venga effettuata, tutti i passaggi
4182 che devono essere compiuti per realizzarla verranno eseguiti senza possibilità
4183 di interruzione in una fase intermedia.
4184
4185 In un ambiente multitasking il concetto è essenziale, dato che un processo può
4186 essere interrotto in qualunque momento dal kernel che mette in esecuzione un
4187 altro processo o dalla ricezione di un segnale. Occorre pertanto essere
4188 accorti nei confronti delle possibili \itindex{race~condition} \textit{race
4189   condition} (vedi sez.~\ref{sec:proc_race_cond}) derivanti da operazioni
4190 interrotte in una fase in cui non erano ancora state completate.
4191
4192 Nel caso dell'interazione fra processi la situazione è molto più semplice, ed
4193 occorre preoccuparsi della atomicità delle operazioni solo quando si ha a che
4194 fare con meccanismi di intercomunicazione (che esamineremo in dettaglio in
4195 cap.~\ref{cha:IPC}) o nelle operazioni con i file (vedremo alcuni esempi in
4196 sez.~\ref{sec:file_shared_access}). In questi casi in genere l'uso delle
4197 appropriate funzioni di libreria per compiere le operazioni necessarie è
4198 garanzia sufficiente di atomicità in quanto le \textit{system call} con cui
4199 esse sono realizzate non possono essere interrotte (o subire interferenze
4200 pericolose) da altri processi.
4201
4202 Nel caso dei segnali invece la situazione è molto più delicata, in quanto lo
4203 stesso processo, e pure alcune \textit{system call}, possono essere interrotti
4204 in qualunque momento, e le operazioni di un eventuale \textit{signal handler}
4205 sono compiute nello stesso spazio di indirizzi del processo. Per questo, anche
4206 il solo accesso o l'assegnazione di una variabile possono non essere più
4207 operazioni atomiche (torneremo su questi aspetti in
4208 sez.~\ref{sec:sig_adv_control}).
4209
4210 Qualora invece si usino i \textit{thread}, in cui lo spazio degli indirizzi è
4211 condiviso, il problema è sempre presente, perché qualunque \textit{thread} può
4212 interromperne un altro in qualunque momento e l'atomicità di qualunque
4213 operazione è messa in discussione, per cui l'assenza di eventuali
4214 \itindex{race~condition} \textit{race condition} deve essere sempre verificata
4215 nei minimi dettagli.
4216
4217 In questo caso il sistema provvede un tipo di dato, il \type{sig\_atomic\_t},
4218 il cui accesso è assicurato essere atomico.  In pratica comunque si può
4219 assumere che, in ogni piattaforma su cui è implementato Linux, il tipo
4220 \ctyp{int}, gli altri interi di dimensione inferiore ed i puntatori sono
4221 atomici. Non è affatto detto che lo stesso valga per interi di dimensioni
4222 maggiori (in cui l'accesso può comportare più istruzioni in assembler) o per
4223 le strutture di dati. In tutti questi casi è anche opportuno marcare come
4224 \direct{volatile} le variabili che possono essere interessate ad accesso
4225 condiviso, onde evitare problemi con le ottimizzazioni del codice.
4226
4227
4228
4229 \subsection{Le \textit{race condition} ed i \textit{deadlock}}
4230 \label{sec:proc_race_cond}
4231
4232 \itindbeg{race~condition}
4233
4234 Si definiscono \textit{race condition} tutte quelle situazioni in cui processi
4235 diversi operano su una risorsa comune, ed in cui il risultato viene a
4236 dipendere dall'ordine in cui essi effettuano le loro operazioni. Il caso
4237 tipico è quello di un'operazione che viene eseguita da un processo in più
4238 passi, e può essere compromessa dall'intervento di un altro processo che
4239 accede alla stessa risorsa quando ancora non tutti i passi sono stati
4240 completati.
4241
4242 Dato che in un sistema multitasking ogni processo può essere interrotto in
4243 qualunque momento per farne subentrare un altro in esecuzione, niente può
4244 assicurare un preciso ordine di esecuzione fra processi diversi o che una
4245 sezione di un programma possa essere eseguita senza interruzioni da parte di
4246 altri. Queste situazioni comportano pertanto errori estremamente subdoli e
4247 difficili da tracciare, in quanto nella maggior parte dei casi tutto
4248 funzionerà regolarmente, e solo occasionalmente si avranno degli errori.
4249
4250 Per questo occorre essere ben consapevoli di queste problematiche, e del fatto
4251 che l'unico modo per evitarle è quello di riconoscerle come tali e prendere
4252 gli adeguati provvedimenti per far sì che non si verifichino. Casi tipici di
4253 \textit{race condition} si hanno quando diversi processi accedono allo stesso
4254 file, o nell'accesso a meccanismi di intercomunicazione come la memoria
4255 condivisa.
4256
4257 In questi casi, se non si dispone della possibilità di eseguire atomicamente
4258 le operazioni necessarie, occorre che quelle parti di codice in cui si
4259 compiono le operazioni sulle risorse condivise (le cosiddette
4260 \index{sezione~critica} \textsl{sezioni critiche}) del programma, siano
4261 opportunamente protette da meccanismi di sincronizzazione (torneremo su queste
4262 problematiche di questo tipo in cap.~\ref{cha:IPC}).
4263
4264 Nel caso dei \textit{thread} invece la situazione è molto più delicata e
4265 sostanzialmente qualunque accesso in memoria (a buffer, variabili o altro) può
4266 essere soggetto a \textit{race condition} dato potrebbe essere interrotto in
4267 qualunque momento da un altro \textit{thread}. In tal caso occorre pianificare
4268 con estrema attenzione l'uso delle variabili ed utilizzare i vari meccanismi
4269 di sincronizzazione che anche in questo caso sono disponibili (torneremo su
4270 queste problematiche di questo tipo in cap.~\ref{sez:thread_xxx})
4271
4272 \itindbeg{deadlock} Un caso particolare di \textit{race condition} sono poi i
4273 cosiddetti \textit{deadlock} (traducibile in \textsl{condizione di stallo}),
4274 che particolarmente gravi in quanto comportano spesso il blocco completo di un
4275 servizio, e non il fallimento di una singola operazione. Per definizione un
4276 \textit{deadlock} è una situazione in cui due o più processi non sono più in
4277 grado di proseguire perché ciascuno aspetta il risultato di una operazione che
4278 dovrebbe essere eseguita dall'altro.
4279
4280 L'esempio tipico di una situazione che può condurre ad un
4281 \textit{deadlock} è quello in cui un flag di
4282 ``\textsl{occupazione}'' viene rilasciato da un evento asincrono (come un
4283 segnale o un altro processo) fra il momento in cui lo si è controllato
4284 (trovandolo occupato) e la successiva operazione di attesa per lo sblocco. In
4285 questo caso, dato che l'evento di sblocco del flag è avvenuto senza che ce ne
4286 accorgessimo proprio fra il controllo e la messa in attesa, quest'ultima
4287 diventerà perpetua (da cui il nome di \textit{deadlock}).
4288
4289 In tutti questi casi è di fondamentale importanza il concetto di atomicità
4290 visto in sez.~\ref{sec:proc_atom_oper}; questi problemi infatti possono essere
4291 risolti soltanto assicurandosi, quando essa sia richiesta, che sia possibile
4292 eseguire in maniera atomica le operazioni necessarie.
4293
4294 \itindend{race~condition}
4295 \itindend{deadlock}
4296
4297
4298 \subsection{Le funzioni rientranti}
4299 \label{sec:proc_reentrant}
4300
4301 \index{funzioni!rientranti|(}
4302
4303 Si dice \textsl{rientrante} una funzione che può essere interrotta in
4304 qualunque punto della sua esecuzione ed essere chiamata una seconda volta da
4305 un altro \itindex{thread} \textit{thread} di esecuzione senza che questo
4306 comporti nessun problema nell'esecuzione della stessa. La problematica è
4307 comune nella programmazione \itindex{thread} \textit{multi-thread}, ma si
4308 hanno gli stessi problemi quando si vogliono chiamare delle funzioni
4309 all'interno dei gestori dei segnali.
4310
4311 Fintanto che una funzione opera soltanto con le variabili locali è rientrante;
4312 queste infatti vengono allocate nello \itindex{stack} \textit{stack}, ed
4313 un'altra invocazione non fa altro che allocarne un'altra copia. Una funzione
4314 può non essere rientrante quando opera su memoria che non è nello
4315 \itindex{stack} \textit{stack}.  Ad esempio una funzione non è mai rientrante
4316 se usa una \index{variabili!globali} variabile globale o
4317 \index{variabili!statiche} statica.
4318
4319 Nel caso invece la funzione operi su un oggetto allocato dinamicamente, la
4320 cosa viene a dipendere da come avvengono le operazioni: se l'oggetto è creato
4321 ogni volta e ritornato indietro la funzione può essere rientrante, se invece
4322 esso viene individuato dalla funzione stessa due chiamate alla stessa funzione
4323 potranno interferire quando entrambe faranno riferimento allo stesso oggetto.
4324 Allo stesso modo una funzione può non essere rientrante se usa e modifica un
4325 oggetto che le viene fornito dal chiamante: due chiamate possono interferire
4326 se viene passato lo stesso oggetto; in tutti questi casi occorre molta cura da
4327 parte del programmatore.
4328
4329 In genere le funzioni di libreria non sono rientranti, molte di esse ad
4330 esempio utilizzano \index{variabili!statiche} variabili statiche, la
4331 \acr{glibc} però mette a disposizione due macro di compilatore,
4332 \macro{\_REENTRANT} e \macro{\_THREAD\_SAFE}, la cui definizione attiva le
4333 versioni rientranti di varie funzioni di libreria, che sono identificate
4334 aggiungendo il suffisso \code{\_r} al nome della versione normale.
4335
4336 \index{funzioni!rientranti|)}
4337
4338
4339 % LocalWords:  multitasking like VMS child process identifier pid sez shell fig
4340 % LocalWords:  parent kernel init pstree keventd kswapd table struct linux call
4341 % LocalWords:  nell'header scheduler system interrupt timer HZ asm Hertz clock
4342 % LocalWords:  l'alpha tick fork wait waitpid exit exec image glibc int pgid ps
4343 % LocalWords:  sid thread Ingo Molnar ppid getpid getppid sys unistd LD threads
4344 % LocalWords:  void tempnam pathname sibling cap errno EAGAIN ENOMEM
4345 % LocalWords:  stack read only copy write tab client spawn forktest sleep PATH
4346 % LocalWords:  source LIBRARY scheduling race condition printf descriptor dup
4347 % LocalWords:  close group session tms lock vfork execve BSD stream main abort
4348 % LocalWords:  SIGABRT SIGCHLD SIGHUP foreground SIGCONT termination signal ANY
4349 % LocalWords:  handler kill EINTR POSIX options WNOHANG ECHILD option WUNTRACED
4350 % LocalWords:  dump bits rusage getrusage heap const filename argv envp EACCES
4351 % LocalWords:  filesystem noexec EPERM suid sgid root nosuid ENOEXEC ENOENT ELF
4352 % LocalWords:  ETXTBSY EINVAL ELIBBAD BIG EFAULT EIO ENAMETOOLONG ELOOP ENOTDIR
4353 % LocalWords:  ENFILE EMFILE argc execl path execv execle execlp execvp vector
4354 % LocalWords:  list environ NULL umask utime cutime ustime fcntl linker
4355 % LocalWords:  opendir libc interpreter FreeBSD capabilities mandatory access
4356 % LocalWords:  control MAC SELinux security modules LSM superuser uid gid saved
4357 % LocalWords:  effective euid egid dell' fsuid fsgid getuid geteuid getgid SVr
4358 % LocalWords:  getegid IDS NFS setuid setgid all' logout utmp screen xterm TODO
4359 % LocalWords:  setreuid setregid FIXME ruid rgid seteuid setegid setresuid size
4360 % LocalWords:  setresgid getresuid getresgid value result argument setfsuid DAC
4361 % LocalWords:  setfsgid NGROUPS sysconf getgroups getgrouplist groups ngroups
4362 % LocalWords:  setgroups initgroups patch LIDS CHOWN OVERRIDE Discrectionary PF
4363 % LocalWords:  SEARCH chattr sticky NOATIME socket domain immutable append mmap
4364 % LocalWords:  broadcast multicast multicasting memory locking mlock mlockall
4365 % LocalWords:  shmctl ioperm iopl chroot ptrace accounting swap reboot hangup
4366 % LocalWords:  vhangup mknod lease permitted inherited inheritable bounding AND
4367 % LocalWords:  capability capget capset header ESRCH undef version obj clear PT
4368 % LocalWords:  pag ssize length proc capgetp preemptive cache runnable  contest
4369 % LocalWords:  SIGSTOP soft slice nice niceness counter which SC switch side
4370 % LocalWords:  getpriority who setpriority RTLinux RTAI Adeos fault FIFO  COUNT
4371 % LocalWords:  yield Robin setscheduler policy param OTHER priority setparam to
4372 % LocalWords:  min getparam getscheduler interval robin ENOSYS fifo ping long
4373 % LocalWords:  affinity setaffinity unsigned mask cpu NUMA CLR ISSET SETSIZE RR
4374 % LocalWords:  getaffinity assembler deadlock REENTRANT SAFE tgz MYPGRP l'OR rr
4375 % LocalWords:  WIFEXITED WEXITSTATUS WIFSIGNALED WTERMSIG WCOREDUMP WIFSTOPPED
4376 % LocalWords:  WSTOPSIG opt char INTERP arg SIG IGN DFL mascheck grp FOWNER RAW
4377 % LocalWords:  FSETID SETPCAP BIND SERVICE ADMIN PACKET IPC OWNER MODULE RAWIO
4378 % LocalWords:  PACCT RESOURCE TTY CONFIG SETFCAP hdrp datap libcap lcap text tp
4379 % LocalWords:  get ncap caps CapInh CapPrm fffffeff CapEff getcap STAT dall'I
4380 % LocalWords:  inc PRIO SUSv PRGR prio SysV SunOS Ultrix sched timespec len sig
4381 % LocalWords:  cpusetsize cpuset atomic tickless redirezione WCONTINUED stopped
4382 % LocalWords:  waitid NOCLDSTOP ENOCHLD WIFCONTINUED ifdef endif idtype siginfo
4383 % LocalWords:  infop ALL WEXITED WSTOPPED WNOWAIT signo CLD EXITED KILLED page
4384 % LocalWords:  CONTINUED sources forking Spawned successfully executing exiting
4385 % LocalWords:  next cat for COMMAND pts bash defunct TRAPPED DUMPED PR effects
4386 % LocalWords:  SIGKILL static RLIMIT preemption PREEMPT VOLUNTARY IDLE RTPRIO
4387 % LocalWords:  completely fair compat uniform CFQ queuing elevator dev cfq RT
4388 % LocalWords:  documentation block syscall ioprio IPRIO CLASS class best effort
4389 % LocalWords:  refresh semop dnotify MADV DONTFORK prctl WCLONE WALL big mount
4390 % LocalWords:  WNOTHREAD DUMPABLE KEEPCAPS IRIX CAPBSET endianness endian flags
4391 % LocalWords:  little PPC PowerPC FPEMU NOPRINT SIGFPE FPEXC point FP SW malloc
4392 % LocalWords:  exception EXC ENABLE OVF overflow UND underflow RES INV DISABLED
4393 % LocalWords:  NONRECOV ASYNC KEEP securebits NAME NUL PDEATHSIG SECCOMP VM FS
4394 % LocalWords:  secure computing sigreturn TIMING STATISTICAL TSC MCE conditions
4395 % LocalWords:  timestamp Stamp SIGSEGV UNALIGN SIGBUS MCEERR AO failure early
4396 % LocalWords:  namespace vsyscall SETTID FILES NEWIPC NEWNET NEWNS NEWPID ptid
4397 % LocalWords:  NEWUTS SETTLS SIGHAND SYSVSEM UNTRACED tls ctid CLEARTID panic
4398 % LocalWords:  loader EISDIR SIGTRAP uninterrutible killable EQUAL sizeof XOR
4399 % LocalWords:  destset srcset ALLOC num cpus setsize emacs pager getty TID
4400
4401 %%% Local Variables:
4402 %%% mode: latex
4403 %%% TeX-master: "gapil"
4404 %%% End: