prochand.tex

   1 %% prochand.tex
   2 %%
   3 %% Copyright (C) 2000-2015 by Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{La gestione dei processi}
  13 \label{cha:process_handling}
  14
  15 Come accennato nell'introduzione in un sistema unix-like tutte le operazioni
  16 vengono svolte tramite opportuni processi.  In sostanza questi ultimi vengono
  17 a costituire l'unità base per l'allocazione e l'uso delle risorse del sistema.
  18
  19 Nel precedente capitolo abbiamo esaminato il funzionamento di un processo come
  20 unità a se stante, in questo esamineremo il funzionamento dei processi
  21 all'interno del sistema. Saranno cioè affrontati i dettagli della creazione e
  22 della terminazione dei processi, della gestione dei loro attributi e
  23 privilegi, e di tutte le funzioni a questo connesse. Infine nella sezione
  24 finale introdurremo alcune problematiche generiche della programmazione in
  25 ambiente multitasking.
  26
  27
  28 \section{Le funzioni di base della gestione dei processi}
  29 \label{sec:proc_handling}
  30
  31 In questa sezione tratteremo le problematiche della gestione dei processi
  32 all'interno del sistema, illustrandone tutti i dettagli.  Inizieremo con una
  33 panoramica dell'architettura dei processi, tratteremo poi le funzioni
  34 elementari che permettono di leggerne gli identificatori, per poi passare alla
  35 spiegazione delle funzioni base che si usano per la creazione e la
  36 terminazione dei processi, e per la messa in esecuzione degli altri programmi.
  37
  38
  39 \subsection{L'architettura della gestione dei processi}
  40 \label{sec:proc_hierarchy}
  41
  42 A differenza di quanto avviene in altri sistemi, ad esempio nel VMS la
  43 generazione di nuovi processi è un'operazione privilegiata, una delle
  44 caratteristiche fondanti di Unix, che esamineremo in dettaglio più avanti, è
  45 che qualunque processo può a sua volta generarne altri. Ogni processo è
  46 identificato presso il sistema da un numero univoco, il cosiddetto
  47 \textit{Process ID} o, più brevemente, \ids{PID}, assegnato in forma
  48 progressiva (vedi sez.~\ref{sec:proc_pid}) quando il processo viene creato.
  49
  50 Una seconda caratteristica di un sistema unix-like è che la generazione di un
  51 processo è un'operazione separata rispetto al lancio di un programma. In
  52 genere la sequenza è sempre quella di creare un nuovo processo, il quale
  53 eseguirà, in un passo successivo, il programma desiderato: questo è ad esempio
  54 quello che fa la shell quando mette in esecuzione il programma che gli
  55 indichiamo nella linea di comando.
  56
  57 Una terza caratteristica del sistema è che ogni processo è sempre stato
  58 generato da un altro processo, il processo generato viene chiamato
  59 \textit{processo figlio} (\textit{child process}) mentre quello che lo ha
  60 viene chiamato \textsl{processo padre} (\textit{parent process}). Questo vale
  61 per tutti i processi, con una sola eccezione, dato che ci deve essere un punto
  62 di partenza esiste un processo speciale (che normalmente è \cmd{/sbin/init}),
  63 che come abbiamo accennato in sez.~\ref{sec:intro_kern_and_sys} viene lanciato
  64 dal kernel alla conclusione della fase di avvio. Essendo questo il primo
  65 processo lanciato dal sistema ha sempre il \ids{PID} uguale a 1 e non è figlio
  66 di nessun altro processo.
  67
  68 Ovviamente \cmd{init} è un processo speciale che in genere si occupa di far
  69 partire tutti gli altri processi necessari al funzionamento del sistema,
  70 inoltre \cmd{init} è essenziale per svolgere una serie di compiti
  71 amministrativi nelle operazioni ordinarie del sistema (torneremo su alcuni di
  72 essi in sez.~\ref{sec:proc_termination}) e non può mai essere terminato. La
  73 struttura del sistema comunque consente di lanciare al posto di \cmd{init}
  74 qualunque altro programma, e in casi di emergenza (ad esempio se il file di
  75 \cmd{init} si fosse corrotto) è ad esempio possibile lanciare una shell al suo
  76 posto.\footnote{la cosa si fa passando la riga \cmd{init=/bin/sh} come
  77   parametro di avvio del kernel, l'argomento è di natura sistemistica e
  78   trattato in sez.~5.3 di \cite{AGL}.}
  79
  80 \begin{figure}[!htb]
  81   \footnotesize
  82 \begin{Console}
  83 [piccardi@gont piccardi]$ \textbf{pstree -n}
  84 init-+-keventd
  85      |-kapm-idled
  86      |-kreiserfsd
  87      |-portmap
  88      |-syslogd
  89      |-klogd
  90      |-named
  91      |-rpc.statd
  92      |-gpm
  93      |-inetd
  94      |-junkbuster
  95      |-master-+-qmgr
  96      |        `-pickup
  97      |-sshd
  98      |-xfs
  99      |-cron
 100      |-bash---startx---xinit-+-XFree86
 101      |                       `-WindowMaker-+-ssh-agent
 102      |                                     |-wmtime
 103      |                                     |-wmmon
 104      |                                     |-wmmount
 105      |                                     |-wmppp
 106      |                                     |-wmcube
 107      |                                     |-wmmixer
 108      |                                     |-wmgtemp
 109      |                                     |-wterm---bash---pstree
 110      |                                     `-wterm---bash-+-emacs
 111      |                                                    `-man---pager
 112      |-5*[getty]
 113      |-snort
 114      `-wwwoffled
 115 \end{Console}
 116 %$
 117   \caption{L'albero dei processi, così come riportato dal comando
 118     \cmd{pstree}.}
 119   \label{fig:proc_tree}
 120 \end{figure}
 121
 122 Dato che tutti i processi attivi nel sistema sono comunque generati da
 123 \cmd{init} o da uno dei suoi figli si possono classificare i processi con la
 124 relazione padre/figlio in un'organizzazione gerarchica ad albero. In
 125 fig.~\ref{fig:proc_tree} si è mostrato il risultato del comando \cmd{pstree}
 126 che permette di visualizzare questa struttura, alla cui base c'è \cmd{init}
 127 che è progenitore di tutti gli altri processi.\footnote{in realtà questo non è
 128   del tutto vero, in Linux, specialmente nelle versioni più recenti del
 129   kernel, ci sono alcuni processi speciali (come \cmd{keventd}, \cmd{kswapd},
 130   ecc.) che pur comparendo nei comandi come figli di \cmd{init}, o con
 131   \ids{PID} successivi ad uno, sono in realtà processi interni al kernel e che
 132   non rientrano in questa classificazione.}
 133
 134 \itindbeg{process~table}
 135
 136 Il kernel mantiene una tabella dei processi attivi, la cosiddetta
 137 \textit{process table}. Per ciascun processo viene mantenuta una voce in
 138 questa tabella, costituita da una struttura \kstruct{task\_struct}, che
 139 contiene tutte le informazioni rilevanti per quel processo. Tutte le strutture
 140 usate a questo scopo sono dichiarate nell'\textit{header file}
 141 \file{linux/sched.h}, ed uno schema semplificato, che riporta la struttura
 142 delle principali informazioni contenute nella \struct{task\_struct} (che in
 143 seguito incontreremo a più riprese), è mostrato in
 144 fig.~\ref{fig:proc_task_struct}.
 145
 146 \begin{figure}[!htb]
 147   \centering \includegraphics[width=14cm]{img/task_struct}
 148   \caption{Schema semplificato dell'architettura delle strutture usate dal
 149     kernel nella gestione dei processi.}
 150   \label{fig:proc_task_struct}
 151 \end{figure}
 152
 153 \itindend{process~table}
 154
 155 % TODO la task_struct è cambiata per qualche dettaglio vedi anche
 156 % http://www.ibm.com/developerworks/linux/library/l-linux-process-management/
 157 % TODO completare la parte su quando viene chiamato lo scheduler.
 158
 159 \itindbeg{scheduler}
 160
 161 Come accennato in sez.~\ref{sec:intro_unix_struct} è lo \textit{scheduler} che
 162 decide quale processo mettere in esecuzione; esso viene eseguito in occasione
 163 di dell'invocazione di ogni \textit{system call} ed per ogni interrupt
 164 dall'hardware oltre che in una serie di altre occasioni, e può essere anche
 165 attivato esplicitamente. Il timer di sistema provvede comunque a che esso sia
 166 invocato periodicamente, generando un interrupt periodico secondo una
 167 frequenza predeterminata, specificata dalla costante \const{HZ} del kernel
 168 (torneremo su questo argomento in sez.~\ref{sec:sys_unix_time}), che assicura
 169 che lo \textit{scheduler} venga comunque eseguito ad intervalli regolari e
 170 possa prendere le sue decisioni.
 171
 172 A partire dal kernel 2.6.21 è stato introdotto anche un meccanismo
 173 completamente diverso, detto \textit{tickless}, in cui non c'è più una
 174 interruzione periodica con frequenza prefissata, ma ad ogni chiamata del timer
 175 viene programmata l'interruzione successiva sulla base di una stima; in questo
 176 modo si evita di dover eseguire un migliaio di interruzioni al secondo anche
 177 su macchine che non stanno facendo nulla, con un forte risparmio nell'uso
 178 dell'energia da parte del processore che può essere messo in stato di
 179 sospensione anche per lunghi periodi di tempo.
 180
 181 Indipendentemente dalle motivazioni per cui questo avviene, ogni volta che
 182 viene eseguito lo \textit{scheduler} effettua il calcolo delle priorità dei
 183 vari processi attivi (torneremo su questo in sez.~\ref{sec:proc_priority}) e
 184 stabilisce quale di essi debba essere posto in esecuzione fino alla successiva
 185 invocazione.
 186
 187 \itindend{scheduler}
 188
 189 \subsection{Gli identificatori dei processi}
 190 \label{sec:proc_pid}
 191
 192 \itindbeg{Process~ID~(PID)}
 193
 194 Come accennato nella sezione precedente ogni processo viene identificato dal
 195 sistema da un numero identificativo univoco, il \textit{process ID} o
 196 \ids{PID}. Questo è un tipo di dato standard, \type{pid\_t} che in genere è un
 197 intero con segno (nel caso di Linux e della \acr{glibc} il tipo usato è
 198 \ctyp{int}).
 199
 200 Il \ids{PID} viene assegnato in forma progressiva ogni volta che un nuovo
 201 processo viene creato,\footnote{in genere viene assegnato il numero successivo
 202   a quello usato per l'ultimo processo creato, a meno che questo numero non
 203   sia già utilizzato per un altro \ids{PID}, \acr{pgid} o \acr{sid} (vedi
 204   sez.~\ref{sec:sess_proc_group}).} fino ad un limite che, essendo il
 205 tradizionalmente il \ids{PID} un numero positivo memorizzato in un intero a 16
 206 bit, arriva ad un massimo di 32768.  Oltre questo valore l'assegnazione
 207 riparte dal numero più basso disponibile a partire da un minimo di
 208 300,\footnote{questi valori, fino al kernel 2.4.x, erano definiti dalla macro
 209   \const{PID\_MAX} nei file \file{threads.h} e \file{fork.c} dei sorgenti del
 210   kernel, con il 2.6.x e la nuova interfaccia per i \textit{thread} anche il
 211   meccanismo di allocazione dei \ids{PID} è stato modificato ed il valore
 212   massimo è impostabile attraverso il file \sysctlfile{kernel/pid\_max} e di
 213   default vale 32768.} che serve a riservare i \ids{PID} più bassi ai processi
 214 eseguiti direttamente dal kernel.  Per questo motivo, come visto in
 215 sez.~\ref{sec:proc_hierarchy}, il processo di avvio (\cmd{init}) ha sempre il
 216 \ids{PID} uguale a uno.
 217
 218 \itindbeg{Parent~Process~ID~(PPID)}
 219
 220 Tutti i processi inoltre memorizzano anche il \ids{PID} del genitore da cui
 221 sono stati creati, questo viene chiamato in genere \ids{PPID} (da
 222 \textit{Parent Process ID}).  Questi due identificativi possono essere
 223 ottenuti usando le due funzioni di sistema \funcd{getpid} e \funcd{getppid}, i
 224 cui prototipi sono:
 225
 226 \begin{funcproto}{
 227 \fhead{sys/types.h}
 228 \fhead{unistd.h}
 229 \fdecl{pid\_t getpid(void)}
 230 \fdesc{Restituisce il \ids{PID} del processo corrente..}
 231 \fdecl{pid\_t getppid(void)}
 232 \fdesc{Restituisce il \ids{PID} del padre del processo corrente.}
 233 }
 234 {Entrambe le funzioni non riportano condizioni di errore.}
 235 \end{funcproto}
 236
 237 \noindent esempi dell'uso di queste funzioni sono riportati in
 238 fig.~\ref{fig:proc_fork_code}, nel programma \file{fork\_test.c}.
 239
 240 Il fatto che il \ids{PID} sia un numero univoco per il sistema lo rende un
 241 candidato per generare ulteriori indicatori associati al processo di cui
 242 diventa possibile garantire l'unicità: ad esempio in alcune implementazioni la
 243 funzione \func{tempnam} (si veda sez.~\ref{sec:file_temp_file}) usa il
 244 \ids{PID} per generare un \textit{pathname} univoco, che non potrà essere
 245 replicato da un altro processo che usi la stessa funzione. Questo utilizzo
 246 però può risultare pericoloso, un \ids{PID} infatti è univoco solo fintanto
 247 che un processo è attivo, una volta terminato esso potrà essere riutilizzato
 248 da un processo completamente diverso, e di questo bisogna essere ben
 249 consapevoli.
 250
 251 Tutti i processi figli dello stesso processo padre sono detti
 252 \textit{sibling}, questa è una delle relazioni usate nel \textsl{controllo di
 253   sessione}, in cui si raggruppano i processi creati su uno stesso terminale,
 254 o relativi allo stesso login. Torneremo su questo argomento in dettaglio in
 255 cap.~\ref{cha:session}, dove esamineremo gli altri identificativi associati ad
 256 un processo e le varie relazioni fra processi utilizzate per definire una
 257 sessione.
 258
 259 Oltre al \ids{PID} e al \ids{PPID}, e a quelli che vedremo in
 260 sez.~\ref{sec:sess_proc_group}, relativi al controllo di sessione, ad ogni
 261 processo vengono associati degli ulteriori identificatori ed in particolare
 262 quelli che vengono usati per il controllo di accesso.  Questi servono per
 263 determinare se un processo può eseguire o meno le operazioni richieste, a
 264 seconda dei privilegi e dell'identità di chi lo ha posto in esecuzione;
 265 l'argomento è complesso e sarà affrontato in dettaglio in
 266 sez.~\ref{sec:proc_perms}.
 267
 268 \itindend{Process~ID~(PID)}
 269 \itindend{Parent~Process~ID~(PPID)}
 270
 271 \subsection{La funzione \func{fork} e le funzioni di creazione dei processi}
 272 \label{sec:proc_fork}
 273
 274 La funzione di sistema \funcd{fork} è la funzione fondamentale della gestione
 275 dei processi: come si è detto tradizionalmente l'unico modo di creare un nuovo
 276 processo era attraverso l'uso di questa funzione,\footnote{in realtà oggi la
 277   \textit{system call} usata da Linux per creare nuovi processi è \func{clone}
 278   (vedi \ref{sec:process_clone}), anche perché a partire dalla \acr{glibc}
 279   2.3.3 non viene più usata la \textit{system call} originale, ma la stessa
 280   \func{fork} viene implementata tramite \func{clone}, cosa che consente una
 281   migliore interazione coi \textit{thread}.} essa quindi riveste un ruolo
 282 centrale tutte le volte che si devono scrivere programmi che usano il
 283 multitasking.\footnote{oggi questa rilevanza, con la diffusione dell'uso dei
 284   \textit{thread} che tratteremo al cap.~\ref{cha:threads}, è in parte minore,
 285   ma \func{fork} resta comunque la funzione principale per la creazione di
 286   processi.} Il prototipo della funzione è:
 287
 288 \begin{funcproto}{
 289 \fhead{unistd.h}
 290 \fdecl{pid\_t fork(void)}
 291 \fdesc{Crea un nuovo processo.}
 292 }
 293 {La funzione ritorna il \ids{PID} del figlio al padre e $0$ al figlio in caso
 294   di successo e $-1$ al padre senza creare il figlio per un errore,
 295   nel qual caso \var{errno} assumerà uno dei valori:
 296   \begin{errlist}
 297   \item[\errcode{EAGAIN}] non ci sono risorse sufficienti per creare un altro
 298     processo (per allocare la tabella delle pagine e le strutture del task) o
 299     si è esaurito il numero di processi disponibili.
 300   \item[\errcode{ENOMEM}] non è stato possibile allocare la memoria per le
 301     strutture necessarie al kernel per creare il nuovo processo.
 302   \end{errlist}}
 303 \end{funcproto}
 304
 305 Dopo il successo dell'esecuzione di una \func{fork} sia il processo padre che
 306 il processo figlio continuano ad essere eseguiti normalmente a partire
 307 dall'istruzione successiva alla \func{fork}. Il processo figlio è una copia
 308 del padre, e riceve una copia dei segmenti di testo, dati e dello
 309 \textit{stack} (vedi sez.~\ref{sec:proc_mem_layout}), ed esegue esattamente lo
 310 stesso codice del padre. Si tenga presente però che la memoria è copiata e non
 311 condivisa, pertanto padre e figlio vedranno variabili diverse e le eventuali
 312 modifiche saranno totalmente indipendenti.
 313
 314 \itindbeg{copy~on~write}
 315
 316 Per quanto riguarda la gestione della memoria, in generale il segmento di
 317 testo, che è identico per i due processi, è condiviso e tenuto in sola lettura
 318 per il padre e per i figli. Per gli altri segmenti Linux utilizza la tecnica
 319 del \textit{copy on write}. Questa tecnica comporta che una pagina di memoria
 320 viene effettivamente copiata per il nuovo processo solo quando ci viene
 321 effettuata sopra una scrittura, e si ha quindi una reale differenza fra padre
 322 e figlio.  In questo modo si rende molto più efficiente il meccanismo della
 323 creazione di un nuovo processo, non essendo più necessaria la copia di tutto
 324 lo spazio degli indirizzi virtuali del padre, ma solo delle pagine di memoria
 325 che sono state modificate, e solo al momento della modifica stessa.
 326
 327 \itindend{copy~on~write}
 328
 329 La differenza che si ha nei due processi è che nel processo padre il valore di
 330 ritorno della funzione \func{fork} è il \ids{PID} del processo figlio, mentre
 331 nel figlio è zero; in questo modo il programma può identificare se viene
 332 eseguito dal padre o dal figlio.  Si noti come la funzione \func{fork} ritorni
 333 due volte, una nel padre e una nel figlio.
 334
 335 La scelta di questi valori di ritorno non è casuale, un processo infatti può
 336 avere più figli, ed il valore di ritorno di \func{fork} è l'unico modo che gli
 337 permette di identificare quello appena creato. Al contrario un figlio ha
 338 sempre un solo padre, il cui \ids{PID} può sempre essere ottenuto con
 339 \func{getppid}, come spiegato in sez.~\ref{sec:proc_pid}, per cui si usa il
 340 valore nullo, che non è il \ids{PID} di nessun processo.
 341
 342 Normalmente la chiamata a \func{fork} può fallire solo per due ragioni: o ci
 343 sono già troppi processi nel sistema, il che di solito è sintomo che
 344 qualcos'altro non sta andando per il verso giusto, o si è ecceduto il limite
 345 sul numero totale di processi permessi all'utente, argomento che tratteremo in
 346 dettaglio in sez.~\ref{sec:sys_resource_limit}.
 347
 348 L'uso di \func{fork} avviene secondo due modalità principali; la prima è
 349 quella in cui all'interno di un programma si creano processi figli cui viene
 350 affidata l'esecuzione di una certa sezione di codice, mentre il processo padre
 351 ne esegue un'altra. È il caso tipico dei programmi server (il modello
 352 \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}) in cui il
 353 padre riceve ed accetta le richieste da parte dei programmi client, per
 354 ciascuna delle quali pone in esecuzione un figlio che è incaricato di fornire
 355 il servizio.
 356
 357 La seconda modalità è quella in cui il processo vuole eseguire un altro
 358 programma; questo è ad esempio il caso della shell. In questo caso il processo
 359 crea un figlio la cui unica operazione è quella di fare una \func{exec} (di
 360 cui parleremo in sez.~\ref{sec:proc_exec}) subito dopo la \func{fork}.
 361
 362 Alcuni sistemi operativi (il VMS ad esempio) combinano le operazioni di questa
 363 seconda modalità (una \func{fork} seguita da una \func{exec}) in un'unica
 364 operazione che viene chiamata \textit{spawn}. Nei sistemi unix-like è stato
 365 scelto di mantenere questa separazione, dato che, come per la prima modalità
 366 d'uso, esistono numerosi scenari in cui si può usare una \func{fork} senza
 367 aver bisogno di eseguire una \func{exec}.
 368
 369 Inoltre, anche nel caso della seconda modalità d'uso, avere le due funzioni
 370 separate permette al figlio di cambiare alcune caratteristiche del processo
 371 (maschera dei segnali, redirezione dell'output, utente per conto del cui viene
 372 eseguito, e molto altro su cui torneremo in seguito) prima della \func{exec},
 373 rendendo così relativamente facile intervenire sulle le modalità di esecuzione
 374 del nuovo programma.
 375
 376 \begin{figure}[!htb]
 377   \footnotesize \centering
 378   \begin{minipage}[c]{\codesamplewidth}
 379   \includecodesample{listati/fork_test.c}
 380   \end{minipage}
 381   \normalsize
 382   \caption{Esempio di codice per la creazione di nuovi processi (da
 383     \file{fork\_test.c}).}
 384   \label{fig:proc_fork_code}
 385 \end{figure}
 386
 387 In fig.~\ref{fig:proc_fork_code} è riportato il corpo del codice del programma
 388 di esempio \cmd{forktest}, che permette di illustrare molte caratteristiche
 389 dell'uso della funzione \func{fork}. Il programma crea un numero di figli
 390 specificato da linea di comando, e prende anche alcune opzioni per indicare
 391 degli eventuali tempi di attesa in secondi (eseguiti tramite la funzione
 392 \func{sleep}) per il padre ed il figlio (con \cmd{forktest -h} si ottiene la
 393 descrizione delle opzioni). Il codice completo, compresa la parte che gestisce
 394 le opzioni a riga di comando, è disponibile nel file \file{fork\_test.c},
 395 distribuito insieme agli altri sorgenti degli esempi su
 396 \url{http://gapil.truelite.it/gapil_source.tgz}.
 397
 398 Decifrato il numero di figli da creare, il ciclo principale del programma
 399 (\texttt{\small 24-40}) esegue in successione la creazione dei processi figli
 400 controllando il successo della chiamata a \func{fork} (\texttt{\small
 401   25-29}); ciascun figlio (\texttt{\small 31-34}) si limita a stampare il
 402 suo numero di successione, eventualmente attendere il numero di secondi
 403 specificato e scrivere un messaggio prima di uscire. Il processo padre invece
 404 (\texttt{\small 36-38}) stampa un messaggio di creazione, eventualmente
 405 attende il numero di secondi specificato, e procede nell'esecuzione del ciclo;
 406 alla conclusione del ciclo, prima di uscire, può essere specificato un altro
 407 periodo di attesa.
 408
 409 Se eseguiamo il comando, che è preceduto dall'istruzione \code{export
 410   LD\_LIBRARY\_PATH=./} per permettere l'uso delle librerie dinamiche, senza
 411 specificare attese (come si può notare in (\texttt{\small 17-19}) i valori
 412 predefiniti specificano di non attendere), otterremo come risultato sul
 413 terminale:
 414 \begin{Console}
 415 [piccardi@selidor sources]$ \textbf{export LD_LIBRARY_PATH=./; ./forktest 3}
 416 Process 1963: forking 3 child
 417 Spawned 1 child, pid 1964
 418 Child 1 successfully executing
 419 Child 1, parent 1963, exiting
 420 Go to next child
 421 Spawned 2 child, pid 1965
 422 Child 2 successfully executing
 423 Child 2, parent 1963, exiting
 424 Go to next child
 425 Child 3 successfully executing
 426 Child 3, parent 1963, exiting
 427 Spawned 3 child, pid 1966
 428 Go to next child
 429 \end{Console}
 430 %$
 431
 432 Esaminiamo questo risultato: una prima conclusione che si può trarre è che non
 433 si può dire quale processo fra il padre ed il figlio venga eseguito per primo
 434 dopo la chiamata a \func{fork}; dall'esempio si può notare infatti come nei
 435 primi due cicli sia stato eseguito per primo il padre (con la stampa del
 436 \ids{PID} del nuovo processo) per poi passare all'esecuzione del figlio
 437 (completata con i due avvisi di esecuzione ed uscita), e tornare
 438 all'esecuzione del padre (con la stampa del passaggio al ciclo successivo),
 439 mentre la terza volta è stato prima eseguito il figlio (fino alla conclusione)
 440 e poi il padre.
 441
 442 In generale l'ordine di esecuzione dipenderà, oltre che dall'algoritmo di
 443 \textit{scheduling} usato dal kernel, dalla particolare situazione in cui si
 444 trova la macchina al momento della chiamata, risultando del tutto
 445 impredicibile.  Eseguendo più volte il programma di prova e producendo un
 446 numero diverso di figli, si sono ottenute situazioni completamente diverse,
 447 compreso il caso in cui il processo padre ha eseguito più di una \func{fork}
 448 prima che uno dei figli venisse messo in esecuzione.
 449
 450 Pertanto non si può fare nessuna assunzione sulla sequenza di esecuzione delle
 451 istruzioni del codice fra padre e figli, né sull'ordine in cui questi potranno
 452 essere messi in esecuzione. Se è necessaria una qualche forma di precedenza
 453 occorrerà provvedere ad espliciti meccanismi di sincronizzazione, pena il
 454 rischio di incorrere nelle cosiddette \textit{race condition} (vedi
 455 sez.~\ref{sec:proc_race_cond}).
 456
 457 In realtà con l'introduzione dei kernel della serie 2.6 lo \textit{scheduler}
 458 è stato modificato per eseguire sempre per primo il figlio.\footnote{i
 459   risultati precedenti infatti sono stati ottenuti usando un kernel della
 460   serie 2.4.}  Questa è una ottimizzazione adottata per evitare che il padre,
 461 effettuando per primo una operazione di scrittura in memoria, attivasse il
 462 meccanismo del \textit{copy on write}, operazione inutile qualora il figlio
 463 venga creato solo per eseguire una \func{exec} su altro programma che scarta
 464 completamente lo spazio degli indirizzi e rende superflua la copia della
 465 memoria modificata dal padre. Eseguendo sempre per primo il figlio la
 466 \func{exec} verrebbe effettuata subito, con la certezza di utilizzare
 467 \textit{copy on write} solo quando necessario.
 468
 469 Con il kernel 2.6.32 però il comportamento è stato nuovamente cambiato,
 470 stavolta facendo eseguire per primo sempre il padre. Si è realizzato infatti
 471 che l'eventualità prospettata per la scelta precedente era comunque molto
 472 improbabile, mentre l'esecuzione immediata del padre presenta sempre il
 473 vantaggio di poter utilizzare immediatamente tutti i dati che sono nella cache
 474 della CPU e nella unità di gestione della memoria virtuale senza doverli
 475 invalidare, cosa che per i processori moderni, che hanno linee di cache
 476 interne molto profonde, avrebbe un forte impatto sulle prestazioni.
 477
 478 Allora anche se quanto detto in precedenza vale come comportamento effettivo
 479 dei programmi soltanto per i kernel fino alla serie 2.4, per mantenere la
 480 portabilità con altri kernel unix-like, e con i diversi comportamenti adottati
 481 dalle Linux nelle versioni successive, è opportuno non fare affidamento su
 482 nessun tipo comportamento predefinito e non dare per assunta l'esecuzione
 483 preventiva del padre o del figlio.
 484
 485 Si noti poi come dopo la \func{fork}, essendo i segmenti di memoria utilizzati
 486 dai singoli processi completamente indipendenti, le modifiche delle variabili
 487 nei processi figli, come l'incremento di \var{i} in (\texttt{\small 31}), sono
 488 visibili solo a loro, (ogni processo vede solo la propria copia della
 489 memoria), e non hanno alcun effetto sul valore che le stesse variabili hanno
 490 nel processo padre ed in eventuali altri processi figli che eseguano lo stesso
 491 codice.
 492
 493 Un secondo aspetto molto importante nella creazione dei processi figli è
 494 quello dell'interazione dei vari processi con i file. Ne parleremo qui anche
 495 se buona parte dei concetti relativi ai file verranno trattati più avanti
 496 (principalmente in sez.~\ref{sec:file_unix_interface}). Per illustrare meglio
 497 quello che avviene si può redirigere su un file l'output del programma di
 498 test, quello che otterremo è:
 499 \begin{Console}
 500 [piccardi@selidor sources]$ \textbf{./forktest 3 > output}
 501 [piccardi@selidor sources]$ \textbf{cat output}
 502 Process 1967: forking 3 child
 503 Child 1 successfully executing
 504 Child 1, parent 1967, exiting
 505 Test for forking 3 child
 506 Spawned 1 child, pid 1968
 507 Go to next child
 508 Child 2 successfully executing
 509 Child 2, parent 1967, exiting
 510 Test for forking 3 child
 511 Spawned 1 child, pid 1968
 512 Go to next child
 513 Spawned 2 child, pid 1969
 514 Go to next child
 515 Child 3 successfully executing
 516 Child 3, parent 1967, exiting
 517 Test for forking 3 child
 518 Spawned 1 child, pid 1968
 519 Go to next child
 520 Spawned 2 child, pid 1969
 521 Go to next child
 522 Spawned 3 child, pid 1970
 523 Go to next child
 524 \end{Console}
 525 che come si vede è completamente diverso da quanto ottenevamo sul terminale.
 526
 527 Il comportamento delle varie funzioni di interfaccia con i file è analizzato
 528 in gran dettaglio in sez.~\ref{sec:file_unix_interface} per l'interfaccia
 529 nativa Unix ed in sez.~\ref{sec:files_std_interface} per la standardizzazione
 530 adottata nelle librerie del linguaggio C e valida per qualunque sistema
 531 operativo.
 532
 533 Qui basta accennare che si sono usate le funzioni standard della libreria del
 534 C che prevedono l'output bufferizzato. Il punto è che questa bufferizzazione
 535 (che tratteremo in dettaglio in sez.~\ref{sec:file_buffering}) varia a seconda
 536 che si tratti di un file su disco, in cui il buffer viene scaricato su disco
 537 solo quando necessario, o di un terminale, in cui il buffer viene scaricato ad
 538 ogni carattere di a capo.
 539
 540 Nel primo esempio allora avevamo che, essendovi un a capo nella stringa
 541 stampata, ad ogni chiamata a \func{printf} il buffer veniva scaricato, per cui
 542 le singole righe comparivano a video subito dopo l'esecuzione della
 543 \func{printf}. Ma con la redirezione su file la scrittura non avviene più alla
 544 fine di ogni riga e l'output resta nel buffer.
 545
 546 Dato che ogni figlio riceve una copia della memoria del padre, esso riceverà
 547 anche quanto c'è nel buffer delle funzioni di I/O, comprese le linee scritte
 548 dal padre fino allora. Così quando il buffer viene scritto su disco all'uscita
 549 del figlio, troveremo nel file anche tutto quello che il processo padre aveva
 550 scritto prima della sua creazione. E alla fine del file (dato che in questo
 551 caso il padre esce per ultimo) troveremo anche l'output completo del padre.
 552
 553 L'esempio ci mostra un altro aspetto fondamentale dell'interazione con i file,
 554 valido anche per l'esempio precedente, ma meno evidente: il fatto cioè che non
 555 solo processi diversi possono scrivere in contemporanea sullo stesso file
 556 (l'argomento dell'accesso concorrente ai file è trattato in dettaglio in
 557 sez.~\ref{sec:file_shared_access}), ma anche che, a differenza di quanto
 558 avviene per le variabili in memoria, la posizione corrente sul file è
 559 condivisa fra il padre e tutti i processi figli.
 560
 561 Quello che succede è che quando lo \textit{standard output}\footnote{si chiama
 562   così il file su cui di default un programma scrive i suoi dati in uscita,
 563   tratteremo l'argomento in dettaglio in sez.~\ref{sec:file_fd}.} del padre
 564 viene rediretto come si è fatto nell'esempio, lo stesso avviene anche per
 565 tutti i figli. La funzione \func{fork} infatti ha la caratteristica di
 566 duplicare nei processi figli tutti i \textit{file descriptor} (vedi
 567 sez.~\ref{sec:file_fd}) dei file aperti nel processo padre (allo stesso modo
 568 in cui lo fa la funzione \func{dup}, trattata in sez.~\ref{sec:file_dup}), il
 569 che comporta che padre e figli condividono le stesse voci della \textit{file
 570   table} (tratteremo in dettaglio questi termini in sez.~\ref{sec:file_fd} e
 571 sez.~\ref{sec:file_shared_access}) fra cui c'è anche la posizione corrente nel
 572 file.
 573
 574 In questo modo se un processo scrive su un file aggiornerà la posizione
 575 corrente sulla \textit{file table}, e tutti gli altri processi, che vedono la
 576 stessa \textit{file table}, vedranno il nuovo valore. In questo modo si evita,
 577 in casi come quello appena mostrato in cui diversi processi scrivono sullo
 578 stesso file, che l'output successivo di un processo vada a sovrapporsi a
 579 quello dei precedenti: l'output potrà risultare mescolato, ma non ci saranno
 580 parti perdute per via di una sovrascrittura.
 581
 582 Questo tipo di comportamento è essenziale in tutti quei casi in cui il padre
 583 crea un figlio e attende la sua conclusione per proseguire, ed entrambi
 584 scrivono sullo stesso file. Un caso tipico di questo comportamento è la shell
 585 quando lancia un programma.  In questo modo, anche se lo standard output viene
 586 rediretto, il padre potrà sempre continuare a scrivere in coda a quanto
 587 scritto dal figlio in maniera automatica; se così non fosse ottenere questo
 588 comportamento sarebbe estremamente complesso necessitando di una qualche forma
 589 di comunicazione fra i due processi per far riprendere al padre la scrittura
 590 al punto giusto.
 591
 592 In generale comunque non è buona norma far scrivere più processi sullo stesso
 593 file senza una qualche forma di sincronizzazione in quanto, come visto anche
 594 con il nostro esempio, le varie scritture risulteranno mescolate fra loro in
 595 una sequenza impredicibile. Per questo le modalità con cui in genere si usano
 596 i file dopo una \func{fork} sono sostanzialmente due:
 597 \begin{enumerate*}
 598 \item Il processo padre aspetta la conclusione del figlio. In questo caso non
 599   è necessaria nessuna azione riguardo ai file, in quanto la sincronizzazione
 600   della posizione corrente dopo eventuali operazioni di lettura e scrittura
 601   effettuate dal figlio è automatica.
 602 \item L'esecuzione di padre e figlio procede indipendentemente. In questo caso
 603   ciascuno dei due processi deve chiudere i file che non gli servono una volta
 604   che la \func{fork} è stata eseguita, per evitare ogni forma di interferenza.
 605 \end{enumerate*}
 606
 607 Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
 608 proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
 609 comune dopo l'esecuzione di una \func{fork} è la seguente:
 610 \begin{itemize*}
 611 \item i file aperti e gli eventuali flag di \textit{close-on-exec} impostati
 612   (vedi sez.~\ref{sec:proc_exec} e sez.~\ref{sec:file_fcntl_ioctl});
 613 \item gli identificatori per il controllo di accesso: l'\textsl{user-ID
 614     reale}, il \textsl{group-ID reale}, l'\textsl{user-ID effettivo}, il
 615   \textsl{group-ID effettivo} ed i \textsl{group-ID supplementari} (vedi
 616   sez.~\ref{sec:proc_access_id});
 617 \item gli identificatori per il controllo di sessione: il \textit{process
 618     group-ID} e il \textit{session id} ed il terminale di controllo (vedi
 619   sez.~\ref{sec:sess_proc_group});
 620 \item la directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) e la
 621   directory radice (vedi sez.~\ref{sec:file_chroot});
 622 \item la maschera dei permessi di creazione dei file (vedi
 623   sez.~\ref{sec:file_perm_management});
 624 \item la maschera dei segnali bloccati (vedi
 625   sez.~\ref{sec:sig_sigmask}) e le azioni installate (vedi
 626   sez.~\ref{sec:sig_gen_beha});
 627 \item i segmenti di memoria condivisa agganciati al processo (vedi
 628   sez.~\ref{sec:ipc_sysv_shm});
 629 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
 630 \item il valori di \textit{nice}, le priorità \textit{real-time} e le affinità
 631   di processore (vedi sez.~\ref{sec:proc_sched_stand},
 632   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
 633 \item le variabili di ambiente (vedi sez.~\ref{sec:proc_environ}).
 634 \item l'insieme dei descrittori associati alle code di messaggi POSIX (vedi
 635   sez.~\ref{sec:ipc_posix_mq}) che vengono copiate come i \textit{file
 636     descriptor}, questo significa che entrambi condivideranno gli stessi flag.
 637 \end{itemize*}
 638
 639 Oltre a quelle relative ad un diverso spazio degli indirizzi (e una memoria
 640 totalmente indipendente) le differenze fra padre e figlio dopo l'esecuzione di
 641 una \func{fork} invece sono:\footnote{a parte le ultime quattro, relative a
 642   funzionalità specifiche di Linux, le altre sono esplicitamente menzionate
 643   dallo standard POSIX.1-2001.}
 644 \begin{itemize*}
 645 \item il valore di ritorno di \func{fork};
 646 \item il \ids{PID} (\textit{process id}), quello del figlio viene assegnato ad
 647   un nuovo valore univoco;
 648 \item il \ids{PPID} (\textit{parent process id}), quello del figlio viene
 649   impostato al \ids{PID} del padre;
 650 \item i valori dei tempi di esecuzione (vedi sez.~\ref{sec:sys_cpu_times}) e
 651   delle risorse usate (vedi sez.~\ref{sec:sys_resource_use}), che nel figlio
 652   sono posti a zero;
 653 \item i \textit{lock} sui file (vedi sez.~\ref{sec:file_locking}) e sulla
 654   memoria (vedi sez.~\ref{sec:proc_mem_lock}), che non vengono ereditati dal
 655   figlio;
 656 \item gli allarmi, i timer (vedi sez.~\ref{sec:sig_alarm_abort}) ed i segnali
 657   pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che per il figlio vengono
 658   cancellati.
 659 \item le operazioni di I/O asincrono in corso (vedi
 660   sez.~\ref{sec:file_asyncronous_io}) che non vengono ereditate dal figlio;
 661 \item gli aggiustamenti fatti dal padre ai semafori con \func{semop} (vedi
 662   sez.~\ref{sec:ipc_sysv_sem}).
 663 \item le notifiche sui cambiamenti delle directory con \textit{dnotify} (vedi
 664   sez.~\ref{sec:sig_notification}), che non vengono ereditate dal figlio;
 665 \item le mappature di memoria marcate come \const{MADV\_DONTFORK} (vedi
 666   sez.~\ref{sec:file_memory_map}) che non vengono ereditate dal figlio;
 667 \item l'impostazione con \func{prctl} (vedi sez.~\ref{sec:process_prctl}) che
 668   notifica al figlio la terminazione del padre viene cancellata se presente
 669   nel padre;
 670 \item il segnale di terminazione del figlio è sempre \signal{SIGCHLD} anche
 671   qualora nel padre fosse stato modificato (vedi sez.~\ref{sec:process_clone}).
 672 \end{itemize*}
 673
 674 Una seconda funzione storica usata per la creazione di un nuovo processo è
 675 \funcm{vfork}, che è esattamente identica a \func{fork} ed ha la stessa
 676 semantica e gli stessi errori; la sola differenza è che non viene creata la
 677 tabella delle pagine né la struttura dei task per il nuovo processo. Il
 678 processo padre è posto in attesa fintanto che il figlio non ha eseguito una
 679 \func{execve} o non è uscito con una \func{\_exit}. Il figlio condivide la
 680 memoria del padre (e modifiche possono avere effetti imprevedibili) e non deve
 681 ritornare o uscire con \func{exit} ma usare esplicitamente \func{\_exit}.
 682
 683 Questa funzione è un rimasuglio dei vecchi tempi in cui eseguire una
 684 \func{fork} comportava anche la copia completa del segmento dati del processo
 685 padre, che costituiva un inutile appesantimento in tutti quei casi in cui la
 686 \func{fork} veniva fatta solo per poi eseguire una \func{exec}. La funzione
 687 venne introdotta in BSD per migliorare le prestazioni.
 688
 689 Dato che Linux supporta il \textit{copy on write} la perdita di prestazioni è
 690 assolutamente trascurabile, e l'uso di questa funzione, che resta un caso
 691 speciale della \textit{system call} \func{clone} (che tratteremo in dettaglio
 692 in sez.~\ref{sec:process_clone}) è deprecato; per questo eviteremo di
 693 trattarla ulteriormente.
 694
 695
 696 \subsection{La conclusione di un processo}
 697 \label{sec:proc_termination}
 698
 699 In sez.~\ref{sec:proc_conclusion} abbiamo già affrontato le modalità con cui
 700 chiudere un programma, ma dall'interno del programma stesso. Avendo a che fare
 701 con un sistema \textit{multitasking} resta da affrontare l'argomento dal punto
 702 di vista di come il sistema gestisce la conclusione dei processi.
 703
 704 Abbiamo visto in sez.~\ref{sec:proc_conclusion} le tre modalità con cui un
 705 programma viene terminato in maniera normale: la chiamata di \func{exit}, che
 706 esegue le funzioni registrate per l'uscita e chiude gli \textit{stream} e poi
 707 esegue \func{\_exit}, il ritorno dalla funzione \code{main} equivalente alla
 708 chiamata di \func{exit}, e la chiamata diretta a \func{\_exit}, che passa
 709 direttamente alle operazioni di terminazione del processo da parte del kernel.
 710
 711 Ma abbiamo accennato che oltre alla conclusione normale esistono anche delle
 712 modalità di conclusione anomala. Queste sono in sostanza due: il programma può
 713 chiamare la funzione \func{abort} (vedi sez.~\ref{sec:sig_alarm_abort}) per
 714 invocare una chiusura anomala, o essere terminato da un segnale (torneremo sui
 715 segnali in cap.~\ref{cha:signals}).  In realtà anche la prima modalità si
 716 riconduce alla seconda, dato che \func{abort} si limita a generare il segnale
 717 \signal{SIGABRT}.
 718
 719 Qualunque sia la modalità di conclusione di un processo, il kernel esegue
 720 comunque una serie di operazioni di terminazione: chiude tutti i file aperti,
 721 rilascia la memoria che stava usando, e così via; l'elenco completo delle
 722 operazioni eseguite alla chiusura di un processo è il seguente:
 723 \begin{itemize*}
 724 \item tutti i \textit{file descriptor} (vedi sez.~\ref{sec:file_fd}) sono
 725   chiusi;
 726 \item viene memorizzato lo stato di terminazione del processo;
 727 \item ad ogni processo figlio viene assegnato un nuovo padre (in genere
 728   \cmd{init});
 729 \item viene inviato il segnale \signal{SIGCHLD} al processo padre (vedi
 730   sez.~\ref{sec:sig_sigchld});
 731 \item se il processo è un leader di sessione ed il suo terminale di controllo
 732   è quello della sessione viene mandato un segnale di \signal{SIGHUP} a tutti i
 733   processi del gruppo di \textit{foreground} e il terminale di controllo viene
 734   disconnesso (vedi sez.~\ref{sec:sess_ctrl_term});
 735 \item se la conclusione di un processo rende orfano un \textit{process
 736     group} ciascun membro del gruppo viene bloccato, e poi gli vengono
 737   inviati in successione i segnali \signal{SIGHUP} e \signal{SIGCONT}
 738   (vedi ancora sez.~\ref{sec:sess_ctrl_term}).
 739 \end{itemize*}
 740
 741 \itindbeg{termination~status}
 742
 743 Oltre queste operazioni è però necessario poter disporre di un meccanismo
 744 ulteriore che consenta di sapere come la terminazione è avvenuta: dato che in
 745 un sistema unix-like tutto viene gestito attraverso i processi, il meccanismo
 746 scelto consiste nel riportare lo \textsl{stato di terminazione} (il cosiddetto
 747 \textit{termination status}) al processo padre.
 748
 749 Nel caso di conclusione normale, abbiamo visto in
 750 sez.~\ref{sec:proc_conclusion} che lo stato di uscita del processo viene
 751 caratterizzato tramite il valore del cosiddetto \textit{exit status}, cioè il
 752 valore passato come argomento alle funzioni \func{exit} o \func{\_exit} o il
 753 valore di ritorno per \code{main}.  Ma se il processo viene concluso in
 754 maniera anomala il programma non può specificare nessun \textit{exit status},
 755 ed è il kernel che deve generare autonomamente il \textit{termination status}
 756 per indicare le ragioni della conclusione anomala.
 757
 758 Si noti la distinzione fra \textit{exit status} e \textit{termination status}:
 759 quello che contraddistingue lo stato di chiusura del processo e viene
 760 riportato attraverso le funzioni \func{wait} o \func{waitpid} (vedi
 761 sez.~\ref{sec:proc_wait}) è sempre quest'ultimo; in caso di conclusione
 762 normale il kernel usa il primo (nel codice eseguito da \func{\_exit}) per
 763 produrre il secondo.
 764
 765 La scelta di riportare al padre lo stato di terminazione dei figli, pur
 766 essendo l'unica possibile, comporta comunque alcune complicazioni: infatti se
 767 alla sua creazione è scontato che ogni nuovo processo abbia un padre, non è
 768 detto che sia così alla sua conclusione, dato che il padre potrebbe essere già
 769 terminato; si potrebbe avere cioè quello che si chiama un processo
 770 \textsl{orfano}.
 771
 772 Questa complicazione viene superata facendo in modo che il processo orfano
 773 venga \textsl{adottato} da \cmd{init}, o meglio dal processo con \ids{PID} 1,
 774 cioè quello lanciato direttamente dal kernel all'avvio, che sta alla base
 775 dell'albero dei processi visto in sez.~\ref{sec:proc_hierarchy} e che anche
 776 per questo motivo ha un ruolo essenziale nel sistema e non può mai
 777 terminare.\footnote{almeno non senza un blocco completo del sistema, in caso
 778   di terminazione o di non esecuzione di \cmd{init} infatti il kernel si
 779   blocca con un cosiddetto \textit{kernel panic}, dato che questo è un errore
 780   fatale.}
 781
 782 Come già accennato quando un processo termina, il kernel controlla se è il
 783 padre di altri processi in esecuzione: in caso positivo allora il \ids{PPID}
 784 di tutti questi processi verrà sostituito dal kernel con il \ids{PID} di
 785 \cmd{init}, cioè con 1. In questo modo ogni processo avrà sempre un padre (nel
 786 caso possiamo parlare di un padre \textsl{adottivo}) cui riportare il suo
 787 stato di terminazione.
 788
 789 Come verifica di questo comportamento possiamo eseguire il nostro programma
 790 \cmd{forktest} imponendo a ciascun processo figlio due secondi di attesa prima
 791 di uscire, il risultato è:
 792 \begin{Console}
 793 [piccardi@selidor sources]$ \textbf{./forktest -c2 3}
 794 Process 1972: forking 3 child
 795 Spawned 1 child, pid 1973
 796 Child 1 successfully executing
 797 Go to next child
 798 Spawned 2 child, pid 1974
 799 Child 2 successfully executing
 800 Go to next child
 801 Child 3 successfully executing
 802 Spawned 3 child, pid 1975
 803 Go to next child
 804
 805 [piccardi@selidor sources]$ Child 3, parent 1, exiting
 806 Child 2, parent 1, exiting
 807 Child 1, parent 1, exiting
 808 \end{Console}
 809 come si può notare in questo caso il processo padre si conclude prima dei
 810 figli, tornando alla shell, che stampa il prompt sul terminale: circa due
 811 secondi dopo viene stampato a video anche l'output dei tre figli che
 812 terminano, e come si può notare in questo caso, al contrario di quanto visto
 813 in precedenza, essi riportano 1 come \ids{PPID}.
 814
 815 Altrettanto rilevante è il caso in cui il figlio termina prima del padre,
 816 perché non è detto che il padre possa ricevere immediatamente lo stato di
 817 terminazione, quindi il kernel deve comunque conservare una certa quantità di
 818 informazioni riguardo ai processi che sta terminando.
 819
 820 Questo viene fatto mantenendo attiva la voce nella tabella dei processi, e
 821 memorizzando alcuni dati essenziali, come il \ids{PID}, i tempi di CPU usati
 822 dal processo (vedi sez.~\ref{sec:sys_unix_time}) e lo stato di terminazione,
 823 mentre la memoria in uso ed i file aperti vengono rilasciati immediatamente.
 824
 825 \itindbeg{zombie}
 826
 827 I processi che sono terminati, ma il cui stato di terminazione non è stato
 828 ancora ricevuto dal padre sono chiamati \textit{zombie}, essi restano presenti
 829 nella tabella dei processi ed in genere possono essere identificati
 830 dall'output di \cmd{ps} per la presenza di una \texttt{Z} nella colonna che ne
 831 indica lo stato (vedi tab.~\ref{tab:proc_proc_states}). Quando il padre
 832 effettuerà la lettura dello stato di terminazione anche questa informazione,
 833 non più necessaria, verrà scartata ed il processo potrà considerarsi
 834 completamente concluso.
 835
 836 Possiamo utilizzare il nostro programma di prova per analizzare anche questa
 837 condizione: lanciamo il comando \cmd{forktest} in \textit{background} (vedi
 838 sez.~\ref{sec:sess_job_control}), indicando al processo padre di aspettare 10
 839 secondi prima di uscire. In questo caso, usando \cmd{ps} sullo stesso
 840 terminale (prima dello scadere dei 10 secondi) otterremo:
 841 \begin{Console}
 842 [piccardi@selidor sources]$ \textbf{ps T}
 843   PID TTY      STAT   TIME COMMAND
 844   419 pts/0    S      0:00 bash
 845   568 pts/0    S      0:00 ./forktest -e10 3
 846   569 pts/0    Z      0:00 [forktest <defunct>]
 847   570 pts/0    Z      0:00 [forktest <defunct>]
 848   571 pts/0    Z      0:00 [forktest <defunct>]
 849   572 pts/0    R      0:00 ps T
 850 \end{Console}
 851 %$
 852 e come si vede, dato che non si è fatto nulla per riceverne lo stato di
 853 terminazione, i tre processi figli sono ancora presenti pur essendosi
 854 conclusi, con lo stato di \textit{zombie} e l'indicazione che sono terminati
 855 (la scritta \texttt{defunct}).
 856
 857 La possibilità di avere degli \textit{zombie} deve essere tenuta sempre
 858 presente quando si scrive un programma che deve essere mantenuto in esecuzione
 859 a lungo e creare molti processi figli. In questo caso si deve sempre avere
 860 cura di far leggere al programma l'eventuale stato di uscita di tutti i
 861 figli. Una modalità comune di farlo è attraverso l'utilizzo di un apposito
 862 \textit{signal handler} che chiami la funzione \func{wait}, (vedi
 863 sez.~\ref{sec:proc_wait}), ne esamineremo in dettaglio un esempio
 864 (fig.~\ref{fig:sig_sigchld_handl}) in sez.~\ref{sec:sig_sigchld}.
 865
 866 La lettura degli stati di uscita è necessaria perché anche se gli
 867 \textit{zombie} non consumano risorse di memoria o processore, occupano
 868 comunque una voce nella tabella dei processi e se li si lasciano accumulare a
 869 lungo quest'ultima potrebbe esaurirsi, con la conseguente impossibilità di
 870 lanciare nuovi processi.
 871
 872 Si noti tuttavia che quando un processo adottato da \cmd{init} termina, non
 873 diviene mai uno \textit{zombie}. Questo perché una delle funzioni di
 874 \cmd{init} è appunto quella di chiamare la funzione \func{wait} per i processi
 875 a cui fa da padre, completandone la terminazione. Questo è quanto avviene
 876 anche quando, come nel caso del precedente esempio con \cmd{forktest}, il
 877 padre termina con dei figli in stato di \textit{zombie}. Questi scompaiono
 878 quando, alla terminazione del padre dopo i secondi programmati, tutti figli
 879 che avevamo generato, e che erano diventati \textit{zombie}, vengono adottati
 880 da \cmd{init}, il quale provvede a completarne la terminazione.
 881
 882 Si tenga presente infine che siccome gli \textit{zombie} sono processi già
 883 terminati, non c'è modo di eliminarli con il comando \cmd{kill} o inviandogli
 884 un qualunque segnale di terminazione (l'argomento è trattato in
 885 sez.~\ref{sec:sig_termination}). Qualora ci si trovi in questa situazione
 886 l'unica possibilità di cancellarli dalla tabella dei processi è quella di
 887 terminare il processo che li ha generati e che non sta facendo il suo lavoro,
 888 in modo che \cmd{init} possa adottarli e concluderne correttamente la
 889 terminazione.
 890
 891 Si tenga anche presente che la presenza di \textit{zombie} nella tabella dei
 892 processi non è sempre indice di un qualche malfunzionamento, in una macchina
 893 con molto carico infatti può esservi una presenza temporanea dovuta al fatto
 894 che il processo padre ancora non ha avuto il tempo di gestirli.
 895
 896 \itindend{zombie}
 897
 898
 899 \subsection{Le funzioni di attesa e ricezione degli stati di uscita}
 900 \label{sec:proc_wait}
 901
 902 Uno degli usi più comuni delle capacità multitasking di un sistema unix-like
 903 consiste nella creazione di programmi di tipo server, in cui un processo
 904 principale attende le richieste che vengono poi soddisfatte da una serie di
 905 processi figli.
 906
 907 Si è già sottolineato al paragrafo precedente come in questo caso diventi
 908 necessario gestire esplicitamente la conclusione dei figli onde evitare di
 909 riempire di \textit{zombie} la tabella dei processi. Tratteremo in questa
 910 sezione le funzioni di sistema deputate a questo compito; la prima è
 911 \funcd{wait} ed il suo prototipo è:
 912
 913 \begin{funcproto}{
 914 \fhead{sys/types.h}
 915 \fhead{sys/wait.h}
 916 \fdecl{pid\_t wait(int *status)}
 917 \fdesc{Attende la terminazione di un processo.}
 918 }
 919 {La funzione ritorna il \ids{PID} del figlio in caso di successo e $-1$ per un
 920   errore, nel qual caso \var{errno} assumerà uno dei valori:
 921   \begin{errlist}
 922   \item[\errcode{ECHILD}] il processo non ha nessun figlio di cui attendere
 923     uno stato di terminazione.
 924   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
 925   \end{errlist}}
 926 \end{funcproto}
 927
 928 Questa funzione è presente fin dalle prime versioni di Unix ed è quella usata
 929 tradizionalmente per attendere la terminazione dei figli. La funzione sospende
 930 l'esecuzione del processo corrente e ritorna non appena un qualunque processo
 931 figlio termina. Se un figlio è già terminato prima della sua chiamata la
 932 funzione ritorna immediatamente, se più processi figli sono già terminati
 933 occorrerà continuare a chiamare la funzione più volte fintanto che non si è
 934 recuperato lo stato di terminazione di tutti quanti.
 935
 936 Al ritorno della funzione lo stato di terminazione del figlio viene salvato
 937 (come \textit{value result argument}) nella variabile puntata
 938 da \param{status} e tutte le risorse del kernel relative al processo (vedi
 939 sez.~\ref{sec:proc_termination}) vengono rilasciate.  Nel caso un processo
 940 abbia più figli il valore di ritorno della funzione sarà impostato al
 941 \ids{PID} del processo di cui si è ricevuto lo stato di terminazione, cosa che
 942 permette di identificare qual è il figlio che è terminato.
 943
 944 \itindend{termination~status}
 945
 946 Questa funzione ha il difetto di essere poco flessibile, in quanto ritorna
 947 all'uscita di un qualunque processo figlio. Nelle occasioni in cui è
 948 necessario attendere la conclusione di uno specifico processo fra tutti quelli
 949 esistenti occorre predisporre un meccanismo che tenga conto di tutti processi
 950 che sono terminati, e provveda a ripetere la chiamata alla funzione nel caso
 951 il processo cercato non risulti fra questi. Se infatti il processo cercato è
 952 già terminato e se è già ricevuto lo stato di uscita senza registrarlo, la
 953 funzione non ha modo di accorgersene, e si continuerà a chiamarla senza
 954 accorgersi che quanto interessava è già accaduto.
 955
 956 Per questo motivo lo standard POSIX.1 ha introdotto una seconda funzione che
 957 effettua lo stesso servizio, ma dispone di una serie di funzionalità più
 958 ampie, legate anche al controllo di sessione (si veda
 959 sez.~\ref{sec:sess_job_control}).  Dato che è possibile ottenere lo stesso
 960 comportamento di \func{wait}\footnote{in effetti il codice
 961   \code{wait(\&status)} è del tutto equivalente a \code{waitpid(WAIT\_ANY,
 962     \&status, 0)}.} si consiglia di utilizzare sempre questa nuova funzione di
 963 sistema, \funcd{waitpid}, il cui prototipo è:
 964
 965 \begin{funcproto}{
 966 \fhead{sys/types.h}
 967 \fhead{sys/wait.h}
 968 \fdecl{pid\_t waitpid(pid\_t pid, int *status, int options)}
 969 \fdesc{Attende il cambiamento di stato di un processo figlio.}
 970 }
 971 {La funzione ritorna il \ids{PID} del processo che ha cambiato stato in caso
 972   di successo, o 0 se è stata specificata l'opzione \const{WNOHANG} e il
 973   processo non è uscito e $-1$ per un errore, nel qual caso \var{errno}
 974   assumerà uno dei valori:
 975   \begin{errlist}
 976   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
 977     non è figlio del processo chiamante.
 978   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
 979     la funzione è stata interrotta da un segnale.
 980   \item[\errcode{EINVAL}] si è specificato un valore non valido per
 981     l'argomento \param{options}.
 982   \end{errlist}}
 983 \end{funcproto}
 984
 985 La prima differenza fra le due funzioni è che con \func{waitpid} si può
 986 specificare in maniera flessibile quale processo attendere, sulla base del
 987 valore fornito dall'argomento \param{pid}, questo può assumere diversi valori,
 988 secondo lo specchietto riportato in tab.~\ref{tab:proc_waidpid_pid}, dove si
 989 sono riportate anche le costanti definite per indicare alcuni di essi.
 990
 991 \begin{table}[!htb]
 992   \centering
 993   \footnotesize
 994   \begin{tabular}[c]{|c|c|p{8cm}|}
 995     \hline
 996     \textbf{Valore} & \textbf{Costante} &\textbf{Significato}\\
 997     \hline
 998     \hline
 999     $<-1$& --               & Attende per un figlio il cui \textit{process
1000                               group} (vedi sez.~\ref{sec:sess_proc_group}) è
1001                               uguale al valore assoluto di \param{pid}.\\
1002     $-1$&\const{WAIT\_ANY}  & Attende per un figlio qualsiasi, usata in
1003                               questa maniera senza specificare nessuna opzione
1004                               è equivalente a \func{wait}.\\
1005     $ 0$&\const{WAIT\_MYPGRP}&Attende per un figlio il cui \textit{process
1006                                group} (vedi sez.~\ref{sec:sess_proc_group}) è
1007                               uguale a quello del processo chiamante.\\
1008     $>0$& --                & Attende per un figlio il cui \ids{PID} è uguale
1009                               al valore di \param{pid}.\\
1010     \hline
1011   \end{tabular}
1012   \caption{Significato dei valori dell'argomento \param{pid} della funzione
1013     \func{waitpid}.}
1014   \label{tab:proc_waidpid_pid}
1015 \end{table}
1016
1017 Il comportamento di \func{waitpid} può inoltre essere modificato passando alla
1018 funzione delle opportune opzioni tramite l'argomento \param{options}; questo
1019 deve essere specificato come maschera binaria delle costanti riportati nella
1020 prima parte in tab.~\ref{tab:proc_waitpid_options} che possono essere
1021 combinate fra loro con un OR aritmetico. Nella seconda parte della stessa
1022 tabella si sono riportati anche alcune opzioni non standard specifiche di
1023 Linux, che consentono un controllo più dettagliato per i processi creati con
1024 la \textit{system call} generica \func{clone} (vedi
1025 sez.~\ref{sec:process_clone}) e che vengono usati principalmente per la
1026 gestione della terminazione dei \textit{thread} (vedi
1027 sez.~\ref{sec:thread_xxx}).
1028
1029 \begin{table}[!htb]
1030   \centering
1031   \footnotesize
1032   \begin{tabular}[c]{|l|p{8cm}|}
1033     \hline
1034     \textbf{Costante} & \textbf{Descrizione}\\
1035     \hline
1036     \hline
1037     \const{WNOHANG}   & La funzione ritorna immediatamente anche se non è
1038                         terminato nessun processo figlio.\\
1039     \const{WUNTRACED} & Ritorna anche quando un processo figlio è stato
1040                         fermato.\\
1041     \const{WCONTINUED}& Ritorna anche quando un processo figlio che era stato
1042                         fermato ha ripreso l'esecuzione (disponibile solo a
1043                         partire dal kernel 2.6.10).\\
1044     \hline
1045     \const{\_\_WCLONE}& Attende solo per i figli creati con \func{clone}
1046                         (vedi sez.~\ref{sec:process_clone}), vale a dire
1047                         processi che non emettono nessun segnale
1048                         o emettono un segnale diverso da \signal{SIGCHLD} alla
1049                         terminazione, il default è attendere soltanto i
1050                         processi figli ordinari ignorando quelli creati da
1051                         \func{clone}.\\
1052     \const{\_\_WALL}  & Attende per qualunque figlio, sia ordinario che creato
1053                         con  \func{clone}, se specificata insieme a
1054                         \const{\_\_WCLONE} quest'ultima viene ignorata. \\
1055     \const{\_\_WNOTHREAD}& Non attende per i figli di altri \textit{thread}
1056                         dello stesso \textit{thread group}, questo era il
1057                         comportamento di default del kernel 2.4 che non
1058                         supportava la possibilità, divenuta il default a
1059                         partire dal 2.6, di attendere un qualunque figlio
1060                         appartenente allo stesso \textit{thread group}. \\
1061     \hline
1062   \end{tabular}
1063   \caption{Costanti che identificano i bit dell'argomento \param{options}
1064     della funzione \func{waitpid}.}
1065   \label{tab:proc_waitpid_options}
1066 \end{table}
1067
1068
1069 L'uso dell'opzione \const{WNOHANG} consente di prevenire il blocco della
1070 funzione qualora nessun figlio sia uscito o non si siano verificate le altre
1071 condizioni per l'uscita della funzione. in tal caso. In tal caso la funzione,
1072 invece di restituire il \ids{PID} del processo (che è sempre un intero
1073 positivo) ritornerà un valore nullo.
1074
1075 Le altre due opzioni, \const{WUNTRACED} e \const{WCONTINUED}, consentono
1076 rispettivamente di tracciare non la terminazione di un processo, ma il fatto
1077 che esso sia stato fermato, o fatto ripartire, e sono utilizzate per la
1078 gestione del controllo di sessione (vedi sez.~\ref{sec:sess_job_control}).
1079
1080 Nel caso di \const{WUNTRACED} la funzione ritorna, restituendone il \ids{PID},
1081 quando un processo figlio entra nello stato \textit{stopped}\footnote{in
1082   realtà viene notificato soltanto il caso in cui il processo è stato fermato
1083   da un segnale di stop (vedi sez.~\ref{sec:sess_ctrl_term}), e non quello in
1084   cui lo stato \textit{stopped} è dovuto all'uso di \func{ptrace} (vedi
1085   sez.~\ref{sec:process_ptrace}).} (vedi tab.~\ref{tab:proc_proc_states}),
1086 mentre con \const{WCONTINUED} la funzione ritorna quando un processo in stato
1087 \textit{stopped} riprende l'esecuzione per la ricezione del segnale
1088 \signal{SIGCONT} (l'uso di questi segnali per il controllo di sessione è
1089 trattato in sez.~\ref{sec:sess_ctrl_term}).
1090
1091 La terminazione di un processo figlio (così come gli altri eventi osservabili
1092 con \func{waitpid}) è chiaramente un evento asincrono rispetto all'esecuzione
1093 di un programma e può avvenire in un qualunque momento. Per questo motivo,
1094 come accennato nella sezione precedente, una delle azioni prese dal kernel
1095 alla conclusione di un processo è quella di mandare un segnale di
1096 \signal{SIGCHLD} al padre. L'azione predefinita (si veda
1097 sez.~\ref{sec:sig_base}) per questo segnale è di essere ignorato, ma la sua
1098 generazione costituisce il meccanismo di comunicazione asincrona con cui il
1099 kernel avverte il processo padre che uno dei suoi figli è terminato.
1100
1101 Il comportamento delle funzioni è però cambiato nel passaggio dal kernel 2.4
1102 al kernel 2.6, quest'ultimo infatti si è adeguato alle prescrizioni dello
1103 standard POSIX.1-2001 e come da esso richiesto se \signal{SIGCHLD} viene
1104 ignorato, o se si imposta il flag di \const{SA\_NOCLDSTOP} nella ricezione
1105 dello stesso (si veda sez.~\ref{sec:sig_sigaction}) i processi figli che
1106 terminano non diventano \textit{zombie} e sia \func{wait} che \func{waitpid}
1107 si bloccano fintanto che tutti i processi figli non sono terminati, dopo di
1108 che falliscono con un errore di \errcode{ENOCHLD}.\footnote{questo è anche il
1109   motivo per cui le opzioni \const{WUNTRACED} e \const{WCONTINUED} sono
1110   utilizzabili soltanto qualora non si sia impostato il flag di
1111   \const{SA\_NOCLDSTOP} per il segnale \signal{SIGCHLD}.}
1112
1113 Con i kernel della serie 2.4 e tutti i kernel delle serie precedenti entrambe
1114 le funzioni di attesa ignorano questa prescrizione e si comportano sempre
1115 nello stesso modo,\footnote{lo standard POSIX.1 originale infatti lascia
1116   indefinito il comportamento di queste funzioni quando \signal{SIGCHLD} viene
1117   ignorato.} indipendentemente dal fatto \signal{SIGCHLD} sia ignorato o meno:
1118 attendono la terminazione di un processo figlio e ritornano il relativo
1119 \ids{PID} e lo stato di terminazione nell'argomento \param{status}.
1120
1121 In generale in un programma non si vuole essere forzati ad attendere la
1122 conclusione di un processo figlio per proseguire l'esecuzione, specie se tutto
1123 questo serve solo per leggerne lo stato di chiusura (ed evitare eventualmente
1124 la presenza di \textit{zombie}).  Per questo la modalità più comune di
1125 chiamare queste funzioni è quella di utilizzarle all'interno di un
1126 \textit{signal handler} (vedremo un esempio di come gestire \signal{SIGCHLD}
1127 con i segnali in sez.~\ref{sec:sig_example}). In questo caso infatti, dato che
1128 il segnale è generato dalla terminazione di un figlio, avremo la certezza che
1129 la chiamata a \func{waitpid} non si bloccherà.
1130
1131 Come accennato sia \func{wait} che \func{waitpid} restituiscono lo stato di
1132 terminazione del processo tramite il puntatore \param{status}, e se non
1133 interessa memorizzare lo stato si può passare un puntatore nullo. Il valore
1134 restituito da entrambe le funzioni dipende dall'implementazione, ma
1135 tradizionalmente gli 8 bit meno significativi sono riservati per memorizzare
1136 lo stato di uscita del processo, e gli altri per indicare il segnale che ha
1137 causato la terminazione (in caso di conclusione anomala), uno per indicare se
1138 è stato generato un \textit{core dump} (vedi sez.~\ref{sec:sig_standard}),
1139 ecc.\footnote{le definizioni esatte si possono trovare in
1140   \file{<bits/waitstatus.h>} ma questo file non deve mai essere usato
1141   direttamente, esso viene incluso attraverso \file{<sys/wait.h>}.}
1142
1143 \begin{table}[!htb]
1144   \centering
1145   \footnotesize
1146   \begin{tabular}[c]{|l|p{10cm}|}
1147     \hline
1148     \textbf{Macro} & \textbf{Descrizione}\\
1149     \hline
1150     \hline
1151     \macro{WIFEXITED}\texttt{(s)}   & Condizione vera (valore non nullo) per
1152                                       un processo figlio che sia terminato
1153                                       normalmente. \\
1154     \macro{WEXITSTATUS}\texttt{(s)} & Restituisce gli otto bit meno
1155                                       significativi dello stato di uscita del
1156                                       processo (passato attraverso
1157                                       \func{\_exit}, \func{exit} o come valore
1158                                       di ritorno di \code{main}); può essere
1159                                       valutata solo se \val{WIFEXITED} ha
1160                                       restituito un valore non nullo.\\
1161     \macro{WIFSIGNALED}\texttt{(s)} & Condizione vera se il processo figlio è
1162                                       terminato in maniera anomala a causa di
1163                                       un segnale che non è stato catturato
1164                                       (vedi sez.~\ref{sec:sig_notification}).\\
1165     \macro{WTERMSIG}\texttt{(s)}    & Restituisce il numero del segnale che ha
1166                                       causato la terminazione anomala del
1167                                       processo; può essere valutata solo se
1168                                       \val{WIFSIGNALED} ha restituito un
1169                                       valore non nullo.\\
1170     \macro{WCOREDUMP}\texttt{(s)}   & Vera se il processo terminato ha
1171                                       generato un file di
1172                                       \textit{core dump}; può essere valutata
1173                                       solo se \val{WIFSIGNALED} ha restituito
1174                                       un valore non nullo.\footnotemark \\
1175     \macro{WIFSTOPPED}\texttt{(s)}  & Vera se il processo che ha causato il
1176                                       ritorno di \func{waitpid} è bloccato;
1177                                       l'uso è possibile solo con
1178                                       \func{waitpid} avendo specificato
1179                                       l'opzione \const{WUNTRACED}.\\
1180     \macro{WSTOPSIG}\texttt{(s)}    & Restituisce il numero del segnale che ha
1181                                       bloccato il processo; può essere
1182                                       valutata solo se \val{WIFSTOPPED} ha
1183                                       restituito un valore non nullo. \\
1184     \macro{WIFCONTINUED}\texttt{(s)}& Vera se il processo che ha causato il
1185                                       ritorno è stato riavviato da un
1186                                       \signal{SIGCONT} (disponibile solo a
1187                                       partire dal kernel 2.6.10).\\
1188     \hline
1189   \end{tabular}
1190   \caption{Descrizione delle varie macro di preprocessore utilizzabili per
1191     verificare lo stato di terminazione \var{s} di un processo.}
1192   \label{tab:proc_status_macro}
1193 \end{table}
1194
1195 \footnotetext{questa macro non è definita dallo standard POSIX.1-2001, ma è
1196   presente come estensione sia in Linux che in altri Unix, deve essere
1197   pertanto utilizzata con attenzione (ad esempio è il caso di usarla in un
1198   blocco \texttt{\#ifdef WCOREDUMP ... \#endif}.}
1199
1200 Lo standard POSIX.1 definisce una serie di macro di preprocessore da usare per
1201 analizzare lo stato di uscita. Esse sono definite sempre in
1202 \file{<sys/wait.h>} ed elencate in tab.~\ref{tab:proc_status_macro}. Si tenga
1203 presente che queste macro prevedono che gli si passi come parametro la
1204 variabile di tipo \ctyp{int} puntata dall'argomento \param{status} restituito
1205 da \func{wait} o \func{waitpid}.
1206
1207 Si tenga conto che nel caso di conclusione anomala il valore restituito da
1208 \val{WTERMSIG} può essere confrontato con le costanti che identificano i
1209 segnali definite in \headfile{signal.h} ed elencate in
1210 tab.~\ref{tab:sig_signal_list}, e stampato usando le apposite funzioni
1211 trattate in sez.~\ref{sec:sig_strsignal}.
1212
1213 A partire dal kernel 2.6.9, sempre in conformità allo standard POSIX.1-2001, è
1214 stata introdotta una nuova funzione di attesa che consente di avere un
1215 controllo molto più preciso sui possibili cambiamenti di stato dei processi
1216 figli e più dettagli sullo stato di uscita; la funzione di sistema è
1217 \funcd{waitid} ed il suo prototipo è:
1218
1219 \begin{funcproto}{
1220 \fhead{sys/types.h}
1221 \fhead{sys/wait.h}
1222 \fdecl{int waitid(idtype\_t idtype, id\_t id, siginfo\_t *infop, int options)}
1223 \fdesc{Attende il cambiamento di stato di un processo figlio.}
1224 }
1225 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1226   caso \var{errno} assumerà uno dei valori:
1227   \begin{errlist}
1228   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
1229     non è figlio del processo chiamante.
1230   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
1231     la funzione è stata interrotta da un segnale.
1232   \item[\errcode{EINVAL}] si è specificato un valore non valido per
1233     l'argomento \param{options}.
1234   \end{errlist}}
1235 \end{funcproto}
1236
1237 La funzione prevede che si specifichi quali processi si intendono osservare
1238 usando i due argomenti \param{idtype} ed \param{id}; il primo indica se ci si
1239 vuole porre in attesa su un singolo processo, un gruppo di processi o un
1240 processo qualsiasi, e deve essere specificato secondo uno dei valori di
1241 tab.~\ref{tab:proc_waitid_idtype}; il secondo indica, a seconda del valore del
1242 primo, quale processo o quale gruppo di processi selezionare.
1243
1244 \begin{table}[!htb]
1245   \centering
1246   \footnotesize
1247   \begin{tabular}[c]{|l|p{8cm}|}
1248     \hline
1249     \textbf{Valore} & \textbf{Descrizione}\\
1250     \hline
1251     \hline
1252     \const{P\_PID} & Indica la richiesta di attendere per un processo figlio
1253                      il cui \ids{PID} corrisponda al valore dell'argomento
1254                      \param{id}.\\
1255     \const{P\_PGID}& Indica la richiesta di attendere per un processo figlio
1256                      appartenente al \textit{process group} (vedi
1257                      sez.~\ref{sec:sess_proc_group}) il cui \acr{pgid}
1258                      corrisponda al valore dell'argomento \param{id}.\\
1259     \const{P\_ALL} & Indica la richiesta di attendere per un processo figlio
1260                      generico, il valore dell'argomento \param{id} viene
1261                      ignorato.\\
1262     \hline
1263   \end{tabular}
1264   \caption{Costanti per i valori dell'argomento \param{idtype} della funzione
1265     \func{waitid}.}
1266   \label{tab:proc_waitid_idtype}
1267 \end{table}
1268
1269 Come per \func{waitpid} anche il comportamento di \func{waitid} è
1270 controllato dall'argomento \param{options}, da specificare come maschera
1271 binaria dei valori riportati in tab.~\ref{tab:proc_waitid_options}. Benché
1272 alcuni di questi siano identici come significato ed effetto ai precedenti di
1273 tab.~\ref{tab:proc_waitpid_options}, ci sono delle differenze significative:
1274 in questo caso si dovrà specificare esplicitamente l'attesa della terminazione
1275 di un processo impostando l'opzione \const{WEXITED}, mentre il precedente
1276 \const{WUNTRACED} è sostituito da \const{WSTOPPED}.  Infine è stata aggiunta
1277 l'opzione \const{WNOWAIT} che consente una lettura dello stato mantenendo il
1278 processo in attesa di ricezione, così che una successiva chiamata possa di
1279 nuovo riceverne lo stato.
1280
1281 \begin{table}[!htb]
1282   \centering
1283   \footnotesize
1284   \begin{tabular}[c]{|l|p{8cm}|}
1285     \hline
1286     \textbf{Valore} & \textbf{Descrizione}\\
1287     \hline
1288     \hline
1289     \const{WEXITED}   & Ritorna quando un processo figlio è terminato.\\
1290     \const{WNOHANG}   & Ritorna immediatamente anche se non c'è niente da
1291                         notificare.\\
1292     \const{WSTOPPED} &  Ritorna quando un processo figlio è stato fermato.\\
1293     \const{WCONTINUED}& Ritorna quando un processo figlio che era stato
1294                         fermato ha ripreso l'esecuzione.\\
1295     \const{WNOWAIT}   & Lascia il processo ancora in attesa di ricezione, così
1296                         che una successiva chiamata possa di nuovo riceverne
1297                         lo stato.\\
1298     \hline
1299   \end{tabular}
1300   \caption{Costanti che identificano i bit dell'argomento \param{options}
1301     della funzione \func{waitid}.}
1302   \label{tab:proc_waitid_options}
1303 \end{table}
1304
1305 La funzione \func{waitid} restituisce un valore nullo in caso di successo, e
1306 $-1$ in caso di errore; viene restituito un valore nullo anche se è stata
1307 specificata l'opzione \const{WNOHANG} e la funzione è ritornata immediatamente
1308 senza che nessun figlio sia terminato. Pertanto per verificare il motivo del
1309 ritorno della funzione occorre analizzare le informazioni che essa
1310 restituisce; queste, al contrario delle precedenti \func{wait} e
1311 \func{waitpid} che usavano un semplice valore numerico, sono ritornate in una
1312 struttura di tipo \struct{siginfo\_t} (vedi fig.~\ref{fig:sig_siginfo_t})
1313 all'indirizzo puntato dall'argomento \param{infop}.
1314
1315 Tratteremo nei dettagli la struttura \struct{siginfo\_t} ed il significato dei
1316 suoi vari campi in sez.~\ref{sec:sig_sigaction}, per quanto ci interessa qui
1317 basta dire che al ritorno di \func{waitid} verranno avvalorati i seguenti
1318 campi:
1319 \begin{basedescript}{\desclabelwidth{2.0cm}}
1320 \item[\var{si\_pid}] con il \ids{PID} del figlio.
1321 \item[\var{si\_uid}] con l'\textsl{user-ID reale} (vedi
1322   sez.~\ref{sec:proc_perms}) del figlio.
1323 \item[\var{si\_signo}] con \signal{SIGCHLD}.
1324 \item[\var{si\_status}] con lo stato di uscita del figlio o con il segnale che
1325   lo ha terminato, fermato o riavviato.
1326 \item[\var{si\_code}] con uno fra \const{CLD\_EXITED}, \const{CLD\_KILLED},
1327   \const{CLD\_STOPPED}, \const{CLD\_CONTINUED}, \const{CLD\_TRAPPED} e
1328   \const{CLD\_DUMPED} a indicare la ragione del ritorno della funzione, il cui
1329   significato è, nell'ordine: uscita normale, terminazione da segnale,
1330   processo fermato, processo riavviato, processo terminato in
1331   \textit{core dump} (vedi sez.~\ref{sec:sig_standard}).
1332 \end{basedescript}
1333
1334 Infine Linux, seguendo un'estensione di BSD, supporta altre due funzioni per
1335 la lettura dello stato di terminazione di un processo, analoghe alle
1336 precedenti ma che prevedono un ulteriore argomento attraverso il quale il
1337 kernel può restituire al padre informazioni sulle risorse (vedi
1338 sez.~\ref{sec:sys_res_limits}) usate dal processo terminato e dai vari figli.
1339 Le due funzioni di sistema sono \funcd{wait3} e \funcd{wait4}, che diventano
1340 accessibili definendo la macro \macro{\_USE\_BSD}, i loro prototipi sono:
1341
1342 \begin{funcproto}{
1343 \fhead{sys/types.h}
1344 \fhead{sys/times.h}
1345 \fhead{sys/resource.h}
1346 \fhead{sys/wait.h}
1347 \fdecl{int wait3(int *status, int options, struct rusage *rusage)}
1348 \fdecl{int wait4(pid\_t pid, int *status, int options, struct rusage *rusage)}
1349 \fdesc{Attende il cambiamento di stato di un processo figlio, riportando l'uso
1350   delle risorse.}
1351 }
1352 {La funzione ha gli stessi valori di ritorno e codici di errore di
1353   \func{waitpid}. }
1354 \end{funcproto}
1355
1356 La funzione \func{wait4} è identica \func{waitpid} sia nel comportamento che
1357 per i valori dei primi tre argomenti, ma in più restituisce nell'argomento
1358 aggiuntivo \param{rusage} un sommario delle risorse usate dal processo. Questo
1359 argomento è una struttura di tipo \struct{rusage} definita in
1360 \headfile{sys/resource.h}, che viene utilizzata anche dalla funzione
1361 \func{getrusage} per ottenere le risorse di sistema usate da un processo. La
1362 sua definizione è riportata in fig.~\ref{fig:sys_rusage_struct} e ne
1363 tratteremo in dettaglio il significato sez.~\ref{sec:sys_resource_use}. La
1364 funzione \func{wait3} è semplicemente un caso particolare di (e con Linux
1365 viene realizzata con la stessa \textit{system call}), ed è equivalente a
1366 chiamare \code{wait4(-1, \&status, opt, rusage)}, per questo motivo è ormai
1367 deprecata in favore di \func{wait4}.
1368
1369
1370
1371 \subsection{La famiglia delle funzioni \func{exec} per l'esecuzione dei
1372   programmi}
1373 \label{sec:proc_exec}
1374
1375 Abbiamo già detto che una delle modalità principali con cui si utilizzano i
1376 processi in Unix è quella di usarli per lanciare nuovi programmi: questo viene
1377 fatto attraverso una delle funzioni della famiglia \func{exec}. Quando un
1378 processo chiama una di queste funzioni esso viene completamente sostituito dal
1379 nuovo programma, il \ids{PID} del processo non cambia, dato che non viene
1380 creato un nuovo processo, la funzione semplicemente rimpiazza lo
1381 \textit{stack}, i dati ed il testo del processo corrente con un nuovo
1382 programma letto da disco, eseguendo il \textit{link-loader} con gli effetti
1383 illustrati in sez.~\ref{sec:proc_main}.
1384
1385 Ci sono sei diverse versioni di \func{exec} (per questo la si è chiamata
1386 famiglia di funzioni) che possono essere usate per questo compito, in realtà
1387 (come mostrato in fig.~\ref{fig:proc_exec_relat}), tutte queste funzioni sono
1388 tutte varianti che consentono di invocare in modi diversi, semplificando il
1389 passaggio degli argomenti, la funzione di sistema \funcd{execve}, il cui
1390 prototipo è:
1391
1392 \begin{funcproto}{
1393 \fhead{unistd.h}
1394 \fdecl{int execve(const char *filename, char *const argv[], char *const envp[])}
1395 \fdesc{Esegue un programma.}
1396 }
1397 {La funzione ritorna solo in caso di errore, restituendo $-1$, nel qual
1398  caso \var{errno} assumerà uno dei valori:
1399 \begin{errlist}
1400   \item[\errcode{EACCES}] il file o l'interprete non file ordinari, o non sono
1401     eseguibili, o il file è su un filesystem montato con l'opzione
1402     \cmd{noexec}, o manca  il permesso di attraversamento di una delle
1403     directory del \textit{pathname}.
1404   \item[\errcode{EINVAL}] l'eseguibile ELF ha più di un segmento
1405     \const{PF\_INTERP}, cioè chiede di essere eseguito da più di un
1406     interprete.
1407   \item[\errcode{ELIBBAD}] un interprete ELF non è in un formato
1408     riconoscibile.
1409   \item[\errcode{ENOEXEC}] il file è in un formato non eseguibile o non
1410     riconosciuto come tale, o compilato per un'altra architettura.
1411   \item[\errcode{ENOENT}] il file o una delle librerie dinamiche o l'interprete
1412     necessari per eseguirlo non esistono.
1413   \item[\errcode{EPERM}] il file ha i bit \acr{suid} o \acr{sgid} e l'utente
1414     non è root, ed il processo viene tracciato, oppure il filesystem è montato
1415     con l'opzione \cmd{nosuid}.
1416   \item[\errcode{ETXTBSY}] l'eseguibile è aperto in scrittura da uno o più
1417     processi.
1418   \item[\errcode{E2BIG}] la lista degli argomenti è troppo grande.
1419   \end{errlist}
1420   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{EISDIR}, \errval{ELOOP},
1421   \errval{EMFILE}, \errval{ENAMETOOLONG}, \errval{ENFILE}, \errval{ENOMEM},
1422   \errval{ENOTDIR} nel loro significato generico.  }
1423 \end{funcproto}
1424
1425 La funzione \func{execve} esegue il programma o lo script indicato dal
1426 \textit{pathname} \param{filename}, passandogli la lista di argomenti indicata
1427 da \param{argv} e come ambiente la lista di stringhe indicata
1428 da \param{envp}. Entrambe le liste devono essere terminate da un puntatore
1429 nullo. I vettori degli argomenti e dell'ambiente possono essere acceduti dal
1430 nuovo programma quando la sua funzione \code{main} è dichiarata nella forma
1431 \code{main(int argc, char *argv[], char *envp[])}. Si tenga presente per il
1432 passaggio degli argomenti e dell'ambiente esistono comunque dei limiti, su cui
1433 torneremo in sez.~\ref{sec:sys_res_limits}).
1434 % TODO aggiungere la parte sul numero massimo di argomenti, da man execve
1435
1436 In caso di successo la funzione non ritorna, in quanto al posto del programma
1437 chiamante viene eseguito il nuovo programma indicato da \param{filename}. Se
1438 il processo corrente è tracciato con \func{ptrace} (vedi
1439 sez.~\ref{sec:process_ptrace}) in caso di successo viene emesso il segnale
1440 \signal{SIGTRAP}.
1441
1442 Le altre funzioni della famiglia (\funcd{execl}, \funcd{execv},
1443 \funcd{execle}, \funcd{execlp}, \funcd{execvp}) servono per fornire all'utente
1444 una serie di possibili diverse interfacce nelle modalità di passaggio degli
1445 argomenti all'esecuzione del nuovo programma. I loro prototipi sono:
1446
1447 \begin{funcproto}{
1448 \fhead{unistd.h}
1449 \fdecl{int execl(const char *path, const char *arg, ...)}
1450 \fdecl{int execv(const char *path, char *const argv[])}
1451 \fdecl{int execle(const char *path, const char *arg, ..., char * const envp[])}
1452 \fdecl{int execlp(const char *file, const char *arg, ...)}
1453 \fdecl{int execvp(const char *file, char *const argv[])}
1454 \fdesc{Eseguono un programma.}
1455 }
1456 {Le funzioni ritornano solo in caso di errore, restituendo $-1$, i codici di
1457   errore sono gli stessi di \func{execve}.
1458 }
1459 \end{funcproto}
1460
1461 Tutte le funzioni mettono in esecuzione nel processo corrente il programma
1462 indicati nel primo argomento. Gli argomenti successivi consentono di
1463 specificare gli argomenti e l'ambiente che saranno ricevuti dal nuovo
1464 processo. Per capire meglio le differenze fra le funzioni della famiglia si può
1465 fare riferimento allo specchietto riportato in
1466 tab.~\ref{tab:proc_exec_scheme}. La relazione fra le funzioni è invece
1467 illustrata in fig.~\ref{fig:proc_exec_relat}.
1468
1469 \begin{table}[!htb]
1470   \footnotesize
1471   \centering
1472   \begin{tabular}[c]{|l|c|c|c||c|c|c|}
1473     \hline
1474     \multicolumn{1}{|c|}{\textbf{Caratteristiche}} &
1475     \multicolumn{6}{|c|}{\textbf{Funzioni}} \\
1476     \hline
1477     &\func{execl}\texttt{ }&\func{execlp}&\func{execle}
1478     &\func{execv}\texttt{ }& \func{execvp}& \func{execve} \\
1479     \hline
1480     \hline
1481     argomenti a lista    &$\bullet$&$\bullet$&$\bullet$&&& \\
1482     argomenti a vettore  &&&&$\bullet$&$\bullet$&$\bullet$\\
1483     \hline
1484     filename completo     &$\bullet$&&$\bullet$&$\bullet$&&$\bullet$\\
1485     ricerca su \var{PATH} &&$\bullet$&&&$\bullet$& \\
1486     \hline
1487     ambiente a vettore   &&&$\bullet$&&&$\bullet$ \\
1488     uso di \var{environ} &$\bullet$&$\bullet$&&$\bullet$&$\bullet$& \\
1489     \hline
1490   \end{tabular}
1491   \caption{Confronto delle caratteristiche delle varie funzioni della
1492     famiglia \func{exec}.}
1493   \label{tab:proc_exec_scheme}
1494 \end{table}
1495
1496 La prima differenza fra le funzioni riguarda le modalità di passaggio dei
1497 valori che poi andranno a costituire gli argomenti a linea di comando (cioè i
1498 valori di \param{argv} e \param{argc} visti dalla funzione \code{main} del
1499 programma chiamato). Queste modalità sono due e sono riassunte dagli mnemonici
1500 ``\texttt{v}'' e ``\texttt{l}'' che stanno rispettivamente per \textit{vector}
1501 e \textit{list}.
1502
1503 Nel primo caso gli argomenti sono passati tramite il vettore di puntatori
1504 \var{argv[]} a stringhe terminate con zero che costituiranno gli argomenti a
1505 riga di comando, questo vettore \emph{deve} essere terminato da un puntatore
1506 nullo. Nel secondo caso le stringhe degli argomenti sono passate alla funzione
1507 come lista di puntatori, nella forma:
1508 \includecodesnip{listati/char_list.c}
1509 che deve essere terminata da un puntatore nullo.  In entrambi i casi vale la
1510 convenzione che il primo argomento (\var{arg0} o \var{argv[0]}) viene usato
1511 per indicare il nome del file che contiene il programma che verrà eseguito.
1512
1513 \begin{figure}[!htb]
1514   \centering \includegraphics[width=9cm]{img/exec_rel}
1515   \caption{La interrelazione fra le sei funzioni della famiglia \func{exec}.}
1516   \label{fig:proc_exec_relat}
1517 \end{figure}
1518
1519 La seconda differenza fra le funzioni riguarda le modalità con cui si
1520 specifica il programma che si vuole eseguire. Con lo mnemonico ``\texttt{p}''
1521 si indicano le due funzioni che replicano il comportamento della shell nello
1522 specificare il comando da eseguire; quando l'argomento \param{file} non
1523 contiene una ``\texttt{/}'' esso viene considerato come un nome di programma,
1524 e viene eseguita automaticamente una ricerca fra i file presenti nella lista
1525 di directory specificate dalla variabile di ambiente \envvar{PATH}. Il file
1526 che viene posto in esecuzione è il primo che viene trovato. Se si ha un errore
1527 relativo a permessi di accesso insufficienti (cioè l'esecuzione della
1528 sottostante \func{execve} ritorna un \errcode{EACCES}), la ricerca viene
1529 proseguita nelle eventuali ulteriori directory indicate in \envvar{PATH}; solo
1530 se non viene trovato nessun altro file viene finalmente restituito
1531 \errcode{EACCES}.  Le altre quattro funzioni si limitano invece a cercare di
1532 eseguire il file indicato dall'argomento \param{path}, che viene interpretato
1533 come il \textit{pathname} del programma.
1534
1535 La terza differenza è come viene passata la lista delle variabili di ambiente.
1536 Con lo mnemonico ``\texttt{e}'' vengono indicate quelle funzioni che
1537 necessitano di un vettore di parametri \var{envp[]} analogo a quello usato per
1538 gli argomenti a riga di comando (terminato quindi da un \val{NULL}), le altre
1539 usano il valore della variabile \var{environ} (vedi
1540 sez.~\ref{sec:proc_environ}) del processo di partenza per costruire
1541 l'ambiente.
1542
1543 Oltre a mantenere lo stesso \ids{PID}, il nuovo programma fatto partire da una
1544 delle funzioni della famiglia \func{exec} mantiene la gran parte delle
1545 proprietà del processo chiamante; una lista delle più significative è la
1546 seguente:
1547 \begin{itemize*}
1548 \item il \textit{process id} (\ids{PID}) ed il \textit{parent process id}
1549   (\ids{PPID});
1550 \item l'\textsl{user-ID reale}, il \textsl{group-ID reale} ed i
1551   \textsl{group-ID supplementari} (vedi sez.~\ref{sec:proc_access_id});
1552 \item la directory radice (vedi sez.~\ref{sec:file_chroot}) e la directory di
1553   lavoro corrente (vedi sez.~\ref{sec:file_work_dir});
1554 \item la maschera di creazione dei file (\textit{umask}, vedi
1555   sez.~\ref{sec:file_perm_management}) ed i \textit{lock} sui file (vedi
1556   sez.~\ref{sec:file_locking});
1557 \item il valori di \textit{nice}, le priorità real-time e le affinità di
1558   processore (vedi sez.~\ref{sec:proc_sched_stand};
1559   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
1560 \item il \textit{session ID} (\acr{sid}) ed il \textit{process group ID}
1561   (\acr{pgid}), vedi sez.~\ref{sec:sess_proc_group};
1562 \item il terminale di controllo (vedi sez.~\ref{sec:sess_ctrl_term});
1563 \item il tempo restante ad un allarme (vedi sez.~\ref{sec:sig_alarm_abort});
1564 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
1565 \item i valori delle variabili \var{tms\_utime}, \var{tms\_stime};
1566   \var{tms\_cutime}, \var{tms\_ustime} (vedi sez.~\ref{sec:sys_cpu_times});
1567 % TODO ===========Importante=============
1568 % TODO questo sotto è incerto, verificare
1569 % TODO ===========Importante=============
1570 \item la maschera dei segnali (si veda sez.~\ref{sec:sig_sigmask}).
1571 \end{itemize*}
1572
1573 Una serie di proprietà del processo originale, che non avrebbe senso mantenere
1574 in un programma che esegue un codice completamente diverso in uno spazio di
1575 indirizzi totalmente indipendente e ricreato da zero, vengono perse con
1576 l'esecuzione di una \func{exec}. Lo standard POSIX.1-2001 prevede che le
1577 seguenti proprietà non vengano preservate:
1578 \begin{itemize*}
1579 \item l'insieme dei segnali pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che
1580   viene cancellato;
1581 \item gli eventuali stack alternativi per i segnali (vedi
1582   sez.~\ref{sec:sig_specific_features});
1583 \item i \textit{directory stream} (vedi sez.~\ref{sec:file_dir_read}), che
1584   vengono chiusi;
1585 \item le mappature dei file in memoria (vedi sez.~\ref{sec:file_memory_map});
1586 \item i segmenti di memoria condivisa SysV (vedi sez.~\ref{sec:ipc_sysv_shm})
1587   e POSIX (vedi sez.~\ref{sec:ipc_posix_shm});
1588 \item i \textit{memory lock} (vedi sez.~\ref{sec:proc_mem_lock});
1589 \item le funzioni registrate all'uscita (vedi sez.~\ref{sec:proc_atexit});
1590 \item i semafori e le code di messaggi POSIX (vedi
1591   sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq});
1592 \item i timer POSIX (vedi sez.~\ref{sec:sig_timer_adv}).
1593 \end{itemize*}
1594
1595 Inoltre i segnali che sono stati impostati per essere ignorati nel processo
1596 chiamante mantengono la stessa impostazione pure nel nuovo programma, ma tutti
1597 gli altri segnali, ed in particolare quelli per i quali è stato installato un
1598 gestore vengono impostati alla loro azione predefinita (vedi
1599 sez.~\ref{sec:sig_gen_beha}). Un caso speciale è il segnale \signal{SIGCHLD}
1600 che, quando impostato a \const{SIG\_IGN}, potrebbe anche essere reimpostato a
1601 \const{SIG\_DFL}. Lo standard POSIX.1-2001 prevede che questo comportamento
1602 sia deciso dalla singola implementazione, quella di Linux è di non modificare
1603 l'impostazione precedente.
1604
1605 Oltre alle precedenti, che sono completamente generali e disponibili anche su
1606 altri sistemi unix-like, esistono altre proprietà dei processi, attinenti alle
1607 caratteristiche specifiche di Linux, che non vengono preservate
1608 nell'esecuzione della funzione \func{exec}, queste sono:
1609 \begin{itemize*}
1610 \item le operazioni di I/O asincrono (vedi sez.~\ref{sec:file_asyncronous_io})
1611   pendenti vengono cancellate;
1612 \item le \textit{capabilities} vengono modificate come
1613   illustrato in sez.~\ref{sec:proc_capabilities};
1614 \item tutti i \textit{thread} tranne il chiamante (vedi
1615   sez.~\ref{sec:thread_xxx}) sono cancellati e tutti gli oggetti ad essi
1616   relativi (vedi sez.~\ref{sec:thread_xxx}) rimossi;
1617 \item viene impostato il flag \const{PR\_SET\_DUMPABLE} di \func{prctl} (vedi
1618   sez.~\ref{sec:process_prctl}) a meno che il programma da eseguire non sia
1619   \acr{suid} o \acr{sgid} (vedi sez.~\ref{sec:proc_access_id} e
1620   sez.~\ref{sec:file_special_perm});
1621 \item il flag \const{PR\_SET\_KEEPCAPS} di \func{prctl} (vedi
1622   sez.~\ref{sec:process_prctl}) viene cancellato;
1623 \item il nome del processo viene impostato al nome del file contenente il
1624   programma messo in esecuzione;
1625 \item il segnale di terminazione viene reimpostato a \signal{SIGCHLD};
1626 \item l'ambiente viene reinizializzato impostando le variabili attinenti alla
1627   localizzazione al valore di default POSIX.
1628 \end{itemize*}
1629
1630 \itindbeg{close-on-exec}
1631
1632 La gestione dei file aperti nel passaggio al nuovo programma lanciato con
1633 \func{exec} dipende dal valore che ha il flag di \textit{close-on-exec} (vedi
1634 sez.~\ref{sec:file_fcntl_ioctl}) per ciascun \textit{file descriptor}. I file
1635 per cui è impostato vengono chiusi, tutti gli altri file restano
1636 aperti. Questo significa che il comportamento predefinito è che i file restano
1637 aperti attraverso una \func{exec}, a meno di una chiamata esplicita a
1638 \func{fcntl} che imposti il suddetto flag.  Per le directory, lo standard
1639 POSIX.1 richiede che esse vengano chiuse attraverso una \func{exec}, in genere
1640 questo è fatto dalla funzione \func{opendir} (vedi
1641 sez.~\ref{sec:file_dir_read}) che effettua da sola l'impostazione del flag di
1642 \textit{close-on-exec} sulle directory che apre, in maniera trasparente
1643 all'utente.
1644
1645 \itindend{close-on-exec}
1646
1647 Il comportamento della funzione in relazione agli identificatori relativi al
1648 controllo di accesso verrà trattato in dettaglio in sez.~\ref{sec:proc_perms},
1649 qui è sufficiente anticipare (si faccia riferimento a
1650 sez.~\ref{sec:proc_access_id} per la definizione di questi identificatori)
1651 come l'\textsl{user-ID reale} ed il \textsl{group-ID reale} restano sempre gli
1652 stessi, mentre l'\textsl{user-ID salvato} ed il \textsl{group-ID salvato}
1653 vengono impostati rispettivamente all'\textsl{user-ID effettivo} ed il
1654 \textsl{group-ID effettivo}. Questi ultimi normalmente non vengono modificati,
1655 a meno che il file di cui viene chiesta l'esecuzione non abbia o il \acr{suid}
1656 bit o lo \acr{sgid} bit impostato (vedi sez.~\ref{sec:file_special_perm}), in
1657 questo caso l'\textsl{user-ID effettivo} ed il \textsl{group-ID effettivo}
1658 vengono impostati rispettivamente all'utente o al gruppo cui il file
1659 appartiene.
1660
1661 Se il file da eseguire è in formato \emph{a.out} e necessita di librerie
1662 condivise, viene lanciato il \textit{linker} dinamico \cmd{/lib/ld.so} prima
1663 del programma per caricare le librerie necessarie ed effettuare il link
1664 dell'eseguibile; il formato è ormai in completo disuso, per cui è molto
1665 probabile che non il relativo supporto non sia disponibile. Se il programma è
1666 in formato ELF per caricare le librerie dinamiche viene usato l'interprete
1667 indicato nel segmento \const{PT\_INTERP} previsto dal formato stesso, in
1668 genere questo è \sysfile{/lib/ld-linux.so.1} per programmi collegati con la
1669 \acr{libc5}, e \sysfile{/lib/ld-linux.so.2} per programmi collegati con la
1670 \acr{glibc}.
1671
1672 Infine nel caso il programma che si vuole eseguire sia uno script e non un
1673 binario, questo deve essere un file di testo che deve iniziare con una linea
1674 nella forma:
1675 \begin{Example}
1676 #!/path/to/interpreter [argomenti]
1677 \end{Example}
1678 dove l'interprete indicato deve essere un eseguibile binario e non un altro
1679 script, che verrà chiamato come se si fosse eseguito il comando
1680 \cmd{interpreter [argomenti] filename}.
1681
1682 Si tenga presente che con Linux quanto viene scritto come \texttt{argomenti}
1683 viene passato all'interprete come un unico argomento con una unica stringa di
1684 lunghezza massima di 127 caratteri e se questa dimensione viene ecceduta la
1685 stringa viene troncata; altri Unix hanno dimensioni massime diverse, e diversi
1686 comportamenti, ad esempio FreeBSD esegue la scansione della riga e la divide
1687 nei vari argomenti e se è troppo lunga restituisce un errore di
1688 \const{ENAMETOOLONG}; una comparazione dei vari comportamenti sui diversi
1689 sistemi unix-like si trova su
1690 \url{http://www.in-ulm.de/~mascheck/various/shebang/}.
1691
1692 Con la famiglia delle \func{exec} si chiude il novero delle funzioni su cui è
1693 basata la gestione tradizionale dei processi in Unix: con \func{fork} si crea
1694 un nuovo processo, con \func{exec} si lancia un nuovo programma, con
1695 \func{exit} e \func{wait} si effettua e verifica la conclusione dei
1696 processi. Tutte le altre funzioni sono ausiliarie e servono per la lettura e
1697 l'impostazione dei vari parametri connessi ai processi.
1698
1699
1700
1701 \section{Il controllo di accesso}
1702 \label{sec:proc_perms}
1703
1704 In questa sezione esamineremo le problematiche relative al controllo di
1705 accesso dal punto di vista dei processi; vedremo quali sono gli identificatori
1706 usati, come questi possono essere modificati nella creazione e nel lancio di
1707 nuovi processi, le varie funzioni per la loro manipolazione diretta e tutte le
1708 problematiche connesse ad una gestione accorta dei privilegi.
1709
1710
1711 \subsection{Gli identificatori del controllo di accesso}
1712 \label{sec:proc_access_id}
1713
1714 Come accennato in sez.~\ref{sec:intro_multiuser} il modello base\footnote{in
1715   realtà già esistono estensioni di questo modello base, che lo rendono più
1716   flessibile e controllabile, come le \textit{capabilities} illustrate in
1717   sez.~\ref{sec:proc_capabilities}, le ACL per i file (vedi
1718   sez.~\ref{sec:file_ACL}) o il \textit{Mandatory Access Control} di
1719   \textit{SELinux}; inoltre basandosi sul lavoro effettuato con
1720   \textit{SELinux}, a partire dal kernel 2.5.x, è iniziato lo sviluppo di una
1721   infrastruttura di sicurezza, i \textit{Linux Security Modules}, o LSM, in
1722   grado di fornire diversi agganci a livello del kernel per modularizzare
1723   tutti i possibili controlli di accesso, cosa che ha permesso di realizzare
1724   diverse alternative a \textit{SELinux}.}
1725 di sicurezza di un sistema unix-like è fondato sui concetti di utente e
1726 gruppo, e sulla separazione fra l'amministratore (\textsl{root}, detto spesso
1727 anche \textit{superuser}) che non è sottoposto a restrizioni, ed il resto
1728 degli utenti, per i quali invece vengono effettuati i vari controlli di
1729 accesso.
1730
1731 Abbiamo già accennato come il sistema associ ad ogni utente e gruppo due
1732 identificatori univoci, lo \itindex{User~ID~(UID)} \textsl{User-ID}
1733 (abbreviato in \ids{UID}) ed il \itindex{Group~ID~(GID)} \textsl{Group-ID}
1734 (abbreviato in \ids{GID}). Questi servono al kernel per identificare uno
1735 specifico utente o un gruppo di utenti, per poi poter controllare che essi
1736 siano autorizzati a compiere le operazioni richieste.  Ad esempio in
1737 sez.~\ref{sec:file_access_control} vedremo come ad ogni file vengano associati
1738 un utente ed un gruppo (i suoi \textsl{proprietari}, indicati appunto tramite
1739 un \ids{UID} ed un \ids{GID}) che vengono controllati dal kernel nella
1740 gestione dei permessi di accesso.
1741
1742 Dato che tutte le operazioni del sistema vengono compiute dai processi, è
1743 evidente che per poter implementare un controllo sulle operazioni occorre
1744 anche poter identificare chi è che ha lanciato un certo programma, e pertanto
1745 anche a ciascun processo dovrà essere associato un utente e un gruppo.
1746
1747 Un semplice controllo di una corrispondenza fra identificativi non garantisce
1748 però sufficiente flessibilità per tutti quei casi in cui è necessario poter
1749 disporre di privilegi diversi, o dover impersonare un altro utente per un
1750 limitato insieme di operazioni. Per questo motivo in generale tutti i sistemi
1751 unix-like prevedono che i processi abbiano almeno due gruppi di
1752 identificatori, chiamati rispettivamente \textit{real} ed \textit{effective}
1753 (cioè \textsl{reali} ed \textsl{effettivi}). Nel caso di Linux si aggiungono
1754 poi altri due gruppi, il \textit{saved} (\textsl{salvati}) ed il
1755 \textit{filesystem} (\textsl{di filesystem}), secondo la situazione illustrata
1756 in tab.~\ref{tab:proc_uid_gid}.
1757
1758 \begin{table}[htb]
1759   \footnotesize
1760   \centering
1761   \begin{tabular}[c]{|c|c|l|p{7cm}|}
1762     \hline
1763     \textbf{Suffisso} & \textbf{Gruppo} & \textbf{Denominazione}
1764                                         & \textbf{Significato} \\
1765     \hline
1766     \hline
1767     \texttt{uid} & \textit{real} & \textsl{user-ID reale}
1768                  & Indica l'utente che ha lanciato il programma.\\
1769     \texttt{gid} & '' &\textsl{group-ID reale}
1770                  & Indica il gruppo principale dell'utente che ha lanciato
1771                    il programma.\\
1772     \hline
1773     \texttt{euid}& \textit{effective} &\textsl{user-ID effettivo}
1774                  & Indica l'utente usato nel controllo di accesso.\\
1775     \texttt{egid}& '' & \textsl{group-ID effettivo}
1776                  & Indica il gruppo usato nel controllo di accesso.\\
1777     --           & -- & \textsl{group-ID supplementari}
1778                  & Indicano gli ulteriori gruppi cui l'utente appartiene.\\
1779     \hline
1780     --           & \textit{saved} & \textsl{user-ID salvato}
1781                  & Mantiene una copia dell'\acr{euid} iniziale.\\
1782     --           & '' & \textsl{group-ID salvato}
1783                  & Mantiene una copia dell'\acr{egid} iniziale.\\
1784     \hline
1785     \texttt{fsuid}& \textit{filesystem} &\textsl{user-ID di filesystem}
1786                  & Indica l'utente effettivo per l'accesso al filesystem. \\
1787     \texttt{fsgid}& '' & \textsl{group-ID di filesystem}
1788                  & Indica il gruppo effettivo per l'accesso al filesystem.\\
1789     \hline
1790   \end{tabular}
1791   \caption{Identificatori di utente e gruppo associati a ciascun processo con
1792     indicazione dei suffissi usati dalle varie funzioni di manipolazione.}
1793   \label{tab:proc_uid_gid}
1794 \end{table}
1795
1796 Al primo gruppo appartengono l'\ids{UID} \textsl{reale} ed il \ids{GID}
1797 \textsl{reale}: questi vengono impostati al login ai valori corrispondenti
1798 all'utente con cui si accede al sistema (e relativo gruppo principale).
1799 Servono per l'identificazione dell'utente e normalmente non vengono mai
1800 cambiati. In realtà vedremo (in sez.~\ref{sec:proc_setuid}) che è possibile
1801 modificarli, ma solo ad un processo che abbia i privilegi di amministratore;
1802 questa possibilità è usata proprio dal programma \cmd{login} che, una volta
1803 completata la procedura di autenticazione, lancia una shell per la quale
1804 imposta questi identificatori ai valori corrispondenti all'utente che entra
1805 nel sistema.
1806
1807 Al secondo gruppo appartengono l'\ids{UID} \textsl{effettivo} e il \ids{GID}
1808 \textsl{effettivo}, a cui si aggiungono gli eventuali \ids{GID}
1809 \textsl{supplementari} dei gruppi dei quali l'utente fa parte.  Questi sono
1810 invece gli identificatori usati nelle verifiche dei permessi del processo e
1811 per il controllo di accesso ai file (argomento affrontato in dettaglio in
1812 sez.~\ref{sec:file_perm_overview}).
1813
1814 Questi identificatori normalmente sono identici ai corrispondenti del gruppo
1815 \textit{real} tranne nel caso in cui, come accennato in
1816 sez.~\ref{sec:proc_exec}, il programma che si è posto in esecuzione abbia i
1817 bit \acr{suid} o \acr{sgid} impostati (il significato di questi bit è
1818 affrontato in dettaglio in sez.~\ref{sec:file_special_perm}). In questo caso
1819 essi saranno impostati all'utente e al gruppo proprietari del file. Questo
1820 consente, per programmi in cui ci sia questa necessità, di dare a qualunque
1821 utente i privilegi o i permessi di un altro, compreso l'amministratore.
1822
1823 Come nel caso del \ids{PID} e del \ids{PPID}, anche tutti questi
1824 identificatori possono essere ottenuti da un programma attraverso altrettante
1825 funzioni di sistema dedicate alla loro lettura, queste sono \funcd{getuid},
1826 \funcd{geteuid}, \funcd{getgid} e \funcd{getegid}, ed i loro prototipi sono:
1827
1828 \begin{funcproto}{
1829 \fhead{unistd.h}
1830 \fhead{sys/types.h}
1831 \fdecl{uid\_t getuid(void)}
1832 \fdesc{Legge l'\ids{UID} reale del processo corrente.}
1833 \fdecl{uid\_t geteuid(void)}
1834 \fdesc{Legge l'\ids{UID} effettivo del processo corrente.}
1835 \fdecl{gid\_t getgid(void)}
1836 \fdesc{Legge il \ids{GID} reale del processo corrente.}
1837 \fdecl{gid\_t getegid(void)}
1838 \fdesc{Legge il \ids{GID} effettivo del processo corrente.}
1839 }
1840 {Le funzioni ritornano i rispettivi identificativi del processo corrente, e
1841   non sono previste condizioni di errore.}
1842 \end{funcproto}
1843
1844 In generale l'uso di privilegi superiori, ottenibile con un \ids{UID}
1845 \textsl{effettivo} diverso da quello reale, deve essere limitato il più
1846 possibile, per evitare abusi e problemi di sicurezza, per questo occorre anche
1847 un meccanismo che consenta ad un programma di rilasciare gli eventuali
1848 maggiori privilegi necessari, una volta che si siano effettuate le operazioni
1849 per i quali erano richiesti, e a poterli eventualmente recuperare in caso
1850 servano di nuovo.
1851
1852 Questo in Linux viene fatto usando altri due gruppi di identificatori, il
1853 \textit{saved} ed il \textit{filesystem}. Il primo gruppo è lo stesso usato in
1854 SVr4, e previsto dallo standard POSIX quando è definita la costante
1855 \macro{\_POSIX\_SAVED\_IDS},\footnote{in caso si abbia a cuore la portabilità
1856   del programma su altri Unix è buona norma controllare sempre la
1857   disponibilità di queste funzioni controllando se questa costante è
1858   definita.} il secondo gruppo è specifico di Linux e viene usato per
1859 migliorare la sicurezza con NFS (il \textit{Network File System}, protocollo
1860 che consente di accedere ai file via rete).
1861
1862 L'\ids{UID} \textsl{salvato} ed il \ids{GID} \textsl{salvato} sono copie
1863 dell'\ids{UID} \textsl{effettivo} e del \ids{GID} \textsl{effettivo} del
1864 processo padre, e vengono impostati dalla funzione \func{exec} all'avvio del
1865 processo, come copie dell'\ids{UID} \textsl{effettivo} e del \ids{GID}
1866 \textsl{effettivo} dopo che questi sono stati impostati tenendo conto di
1867 eventuali permessi \acr{suid} o \acr{sgid} (su cui torneremo in
1868 sez.~\ref{sec:file_special_perm}).  Essi quindi consentono di tenere traccia
1869 di quale fossero utente e gruppo effettivi all'inizio dell'esecuzione di un
1870 nuovo programma.
1871
1872 L'\ids{UID} \textsl{di filesystem} e il \ids{GID} \textsl{di filesystem} sono
1873 un'estensione introdotta in Linux per rendere più sicuro l'uso di NFS
1874 (torneremo sull'argomento in sez.~\ref{sec:proc_setuid}). Essi sono una
1875 replica dei corrispondenti identificatori del gruppo \textit{effective}, ai
1876 quali si sostituiscono per tutte le operazioni di verifica dei permessi
1877 relativi ai file (trattate in sez.~\ref{sec:file_perm_overview}).  Ogni
1878 cambiamento effettuato sugli identificatori effettivi viene automaticamente
1879 riportato su di essi, per cui in condizioni normali si può tranquillamente
1880 ignorarne l'esistenza, in quanto saranno del tutto equivalenti ai precedenti.
1881
1882
1883 \subsection{Le funzioni di gestione degli identificatori dei processi}
1884 \label{sec:proc_setuid}
1885
1886 Le funzioni di sistema più comuni che vengono usate per cambiare identità
1887 (cioè utente e gruppo di appartenenza) ad un processo, e che come accennato in
1888 sez.~\ref{sec:proc_access_id} seguono la semantica POSIX che prevede
1889 l'esistenza dell'\ids{UID} salvato e del \ids{GID} salvato, sono
1890 rispettivamente \funcd{setuid} e \funcd{setgid}; i loro prototipi sono:
1891
1892 \begin{funcproto}{
1893 \fhead{unistd.h}
1894 \fhead{sys/types.h}
1895 \fdecl{int setuid(uid\_t uid)}
1896 \fdesc{Imposta l'\ids{UID} del processo corrente.}
1897 \fdecl{int setgid(gid\_t gid)}
1898 \fdesc{Imposta il \ids{GID} del processo corrente.}
1899 }
1900 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1901 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
1902 }
1903 \end{funcproto}
1904
1905 Il funzionamento di queste due funzioni è analogo, per cui considereremo solo
1906 la prima, la seconda si comporta esattamente allo stesso modo facendo
1907 riferimento al \ids{GID} invece che all'\ids{UID}.  Gli eventuali \ids{GID}
1908 supplementari non vengono modificati.
1909
1910 L'effetto della chiamata è diverso a seconda dei privilegi del processo; se
1911 l'\ids{UID} effettivo è zero (cioè è quello dell'amministratore di sistema)
1912 allora tutti gli identificatori (\textit{real}, \textit{effective} e
1913 \textit{saved}) vengono impostati al valore specificato da \param{uid},
1914 altrimenti viene impostato solo l'\ids{UID} effettivo, e soltanto se il valore
1915 specificato corrisponde o all'\ids{UID} reale o all'\ids{UID} salvato. Negli
1916 altri casi viene segnalato un errore con \errcode{EPERM}.
1917
1918 Come accennato l'uso principale di queste funzioni è quello di poter
1919 consentire ad un programma con i bit \acr{suid} o \acr{sgid} impostati (vedi
1920 sez.~\ref{sec:file_special_perm}) di riportare l'\ids{UID} effettivo a quello
1921 dell'utente che ha lanciato il programma, effettuare il lavoro che non
1922 necessita di privilegi aggiuntivi, ed eventualmente tornare indietro.
1923
1924 Come esempio per chiarire l'uso di queste funzioni prendiamo quello con cui
1925 viene gestito l'accesso al file \sysfile{/var/run/utmp}.  In questo file viene
1926 registrato chi sta usando il sistema al momento corrente; chiaramente non può
1927 essere lasciato aperto in scrittura a qualunque utente, che potrebbe
1928 falsificare la registrazione. Per questo motivo questo file (e l'analogo
1929 \sysfile{/var/log/wtmp} su cui vengono registrati login e logout) appartengono
1930 ad un gruppo dedicato (in genere \acr{utmp}) ed i programmi che devono
1931 accedervi (ad esempio tutti i programmi di terminale in X, o il programma
1932 \cmd{screen} che crea terminali multipli su una console) appartengono a questo
1933 gruppo ed hanno il bit \acr{sgid} impostato.
1934
1935 Quando uno di questi programmi (ad esempio \cmd{xterm}) viene lanciato, la
1936 situazione degli identificatori è la seguente:
1937 \begin{eqnarray*}
1938   \label{eq:1}
1939   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (del chiamante)} \\
1940   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1941   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp}}
1942 \end{eqnarray*}
1943 in questo modo, dato che il \textsl{group-ID effettivo} è quello giusto, il
1944 programma può accedere a \sysfile{/var/run/utmp} in scrittura ed aggiornarlo.
1945 A questo punto il programma può eseguire una \code{setgid(getgid())} per
1946 impostare il \textsl{group-ID effettivo} a quello dell'utente (e dato che il
1947 \textsl{group-ID reale} corrisponde la funzione avrà successo), in questo modo
1948 non sarà possibile lanciare dal terminale programmi che modificano detto file,
1949 in tal caso infatti la situazione degli identificatori sarebbe:
1950 \begin{eqnarray*}
1951   \label{eq:2}
1952   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (invariato)}  \\
1953   \textsl{group-ID effettivo}  &=& \textrm{\ids{GID}} \\
1954   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1955 \end{eqnarray*}
1956 e ogni processo lanciato dal terminale avrebbe comunque \ids{GID} come
1957 \textsl{group-ID effettivo}. All'uscita dal terminale, per poter di nuovo
1958 aggiornare lo stato di \sysfile{/var/run/utmp} il programma eseguirà una
1959 \code{setgid(utmp)} (dove \var{utmp} è il valore numerico associato al gruppo
1960 \acr{utmp}, ottenuto ad esempio con una precedente \func{getegid}), dato che
1961 in questo caso il valore richiesto corrisponde al \textsl{group-ID salvato} la
1962 funzione avrà successo e riporterà la situazione a:
1963 \begin{eqnarray*}
1964   \label{eq:3}
1965   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (invariato)}  \\
1966   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1967   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1968 \end{eqnarray*}
1969 consentendo l'accesso a \sysfile{/var/run/utmp}.
1970
1971 Occorre però tenere conto che tutto questo non è possibile con un processo con
1972 i privilegi di amministratore, in tal caso infatti l'esecuzione di una
1973 \func{setuid} comporta il cambiamento di tutti gli identificatori associati al
1974 processo, rendendo impossibile riguadagnare i privilegi di amministratore.
1975 Questo comportamento è corretto per l'uso che ne fa \cmd{login} una volta che
1976 crea una nuova shell per l'utente, ma quando si vuole cambiare soltanto
1977 l'\ids{UID} effettivo del processo per cedere i privilegi occorre
1978 ricorrere ad altre funzioni.
1979
1980 Le due funzioni di sistema \funcd{setreuid} e \funcd{setregid} derivano da BSD
1981 che, non supportando (almeno fino alla versione 4.3+BSD) gli identificatori
1982 del gruppo \textit{saved}, le usa per poter scambiare fra di loro
1983 \textit{effective} e \textit{real}; i rispettivi prototipi sono:
1984
1985 \begin{funcproto}{
1986 \fhead{unistd.h}
1987 \fhead{sys/types.h}
1988 \fdecl{int setreuid(uid\_t ruid, uid\_t euid)}
1989 \fdesc{Imposta \ids{UID} reale e \ids{UID} effettivo del processo corrente.}
1990 \fdecl{int setregid(gid\_t rgid, gid\_t egid)}
1991 \fdesc{Imposta \ids{GID} reale e \ids{GID} effettivo del processo corrente.}
1992 }
1993 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1994 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
1995 }
1996 \end{funcproto}
1997
1998 Le due funzioni sono identiche, quanto diremo per la prima riguardo gli
1999 \ids{UID} si applica alla seconda per i \ids{GID}.  La funzione
2000 \func{setreuid} imposta rispettivamente l'\ids{UID} reale e l'\ids{UID}
2001 effettivo del processo corrente ai valori specificati da \param{ruid}
2002 e \param{euid}.  I processi non privilegiati possono impostare solo valori che
2003 corrispondano o al loro \ids{UID} effettivo o a quello reale o a quello
2004 salvato, valori diversi comportano il fallimento della chiamata.
2005 L'amministratore invece può specificare un valore qualunque.  Specificando un
2006 argomento di valore $-1$ l'identificatore corrispondente verrà lasciato
2007 inalterato.
2008
2009 Con queste funzioni si possono scambiare fra loro gli \ids{UID} reale ed
2010 effettivo, e pertanto è possibile implementare un comportamento simile a
2011 quello visto in precedenza per \func{setgid}, cedendo i privilegi con un primo
2012 scambio, e recuperandoli, una volta eseguito il lavoro non privilegiato, con
2013 un secondo scambio.
2014
2015 In questo caso però occorre porre molta attenzione quando si creano nuovi
2016 processi nella fase intermedia in cui si sono scambiati gli identificatori, in
2017 questo caso infatti essi avranno un \ids{UID} reale privilegiato, che dovrà
2018 essere esplicitamente eliminato prima di porre in esecuzione un nuovo
2019 programma, occorrerà cioè eseguire un'altra chiamata dopo la \func{fork} e
2020 prima della \func{exec} per uniformare l'\ids{UID} reale a quello effettivo,
2021 perché in caso contrario il nuovo programma potrebbe a sua volta effettuare
2022 uno scambio e riottenere dei privilegi non previsti.
2023
2024 Lo stesso problema di propagazione dei privilegi ad eventuali processi figli
2025 si pone anche per l'\ids{UID} salvato. Ma la funzione \func{setreuid} deriva
2026 da un'implementazione di sistema che non ne prevede la presenza, e quindi non
2027 è possibile usarla per correggere la situazione come nel caso precedente. Per
2028 questo motivo in Linux tutte le volte che si imposta un qualunque valore
2029 diverso da quello dall'\ids{UID} reale corrente, l'\ids{UID} salvato viene
2030 automaticamente uniformato al valore dell'\ids{UID} effettivo.
2031
2032 Altre due funzioni di sistema, \funcd{seteuid} e \funcd{setegid}, sono
2033 un'estensione dello standard POSIX.1, ma sono comunque supportate dalla
2034 maggior parte degli Unix, esse vengono usate per cambiare gli identificatori
2035 del gruppo \textit{effective} ed i loro prototipi sono:
2036
2037 \begin{funcproto}{
2038 \fhead{unistd.h}
2039 \fhead{sys/types.h}
2040 \fdecl{int seteuid(uid\_t uid)}
2041 \fdesc{Imposta l'\ids{UID} effettivo del processo corrente.}
2042 \fdecl{int setegid(gid\_t gid)}
2043 \fdesc{Imposta il \ids{GID} effettivo del processo corrente.}
2044 }
2045 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2046 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
2047 }
2048 \end{funcproto}
2049
2050 Ancora una volta le due funzioni sono identiche, e quanto diremo per la prima
2051 riguardo gli \ids{UID} si applica allo stesso modo alla seconda per i
2052 \ids{GID}. Con \func{seteuid} gli utenti normali possono impostare l'\ids{UID}
2053 effettivo solo al valore dell'\ids{UID} reale o dell'\ids{UID} salvato,
2054 l'amministratore può specificare qualunque valore. Queste funzioni sono usate
2055 per permettere all'amministratore di impostare solo l'\ids{UID} effettivo,
2056 dato che l'uso normale di \func{setuid} comporta l'impostazione di tutti gli
2057 identificatori.
2058
2059 Le due funzioni di sistema \funcd{setresuid} e \funcd{setresgid} sono invece
2060 un'estensione introdotta in Linux (a partire dal kernel 2.1.44) e permettono
2061 un completo controllo su tutti e tre i gruppi di identificatori
2062 (\textit{real}, \textit{effective} e \textit{saved}), i loro prototipi sono:
2063
2064 \begin{funcproto}{
2065 \fhead{unistd.h}
2066 \fhead{sys/types.h}
2067 \fdecl{int setresuid(uid\_t ruid, uid\_t euid, uid\_t suid)}
2068 \fdesc{Imposta l'\ids{UID} reale, effettivo e salvato del processo corrente.}
2069 \fdecl{int setresgid(gid\_t rgid, gid\_t egid, gid\_t sgid)}
2070 \fdesc{Imposta il \ids{GID} reale, effettivo e salvato del processo corrente.}
2071 }
2072 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2073 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
2074 }
2075 \end{funcproto}
2076
2077 Di nuovo le due funzioni sono identiche e quanto detto per la prima riguardo
2078 gli \ids{UID} si applica alla seconda per i \ids{GID}.  La funzione
2079 \func{setresuid} imposta l'\ids{UID} reale, l'\ids{UID} effettivo e
2080 l'\ids{UID} salvato del processo corrente ai valori specificati
2081 rispettivamente dagli argomenti \param{ruid}, \param{euid} e \param{suid}.  I
2082 processi non privilegiati possono cambiare uno qualunque degli\ids{UID} solo
2083 ad un valore corrispondente o all'\ids{UID} reale, o a quello effettivo o a
2084 quello salvato, l'amministratore può specificare i valori che vuole. Un valore
2085 di $-1$ per un qualunque argomento lascia inalterato l'identificatore
2086 corrispondente.
2087
2088 Per queste funzioni di sistema esistono anche due controparti,
2089 \funcd{getresuid} e \funcd{getresgid},\footnote{le funzioni non sono standard,
2090   anche se appaiono in altri kernel, su Linux sono presenti dal kernel 2.1.44
2091   e con le versioni della \acr{glibc} a partire dalla 2.3.2, definendo la
2092   macro \macro{\_GNU\_SOURCE}.} che permettono di leggere in blocco i vari
2093 identificatori; i loro prototipi sono:
2094
2095 \begin{funcproto}{
2096 \fhead{unistd.h}
2097 \fhead{sys/types.h}
2098 \fdecl{int getresuid(uid\_t *ruid, uid\_t *euid, uid\_t *suid)}
2099 \fdesc{Legge l'\ids{UID} reale, effettivo e salvato del processo corrente.}
2100 \fdecl{int getresgid(gid\_t *rgid, gid\_t *egid, gid\_t *sgid)}
2101 \fdesc{Legge il \ids{GID} reale, effettivo e salvato del processo corrente.}
2102 }
2103 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2104   caso \var{errno} può assumere solo il valore \errcode{EFAULT} se gli
2105   indirizzi delle variabili di ritorno non sono validi.  }
2106 \end{funcproto}
2107
2108 Anche queste funzioni sono un'estensione specifica di Linux, e non richiedono
2109 nessun privilegio. I valori sono restituiti negli argomenti, che vanno
2110 specificati come puntatori (è un altro esempio di \textit{value result
2111   argument}). Si noti che queste funzioni sono le uniche in grado di leggere
2112 gli identificatori del gruppo \textit{saved}.
2113
2114 Infine le funzioni \func{setfsuid} e \func{setfsgid} servono per impostare gli
2115 identificatori del gruppo \textit{filesystem} che sono usati da Linux per il
2116 controllo dell'accesso ai file.  Come già accennato in
2117 sez.~\ref{sec:proc_access_id} Linux definisce questo ulteriore gruppo di
2118 identificatori, che in circostanze normali sono assolutamente equivalenti a
2119 quelli del gruppo \textit{effective}, dato che ogni cambiamento di questi
2120 ultimi viene immediatamente riportato su di essi.
2121
2122 C'è un solo caso in cui si ha necessità di introdurre una differenza fra gli
2123 identificatori dei gruppi \textit{effective} e \textit{filesystem}, ed è per
2124 ovviare ad un problema di sicurezza che si presenta quando si deve
2125 implementare un server NFS.
2126
2127 Il server NFS infatti deve poter cambiare l'identificatore con cui accede ai
2128 file per assumere l'identità del singolo utente remoto, ma se questo viene
2129 fatto cambiando l'\ids{UID} effettivo o l'\ids{UID} reale il server si espone
2130 alla ricezione di eventuali segnali ostili da parte dell'utente di cui ha
2131 temporaneamente assunto l'identità.  Cambiando solo l'\ids{UID} di filesystem
2132 si ottengono i privilegi necessari per accedere ai file, mantenendo quelli
2133 originari per quanto riguarda tutti gli altri controlli di accesso, così che
2134 l'utente non possa inviare segnali al server NFS.
2135
2136 Le due funzioni di sistema usate per cambiare questi identificatori sono
2137 \funcd{setfsuid} e \funcd{setfsgid}, ed ovviamente sono specifiche di Linux e
2138 non devono essere usate se si intendono scrivere programmi portabili; i loro
2139 prototipi sono:
2140
2141 \begin{funcproto}{
2142 \fhead{sys/fsuid.h}
2143 \fdecl{int setfsuid(uid\_t fsuid)}
2144 \fdesc{Imposta l'\ids{UID} di filesystem del processo corrente.}
2145 \fdecl{int setfsgid(gid\_t fsgid)}
2146 \fdesc{Legge il \ids{GID} di filesystem del processo corrente.}
2147 }
2148 {Le funzioni restituiscono il nuovo valore dell'identificativo in caso di
2149   successo e quello corrente per un errore, in questo caso non viene però
2150   impostato nessun codice di errore in \var{errno}.}
2151 \end{funcproto}
2152
2153 Le due funzioni sono analoghe ed usano il valore passato come argomento per
2154 effettuare l'impostazione dell'identificativo.  Le funzioni hanno successo
2155 solo se il processo chiamante ha i privilegi di amministratore o, per gli
2156 altri utenti, se il valore specificato coincide con uno dei di quelli del
2157 gruppo \textit{real}, \textit{effective} o \textit{saved}.
2158
2159
2160 \subsection{Le funzioni per la gestione dei gruppi associati a un processo}
2161 \label{sec:proc_setgroups}
2162
2163 Le ultime funzioni che esamineremo sono quelle che permettono di operare sui
2164 gruppi supplementari cui un utente può appartenere. Ogni processo può avere
2165 almeno \const{NGROUPS\_MAX} gruppi supplementari\footnote{il numero massimo di
2166   gruppi secondari può essere ottenuto con \func{sysconf} (vedi
2167   sez.~\ref{sec:sys_limits}), leggendo il parametro
2168   \texttt{\_SC\_NGROUPS\_MAX}.} in aggiunta al gruppo primario; questi vengono
2169 ereditati dal processo padre e possono essere cambiati con queste funzioni.
2170
2171 La funzione di sistema che permette di leggere i gruppi supplementari
2172 associati ad un processo è \funcd{getgroups}; questa funzione è definita nello
2173 standard POSIX.1, ed il suo prototipo è:
2174
2175 \begin{funcproto}{
2176 \fhead{sys/types.h}
2177 \fhead{unistd.h}
2178 \fdecl{int getgroups(int size, gid\_t list[])}
2179 \fdesc{Legge gli identificatori dei gruppi supplementari.}
2180 }
2181 {La funzione ritorna il numero di gruppi letti in caso di successo e $-1$ per
2182   un errore, nel qual caso \var{errno} assumerà uno dei valori:
2183 \begin{errlist}
2184 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2185 \item[\errcode{EINVAL}] il valore di \param{size} è diverso da zero ma
2186   minore del numero di gruppi supplementari del processo.
2187 \end{errlist}}
2188 \end{funcproto}
2189
2190 La funzione legge gli identificatori dei gruppi supplementari del processo sul
2191 vettore \param{list} che deve essere di dimensione pari a \param{size}. Non è
2192 specificato se la funzione inserisca o meno nella lista il \ids{GID} effettivo
2193 del processo. Se si specifica un valore di \param{size} uguale a $0$ allora
2194 l'argomento \param{list} non viene modificato, ma si ottiene il numero di
2195 gruppi supplementari.
2196
2197 Una seconda funzione, \funcd{getgrouplist}, può invece essere usata per
2198 ottenere tutti i gruppi a cui appartiene utente identificato per nome; il suo
2199 prototipo è:
2200
2201 \begin{funcproto}{
2202 \fhead{grp.h}
2203 \fdecl{int getgrouplist(const char *user, gid\_t group, gid\_t *groups, int
2204   *ngroups)}
2205 \fdesc{Legge i gruppi cui appartiene un utente.}
2206 }
2207 {La funzione ritorna il numero di gruppi ottenuto in caso di successo e $-1$
2208   per un errore, che avviene solo quando il numero di gruppi è maggiore di
2209   quelli specificati con \param{ngroups}.}
2210 \end{funcproto}
2211
2212 La funzione esegue una scansione del database dei gruppi (si veda
2213 sez.~\ref{sec:sys_user_group}) per leggere i gruppi supplementari dell'utente
2214 specificato per nome (e non con un \ids{UID}) nella stringa passata con
2215 l'argomento \param{user}. Ritorna poi nel vettore \param{groups} la lista dei
2216 \ids{GID} dei gruppi a cui l'utente appartiene. Si noti che \param{ngroups},
2217 che in ingresso deve indicare la dimensione di \param{group}, è passato come
2218 \textit{value result argument} perché, qualora il valore specificato sia
2219 troppo piccolo, la funzione ritorna $-1$, passando comunque indietro il numero
2220 dei gruppi trovati, in modo da poter ripetere la chiamata con un vettore di
2221 dimensioni adeguate.
2222
2223 Infine per impostare i gruppi supplementari di un processo ci sono due
2224 funzioni, che possono essere usate solo se si hanno i privilegi di
2225 amministratore.\footnote{e più precisamente se si ha la \textit{capability}
2226   \macro{CAP\_SETGID}.} La prima delle due è la funzione di sistema
2227 \funcd{setgroups},\footnote{la funzione è definita in BSD e SRv4, ma a
2228   differenza di \func{getgroups} non è stata inclusa in POSIX.1-2001, per
2229   poterla utilizzare deve essere definita la macro \macro{\_BSD\_SOURCE}.} ed
2230 il suo prototipo è:
2231
2232 \begin{funcproto}{
2233 \fhead{grp.h}
2234 \fdecl{int setgroups(size\_t size, gid\_t *list)}
2235 \fdesc{Imposta i gruppi supplementari del processo.}
2236 }
2237 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2238 caso \var{errno} assumerà uno dei valori:
2239 \begin{errlist}
2240 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2241 \item[\errcode{EINVAL}] il valore di \param{size} è maggiore del valore
2242     massimo consentito di gruppi supplementari.
2243 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2244 \end{errlist}}
2245 \end{funcproto}
2246
2247 La funzione imposta i gruppi supplementari del processo corrente ai valori
2248 specificati nel vettore passato con l'argomento \param{list}, di dimensioni
2249 date dall'argomento \param{size}. Il numero massimo di gruppi supplementari
2250 che si possono impostare è un parametro di sistema, che può essere ricavato
2251 con le modalità spiegate in sez.~\ref{sec:sys_characteristics}.
2252
2253 Se invece si vogliono impostare i gruppi supplementari del processo a quelli
2254 di un utente specifico, si può usare la funzione \funcd{initgroups} il cui
2255 prototipo è:
2256
2257 \begin{funcproto}{
2258 \fhead{sys/types.h}
2259 \fhead{grp.h}
2260 \fdecl{int initgroups(const char *user, gid\_t group)}
2261 \fdesc{Inizializza la lista dei gruppi supplementari.}
2262 }
2263 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2264 caso \var{errno} assumerà uno dei valori:
2265 \begin{errlist}
2266 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare lo spazio per
2267   informazioni dei gruppi.
2268 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2269 \end{errlist}}
2270 \end{funcproto}
2271
2272 La funzione esegue la scansione del database dei gruppi (usualmente
2273 \conffile{/etc/group}) cercando i gruppi di cui è membro l'utente \param{user}
2274 (di nuovo specificato per nome e non per \ids{UID}) con cui costruisce una
2275 lista di gruppi supplementari, a cui aggiunge anche
2276 \param{group}, infine imposta questa lista per il processo corrente usando
2277 \func{setgroups}.  Si tenga presente che sia \func{setgroups} che
2278 \func{initgroups} non sono definite nello standard POSIX.1 e che pertanto non
2279 è possibile utilizzarle quando si definisce \macro{\_POSIX\_SOURCE} o si
2280 compila con il flag \cmd{-ansi}, è pertanto meglio evitarle se si vuole
2281 scrivere codice portabile.
2282
2283
2284 \section{La gestione della priorità dei processi}
2285 \label{sec:proc_priority}
2286
2287 In questa sezione tratteremo più approfonditamente i meccanismi con il quale
2288 lo \textit{scheduler} assegna la CPU ai vari processi attivi.  In particolare
2289 prenderemo in esame i vari meccanismi con cui viene gestita l'assegnazione del
2290 tempo di CPU, ed illustreremo le varie funzioni di gestione. Tratteremo infine
2291 anche le altre priorità dei processi (come quelle per l'accesso a disco)
2292 divenute disponibili con i kernel più recenti.
2293
2294
2295 \subsection{I meccanismi di \textit{scheduling}}
2296 \label{sec:proc_sched}
2297
2298 \itindbeg{scheduler}
2299
2300 La scelta di un meccanismo che sia in grado di distribuire in maniera efficace
2301 il tempo di CPU per l'esecuzione dei processi è sempre una questione delicata,
2302 ed oggetto di numerose ricerche; in generale essa dipende in maniera
2303 essenziale anche dal tipo di utilizzo che deve essere fatto del sistema, per
2304 cui non esiste un meccanismo che sia valido per tutti gli usi.
2305
2306 La caratteristica specifica di un sistema multitasking come Linux è quella del
2307 cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
2308   multitasking}: questo significa che al contrario di altri sistemi (che usano
2309 invece il cosiddetto \itindex{cooperative~multitasking} \textit{cooperative
2310   multitasking}) non sono i singoli processi, ma il kernel stesso a decidere
2311 quando la CPU deve essere passata ad un altro processo. Come accennato in
2312 sez.~\ref{sec:proc_hierarchy} questa scelta viene eseguita da una sezione
2313 apposita del kernel, lo \textit{scheduler}, il cui scopo è quello di
2314 distribuire al meglio il tempo di CPU fra i vari processi.
2315
2316 La cosa è resa ancora più complicata dal fatto che con le architetture
2317 multi-processore si deve anche scegliere quale sia la CPU più opportuna da
2318 utilizzare.\footnote{nei processori moderni la presenza di ampie cache può
2319   rendere poco efficiente trasferire l'esecuzione di un processo da una CPU ad
2320   un'altra, per cui effettuare la migliore scelta fra le diverse CPU non è
2321   banale.}  Tutto questo comunque appartiene alle sottigliezze
2322 dell'implementazione del kernel; dal punto di vista dei programmi che girano
2323 in \textit{user space}, anche quando si hanno più processori (e dei processi
2324 che sono eseguiti davvero in contemporanea), le politiche di
2325 \textit{scheduling} riguardano semplicemente l'allocazione della risorsa
2326 \textsl{tempo di esecuzione}, la cui assegnazione sarà governata dai
2327 meccanismi di scelta delle priorità che restano gli stessi indipendentemente
2328 dal numero di processori.
2329
2330 Si tenga conto poi che i processi non devono solo eseguire del codice: ad
2331 esempio molto spesso saranno impegnati in operazioni di I/O, o potranno
2332 venire bloccati da un comando dal terminale, o sospesi per un certo periodo di
2333 tempo.  In tutti questi casi la CPU diventa disponibile ed è compito dello
2334 kernel provvedere a mettere in esecuzione un altro processo.
2335
2336 Tutte queste possibilità sono caratterizzate da un diverso \textsl{stato} del
2337 processo, in Linux un processo può trovarsi in uno degli stati riportati in
2338 tab.~\ref{tab:proc_proc_states}; ma soltanto i processi che sono nello stato
2339 \textit{runnable} concorrono per l'esecuzione. Questo vuol dire che, qualunque
2340 sia la sua priorità, un processo non potrà mai essere messo in esecuzione
2341 fintanto che esso si trova in uno qualunque degli altri stati.
2342
2343 \begin{table}[htb]
2344   \footnotesize
2345   \centering
2346   \begin{tabular}[c]{|p{2.4cm}|c|p{9cm}|}
2347     \hline
2348     \textbf{Stato} & \texttt{STAT} & \textbf{Descrizione} \\
2349     \hline
2350     \hline
2351     \textit{runnable}& \texttt{R} & Il processo è in esecuzione o è pronto ad
2352                                     essere eseguito (cioè è in attesa che gli
2353                                     venga assegnata la CPU).\\
2354     \textit{sleep}   & \texttt{S} & Il processo  è in attesa di un
2355                                     risposta dal sistema, ma può essere
2356                                     interrotto da un segnale.\\
2357     \textit{uninterrutible sleep}& \texttt{D} & Il  processo è in
2358                                     attesa di un risposta dal sistema (in
2359                                     genere per I/O), e non può essere
2360                                     interrotto in nessuna circostanza.\\
2361     \textit{stopped} & \texttt{T} & Il processo è stato fermato con un
2362                                     \signal{SIGSTOP}, o è tracciato.\\
2363     \textit{zombie}  & \texttt{Z} & Il processo è terminato ma il
2364                                     suo stato di terminazione non è ancora
2365                                     stato letto dal padre.\\
2366     \textit{killable}& \texttt{D} & Un nuovo stato introdotto con il kernel
2367                                     2.6.25, sostanzialmente identico
2368                                     all'\textit{uninterrutible sleep} con la
2369                                     sola differenza che il processo può
2370                                     terminato con \signal{SIGKILL} (usato per
2371                                     lo più per NFS).\\
2372     \hline
2373   \end{tabular}
2374   \caption{Elenco dei possibili stati di un processo in Linux, nella colonna
2375     \texttt{STAT} si è riportata la corrispondente lettera usata dal comando
2376     \cmd{ps} nell'omonimo campo.}
2377   \label{tab:proc_proc_states}
2378 \end{table}
2379
2380 Si deve quindi tenere presente che l'utilizzo della CPU è soltanto una delle
2381 risorse che sono necessarie per l'esecuzione di un programma, e a seconda
2382 dello scopo del programma non è detto neanche che sia la più importante, dato
2383 che molti programmi dipendono in maniera molto più critica dall'I/O. Per
2384 questo motivo non è affatto detto che dare ad un programma la massima priorità
2385 di esecuzione abbia risultati significativi in termini di prestazioni.
2386
2387 Il meccanismo tradizionale di \textit{scheduling} di Unix (che tratteremo in
2388 sez.~\ref{sec:proc_sched_stand}) è sempre stato basato su delle
2389 \textsl{priorità dinamiche}, in modo da assicurare che tutti i processi, anche
2390 i meno importanti, potessero ricevere un po' di tempo di CPU. In sostanza
2391 quando un processo ottiene la CPU la sua priorità viene diminuita. In questo
2392 modo alla fine, anche un processo con priorità iniziale molto bassa, finisce
2393 per avere una priorità sufficiente per essere eseguito.
2394
2395 Lo standard POSIX.1b però ha introdotto il concetto di \textsl{priorità
2396   assoluta}, (chiamata anche \textsl{priorità statica}, in contrapposizione
2397 alla normale priorità dinamica), per tenere conto dei sistemi
2398 \textit{real-time},\footnote{per sistema \textit{real-time} si intende un
2399   sistema in grado di eseguire operazioni in un tempo ben determinato; in
2400   genere si tende a distinguere fra l'\textit{hard real-time} in cui è
2401   necessario che i tempi di esecuzione di un programma siano determinabili con
2402   certezza assoluta (come nel caso di meccanismi di controllo di macchine,
2403   dove uno sforamento dei tempi avrebbe conseguenze disastrose), e
2404   \textit{soft-real-time} in cui un occasionale sforamento è ritenuto
2405   accettabile.} in cui è vitale che i processi che devono essere eseguiti in
2406 un determinato momento non debbano aspettare la conclusione di altri che non
2407 hanno questa necessità.
2408
2409 Il concetto di priorità assoluta dice che quando due processi si contendono
2410 l'esecuzione, vince sempre quello con la priorità assoluta più alta.
2411 Ovviamente questo avviene solo per i processi che sono pronti per essere
2412 eseguiti (cioè nello stato \textit{runnable}).  La priorità assoluta viene in
2413 genere indicata con un numero intero, ed un valore più alto comporta una
2414 priorità maggiore. Su questa politica di \textit{scheduling} torneremo in
2415 sez.~\ref{sec:proc_real_time}.
2416
2417 In generale quello che succede in tutti gli Unix moderni è che ai processi
2418 normali viene sempre data una priorità assoluta pari a zero, e la decisione di
2419 assegnazione della CPU è fatta solo con il meccanismo tradizionale della
2420 priorità dinamica. In Linux tuttavia è possibile assegnare anche una priorità
2421 assoluta, nel qual caso un processo avrà la precedenza su tutti gli altri di
2422 priorità inferiore, che saranno eseguiti solo quando quest'ultimo non avrà
2423 bisogno della CPU.
2424
2425
2426 \subsection{Il meccanismo di \textit{scheduling} standard}
2427 \label{sec:proc_sched_stand}
2428
2429 A meno che non si abbiano esigenze specifiche,\footnote{per alcune delle quali
2430   sono state introdotte delle varianti specifiche.} l'unico meccanismo di
2431 \textit{scheduling} con il quale si avrà a che fare è quello tradizionale, che
2432 prevede solo priorità dinamiche. È di questo che, di norma, ci si dovrà
2433 preoccupare nella programmazione.  Come accennato in Linux i processi ordinari
2434 hanno tutti una priorità assoluta nulla; quello che determina quale, fra tutti
2435 i processi in attesa di esecuzione, sarà eseguito per primo, è la cosiddetta
2436 \textsl{priorità dinamica},\footnote{quella che viene mostrata nella colonna
2437   \texttt{PR} del comando \texttt{top}.} che è chiamata così proprio perché
2438 varia nel corso dell'esecuzione di un processo.
2439
2440 Il meccanismo usato da Linux è in realtà piuttosto complesso,\footnote{e
2441   dipende strettamente dalla versione di kernel; in particolare a partire
2442   dalla serie 2.6.x lo \textit{scheduler} è stato riscritto completamente, con
2443   molte modifiche susseguitesi per migliorarne le prestazioni, per un certo
2444   periodo ed è stata anche introdotta la possibilità di usare diversi
2445   algoritmi, selezionabili sia in fase di compilazione, che, nelle versioni
2446   più recenti, all'avvio (addirittura è stato ideato un sistema modulare che
2447   permette di cambiare lo \textit{scheduler} a sistema attivo).} ma a grandi
2448 linee si può dire che ad ogni processo è assegnata una \textit{time-slice},
2449 cioè un intervallo di tempo (letteralmente una fetta) per il quale, a meno di
2450 eventi esterni, esso viene eseguito senza essere interrotto.  Inoltre la
2451 priorità dinamica viene calcolata dallo \textit{scheduler} a partire da un
2452 valore iniziale che viene \textsl{diminuito} tutte le volte che un processo è
2453 in stato \textit{runnable} ma non viene posto in esecuzione.\footnote{in
2454   realtà il calcolo della priorità dinamica e la conseguente scelta di quale
2455   processo mettere in esecuzione avviene con un algoritmo molto più
2456   complicato, che tiene conto anche della \textsl{interattività} del processo,
2457   utilizzando diversi fattori, questa è una brutale semplificazione per
2458   rendere l'idea del funzionamento, per una trattazione più dettagliata, anche
2459   se non aggiornatissima, dei meccanismi di funzionamento dello
2460   \textit{scheduler} si legga il quarto capitolo di \cite{LinKernDev}.} Lo
2461 \textit{scheduler} infatti mette sempre in esecuzione, fra tutti i processi in
2462 stato \textit{runnable}, quello che ha il valore di priorità dinamica più
2463 basso.\footnote{con le priorità dinamiche il significato del valore numerico
2464   ad esse associato è infatti invertito, un valore più basso significa una
2465   priorità maggiore.} Il fatto che questo valore venga diminuito quando un
2466 processo non viene posto in esecuzione pur essendo pronto, significa che la
2467 priorità dei processi che non ottengono l'uso del processore viene
2468 progressivamente incrementata, così che anche questi alla fine hanno la
2469 possibilità di essere eseguiti.
2470
2471 Sia la dimensione della \textit{time-slice} che il valore di partenza della
2472 priorità dinamica sono determinate dalla cosiddetta \textit{nice} (o
2473 \textit{niceness}) del processo.\footnote{questa è una delle tante proprietà
2474   che ciascun processo si porta dietro, essa viene ereditata dai processi
2475   figli e mantenuta attraverso una \func{exec}; fino alla serie 2.4 essa era
2476   mantenuta nell'omonimo campo \texttt{nice} della \texttt{task\_struct}, con
2477   la riscrittura dello \textit{scheduler} eseguita nel 2.6 viene mantenuta nel
2478   campo \texttt{static\_prio} come per le priorità statiche.} L'origine del
2479 nome di questo parametro sta nel fatto che generalmente questo viene usato per
2480 \textsl{diminuire} la priorità di un processo, come misura di cortesia nei
2481 confronti degli altri.  I processi infatti vengono creati dal sistema con un
2482 valore nullo e nessuno è privilegiato rispetto agli altri. Specificando un
2483 valore di \textit{nice} positivo si avrà una \textit{time-slice} più breve ed
2484 un valore di priorità dinamica iniziale più alto, mentre un valore negativo
2485 darà una \textit{time-slice} più lunga ed un valore di priorità dinamica
2486 iniziale più basso.
2487
2488 Esistono diverse funzioni che consentono di indicare un valore di
2489 \textit{nice} di un processo; la più semplice è \funcd{nice}, che opera sul
2490 processo corrente, il suo prototipo è:
2491
2492 \begin{funcproto}{
2493 \fhead{unistd.h}
2494 \fdecl{int nice(int inc)}
2495 \fdesc{Aumenta il valore di \textit{nice} del processo corrente.}
2496 }
2497 {La funzione ritorna il nuovo valore di \textit{nice} in caso di successo e
2498   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2499 \begin{errlist}
2500   \item[\errcode{EPERM}] non si ha il permesso di specificare un valore
2501     di \param{inc} negativo.
2502 \end{errlist}}
2503 \end{funcproto}
2504
2505 L'argomento \param{inc} indica l'incremento da effettuare rispetto al valore
2506 di \textit{nice} corrente, che può assumere valori compresi fra
2507 \const{PRIO\_MIN} e \const{PRIO\_MAX}; nel caso di Linux sono fra $-20$ e
2508 $19$,\footnote{in realtà l'intervallo varia a seconda delle versioni di
2509   kernel, ed è questo a partire dal kernel 1.3.43, anche se oggi si può avere
2510   anche l'intervallo fra $-20$ e $20$.} ma per \param{inc} si può specificare
2511 un valore qualunque, positivo o negativo, ed il sistema provvederà a troncare
2512 il risultato nell'intervallo consentito. Valori positivi comportano maggiore
2513 \textit{cortesia} e cioè una diminuzione della priorità, valori negativi
2514 comportano invece un aumento della priorità. Con i kernel precedenti il 2.6.12
2515 solo l'amministratore\footnote{o un processo con la \textit{capability}
2516   \const{CAP\_SYS\_NICE}, vedi sez.~\ref{sec:proc_capabilities}.} può
2517 specificare valori negativi di \param{inc} che permettono di aumentare la
2518 priorità di un processo, a partire da questa versione è consentito anche agli
2519 utenti normali alzare (entro certi limiti, che vedremo in
2520 sez.~\ref{sec:sys_resource_limit}) la priorità dei propri processi.
2521
2522 Gli standard SUSv2 e POSIX.1 prevedono che la funzione ritorni il nuovo valore
2523 di \textit{nice} del processo; tuttavia la \textit{system call} di Linux non
2524 segue questa convenzione e restituisce sempre $0$ in caso di successo e $-1$
2525 in caso di errore; questo perché $-1$ è anche un valore di \textit{nice}
2526 legittimo e questo comporta una confusione con una eventuale condizione di
2527 errore. La \textit{system call} originaria inoltre non consente, se non dotati
2528 di adeguati privilegi, di diminuire un valore di \textit{nice} precedentemente
2529 innalzato.
2530
2531 Fino alla \acr{glibc} 2.2.4 la funzione di libreria riportava direttamente il
2532 risultato dalla \textit{system call}, violando lo standard, per cui per
2533 ottenere il nuovo valore occorreva una successiva chiamata alla funzione
2534 \func{getpriority}. A partire dalla \acr{glibc} 2.2.4 \func{nice} è stata
2535 reimplementata e non viene più chiamata la omonima \textit{system call}, con
2536 questa versione viene restituito come valore di ritorno il valore di
2537 \textit{nice}, come richiesto dallo standard.\footnote{questo viene fatto
2538   chiamando al suo interno \func{setpriority}, che tratteremo a breve.}  In
2539 questo caso l'unico modo per rilevare in maniera affidabile una condizione di
2540 errore è quello di azzerare \var{errno} prima della chiamata della funzione e
2541 verificarne il valore quando \func{nice} restituisce $-1$.
2542
2543 Per leggere il valore di \textit{nice} di un processo occorre usare la
2544 funzione di sistema \funcd{getpriority}, derivata da BSD; il suo prototipo è:
2545
2546 \begin{funcproto}{
2547 \fhead{sys/time.h}
2548 \fhead{sys/resource.h}
2549 \fdecl{int getpriority(int which, int who)}
2550 \fdesc{Legge un valore di \textit{nice}.}
2551 }
2552 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2553 caso \var{errno} assumerà uno dei valori:
2554 \begin{errlist}
2555 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2556     elencati in tab.~\ref{tab:proc_getpriority}.
2557 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2558   \param{which} e \param{who}.
2559 \end{errlist}}
2560 \end{funcproto}
2561
2562 La funzione permette, a seconda di quanto specificato
2563 nell'argomento \param{which}, di leggere il valore di \textit{nice} di un
2564 processo, di un gruppo di processi (vedi sez.~\ref{sec:sess_proc_group}) o di
2565 un utente indicato dall'argomento \param{who}. Nelle vecchie versioni può
2566 essere necessario includere anche \headfile{sys/time.h}, questo non è più
2567 necessario con versioni recenti delle librerie, ma è comunque utile per
2568 portabilità.
2569
2570 I valori possibili per \param{which}, ed il tipo di valore che occorre usare
2571 in corrispondenza per \param{who} solo elencati nella legenda di
2572 tab.~\ref{tab:proc_getpriority} insieme ai relativi significati. Usare un
2573 valore nullo per \param{who} indica, a seconda della corrispondente
2574 indicazione usata per \param{which} il processo, il gruppo di processi o
2575 l'utente correnti.
2576
2577 \begin{table}[htb]
2578   \centering
2579   \footnotesize
2580   \begin{tabular}[c]{|c|c|l|}
2581     \hline
2582     \param{which} & \param{who} & \textbf{Significato} \\
2583     \hline
2584     \hline
2585     \const{PRIO\_PROCESS} & \type{pid\_t} & processo  \\
2586     \const{PRIO\_PRGR}    & \type{pid\_t} & \textit{process group} (vedi
2587                                             sez.~\ref{sec:sess_proc_group})\\
2588     \const{PRIO\_USER}    & \type{uid\_t} & utente \\
2589     \hline
2590   \end{tabular}
2591   \caption{Legenda del valore dell'argomento \param{which} e del tipo
2592     dell'argomento \param{who} delle funzioni \func{getpriority} e
2593     \func{setpriority} per le tre possibili scelte.}
2594   \label{tab:proc_getpriority}
2595 \end{table}
2596
2597 In caso di una indicazione che faccia riferimento a più processi, la funzione
2598 restituisce la priorità più alta (cioè il valore più basso) fra quelle dei
2599 processi corrispondenti. Come per \func{nice} $-1$ è un valore possibile
2600 corretto, per cui di nuovo per poter rilevare una condizione di errore è
2601 necessario cancellare sempre \var{errno} prima della chiamata alla funzione e
2602 quando si ottiene un valore di ritorno uguale a $-1$ per verificare che essa
2603 resti uguale a zero.
2604
2605 Analoga a \func{getpriority} è la funzione di sistema \funcd{setpriority} che
2606 permette di impostare la priorità di uno o più processi; il suo prototipo è:
2607
2608 \begin{funcproto}{
2609 \fhead{sys/time.h}
2610 \fhead{sys/resource.h}
2611 \fdecl{int setpriority(int which, int who, int prio)}
2612 \fdesc{Imposta un valore di \textit{nice}.}
2613 }
2614 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2615 caso \var{errno} assumerà uno dei valori:
2616 \begin{errlist}
2617 \item[\errcode{EACCES}] si è richiesto un aumento di priorità senza avere
2618   sufficienti privilegi.
2619 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2620   elencati in tab.~\ref{tab:proc_getpriority}.
2621 \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha
2622   cercato di modificare la priorità di un processo di un altro utente.
2623 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2624   \param{which} e \param{who}.
2625 \end{errlist}}
2626 \end{funcproto}
2627
2628 La funzione imposta la priorità dinamica al valore specificato da \param{prio}
2629 per tutti i processi indicati dagli argomenti \param{which} e \param{who}, per
2630 i quali valgono le stesse considerazioni fatte per \func{getpriority} e lo
2631 specchietto di tab.~\ref{tab:proc_getpriority}.
2632
2633 In questo caso come valore di \param{prio} deve essere specificato il valore
2634 di \textit{nice} da assegnare, e non un incremento (positivo o negativo) come
2635 nel caso di \func{nice}, nell'intervallo fra \const{PRIO\_MIN} ($-20$) e
2636 \const{PRIO\_MAX} ($19$). La funzione restituisce il valore di \textit{nice}
2637 assegnato in caso di successo e $-1$ in caso di errore, e come per \func{nice}
2638 anche in questo caso per rilevare un errore occorre sempre porre a zero
2639 \var{errno} prima della chiamata della funzione, essendo $-1$ un valore di
2640 \textit{nice} valido.
2641
2642 Si tenga presente che solo l'amministratore\footnote{o più precisamente un
2643   processo con la \textit{capability} \const{CAP\_SYS\_NICE}, vedi
2644   sez.~\ref{sec:proc_capabilities}.} ha la possibilità di modificare
2645 arbitrariamente le priorità di qualunque processo. Un utente normale infatti
2646 può modificare solo la priorità dei suoi processi ed in genere soltanto
2647 diminuirla.  Fino alla versione di kernel 2.6.12 Linux ha seguito le
2648 specifiche dello standard SUSv3, e come per tutti i sistemi derivati da SysV
2649 veniva richiesto che l'\ids{UID} reale o quello effettivo del processo
2650 chiamante corrispondessero all'\ids{UID} reale (e solo a quello) del processo
2651 di cui si intendeva cambiare la priorità. A partire dalla versione 2.6.12 è
2652 stata adottata la semantica in uso presso i sistemi derivati da BSD (SunOS,
2653 Ultrix, *BSD), in cui la corrispondenza può essere anche con l'\ids{UID}
2654 effettivo.
2655
2656 Sempre a partire dal kernel 2.6.12 è divenuto possibile anche per gli utenti
2657 ordinari poter aumentare la priorità dei propri processi specificando un
2658 valore di \param{prio} negativo. Questa operazione non è possibile però in
2659 maniera indiscriminata, ed in particolare può essere effettuata solo
2660 nell'intervallo consentito dal valore del limite \const{RLIMIT\_NICE}
2661 (torneremo su questo in sez.~\ref{sec:sys_resource_limit}).
2662
2663 Infine nonostante i valori siano sempre rimasti gli stessi, il significato del
2664 valore di \textit{nice} è cambiato parecchio nelle progressive riscritture
2665 dello \textit{scheduler} di Linux, ed in particolare a partire dal kernel
2666 2.6.23 l'uso di diversi valori di \textit{nice} ha un impatto molto più forte
2667 nella distribuzione della CPU ai processi. Infatti se viene comunque calcolata
2668 una priorità dinamica per i processi che non ricevono la CPU così che anche
2669 essi possano essere messi in esecuzione, un alto valore di \textit{nice}
2670 corrisponde comunque ad una \textit{time-slice} molto piccola che non cresce
2671 comunque, per cui un processo a bassa priorità avrà davvero scarse possibilità
2672 di essere eseguito in presenza di processi attivi a priorità più alta.
2673
2674
2675
2676 \subsection{Il meccanismo di \textit{scheduling real-time}}
2677 \label{sec:proc_real_time}
2678
2679 Come spiegato in sez.~\ref{sec:proc_sched} lo standard POSIX.1b ha introdotto
2680 le priorità assolute per permettere la gestione di processi real-time. In
2681 realtà nel caso di Linux non si tratta di un vero \textit{hard real-time}, in
2682 quanto in presenza di eventuali interrupt il kernel interrompe l'esecuzione di
2683 un processo qualsiasi sia la sua priorità,\footnote{questo a meno che non si
2684   siano installate le patch di RTLinux, RTAI o Adeos, con i quali è possibile
2685   ottenere un sistema effettivamente \textit{hard real-time}. In tal caso
2686   infatti gli interrupt vengono intercettati dall'interfaccia
2687   \textit{real-time} (o nel caso di Adeos gestiti dalle code del nano-kernel),
2688   in modo da poterli controllare direttamente qualora ci sia la necessità di
2689   avere un processo con priorità più elevata di un \textit{interrupt
2690     handler}.} mentre con l'incorrere in un \textit{page fault} si possono
2691 avere ritardi non previsti.  Se l'ultimo problema può essere aggirato
2692 attraverso l'uso delle funzioni di controllo della memoria virtuale (vedi
2693 sez.~\ref{sec:proc_mem_lock}), il primo non è superabile e può comportare
2694 ritardi non prevedibili riguardo ai tempi di esecuzione di qualunque processo.
2695
2696 Nonostante questo, ed in particolare con una serie di miglioramenti che sono
2697 stati introdotti nello sviluppo del kernel,\footnote{in particolare a partire
2698   dalla versione 2.6.18 sono stati inserite nel kernel una serie di modifiche
2699   che consentono di avvicinarsi sempre di più ad un vero e proprio sistema
2700   \textit{real-time} estendendo il concetto di \textit{preemption} alle
2701   operazioni dello stesso kernel; esistono vari livelli a cui questo può
2702   essere fatto, ottenibili attivando in fase di compilazione una fra le
2703   opzioni \texttt{CONFIG\_PREEMPT\_NONE}, \texttt{CONFIG\_PREEMPT\_VOLUNTARY}
2704   e \texttt{CONFIG\_PREEMPT\_DESKTOP}.} si può arrivare ad una ottima
2705 approssimazione di sistema \textit{real-time} usando le priorità assolute.
2706 Occorre farlo però con molta attenzione: se si dà ad un processo una priorità
2707 assoluta e questo finisce in un loop infinito, nessun altro processo potrà
2708 essere eseguito, ed esso sarà mantenuto in esecuzione permanentemente
2709 assorbendo tutta la CPU e senza nessuna possibilità di riottenere l'accesso al
2710 sistema. Per questo motivo è sempre opportuno, quando si lavora con processi
2711 che usano priorità assolute, tenere attiva una shell cui si sia assegnata la
2712 massima priorità assoluta, in modo da poter essere comunque in grado di
2713 rientrare nel sistema.
2714
2715 Quando c'è un processo con priorità assoluta lo \textit{scheduler} lo metterà
2716 in esecuzione prima di ogni processo normale. In caso di più processi sarà
2717 eseguito per primo quello con priorità assoluta più alta. Quando ci sono più
2718 processi con la stessa priorità assoluta questi vengono tenuti in una coda e
2719 tocca al kernel decidere quale deve essere eseguito.  Il meccanismo con cui
2720 vengono gestiti questi processi dipende dalla politica di \textit{scheduling}
2721 che si è scelta; lo standard ne prevede due:
2722 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
2723 \item[\textit{First In First Out} (FIFO)] Il processo viene eseguito
2724   fintanto che non cede volontariamente la CPU (con la funzione
2725   \func{sched\_yield}), si blocca, finisce o viene interrotto da un processo a
2726   priorità più alta. Se il processo viene interrotto da uno a priorità più
2727   alta esso resterà in cima alla lista e sarà il primo ad essere eseguito
2728   quando i processi a priorità più alta diverranno inattivi. Se invece lo si
2729   blocca volontariamente sarà posto in coda alla lista (ed altri processi con
2730   la stessa priorità potranno essere eseguiti).
2731 \item[\textit{Round Robin} (RR)] Il comportamento è del tutto analogo a quello
2732   precedente, con la sola differenza che ciascun processo viene eseguito al
2733   massimo per un certo periodo di tempo (la cosiddetta \textit{time-slice})
2734   dopo di che viene automaticamente posto in fondo alla coda dei processi con
2735   la stessa priorità. In questo modo si ha comunque una esecuzione a turno di
2736   tutti i processi, da cui il nome della politica. Solo i processi con la
2737   stessa priorità ed in stato \textit{runnable} entrano nel
2738   \textsl{girotondo}.
2739 \end{basedescript}
2740
2741 Lo standard POSIX.1-2001 prevede una funzione che consenta sia di modificare
2742 le politiche di \textit{scheduling}, passando da \textit{real-time} a
2743 ordinarie o viceversa, che di specificare, in caso di politiche
2744 \textit{real-time}, la eventuale priorità statica; la funzione di sistema è
2745 \funcd{sched\_setscheduler} ed il suo prototipo è:
2746
2747 \begin{funcproto}{
2748 \fhead{sched.h}
2749 \fdecl{int sched\_setscheduler(pid\_t pid, int policy, const struct
2750   sched\_param *p)}
2751 \fdesc{Imposta priorità e politica di \textit{scheduling}.}
2752 }
2753 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2754 caso \var{errno} assumerà uno dei valori:
2755 \begin{errlist}
2756     \item[\errcode{EINVAL}] il valore di \param{policy} non esiste o il
2757       relativo valore di \param{p} non è valido per la politica scelta.
2758     \item[\errcode{EPERM}] il processo non ha i privilegi per attivare la
2759       politica richiesta.
2760     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2761  \end{errlist}}
2762 \end{funcproto}
2763
2764 La funzione esegue l'impostazione per il processo specificato dall'argomento
2765 \param{pid}, un valore nullo di questo argomento esegue l'impostazione per il
2766 processo corrente.  La politica di \textit{scheduling} è specificata
2767 dall'argomento \param{policy} i cui possibili valori sono riportati in
2768 tab.~\ref{tab:proc_sched_policy}; la parte alta della tabella indica le
2769 politiche \textit{real-time}, quella bassa le politiche ordinarie. Un valore
2770 negativo per \param{policy} mantiene la politica di \textit{scheduling}
2771 corrente.
2772
2773 \begin{table}[htb]
2774   \centering
2775   \footnotesize
2776   \begin{tabular}[c]{|l|p{6cm}|}
2777     \hline
2778     \textbf{Politica}  & \textbf{Significato} \\
2779     \hline
2780     \hline
2781     \const{SCHED\_FIFO} & \textit{Scheduling real-time} con politica
2782                           \textit{FIFO}. \\
2783     \const{SCHED\_RR}   & \textit{Scheduling real-time} con politica
2784                           \textit{Round Robin}. \\
2785     \hline
2786     \const{SCHED\_OTHER}& \textit{Scheduling} ordinario.\\
2787     \const{SCHED\_BATCH}& \textit{Scheduling} ordinario con l'assunzione
2788                           ulteriore di lavoro \textit{CPU
2789                             intensive} (dal kernel 2.6.16).\\
2790     \const{SCHED\_IDLE} & \textit{Scheduling} di priorità estremamente
2791                           bassa (dal kernel 2.6.23).\\
2792     \hline
2793   \end{tabular}
2794   \caption{Valori dell'argomento \param{policy} per la funzione
2795     \func{sched\_setscheduler}.}
2796   \label{tab:proc_sched_policy}
2797 \end{table}
2798
2799 % TODO Aggiungere SCHED_DEADLINE, sulla nuova politica di scheduling aggiunta
2800 % con il kernel 3.14, vedi anche Documentation/scheduler/sched-deadline.txt e
2801 % http://lwn.net/Articles/575497/
2802
2803 Con le versioni più recenti del kernel sono state introdotte anche delle
2804 varianti sulla politica di \textit{scheduling} tradizionale per alcuni carichi
2805 di lavoro specifici, queste due nuove politiche sono specifiche di Linux e non
2806 devono essere usate se si vogliono scrivere programmi portabili.
2807
2808 La politica \const{SCHED\_BATCH} è una variante della politica ordinaria con
2809 la sola differenza che i processi ad essa soggetti non ottengono, nel calcolo
2810 delle priorità dinamiche fatto dallo \textit{scheduler}, il cosiddetto bonus
2811 di interattività che mira a favorire i processi che si svegliano dallo stato
2812 di \textit{sleep}.\footnote{cosa che accade con grande frequenza per i
2813   processi interattivi, dato che essi sono per la maggior parte del tempo in
2814   attesa di dati in ingresso da parte dell'utente.} La si usa pertanto, come
2815 indica il nome, per processi che usano molta CPU (come programmi di calcolo)
2816 che in questo modo sono leggermente sfavoriti rispetto ai processi interattivi
2817 che devono rispondere a dei dati in ingresso, pur non perdendo il loro valore
2818 di \textit{nice}.
2819
2820 La politica \const{SCHED\_IDLE} invece è una politica dedicata ai processi che
2821 si desidera siano eseguiti con la più bassa priorità possibile, ancora più
2822 bassa di un processo con il minimo valore di \textit{nice}. In sostanza la si
2823 può utilizzare per processi che devono essere eseguiti se non c'è niente altro
2824 da fare. Va comunque sottolineato che anche un processo \const{SCHED\_IDLE}
2825 avrà comunque una sua possibilità di utilizzo della CPU, sia pure in
2826 percentuale molto bassa.
2827
2828 Qualora si sia richiesta una politica \textit{real-time} il valore della
2829 priorità statica viene impostato attraverso la struttura
2830 \struct{sched\_param}, riportata in fig.~\ref{fig:sig_sched_param}, il cui
2831 solo campo attualmente definito è \var{sched\_priority}. Il campo deve
2832 contenere il valore della priorità statica da assegnare al processo; lo
2833 standard prevede che questo debba essere assegnato all'interno di un
2834 intervallo fra un massimo ed un minimo che nel caso di Linux sono
2835 rispettivamente 1 e 99.
2836
2837 \begin{figure}[!htbp]
2838   \footnotesize \centering
2839   \begin{minipage}[c]{0.5\textwidth}
2840     \includestruct{listati/sched_param.c}
2841   \end{minipage}
2842   \normalsize
2843   \caption{La struttura \structd{sched\_param}.}
2844   \label{fig:sig_sched_param}
2845 \end{figure}
2846
2847 I processi con politica di \textit{scheduling} ordinaria devono sempre
2848 specificare un valore nullo di \var{sched\_priority} altrimenti si avrà un
2849 errore \errcode{EINVAL}, questo valore infatti non ha niente a che vedere con
2850 la priorità dinamica determinata dal valore di \textit{nice}, che deve essere
2851 impostato con le funzioni viste in precedenza.
2852
2853 Lo standard POSIX.1b prevede inoltre che l'intervallo dei valori delle
2854 priorità statiche possa essere ottenuto con le funzioni di sistema
2855 \funcd{sched\_get\_priority\_max} e \funcd{sched\_get\_priority\_min}, i cui
2856 prototipi sono:
2857
2858 \begin{funcproto}{
2859 \fhead{sched.h}
2860 \fdecl{int sched\_get\_priority\_max(int policy)}
2861 \fdesc{Legge il valore massimo di una priorità statica.}
2862 \fdecl{int sched\_get\_priority\_min(int policy)}
2863 \fdesc{Legge il valore minimo di una priorità statica.}
2864 }
2865 {Le funzioni ritornano il valore della priorità in caso di successo e $-1$ per
2866   un errore, nel qual caso \var{errno} assumerà il valore:
2867 \begin{errlist}
2868 \item[\errcode{EINVAL}] il valore di \param{policy} non è valido.
2869 \end{errlist}}
2870 \end{funcproto}
2871
2872 Le funzioni ritornano rispettivamente i due valori della massima e minima
2873 priorità statica possano essere ottenuti per una delle politiche di
2874 \textit{scheduling} \textit{real-time} indicata dall'argomento \param{policy}.
2875
2876 Si tenga presente che quando si imposta una politica di \textit{scheduling}
2877 real-time per un processo o se ne cambia la priorità statica questo viene
2878 messo in cima alla lista dei processi con la stessa priorità; questo comporta
2879 che verrà eseguito subito, interrompendo eventuali altri processi con la
2880 stessa priorità in quel momento in esecuzione.
2881
2882 Il kernel mantiene i processi con la stessa priorità assoluta in una lista, ed
2883 esegue sempre il primo della lista, mentre un nuovo processo che torna in
2884 stato \textit{runnable} viene sempre inserito in coda alla lista. Se la
2885 politica scelta è \const{SCHED\_FIFO} quando il processo viene eseguito viene
2886 automaticamente rimesso in coda alla lista, e la sua esecuzione continua
2887 fintanto che non viene bloccato da una richiesta di I/O, o non rilascia
2888 volontariamente la CPU (in tal caso, tornando nello stato \textit{runnable}
2889 sarà reinserito in coda alla lista); l'esecuzione viene ripresa subito solo
2890 nel caso che esso sia stato interrotto da un processo a priorità più alta.
2891
2892 Solo un processo con i privilegi di amministratore\footnote{più precisamente
2893   con la capacità \const{CAP\_SYS\_NICE}, vedi
2894   sez.~\ref{sec:proc_capabilities}.} può impostare senza restrizioni priorità
2895 assolute diverse da zero o politiche \const{SCHED\_FIFO} e
2896 \const{SCHED\_RR}. Un utente normale può modificare solo le priorità di
2897 processi che gli appartengono; è cioè richiesto che l'\ids{UID} effettivo del
2898 processo chiamante corrisponda all'\ids{UID} reale o effettivo del processo
2899 indicato con \param{pid}.
2900
2901 Fino al kernel 2.6.12 gli utenti normali non potevano impostare politiche
2902 \textit{real-time} o modificare la eventuale priorità statica di un loro
2903 processo. A partire da questa versione è divenuto possibile anche per gli
2904 utenti normali usare politiche \textit{real-time} fintanto che la priorità
2905 assoluta che si vuole impostare è inferiore al limite \const{RLIMIT\_RTPRIO}
2906 (vedi sez.~\ref{sec:sys_resource_limit}) ad essi assegnato.
2907
2908 Unica eccezione a questa possibilità sono i processi \const{SCHED\_IDLE}, che
2909 non possono cambiare politica di \textit{scheduling} indipendentemente dal
2910 valore di \const{RLIMIT\_RTPRIO}. Inoltre, in caso di processo già sottoposto
2911 ad una politica \textit{real-time}, un utente può sempre, indipendentemente
2912 dal valore di \const{RLIMIT\_RTPRIO}, diminuirne la priorità o portarlo ad una
2913 politica ordinaria.
2914
2915 Se si intende operare solo sulla priorità statica di un processo si possono
2916 usare le due funzioni di sistema \funcd{sched\_setparam} e
2917 \funcd{sched\_getparam} che consentono rispettivamente di impostarne e
2918 leggerne il valore, i loro prototipi sono:
2919
2920 \begin{funcproto}{
2921 \fhead{sched.h}
2922 \fdecl{int sched\_setparam(pid\_t pid, const struct sched\_param *param)}
2923 \fdesc{Imposta la priorità statica di un processo.}
2924 \fdecl{int sched\_getparam(pid\_t pid, struct sched\_param *param)}
2925 \fdesc{Legge la priorità statica di un processo.}
2926 }
2927 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2928 caso \var{errno} assumerà uno dei valori:
2929 \begin{errlist}
2930 \item[\errcode{EINVAL}] il valore di \param{param} non ha senso per la
2931   politica usata dal processo.
2932 \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2933   l'operazione.
2934 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2935 \end{errlist}}
2936 \end{funcproto}
2937
2938 Le funzioni richiedono di indicare nell'argomento \param{pid} il processo su
2939 cui operare e usano l'argomento \param{param} per mantenere il valore della
2940 priorità dinamica. Questo è ancora una struttura \struct{sched\_param} ed
2941 assume gli stessi valori già visti per \func{sched\_setscheduler}.
2942
2943 L'uso di \func{sched\_setparam}, compresi i controlli di accesso che vi si
2944 applicano, è del tutto equivalente a quello di \func{sched\_setscheduler} con
2945 argomento \param{policy} uguale a $-1$. Come per \func{sched\_setscheduler}
2946 specificando $0$ come valore dell'argomento \param{pid} si opera sul processo
2947 corrente. Benché la funzione sia utilizzabile anche con processi sottoposti a
2948 politica ordinaria essa ha senso soltanto per quelli \textit{real-time}, dato
2949 che per i primi la priorità statica può essere soltanto nulla.  La
2950 disponibilità di entrambe le funzioni può essere verificata controllando la
2951 macro \macro{\_POSIX\_PRIORITY\_SCHEDULING} che è definita nell'\textit{header
2952   file} \headfile{sched.h}.
2953
2954 Se invece si vuole sapere quale è politica di \textit{scheduling} di un
2955 processo si può usare la funzione di sistema \funcd{sched\_getscheduler}, il
2956 cui prototipo è:
2957
2958 \begin{funcproto}{
2959 \fhead{sched.h}
2960 \fdecl{int sched\_getscheduler(pid\_t pid)}
2961 \fdesc{Legge la politica di \textit{scheduling}.}
2962 }
2963 {La funzione ritorna la politica di \textit{scheduling}  in caso di successo e
2964   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2965 \begin{errlist}
2966     \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2967       l'operazione.
2968     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2969 \end{errlist}}
2970 \end{funcproto}
2971
2972 La funzione restituisce il valore, secondo quanto elencato in
2973 tab.~\ref{tab:proc_sched_policy}, della politica di \textit{scheduling} per il
2974 processo specificato dall'argomento \param{pid}, se questo è nullo viene
2975 restituito il valore relativo al processo chiamante.
2976
2977 L'ultima funzione di sistema che permette di leggere le informazioni relative
2978 ai processi real-time è \funcd{sched\_rr\_get\_interval}, che permette di
2979 ottenere la lunghezza della \textit{time-slice} usata dalla politica
2980 \textit{round robin}; il suo prototipo è:
2981
2982 \begin{funcproto}{
2983 \fhead{sched.h}
2984 \fdecl{int sched\_rr\_get\_interval(pid\_t pid, struct timespec *tp)}
2985 \fdesc{Legge la durata della \textit{time-slice} per lo \textit{scheduling}
2986   \textit{round robin}.}
2987 }
2988 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2989 caso \var{errno} assumerà uno dei valori:
2990 \begin{errlist}
2991 \item[\errcode{EINVAL}] l'argomento \param{pid} non è valido.
2992 \item[\errcode{ENOSYS}] la \textit{system call} non è presente (solo per
2993   kernel arcaici).
2994 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2995 \end{errlist}
2996 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
2997 \end{funcproto}
2998
2999 La funzione restituisce nell'argomento \param{tp} come una struttura
3000 \struct{timespec}, (la cui definizione si può trovare in
3001 fig.~\ref{fig:sys_timeval_struct}) il valore dell'intervallo di tempo usato
3002 per la politica \textit{round robin} dal processo indicato da \ids{PID}. Il
3003 valore dipende dalla versione del kernel, a lungo infatti questo intervallo di
3004 tempo era prefissato e non modificabile ad un valore di 150 millisecondi,
3005 restituito indipendentemente dal \ids{PID} indicato.
3006
3007 Con kernel recenti però è possibile ottenere una variazione della
3008 \textit{time-slice}, modificando il valore di \textit{nice} del processo
3009 (anche se questo non incide assolutamente sulla priorità statica) che come
3010 accennato in precedenza modifica il valore assegnato alla \textit{time-slice}
3011 di un processo ordinario, che però viene usato anche dai processi
3012 \textit{real-time}.
3013
3014 Come accennato ogni processo può rilasciare volontariamente la CPU in modo da
3015 consentire agli altri processi di essere eseguiti; la funzione di sistema che
3016 consente di fare tutto questo è \funcd{sched\_yield}, il cui prototipo è:
3017
3018 \begin{funcproto}{
3019 \fhead{sched.h}
3020 \fdecl{int sched\_yield(void)}
3021 \fdesc{Rilascia volontariamente l'esecuzione.}
3022 }
3023 {La funzione ritorna $0$ in caso di successo e teoricamente $-1$ per un
3024   errore, ma su Linux ha sempre successo.}
3025 \end{funcproto}
3026
3027
3028 Questa funzione ha un utilizzo effettivo soltanto quando si usa lo
3029 \textit{scheduling} \textit{real-time}, e serve a far sì che il processo
3030 corrente rilasci la CPU, in modo da essere rimesso in coda alla lista dei
3031 processi con la stessa priorità per permettere ad un altro di essere eseguito;
3032 se però il processo è l'unico ad essere presente sulla coda l'esecuzione non
3033 sarà interrotta. In genere usano questa funzione i processi con politica
3034 \const{SCHED\_FIFO}, per permettere l'esecuzione degli altri processi con pari
3035 priorità quando la sezione più urgente è finita.
3036
3037 La funzione può essere utilizzata anche con processi che usano lo
3038 \textit{scheduling} ordinario, ma in questo caso il comportamento non è ben
3039 definito, e dipende dall'implementazione. Fino al kernel 2.6.23 questo
3040 comportava che i processi venissero messi in fondo alla coda di quelli attivi,
3041 con la possibilità di essere rimessi in esecuzione entro breve tempo, con
3042 l'introduzione del \textit{Completely Fair Scheduler} questo comportamento è
3043 cambiato ed un processo che chiama la funzione viene inserito nella lista dei
3044 processi inattivo, con un tempo molto maggiore.\footnote{è comunque possibile
3045   ripristinare un comportamento analogo al precedente scrivendo il valore 1
3046   nel file \sysctlfile{kernel/sched\_compat\_yield}.}
3047
3048 L'uso delle funzione nella programmazione ordinaria può essere utile e
3049 migliorare le prestazioni generali del sistema quando si è appena rilasciata
3050 una risorsa contesa con altri processi, e si vuole dare agli altri una
3051 possibilità di approfittarne mettendoli in esecuzione, ma chiamarla senza
3052 necessità, specie se questo avviene ripetutamente all'interno di un qualche
3053 ciclo, può avere invece un forte impatto negativo per la generazione di
3054 \itindex{contest~switch} \textit{contest switch} inutili.
3055
3056
3057 \subsection{Il controllo dello \textit{scheduler} per i sistemi
3058   multiprocessore}
3059 \label{sec:proc_sched_multiprocess}
3060
3061 \index{effetto~ping-pong|(}
3062
3063 Con il supporto dei sistemi multiprocessore sono state introdotte delle
3064 funzioni che permettono di controllare in maniera più dettagliata la scelta di
3065 quale processore utilizzare per eseguire un certo programma. Uno dei problemi
3066 che si pongono nei sistemi multiprocessore è infatti quello del cosiddetto
3067 \textsl{effetto ping-pong}. Può accadere cioè che lo \textit{scheduler},
3068 quando riavvia un processo precedentemente interrotto scegliendo il primo
3069 processore disponibile, lo faccia eseguire da un processore diverso rispetto a
3070 quello su cui era stato eseguito in precedenza. Se il processo passa da un
3071 processore all'altro in questo modo, cosa che avveniva abbastanza di frequente
3072 con i kernel della seria 2.4.x, si ha l'effetto ping-pong.
3073
3074 Questo tipo di comportamento può generare dei seri problemi di prestazioni;
3075 infatti tutti i processori moderni utilizzano una memoria interna (la
3076 \textit{cache}) contenente i dati più usati, che permette di evitare di
3077 eseguire un accesso (molto più lento) alla memoria principale sulla scheda
3078 madre.  Chiaramente un processo sarà favorito se i suoi dati sono nella cache
3079 del processore, ma è ovvio che questo può essere vero solo per un processore
3080 alla volta, perché in presenza di più copie degli stessi dati su più
3081 processori, non si potrebbe determinare quale di questi ha la versione dei
3082 dati aggiornata rispetto alla memoria principale.
3083
3084 Questo comporta che quando un processore inserisce un dato nella sua cache,
3085 tutti gli altri processori che hanno lo stesso dato devono invalidarlo, e
3086 questa operazione è molto costosa in termini di prestazioni. Il problema
3087 diventa serio quando si verifica l'effetto ping-pong, in tal caso infatti un
3088 processo \textsl{rimbalza} continuamente da un processore all'altro e si ha
3089 una continua invalidazione della cache, che non diventa mai disponibile.
3090
3091 \itindbeg{CPU~affinity}
3092
3093 Per ovviare a questo tipo di problemi è nato il concetto di \textsl{affinità
3094   di processore} (o \textit{CPU affinity}); la possibilità cioè di far sì che
3095 un processo possa essere assegnato per l'esecuzione sempre allo stesso
3096 processore. Lo \textit{scheduler} dei kernel della serie 2.4.x aveva una
3097 scarsa \textit{CPU affinity}, e l'effetto ping-pong era comune; con il nuovo
3098 \textit{scheduler} dei kernel della 2.6.x questo problema è stato risolto ed
3099 esso cerca di mantenere il più possibile ciascun processo sullo stesso
3100 processore.
3101
3102 \index{effetto~ping-pong|)}
3103
3104 In certi casi però resta l'esigenza di poter essere sicuri che un processo sia
3105 sempre eseguito dallo stesso processore,\footnote{quella che viene detta
3106   \textit{hard CPU affinity}, in contrasto con quella fornita dallo
3107   \textit{scheduler}, detta \textit{soft CPU affinity}, che di norma indica
3108   solo una preferenza, non un requisito assoluto.} e per poter risolvere
3109 questo tipo di problematiche nei nuovi kernel\footnote{le due \textit{system
3110     call} per la gestione della \textit{CPU affinity} sono state introdotte
3111   nel kernel 2.5.8, e le corrispondenti funzioni di sistema nella
3112   \textsl{glibc} 2.3.} è stata introdotta l'opportuna infrastruttura ed una
3113 nuova \textit{system call} che permette di impostare su quali processori far
3114 eseguire un determinato processo attraverso una \textsl{maschera di
3115   affinità}. La corrispondente funzione di sistema è
3116 \funcd{sched\_setaffinity} ed il suo prototipo è:
3117
3118 \index{insieme~di~processori|(}
3119
3120 \begin{funcproto}{
3121 \fhead{sched.h}
3122 \fdecl{int sched\_setaffinity(pid\_t pid, size\_t setsize,
3123   cpu\_set\_t *mask)}
3124 \fdesc{Imposta la maschera di affinità di un processo.}
3125 }
3126 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3127 caso \var{errno} assumerà uno dei valori:
3128 \begin{errlist}
3129 \item[\errcode{EINVAL}] il valore di \param{mask} contiene riferimenti a
3130   processori non esistenti nel sistema o a cui non è consentito l'accesso.
3131 \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
3132   eseguire l'operazione.
3133 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3134 \end{errlist}
3135 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3136 \end{funcproto}
3137
3138 Questa funzione e la corrispondente \func{sched\_getaffinity} hanno una storia
3139 abbastanza complessa, la sottostante \textit{system call} infatti prevede
3140 l'uso di due soli argomenti (per il pid e l'indicazione della maschera dei
3141 processori), che corrispondono al fatto che l'implementazione effettiva usa
3142 una semplice maschera binaria. Quando le funzioni vennero incluse nella
3143 \acr{glibc} assunsero invece un prototipo simile a quello mostrato però con il
3144 secondo argomento di tipo \ctyp{unsigned int}. A complicare la cosa si
3145 aggiunge il fatto che nella versione 2.3.3 della \acr{glibc} detto argomento
3146 venne stato eliminato, per poi essere ripristinato nella versione 2.3.4 nella
3147 forma attuale.\footnote{pertanto se la vostra pagina di manuale non è
3148   aggiornata, o usate quella particolare versione della \acr{glibc}, potrete
3149   trovare indicazioni diverse, il prototipo illustrato è quello riportato
3150   nella versione corrente (maggio 2008) delle pagine di manuale e
3151   corrispondente alla definizione presente in \headfile{sched.h}.}
3152
3153 La funzione imposta, con l'uso del valore contenuto all'indirizzo
3154 \param{mask}, l'insieme dei processori sui quali deve essere eseguito il
3155 processo identificato tramite il valore passato in \param{pid}. Come in
3156 precedenza il valore nullo di \param{pid} indica il processo corrente.  Per
3157 poter utilizzare questa funzione sono richiesti i privilegi di amministratore
3158 (è necessaria la capacità \const{CAP\_SYS\_NICE}) altrimenti essa fallirà con
3159 un errore di \errcode{EPERM}. Una volta impostata una maschera di affinità,
3160 questa viene ereditata attraverso una \func{fork}, in questo modo diventa
3161 possibile legare automaticamente un gruppo di processi ad un singolo
3162 processore.
3163
3164 Nell'uso comune, almeno con i kernel successivi alla serie 2.6.x, l'uso di
3165 questa funzione non è necessario, in quanto è lo \textit{scheduler} stesso che
3166 provvede a mantenere al meglio l'affinità di processore. Esistono però
3167 esigenze particolari, ad esempio quando un processo (o un gruppo di processi)
3168 è utilizzato per un compito importante (ad esempio per applicazioni
3169 \textit{real-time} o la cui risposta è critica) e si vuole la massima
3170 velocità, e con questa interfaccia diventa possibile selezionare gruppi di
3171 processori utilizzabili in maniera esclusiva.  Lo stesso dicasi quando
3172 l'accesso a certe risorse (memoria o periferiche) può avere un costo diverso a
3173 seconda del processore, come avviene nelle architetture NUMA
3174 (\textit{Non-Uniform Memory Access}).
3175
3176 Infine se un gruppo di processi accede alle stesse risorse condivise (ad
3177 esempio una applicazione con più \textit{thread}) può avere senso usare lo
3178 stesso processore in modo da sfruttare meglio l'uso della sua cache; questo
3179 ovviamente riduce i benefici di un sistema multiprocessore nell'esecuzione
3180 contemporanea dei \textit{thread}, ma in certi casi (quando i \textit{thread}
3181 sono inerentemente serializzati nell'accesso ad una risorsa) possono esserci
3182 sufficienti vantaggi nell'evitare la perdita della cache da rendere
3183 conveniente l'uso dell'affinità di processore.
3184
3185 Dato che il numero di processori può variare a seconda delle architetture, per
3186 semplificare l'uso dell'argomento \param{mask} la \acr{glibc} ha introdotto un
3187 apposito dato di tipo, \type{cpu\_set\_t},\footnote{questa è una estensione
3188   specifica della \acr{glibc}, da attivare definendo la macro
3189   \macro{\_GNU\_SOURCE}, non esiste infatti una standardizzazione per questo
3190   tipo di interfaccia e POSIX al momento non prevede nulla al riguardo.} che
3191 permette di identificare un insieme di processori. Il dato è normalmente una
3192 maschera binaria: nei casi più comuni potrebbe bastare un intero a 32 bit, in
3193 cui ogni bit corrisponde ad un processore, ma oggi esistono architetture in
3194 cui questo numero può non essere sufficiente, e per questo è stato creato
3195 questo tipo opaco e una interfaccia di gestione che permette di usare a basso
3196 livello un tipo di dato qualunque rendendosi indipendenti dal numero di bit e
3197 dalla loro disposizione.  Per questo le funzioni richiedono anche che oltre
3198 all'insieme di processori si indichi anche la dimensione dello stesso con
3199 l'argomento \param{setsize}, per il quale, se non si usa l'allocazione
3200 dinamica che vedremo a breve, ed è in genere sufficiente passare il valore
3201 \code{sizeof(cpu\_set\_t)}.
3202
3203 L'interfaccia di gestione degli insiemi di processori, oltre alla definizione
3204 del tipo \type{cpu\_set\_t}, prevede una serie di macro di preprocessore per
3205 la manipolazione degli stessi. Quelle di base, che consentono rispettivamente
3206 di svuotare un insieme, di aggiungere o togliere un processore o di verificare
3207 se esso è già presente in un insieme, sono le seguenti:
3208
3209 {\centering
3210 \vspace{3pt}
3211 \begin{funcbox}{
3212 \fhead{sched.h}
3213 \fdecl{void \macro{CPU\_ZERO}(cpu\_set\_t *set)}
3214 \fdesc{Inizializza un insieme di processori vuoto \param{set}.}
3215 \fdecl{void \macro{CPU\_SET}(int cpu, cpu\_set\_t *set)}
3216 \fdesc{Inserisce il processore \param{cpu} nell'insieme di processori \param{set}.}
3217 \fdecl{void \macro{CPU\_CLR}(int cpu, cpu\_set\_t *set)}
3218 \fdesc{Rimuove il processore \param{cpu} nell'insieme di processori \param{set}.}
3219 \fdecl{int \macro{CPU\_ISSET}(int cpu, cpu\_set\_t *set)}
3220 \fdesc{Controlla se il processore \param{cpu} è nell'insieme di processori \param{set}.}
3221 }
3222 \end{funcbox}}
3223
3224 Queste macro che sono ispirate dalle analoghe usate per gli insiemi di
3225 \textit{file descriptor} (vedi sez.~\ref{sec:file_select}) e sono state
3226 introdotte con la versione 2.3.3 della \acr{glibc}. Tutte richiedono che si
3227 specifichi il numero di una CPU nell'argomento \param{cpu}, ed un insieme su
3228 cui operare. L'unica che ritorna un risultato è \macro{CPU\_ISSET}, che
3229 restituisce un intero da usare come valore logico (zero se la CPU non è
3230 presente, diverso da zero se è presente).
3231
3232 \itindbeg{side~effects}
3233 Si tenga presente che trattandosi di macro l'argomento \param{cpu} può essere
3234 valutato più volte. Questo significa ad esempio che non si può usare al suo
3235 posto una funzione o un'altra macro, altrimenti queste verrebbero eseguite più
3236 volte, l'argomento cioè non deve avere \textsl{effetti collaterali} (in gergo
3237  \textit{side effects}).\footnote{nel linguaggio C si
3238   parla appunto di \textit{side effects} quando si usano istruzioni la cui
3239   valutazione comporta effetti al di fuori dell'istruzione stessa, come il
3240   caso indicato in cui si passa una funzione ad una macro che usa l'argomento
3241   al suo interno più volte, o si scrivono espressioni come \code{a=a++} in cui
3242   non è chiaro se prima avvenga l'incremento e poi l'assegnazione, ed il cui
3243   risultato dipende dall'implementazione del compilatore.}
3244 \itindend{side~effects}
3245
3246
3247 Le CPU sono numerate da zero (che indica la prima disponibile) fino ad
3248 un numero massimo che dipende dalla architettura hardware. La costante
3249 \const{CPU\_SETSIZE} indica il numero massimo di processori che possono far
3250 parte di un insieme (al momento vale sempre 1024), e costituisce un limite
3251 massimo al valore dell'argomento \param{cpu}.
3252 Dalla versione 2.6 della \acr{glibc} alle precedenti macro è stata aggiunta,
3253 per contare il numero di processori in un insieme, l'ulteriore:
3254
3255 {\centering
3256 \vspace{3pt}
3257 \begin{funcbox}{
3258 \fhead{sched.h}
3259 \fdecl{int \macro{CPU\_COUNT}(cpu\_set\_t *set)}
3260 \fdesc{Conta il numero di processori presenti nell'insieme \param{set}.}
3261 }
3262 \end{funcbox}}
3263
3264 A partire dalla versione 2.7 della \acr{glibc} sono state introdotte altre
3265 macro che consentono ulteriori manipolazioni, in particolare si possono
3266 compiere delle operazioni logiche sugli insiemi di processori con:
3267
3268 {\centering
3269 \vspace{3pt}
3270 \begin{funcbox}{
3271 \fhead{sched.h}
3272 \fdecl{void \macro{CPU\_AND}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3273 \fdesc{Esegue l'AND logico di due insiemi di processori.}
3274 \fdecl{void \macro{CPU\_OR}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3275 \fdesc{Esegue l'OR logico di due insiemi di processori.}
3276 \fdecl{void \macro{CPU\_XOR}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3277 \fdesc{Esegue lo XOR logico di due insiemi di processori.}
3278 \fdecl{int \macro{CPU\_EQUAL}(cpu\_set\_t *set1, cpu\_set\_t *set2)}
3279 \fdesc{Verifica se due insiemi di processori sono uguali.}
3280 }
3281 \end{funcbox}}
3282
3283 Le prime tre macro richiedono due insiemi di partenza, \param{srcset1}
3284 e \param{srcset2} e forniscono in un terzo insieme \param{destset} (che può
3285 essere anche lo stesso di uno dei precedenti) il risultato della rispettiva
3286 operazione logica sui contenuti degli stessi. In sostanza con \macro{CPU\_AND}
3287 si otterrà come risultato l'insieme che contiene le CPU presenti in entrambi
3288 gli insiemi di partenza, con \macro{CPU\_OR} l'insieme che contiene le CPU
3289 presenti in uno qualunque dei due insiemi di partenza, e con \macro{CPU\_XOR}
3290 l'insieme che contiene le CPU presenti presenti in uno solo dei due insiemi di
3291 partenza. Infine \macro{CPU\_EQUAL} confronta due insiemi ed è l'unica che
3292 restituisce un intero, da usare come valore logico che indica se sono
3293 identici o meno.
3294
3295 Inoltre, sempre a partire dalla versione 2.7 della \acr{glibc}, è stata
3296 introdotta la possibilità di una allocazione dinamica degli insiemi di
3297 processori, per poterli avere di dimensioni corrispondenti al numero di CPU
3298 effettivamente in gioco, senza dover fare riferimento necessariamente alla
3299 precedente dimensione preimpostata di 1024. Per questo motivo sono state
3300 definite tre ulteriori macro, che consentono rispettivamente di allocare,
3301 disallocare ed ottenere la dimensione in byte di un insieme di processori:
3302
3303 {\centering
3304 \vspace{3pt}
3305 \begin{funcbox}{
3306 \fhead{sched.h}
3307 \fdecl{cpu\_set\_t * \macro{CPU\_ALLOC}(num\_cpus)}
3308 \fdesc{Alloca dinamicamente un insieme di processori di dimensione voluta.}
3309 \fdecl{void \macro{CPU\_FREE}(cpu\_set\_t *set)}
3310 \fdesc{Disalloca un insieme di processori allocato dinamicamente.}
3311 \fdecl{size\_t \macro{CPU\_ALLOC\_SIZE}(num\_cpus)}
3312 \fdesc{Ritorna la dimensione di un insieme di processori allocato dinamicamente.}
3313 }
3314 \end{funcbox}}
3315
3316 La prima macro, \macro{CPU\_ALLOC}, restituisce il puntatore ad un insieme di
3317 processori in grado di contenere almeno \param{num\_cpus} che viene allocato
3318 dinamicamente. Ogni insieme così allocato dovrà essere disallocato con
3319 \macro{CPU\_FREE} passandogli un puntatore ottenuto da una precedente
3320 \macro{CPU\_ALLOC}. La terza macro, \macro{CPU\_ALLOC\_SIZE}, consente di
3321 ottenere la dimensione in byte di un insieme allocato dinamicamente che
3322 contenga \param{num\_cpus} processori.
3323
3324 Dato che le dimensioni effettive possono essere diverse le macro di gestione e
3325 manipolazione che abbiamo trattato in precedenza non si applicano agli insiemi
3326 allocati dinamicamente, per i quali dovranno sono state definite altrettante
3327 macro equivalenti contraddistinte dal suffisso \texttt{\_S}, che effettuano le
3328 stesse operazioni, ma richiedono in più un argomento
3329 aggiuntivo \param{setsize} che deve essere assegnato al valore ottenuto con
3330 \macro{CPU\_ALLOC\_SIZE}. Questo stesso valore deve essere usato per l'omonimo
3331 argomento delle funzioni \func{sched\_setaffinity} o \func{sched\_getaffinity}
3332 quando si vuole usare per l'argomento che indica la maschera di affinità un
3333 insieme di processori allocato dinamicamente.
3334
3335 \index{insieme~di~processori|)}
3336
3337 A meno di non aver utilizzato \func{sched\_setaffinity}, in condizioni
3338 ordinarie la maschera di affinità di un processo è preimpostata dal sistema in
3339 modo che esso possa essere eseguito su qualunque processore. Se ne può
3340 comunque ottenere il valore corrente usando la funzione di sistema
3341 \funcd{sched\_getaffinity}, il cui prototipo è:
3342
3343 \begin{funcproto}{
3344 \fhead{sched.h}
3345 \fdecl{int sched\_getaffinity (pid\_t pid, size\_t setsize,
3346   cpu\_set\_t *mask)}
3347 \fdesc{Legge la maschera di affinità di un processo.}
3348 }
3349 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3350 caso \var{errno} assumerà uno dei valori:
3351 \begin{errlist}
3352 \item[\errcode{EINVAL}] \param{setsize} è più piccolo delle dimensioni
3353   della maschera di affinità usata dal kernel.
3354 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3355 \end{errlist}
3356 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3357 \end{funcproto}
3358
3359 La funzione restituirà all'indirizzo specificato da \param{mask} il valore
3360 della maschera di affinità del processo indicato dall'argomento \param{pid}
3361 (al solito un valore nullo indica il processo corrente) così da poterla
3362 riutilizzare per una successiva reimpostazione.
3363
3364 È chiaro che queste funzioni per la gestione dell'affinità hanno significato
3365 soltanto su un sistema multiprocessore, esse possono comunque essere
3366 utilizzate anche in un sistema con un processore singolo, nel qual caso però
3367 non avranno alcun risultato effettivo.
3368
3369 \itindend{scheduler}
3370 \itindend{CPU~affinity}
3371
3372
3373 \subsection{Le priorità per le operazioni di I/O}
3374 \label{sec:io_priority}
3375
3376 A lungo l'unica priorità usata per i processi è stata quella relativa
3377 all'assegnazione dell'uso del processore. Ma il processore non è l'unica
3378 risorsa che i processi devono contendersi, un'altra, altrettanto importante
3379 per le prestazioni, è quella dell'accesso a disco. Per questo motivo nello
3380 sviluppo del kernel sono stati introdotti diversi \textit{I/O scheduler} in
3381 grado di distribuire in maniera opportuna questa risorsa ai vari processi.
3382
3383 Fino al kernel 2.6.17 era possibile soltanto differenziare le politiche
3384 generali di gestione, scegliendo di usare un diverso \textit{I/O scheduler}. A
3385 partire da questa versione, con l'introduzione dello \textit{scheduler} CFQ
3386 (\textit{Completely Fair Queuing}) è divenuto possibile, qualora si usi questo
3387 \textit{scheduler}, impostare anche delle diverse priorità di accesso per i
3388 singoli processi.\footnote{al momento (kernel 2.6.31), le priorità di I/O sono
3389   disponibili soltanto per questo \textit{scheduler}.}
3390
3391 La scelta di uno \textit{scheduler} di I/O si può fare in maniera generica per
3392 tutto il sistema all'avvio del kernel con il parametro di avvio
3393 \texttt{elevator},\footnote{per la trattazione dei parametri di avvio del
3394   kernel si rimanda al solito alla sez.~5.3 di \cite{AGL}.} cui assegnare il
3395 nome dello \textit{scheduler}, ma se ne può anche indicare uno specifico per
3396 l'accesso al singolo disco scrivendo nel file
3397 \texttt{/sys/block/\textit{<dev>}/queue/scheduler} (dove
3398 \texttt{\textit{<dev>}} è il nome del dispositivo associato al disco).
3399
3400 Gli \textit{scheduler} disponibili sono mostrati dal contenuto dello stesso
3401 file che riporta fra parentesi quadre quello attivo, il default in tutti i
3402 kernel recenti è proprio il \texttt{cfq},\footnote{nome con cui si indica
3403   appunto lo \textit{scheduler} CFQ.} che supporta le priorità. Per i dettagli
3404 sulle caratteristiche specifiche degli altri \textit{scheduler}, la cui
3405 discussione attiene a problematiche di ambito sistemistico, si consulti la
3406 documentazione nella directory \texttt{Documentation/block/} dei sorgenti del
3407 kernel.
3408
3409 Una volta che si sia impostato lo \textit{scheduler} CFQ ci sono due
3410 specifiche \textit{system call}, specifiche di Linux, che consentono di
3411 leggere ed impostare le priorità di I/O.\footnote{se usate in corrispondenza
3412   ad uno \textit{scheduler} diverso il loro utilizzo non avrà alcun effetto.}
3413 Dato che non esiste una interfaccia diretta nella \acr{glibc} per queste due
3414 funzioni\footnote{almeno al momento della scrittura di questa sezione, con la
3415   versione 2.11 della \acr{glibc}.} occorrerà invocarle tramite la funzione
3416 \func{syscall} (come illustrato in sez.~\ref{sec:proc_syscall}). Le due
3417 \textit{system call} sono \funcd{ioprio\_get} ed \funcd{ioprio\_set}; i
3418 rispettivi prototipi sono:
3419
3420 \begin{funcproto}{
3421 \fhead{linux/ioprio.h}
3422 \fdecl{int ioprio\_get(int which, int who)}
3423 \fdesc{Legge la priorità di I/O di un processo.}
3424 \fdecl{int ioprio\_set(int which, int who, int ioprio)}
3425 \fdesc{Imposta la priorità di I/O di un processo.}
3426 }
3427 {Le funzioni ritornano rispettivamente un intero positivo o 0 in caso di
3428   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
3429   valori:
3430 \begin{errlist}
3431 \item[\errcode{EINVAL}] i valori di \param{which} o di \param{ioprio} non
3432   sono validi.
3433 \item[\errcode{EPERM}] non si hanno i privilegi per eseguire
3434   l'impostazione (solo per \func{ioprio\_set}).
3435 \item[\errcode{ESRCH}] non esiste un processo corrispondente alle indicazioni.
3436 \end{errlist}}
3437 \end{funcproto}
3438
3439 Le funzioni leggono o impostano la priorità di I/O sulla base dell'indicazione
3440 dei due argomenti \param{which} e \param{who} che hanno lo stesso significato
3441 già visto per gli omonimi argomenti di \func{getpriority} e
3442 \func{setpriority}. Anche in questo caso si deve specificare il valore
3443 di \param{which} tramite le opportune costanti riportate in
3444 tab.~\ref{tab:ioprio_args} che consentono di indicare un singolo processo, i
3445 processi di un \textit{process group} (tratteremo questo argomento in
3446 sez.~\ref{sec:sess_proc_group}) o tutti i processi di un utente.
3447
3448 \begin{table}[htb]
3449   \centering
3450   \footnotesize
3451   \begin{tabular}[c]{|c|c|l|}
3452     \hline
3453     \param{which} & \param{who} & \textbf{Significato} \\
3454     \hline
3455     \hline
3456     \const{IPRIO\_WHO\_PROCESS} & \type{pid\_t} & processo\\
3457     \const{IPRIO\_WHO\_PRGR}    & \type{pid\_t} & \textit{process group}\\
3458     \const{IPRIO\_WHO\_USER}    & \type{uid\_t} & utente\\
3459     \hline
3460   \end{tabular}
3461   \caption{Legenda del valore dell'argomento \param{which} e del tipo
3462     dell'argomento \param{who} delle funzioni \func{ioprio\_get} e
3463     \func{ioprio\_set} per le tre possibili scelte.}
3464   \label{tab:ioprio_args}
3465 \end{table}
3466
3467 In caso di successo \func{ioprio\_get} restituisce un intero positivo che
3468 esprime il valore della priorità di I/O, questo valore è una maschera binaria
3469 composta da due parti, una che esprime la \textsl{classe} di
3470 \textit{scheduling} di I/O del processo, l'altra che esprime, quando la classe
3471 di \textit{scheduling} lo prevede, la priorità del processo all'interno della
3472 classe stessa. Questo stesso formato viene utilizzato per indicare il valore
3473 della priorità da impostare con l'argomento \param{ioprio} di
3474 \func{ioprio\_set}.
3475 \begin{table}[htb]
3476   \centering
3477   \footnotesize
3478   \begin{tabular}[c]{|l|p{8cm}|}
3479     \hline
3480     \textbf{Macro} & \textbf{Significato}\\
3481     \hline
3482     \hline
3483     \macro{IOPRIO\_PRIO\_CLASS}\texttt{(\textit{value})}
3484                                 & Dato il valore di una priorità come
3485                                   restituito da \func{ioprio\_get} estrae il
3486                                   valore della classe.\\
3487     \macro{IOPRIO\_PRIO\_DATA}\texttt{(\textit{value})}
3488                                 & Dato il valore di una priorità come
3489                                   restituito da \func{ioprio\_get} estrae il
3490                                   valore della priorità.\\
3491     \macro{IOPRIO\_PRIO\_VALUE}\texttt{(\textit{class},\textit{prio})}
3492                                 & Dato un valore di priorità ed una classe
3493                                   ottiene il valore numerico da passare a
3494                                   \func{ioprio\_set}.\\
3495     \hline
3496   \end{tabular}
3497   \caption{Le macro per la gestione dei valori numerici .}
3498   \label{tab:IOsched_class_macro}
3499 \end{table}
3500
3501
3502 Per la gestione dei valori che esprimono le priorità di I/O sono state
3503 definite delle opportune macro di preprocessore, riportate in
3504 tab.~\ref{tab:IOsched_class_macro}. I valori delle priorità si ottengono o si
3505 impostano usando queste macro.  Le prime due si usano con il valore restituito
3506 da \func{ioprio\_get} e per ottenere rispettivamente la classe di
3507 \textit{scheduling}\footnote{restituita dalla macro con i valori di
3508   tab.~\ref{tab:IOsched_class}.} e l'eventuale valore della priorità. La terza
3509 macro viene invece usata per creare un valore di priorità da usare come
3510 argomento di \func{ioprio\_set} per eseguire una impostazione.
3511
3512 \begin{table}[htb]
3513   \centering
3514   \footnotesize
3515   \begin{tabular}[c]{|l|l|}
3516     \hline
3517     \textbf{Classe}  & \textbf{Significato} \\
3518     \hline
3519     \hline
3520     \const{IOPRIO\_CLASS\_RT}  & \textit{Scheduling} di I/O \textit{real-time}.\\
3521     \const{IOPRIO\_CLASS\_BE}  & \textit{Scheduling} di I/O ordinario.\\
3522     \const{IOPRIO\_CLASS\_IDLE}& \textit{Scheduling} di I/O di priorità minima.\\
3523     \hline
3524   \end{tabular}
3525   \caption{Costanti che identificano le classi di \textit{scheduling} di I/O.}
3526   \label{tab:IOsched_class}
3527 \end{table}
3528
3529 Le classi di \textit{scheduling} previste dallo \textit{scheduler} CFQ sono
3530 tre, e ricalcano tre diverse modalità di distribuzione delle risorse analoghe
3531 a quelle già adottate anche nel funzionamento dello \textit{scheduler} del
3532 processore. Ciascuna di esse è identificata tramite una opportuna costante,
3533 secondo quanto riportato in tab.~\ref{tab:IOsched_class}.
3534
3535 La classe di priorità più bassa è \const{IOPRIO\_CLASS\_IDLE}; i processi in
3536 questa classe riescono ad accedere a disco soltanto quando nessun altro
3537 processo richiede l'accesso. Occorre pertanto usarla con molta attenzione,
3538 perché un processo in questa classe può venire completamente bloccato quando
3539 ci sono altri processi in una qualunque delle altre due classi che stanno
3540 accedendo al disco. Quando si usa questa classe non ha senso indicare un
3541 valore di priorità, dato che in questo caso non esiste nessuna gerarchia e la
3542 priorità è identica, la minima possibile, per tutti i processi.
3543
3544 La seconda classe di priorità di I/O è \const{IOPRIO\_CLASS\_BE} (il nome sta
3545 per \textit{best-effort}) che è quella usata ordinariamente da tutti
3546 processi. In questo caso esistono priorità diverse che consentono di
3547 assegnazione di una maggiore banda passante nell'accesso a disco ad un
3548 processo rispetto agli altri, con meccanismo simile a quello dei valori di
3549 \textit{nice} in cui si evita che un processo a priorità più alta possa
3550 bloccare indefinitamente quelli a priorità più bassa. In questo caso però le
3551 diverse priorità sono soltanto otto, indicate da un valore numerico fra 0 e 7
3552 e come per \textit{nice} anche in questo caso un valore più basso indica una
3553 priorità maggiore.
3554
3555
3556 Infine la classe di priorità di I/O \textit{real-time}
3557 \const{IOPRIO\_CLASS\_RT} ricalca le omonime priorità di processore: un
3558 processo in questa classe ha sempre la precedenza nell'accesso a disco
3559 rispetto a tutti i processi delle altre classi e di un processo nella stessa
3560 classe ma con priorità inferiore, ed è pertanto in grado di bloccare
3561 completamente tutti gli altri. Anche in questo caso ci sono 8 priorità diverse
3562 con un valore numerico fra 0 e 7, con una priorità più elevata per valori più
3563 bassi.
3564
3565 In generale nel funzionamento ordinario la priorità di I/O di un processo
3566 viene impostata in maniera automatica nella classe \const{IOPRIO\_CLASS\_BE}
3567 con un valore ottenuto a partire dal corrispondente valore di \textit{nice}
3568 tramite la formula: $\mathtt{\mathit{prio}}=(\mathtt{\mathit{nice}}+20)/5$. Un
3569 utente ordinario può modificare con \func{ioprio\_set} soltanto le priorità
3570 dei processi che gli appartengono,\footnote{per la modifica delle priorità di
3571   altri processi occorrono privilegi amministrativi, ed in particolare la
3572   capacità \const{CAP\_SYS\_NICE} (vedi sez.~\ref{sec:proc_capabilities}).}
3573 cioè quelli il cui \ids{UID} reale corrisponde all'\ids{UID} reale o effettivo
3574 del chiamante. Data la possibilità di ottenere un blocco totale del sistema,
3575 solo l'amministratore\footnote{o un processo con la capacità
3576   \const{CAP\_SYS\_ADMIN} (vedi sez.~\ref{sec:proc_capabilities}).} può
3577 impostare un processo ad una priorità di I/O nella classe
3578 \const{IOPRIO\_CLASS\_RT}, lo stesso privilegio era richiesto anche per la
3579 classe \const{IOPRIO\_CLASS\_IDLE} fino al kernel 2.6.24, ma dato che in
3580 questo caso non ci sono effetti sugli altri processi questo limite è stato
3581 rimosso a partire dal kernel 2.6.25.
3582
3583 %TODO verificare http://lwn.net/Articles/355987/
3584
3585 \section{Funzioni di gestione avanzata}
3586 \label{sec:proc_advanced_control}
3587
3588 Nelle precedenti sezioni si sono trattate la gran parte delle funzioni che
3589 attengono alla gestione ordinaria dei processi e delle loro proprietà più
3590 comuni. Tratteremo qui alcune \textit{system call} dedicate alla gestione di
3591 funzionalità dei processi molto specifiche ed avanzate, il cui uso è in genere
3592 piuttosto ridotto. Trattandosi di problematiche abbastanza complesse, che
3593 spesso presuppongono la conoscenza di altri argomenti trattati nel seguito
3594 della guida, si può saltare questa sezione in una prima lettura, tornando su
3595 di essa in un secondo tempo.
3596
3597
3598 \subsection{La funzione \func{prctl}}
3599 \label{sec:process_prctl}
3600
3601 Benché la gestione ordinaria possa essere effettuata attraverso le funzioni
3602 che abbiamo già esaminato nelle sezioni precedenti, esistono una serie di
3603 proprietà e caratteristiche particolari dei processi non coperte da esse, per
3604 la cui gestione è stata predisposta una apposita \textit{system call} che
3605 fornisce una interfaccia generica per tutte le operazioni specialistiche. La
3606 funzione di sistema è \funcd{prctl} ed il suo prototipo è:\footnote{la
3607   funzione non è standardizzata ed è specifica di Linux, anche se ne esiste
3608   una analoga in IRIX; è stata introdotta con il kernel 2.1.57.}
3609
3610 \begin{funcproto}{
3611 \fhead{sys/prctl.h}
3612 \fdecl{int prctl(int option, unsigned long arg2, unsigned long arg3, unsigned
3613   long arg4, \\
3614 \phantom{int prctl(}unsigned long arg5)}
3615 \fdesc{Esegue una operazione speciale sul processo corrente.}
3616 }
3617 {La funzione ritorna $0$ o un valore positivo dipendente dall'operazione in
3618   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
3619   valori diversi a seconda del tipo di operazione richiesta (in genere
3620   \errval{EINVAL} o \errval{EPERM}).}
3621 \end{funcproto}
3622
3623 La funzione ritorna un valore nullo o positivo in caso di successo e $-1$ in
3624 caso di errore; il significato degli argomenti della funzione successivi al
3625 primo, il valore di ritorno in caso di successo, il tipo di errore restituito
3626 in \var{errno} dipendono dall'operazione eseguita, indicata tramite il primo
3627 argomento, \param{option}. Questo è un valore intero che identifica
3628 l'operazione, e deve essere specificato con l'uso di una delle costanti
3629 predefinite del seguente elenco, che illustra quelle disponibili al
3630 momento:\footnote{alla stesura di questa sezione, cioè con il kernel 3.2.}
3631
3632 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
3633 \item[\const{PR\_CAPBSET\_READ}] Controlla la disponibilità di una delle
3634   \textit{capability} (vedi sez.~\ref{sec:proc_capabilities}). La funzione
3635   ritorna 1 se la capacità specificata nell'argomento \param{arg2} (con una
3636   delle costanti di tab.~\ref{tab:proc_capabilities}) è presente nel
3637   \textit{capabilities bounding set} del processo e zero altrimenti,
3638   se \param{arg2} non è un valore valido si avrà un errore di \errval{EINVAL}.
3639   Introdotta a partire dal kernel 2.6.25.
3640
3641 \item[\const{PR\_CAPBSET\_DROP}] Rimuove permanentemente una delle
3642   \textit{capabilities} (vedi sez.~\ref{sec:proc_capabilities}) dal processo e
3643   da tutti i suoi discendenti. La funzione cancella la capacità specificata
3644   nell'argomento \param{arg2} con una delle costanti di
3645   tab.~\ref{tab:proc_capabilities} dal \textit{capabilities bounding set} del
3646   processo. L'operazione richiede i privilegi di amministratore (la capacità
3647   \const{CAP\_SETPCAP}), altrimenti la chiamata fallirà con un errore di
3648   \errcode{EPERM}; se il valore di \param{arg2} non è valido o se il supporto
3649   per le \textit{file capabilities} non è stato compilato nel kernel la
3650   chiamata fallirà con un errore di \errval{EINVAL}. Introdotta a partire dal
3651   kernel 2.6.25.
3652
3653 \item[\const{PR\_SET\_DUMPABLE}] Imposta il flag che determina se la
3654   terminazione di un processo a causa di un segnale per il quale è prevista la
3655   generazione di un file di \textit{core dump} (vedi
3656   sez.~\ref{sec:sig_standard}) lo genera effettivamente. In genere questo flag
3657   viene attivato automaticamente, ma per evitare problemi di sicurezza (la
3658   generazione di un file da parte di processi privilegiati può essere usata
3659   per sovrascriverne altri) viene cancellato quando si mette in esecuzione un
3660   programma con i bit \acr{suid} e \acr{sgid} attivi (vedi
3661   sez.~\ref{sec:file_special_perm}) o con l'uso delle funzioni per la modifica
3662   degli \ids{UID} dei processi (vedi sez.~\ref{sec:proc_setuid}).
3663
3664   L'operazione è stata introdotta a partire dal kernel 2.3.20, fino al kernel
3665   2.6.12 e per i kernel successivi al 2.6.17 era possibile usare solo un
3666   valore 0 di \param{arg2} per disattivare il flag ed un valore 1 per
3667   attivarlo. Nei kernel dal 2.6.13 al 2.6.17 è stato supportato anche il
3668   valore 2, che causava la generazione di un \textit{core dump} leggibile solo
3669   dall'amministratore, ma questa funzionalità è stata rimossa per motivi di
3670   sicurezza, in quanto consentiva ad un utente normale di creare un file di
3671   \textit{core dump} appartenente all'amministratore in directory dove
3672   l'utente avrebbe avuto permessi di accesso.
3673
3674 \item[\const{PR\_GET\_DUMPABLE}] Ottiene come valore di ritorno della funzione
3675   lo stato corrente del flag che controlla la effettiva generazione dei
3676   \textit{core dump}. Introdotta a partire dal kernel 2.3.20.
3677
3678 \item[\const{PR\_SET\_ENDIAN}] Imposta la \textit{endianness} del processo
3679   chiamante secondo il valore fornito in \param{arg2}. I valori possibili sono
3680   sono: \const{PR\_ENDIAN\_BIG} (\textit{big endian}),
3681   \const{PR\_ENDIAN\_LITTLE} (\textit{little endian}), e
3682   \const{PR\_ENDIAN\_PPC\_LITTLE} (lo pseudo \textit{little endian} del
3683   PowerPC). Introdotta a partire dal kernel 2.6.18, solo per architettura
3684   PowerPC.
3685
3686 \item[\const{PR\_GET\_ENDIAN}] Ottiene il valore della \textit{endianness} del
3687   processo chiamante, salvato sulla variabile puntata da \param{arg2} che deve
3688   essere passata come di tipo ``\ctyp{int *}''. Introdotta a partire dal
3689   kernel 2.6.18, solo su PowerPC.
3690
3691 \item[\const{PR\_SET\_FPEMU}] Imposta i bit di controllo per l'emulazione
3692   della virgola mobile su architettura ia64, secondo il valore
3693   di \param{arg2}, si deve passare \const{PR\_FPEMU\_NOPRINT} per emulare in
3694   maniera trasparente l'accesso alle operazioni in virgola mobile, o
3695   \const{PR\_FPEMU\_SIGFPE} per non emularle ed inviare il segnale
3696   \signal{SIGFPE} (vedi sez.~\ref{sec:sig_prog_error}). Introdotta a partire
3697   dal kernel 2.4.18, solo su architettura ia64.
3698
3699 \item[\const{PR\_GET\_FPEMU}] Ottiene il valore dei flag di controllo
3700   dell'emulazione della virgola mobile, salvato all'indirizzo puntato
3701   da \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3702   partire dal kernel 2.4.18, solo su architettura ia64.
3703
3704 \item[\const{PR\_SET\_FPEXC}] Imposta la modalità delle eccezioni in virgola
3705   mobile (\textit{floating-point exception mode}) al valore di \param{arg2}.
3706   I valori possibili sono:
3707   \begin{itemize*}
3708   \item \const{PR\_FP\_EXC\_SW\_ENABLE} per usare FPEXC per le eccezioni,
3709   \item \const{PR\_FP\_EXC\_DIV} per la divisione per zero in virgola mobile,
3710   \item \const{PR\_FP\_EXC\_OVF} per gli overflow,
3711   \item \const{PR\_FP\_EXC\_UND} per gli underflow,
3712   \item \const{PR\_FP\_EXC\_RES} per risultati non esatti,
3713   \item \const{PR\_FP\_EXC\_INV} per operazioni invalide,
3714   \item \const{PR\_FP\_EXC\_DISABLED} per disabilitare le eccezioni,
3715   \item \const{PR\_FP\_EXC\_NONRECOV} per usare la modalità di eccezione
3716     asincrona non recuperabile,
3717   \item \const{PR\_FP\_EXC\_ASYNC} per usare la modalità di eccezione
3718     asincrona recuperabile,
3719   \item \const{PR\_FP\_EXC\_PRECISE} per la modalità precisa di
3720     eccezione.\footnote{trattasi di gestione specialistica della gestione
3721       delle eccezioni dei calcoli in virgola mobile che, i cui dettagli al
3722       momento vanno al di là dello scopo di questo testo.}
3723   \end{itemize*}
3724 Introdotta a partire dal kernel 2.4.21, solo su PowerPC.
3725
3726 \item[\const{PR\_GET\_FPEXC}] Ottiene il valore della modalità delle eccezioni
3727   delle operazioni in virgola mobile, salvata all'indirizzo
3728   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''.  Introdotta
3729   a partire dal kernel 2.4.21, solo su PowerPC.
3730
3731 \item[\const{PR\_SET\_KEEPCAPS}] Consente di controllare quali
3732   \textit{capabilities} vengono cancellate quando si esegue un cambiamento di
3733   \ids{UID} del processo (per i dettagli si veda
3734   sez.~\ref{sec:proc_capabilities}, in particolare quanto illustrato a
3735   pag.~\pageref{sec:capability-uid-transition}). Un valore nullo (il default)
3736   per \param{arg2} comporta che vengano cancellate, il valore 1 che vengano
3737   mantenute, questo valore viene sempre cancellato attraverso una \func{exec}.
3738   L'uso di questo flag è stato sostituito, a partire dal kernel 2.6.26, dal
3739   flag \const{SECURE\_KEEP\_CAPS} dei \textit{securebits} (vedi
3740   sez.~\ref{sec:proc_capabilities} e l'uso di \const{PR\_SET\_SECUREBITS} più
3741   avanti). Introdotta a partire dal kernel 2.2.18.
3742
3743 \item[\const{PR\_GET\_KEEPCAPS}] Ottiene come valore di ritorno della funzione
3744   il valore del flag di controllo delle \textit{capabilities} impostato con
3745   \const{PR\_SET\_KEEPCAPS}. Introdotta a partire dal kernel 2.2.18.
3746
3747 \item[\const{PR\_SET\_NAME}] Imposta il nome del processo chiamante alla
3748   stringa puntata da \param{arg2}, che deve essere di tipo ``\ctyp{char *}''. Il
3749   nome può essere lungo al massimo 16 caratteri, e la stringa deve essere
3750   terminata da NUL se più corta.  Introdotta a partire dal kernel 2.6.9.
3751
3752 \item[\const{PR\_GET\_NAME}] Ottiene il nome del processo chiamante nella
3753   stringa puntata da \param{arg2}, che deve essere di tipo ``\ctyp{char *}'';
3754   si devono allocare per questo almeno 16 byte, e il nome sarà terminato da
3755   NUL se più corto. Introdotta a partire dal kernel 2.6.9.
3756
3757 \item[\const{PR\_SET\_PDEATHSIG}] Consente di richiedere l'emissione di un
3758   segnale, che sarà ricevuto dal processo chiamante, in occorrenza della
3759   terminazione del proprio processo padre; in sostanza consente di invertire
3760   il ruolo di \signal{SIGCHLD}. Il valore di \param{arg2} deve indicare il
3761   numero del segnale, o 0 per disabilitare l'emissione. Il valore viene
3762   automaticamente cancellato per un processo figlio creato con \func{fork}.
3763   Introdotta a partire dal kernel 2.1.57.
3764
3765 \item[\const{PR\_GET\_PDEATHSIG}] Ottiene il valore dell'eventuale segnale
3766   emesso alla terminazione del padre, salvato all'indirizzo
3767   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3768   partire dal kernel 2.3.15.
3769
3770 \itindbeg{secure~computing~mode}
3771 \item[\const{PR\_SET\_SECCOMP}] Imposta il cosiddetto \textit{secure computing
3772     mode} per il processo corrente. Prevede come unica possibilità
3773   che \param{arg2} sia impostato ad 1. Una volta abilitato il \textit{secure
3774     computing mode} il processo potrà utilizzare soltanto un insieme
3775   estremamente limitato di \textit{system call}: \func{read}, \func{write},
3776   \func{\_exit} e \funcm{sigreturn}. Ogni altra \textit{system call} porterà
3777   all'emissione di un \signal{SIGKILL} (vedi sez.~\ref{sec:sig_termination}).
3778   Il \textit{secure computing mode} è stato ideato per fornire un supporto per
3779   l'esecuzione di codice esterno non fidato e non verificabile a scopo di
3780   calcolo;\footnote{lo scopo è quello di poter vendere la capacità di calcolo
3781     della proprio macchina ad un qualche servizio di calcolo distribuito senza
3782     comprometterne la sicurezza eseguendo codice non sotto il proprio
3783     controllo.} in genere i dati vengono letti o scritti grazie ad un socket o
3784   una \textit{pipe}, e per evitare problemi di sicurezza non sono possibili
3785   altre operazioni se non quelle citate.  Introdotta a partire dal kernel
3786   2.6.23, disponibile solo se si è abilitato il supporto nel kernel con
3787   \texttt{CONFIG\_SECCOMP}.
3788
3789 % TODO a partire dal kernel 3.5 è stato introdotto la possibilità di usare un
3790 % terzo argomento se il secondo è SECCOMP_MODE_FILTER, vedi
3791 % Documentation/prctl/seccomp_filter.txt
3792 % vedi anche http://lwn.net/Articles/600250/
3793
3794 % TODO a partire dal kernel 3.17 è stata introdotta la nuova syscall seccomp,
3795 % vedi http://lwn.net/Articles/600250/ e http://lwn.net/Articles/603321/
3796
3797 \item[\const{PR\_GET\_SECCOMP}] Ottiene come valore di ritorno della funzione
3798   lo stato corrente del \textit{secure computing mode}, al momento attuale la
3799   funzione è totalmente inutile in quanto l'unico valore ottenibile è 0, dato
3800   che la chiamata di questa funzione in \textit{secure computing mode}
3801   comporterebbe l'emissione di \signal{SIGKILL}, è stata comunque definita per
3802   eventuali estensioni future. Introdotta a partire dal kernel 2.6.23.
3803 \itindend{secure~computing~mode}
3804
3805 \item[\const{PR\_SET\_SECUREBITS}] Imposta i \textit{securebits} per il
3806   processo chiamante al valore indicato da \param{arg2}; per i dettagli sul
3807   significato dei \textit{securebits} si veda
3808   sez.~\ref{sec:proc_capabilities}, ed in particolare i valori di
3809   tab.~\ref{tab:securebits_values} e la relativa trattazione. L'operazione
3810   richiede i privilegi di amministratore (la capacità \const{CAP\_SETPCAP}),
3811   altrimenti la chiamata fallirà con un errore di \errval{EPERM}. Introdotta a
3812   partire dal kernel 2.6.26.
3813
3814 \item[\const{PR\_GET\_SECUREBITS}] Ottiene come valore di ritorno della
3815   funzione l'impostazione corrente per i \textit{securebits}. Introdotta a
3816   partire dal kernel 2.6.26.
3817
3818 \item[\const{PR\_SET\_TIMING}] Imposta il metodo di temporizzazione del
3819   processo da indicare con il valore di \param{arg2}, attualmente i valori
3820   possibili sono due, con \const{PR\_TIMING\_STATISTICAL} si usa il metodo
3821   statistico tradizionale, con \const{PR\_TIMING\_TIMESTAMP} il più accurato
3822   basato su dei \textit{timestamp}, quest'ultimo però non è ancora
3823   implementato ed il suo uso comporta la restituzione di un errore di
3824   \errval{EINVAL}. Introdotta a partire dal kernel 2.6.0-test4.
3825
3826 \item[\const{PR\_GET\_TIMING}] Ottiene come valore di ritorno della funzione
3827   il metodo di temporizzazione del processo attualmente in uso (uno dei due
3828   valori citati per \const{PR\_SET\_TIMING}). Introdotta a partire dal kernel
3829   2.6.0-test4.
3830
3831 \item[\const{PR\_SET\_TSC}] Imposta il flag che indica se il processo
3832   chiamante può leggere il registro di processore contenente il contatore dei
3833   \textit{timestamp} (TSC, o \textit{Time Stamp Counter}) da indicare con il
3834   valore di \param{arg2}. Si deve specificare \const{PR\_TSC\_ENABLE} per
3835   abilitare la lettura o \const{PR\_TSC\_SIGSEGV} per disabilitarla con la
3836   generazione di un segnale di \signal{SIGSEGV} (vedi
3837   sez.~\ref{sec:sig_prog_error}). La lettura viene automaticamente
3838   disabilitata se si attiva il \textit{secure computing mode} (vedi
3839   \const{PR\_SET\_SECCOMP} più avanti).  Introdotta a partire dal kernel
3840   2.6.26, solo su x86.
3841
3842 \item[\const{PR\_GET\_TSC}] Ottiene il valore del flag che controlla la
3843   lettura del contattore dei \textit{timestamp}, salvato all'indirizzo
3844   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3845   partire dal kernel 2.6.26, solo su x86.
3846 % articoli sul TSC e relativi problemi: http://lwn.net/Articles/209101/,
3847 % http://blog.cr0.org/2009/05/time-stamp-counter-disabling-oddities.html,
3848 % http://en.wikipedia.org/wiki/Time_Stamp_Counter
3849
3850 \item[\const{PR\_SET\_UNALIGN}] Imposta la modalità di controllo per l'accesso
3851   a indirizzi di memoria non allineati, che in varie architetture risultano
3852   illegali, da indicare con il valore di \param{arg2}. Si deve specificare il
3853   valore \const{PR\_UNALIGN\_NOPRINT} per ignorare gli accessi non allineati,
3854   ed il valore \const{PR\_UNALIGN\_SIGBUS} per generare un segnale di
3855   \signal{SIGBUS} (vedi sez.~\ref{sec:sig_prog_error}) in caso di accesso non
3856   allineato.  Introdotta con diverse versioni su diverse architetture.
3857
3858 \item[\const{PR\_GET\_UNALIGN}] Ottiene il valore della modalità di controllo
3859   per l'accesso a indirizzi di memoria non allineati, salvato all'indirizzo
3860   puntato \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta con
3861   diverse versioni su diverse architetture.
3862 \item[\const{PR\_MCE\_KILL}] Imposta la politica di gestione degli errori
3863   dovuti a corruzione della memoria per problemi hardware. Questo tipo di
3864   errori vengono riportati dall'hardware di controllo della RAM e vengono
3865   gestiti dal kernel,\footnote{la funzionalità è disponibile solo sulle
3866     piattaforme più avanzate che hanno il supporto hardware per questo tipo di
3867     controlli.} ma devono essere opportunamente riportati ai processi che
3868   usano quella parte di RAM che presenta errori; nel caso specifico questo
3869   avviene attraverso l'emissione di un segnale di \signal{SIGBUS} (vedi
3870   sez.~\ref{sec:sig_prog_error}).\footnote{in particolare viene anche
3871     impostato il valore di \var{si\_code} in \struct{siginfo\_t} a
3872     \const{BUS\_MCEERR\_AO}; per il significato di tutto questo si faccia
3873     riferimento alla trattazione di sez.~\ref{sec:sig_sigaction}.}
3874
3875   Il comportamento di default prevede che per tutti i processi si applichi la
3876   politica generale di sistema definita nel file
3877   \sysctlfile{vm/memory\_failure\_early\_kill}, ma specificando
3878   per \param{arg2} il valore \const{PR\_MCE\_KILL\_SET} è possibile impostare
3879   con il contenuto di \param{arg3} una politica specifica del processo
3880   chiamante. Si può tornare alla politica di default del sistema utilizzando
3881   invece per \param{arg2} il valore \const{PR\_MCE\_KILL\_CLEAR}. In tutti i
3882   casi, per compatibilità con eventuali estensioni future, tutti i valori
3883   degli argomenti non utilizzati devono essere esplicitamente posti a zero,
3884   pena il fallimento della chiamata con un errore di \errval{EINVAL}.
3885
3886   In caso di impostazione di una politica specifica del processo con
3887   \const{PR\_MCE\_KILL\_SET} i valori di \param{arg3} possono essere soltanto
3888   due, che corrispondono anche al valore che si trova nell'impostazione
3889   generale di sistema di \texttt{memory\_failure\_early\_kill}, con
3890   \const{PR\_MCE\_KILL\_EARLY} si richiede l'emissione immediata di
3891   \signal{SIGBUS} non appena viene rilevato un errore, mentre con
3892   \const{PR\_MCE\_KILL\_LATE} il segnale verrà inviato solo quando il processo
3893   tenterà un accesso alla memoria corrotta. Questi due valori corrispondono
3894   rispettivamente ai valori 1 e 0 di
3895   \texttt{memory\_failure\_early\_kill}.\footnote{in sostanza nel primo caso
3896     viene immediatamente inviato il segnale a tutti i processi che hanno la
3897     memoria corrotta mappata all'interno del loro spazio degli indirizzi, nel
3898     secondo caso prima la pagina di memoria viene tolta dallo spazio degli
3899     indirizzi di ciascun processo, mentre il segnale viene inviato solo quei
3900     processi che tentano di accedervi.} Si può usare per \param{arg3} anche un
3901   terzo valore, \const{PR\_MCE\_KILL\_DEFAULT}, che corrisponde a impostare
3902   per il processo la politica di default.\footnote{si presume la politica di
3903     default corrente, in modo da non essere influenzati da un eventuale
3904     successivo cambiamento della stessa.} Introdotta a partire dal kernel
3905   2.6.32.
3906 \item[\const{PR\_MCE\_KILL\_GET}] Ottiene come valore di ritorno della
3907   funzione la politica di gestione degli errori dovuti a corruzione della
3908   memoria. Tutti gli argomenti non utilizzati (al momento tutti) devono essere
3909   nulli pena la ricezione di un errore di \errval{EINVAL}. Introdotta a
3910   partire dal kernel 2.6.32.
3911 \itindbeg{child~reaper}
3912 \item[\const{PR\_SET\_CHILD\_SUBREAPER}] Se \param{arg2} è diverso da zero
3913   imposta l'attributo di \textit{child reaper} per il processo, se nullo lo
3914   cancella. Lo stato di \textit{child reaper} è una funzionalità, introdotta
3915   con il kernel 3.4, che consente di far svolgere al processo che ha questo
3916   attributo il ruolo di ``\textsl{genitore adottivo}'' per tutti i processi
3917   suoi ``\textsl{discendenti}'' che diventano orfani, in questo modo il
3918   processo potrà ricevere gli stati di terminazione alla loro uscita,
3919   sostituendo in questo ruolo \cmd{init} (si ricordi quanto illustrato in
3920   sez.~\ref{sec:proc_termination}). Il meccanismo è stato introdotto ad uso
3921   dei programmi di gestione dei servizi, per consentire loro di ricevere gli
3922   stati di terminazione di tutti i processi che lanciano, anche se questi
3923   eseguono una doppia \func{fork}; nel comportamento ordinario infatti questi
3924   verrebbero adottati da \cmd{init} ed il programma che li ha lanciati non
3925   sarebbe più in grado di riceverne lo stato di terminazione. Se un processo
3926   con lo stato di \textit{child reaper} termina prima dei suoi discendenti,
3927   svolgerà questo ruolo il più prossimo antenato ad avere lo stato di
3928   \textit{child reaper},
3929 \item[\const{PR\_GET\_CHILD\_SUBREAPER}] Ottiene l'impostazione relativa allo
3930   lo stato di \textit{child reaper} del processo chiamante, salvata come
3931   \textit{value result} all'indirizzo puntato da \param{arg2} (da indicare
3932   come di tipo \code{int *}). Il valore viene letto come valore logico, se
3933   diverso da 0 lo stato di \textit{child reaper} è attivo altrimenti è
3934   disattivo. Introdotta a partire dal kernel 3.4.
3935 \itindend{child~reaper}
3936
3937
3938 % TODO documentare PR_SET_SECCOMP introdotto a partire dal kernel 3.5. Vedi:
3939 % * Documentation/prctl/seccomp_filter.txt
3940 % * http://lwn.net/Articles/475043/
3941
3942 % TODO documentare PR_MPX_INIT e PR_MPX_RELEASE, vedi
3943 % http://lwn.net/Articles/582712/
3944
3945 % TODO documentare PR_SET_MM_MAP aggiunta con il kernel 3.18, per impostare i
3946 % parametri di base del layout dello spazio di indirizzi di un processo (area
3947 % codice e dati, stack, brack pointer ecc. vedi
3948 % http://git.kernel.org/linus/f606b77f1a9e362451aca8f81d8f36a3a112139e
3949
3950
3951 \label{sec:prctl_operation}
3952 \end{basedescript}
3953
3954
3955
3956 \subsection{La \textit{system call} \func{clone}}
3957 \label{sec:process_clone}
3958
3959 La funzione tradizionale con cui creare un nuovo processo in un sistema
3960 Unix-like, come illustrato in sez.~\ref{sec:proc_fork}, è \func{fork}, ma con
3961 l'introduzione del supporto del kernel per i \textit{thread} (vedi
3962 cap.~\ref{cha:threads}), si è avuta la necessità di una interfaccia che
3963 consentisse un maggiore controllo sulla modalità con cui vengono creati nuovi
3964 processi, che poi è stata utilizzata anche per fornire supporto per le
3965 tecnologie di virtualizzazione dei processi (i cosiddetti \textit{container}).
3966
3967 Per questo l'interfaccia per la creazione di un nuovo processo è stata
3968 delegata ad una nuova \textit{system call}, \funcm{sys\_clone}, che consente
3969 di reimplementare anche la tradizionale \func{fork}. In realtà in questo caso
3970 più che di nuovi processi si può parlare della creazioni di nuovi
3971 ``\textit{task}'' del kernel che possono assumere la veste sia di un processo
3972 classico isolato dagli altri come quelli trattati finora, che di un
3973 \textit{thread} in cui la memoria viene condivisa fra il processo chiamante ed
3974 il nuovo processo creato, come quelli che vedremo in
3975 sez.~\ref{sec:linux_thread}. Per evitare confusione fra \textit{thread} e
3976 processi ordinari, abbiamo deciso di usare la nomenclatura \textit{task} per
3977 indicare la unità di esecuzione generica messa a disposizione del kernel che
3978 \texttt{sys\_clone} permette di creare.
3979
3980 Oltre a questo la funzione consente, ad uso delle nuove funzionalità di
3981 virtualizzazione dei processi, di creare nuovi \textit{namespace} per una
3982 serie di proprietà generali dei processi (come l'elenco dei \ids{PID},
3983 l'albero dei file, i \textit{mount point}, la rete, ecc.), che consentono di
3984 creare gruppi di processi che vivono in una sorta di spazio separato dagli
3985 altri, che costituisce poi quello che viene chiamato un \textit{container}.
3986
3987 La \textit{system call} richiede soltanto due argomenti: il
3988 primo, \param{flags}, consente di controllare le modalità di creazione del
3989 nuovo \textit{task}, il secondo, \param{child\_stack}, imposta l'indirizzo
3990 dello \textit{stack} per il nuovo \textit{task}, e deve essere indicato quando
3991 si intende creare un \textit{thread}. L'esecuzione del programma creato da
3992 \func{sys\_clone} riprende, come per \func{fork}, da dopo l'esecuzione della
3993 stessa.
3994
3995 La necessità di avere uno \textit{stack} alternativo c'è solo quando si
3996 intende creare un \textit{thread}, in tal caso infatti il nuovo \textit{task}
3997 vede esattamente la stessa memoria del \textit{task}
3998 ``\textsl{padre}'',\footnote{in questo caso per padre si intende semplicemente
3999   il \textit{task} che ha eseguito \func{sys\_clone} rispetto al \textit{task}
4000   da essa creato, senza nessuna delle implicazioni che il concetto ha per i
4001   processi.} e nella sua esecuzione alla prima chiamata di una funzione
4002 andrebbe a scrivere sullo \textit{stack} usato anche dal padre (si ricordi
4003 quanto visto in sez.~\ref{sec:proc_mem_layout} riguardo all'uso dello
4004 \textit{stack}).
4005
4006 Per evitare di doversi garantire contro la evidente possibilità di
4007 \textit{race condition} che questa situazione comporta (vedi
4008 sez.~\ref{sec:proc_race_cond} per una spiegazione della problematica) è
4009 necessario che il chiamante allochi preventivamente un'area di memoria.  In
4010 genere lo si fa con una \func{malloc} che allochi un buffer che la funzione
4011 imposterà come \textit{stack} del nuovo processo, avendo ovviamente cura di
4012 non utilizzarlo direttamente nel processo chiamante.
4013
4014 In questo modo i due \textit{task} avranno degli \textit{stack} indipendenti e
4015 non si dovranno affrontare problematiche di \textit{race condition}.  Si tenga
4016 presente inoltre che in molte architetture di processore lo \textit{stack}
4017 cresce verso il basso, pertanto in tal caso non si dovrà specificare
4018 per \param{child\_stack} il puntatore restituito da \func{malloc}, ma un
4019 puntatore alla fine del buffer da essa allocato.
4020
4021 Dato che tutto ciò è necessario solo per i \textit{thread} che condividono la
4022 memoria, la \textit{system call}, a differenza della funzione di libreria che
4023 vedremo a breve, consente anche di passare per \param{child\_stack} il valore
4024 \val{NULL}, che non imposta un nuovo \textit{stack}. Se infatti si crea un
4025 processo, questo ottiene un suo nuovo spazio degli indirizzi (è sottinteso
4026 cioè che non si stia usando il flag \const{CLONE\_VM} che vedremo a breve) ed
4027 in questo caso si applica la semantica del \textit{copy on write} illustrata
4028 in sez.~\ref{sec:proc_fork}, per cui le pagine dello \textit{stack} verranno
4029 automaticamente copiate come le altre e il nuovo processo avrà un suo
4030 \textit{stack} totalmente indipendente da quello del padre.
4031
4032 Dato che l'uso principale della nuova \textit{system call} è quello relativo
4033 alla creazione dei \textit{thread}, la \acr{glibc} definisce una funzione di
4034 libreria con una sintassi diversa, orientata a questo scopo, e la
4035 \textit{system call} resta accessibile solo se invocata esplicitamente come
4036 visto in sez.~\ref{sec:proc_syscall}.\footnote{ed inoltre per questa
4037   \textit{system call} non è disponibile la chiamata veloce con
4038   \texttt{vsyscall}.} La funzione di libreria si chiama semplicemente
4039 \funcd{clone} ed il suo prototipo è:
4040
4041 \begin{funcproto}{
4042 \fhead{sched.h}
4043 \fdecl{int clone(int (*fn)(void *), void *child\_stack, int flags, void *arg,
4044   ...  \\
4045 \phantom{int clone(}/* pid\_t *ptid, struct user\_desc *tls, pid\_t *ctid */ )}
4046 \fdesc{Crea un nuovo processo o \textit{thread}.}
4047 }
4048 {La funzione ritorna il \textit{Thread ID} assegnato al nuovo processo in caso
4049   di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
4050   valori:
4051 \begin{errlist}
4052     \item[\errcode{EAGAIN}] sono già in esecuzione troppi processi.
4053     \item[\errcode{EINVAL}] si è usata una combinazione non valida di flag o
4054       un valore nullo per \param{child\_stack}.
4055     \item[\errcode{ENOMEM}] non c'è memoria sufficiente per creare una nuova
4056       \struct{task\_struct} o per copiare le parti del contesto del chiamante
4057       necessarie al nuovo \textit{task}.
4058     \item[\errcode{EPERM}] non si hanno i privilegi di amministratore
4059       richiesti dai flag indicati.
4060 \end{errlist}}
4061 \end{funcproto}
4062
4063 % NOTE: una pagina con la descrizione degli argomenti:
4064 % * http://www.lindevdoc.org/wiki/Clone
4065
4066 La funzione prende come primo argomento \param{fn} il puntatore alla funzione
4067 che verrà messa in esecuzione nel nuovo processo, che può avere un unico
4068 argomento di tipo puntatore a \ctyp{void}, il cui valore viene passato dal
4069 terzo argomento \param{arg}. Per quanto il precedente prototipo possa
4070 intimidire nella sua espressione, in realtà l'uso è molto semplice basterà
4071 definire una qualunque funzione \param{fn} che restituisce un intero ed ha
4072 come argomento un puntatore a \ctyp{void}, e \code{fn(arg)} sarà eseguita in
4073 un nuovo processo.
4074
4075 Il nuovo processo resterà in esecuzione fintanto che la funzione \param{fn}
4076 non ritorna, o esegue \func{exit} o viene terminata da un segnale. Il valore
4077 di ritorno della funzione (o quello specificato con \func{exit}) verrà
4078 utilizzato come stato di uscita della funzione. I tre
4079 argomenti \param{ptid}, \param{tls} e \param{ctid} sono opzionali e sono
4080 presenti solo a partire dal kernel 2.6 e sono stati aggiunti come supporto per
4081 le funzioni di gestione dei \textit{thread} (la \textit{Native Thread Posix
4082   Library}, vedi sez.~\ref{sec:linux_ntpl}) nella \acr{glibc}, essi vengono
4083 utilizzati soltanto se si sono specificati rispettivamente i flag
4084 \const{CLONE\_PARENT\_SETTID}, \const{CLONE\_SETTLS} e
4085 \const{CLONE\_CHILD\_SETTID}.
4086
4087 La funzione ritorna un l'identificatore del nuovo \textit{task}, denominato
4088 \texttt{Thread ID} (da qui in avanti \ids{TID}) il cui significato è analogo
4089 al \ids{PID} dei normali processi e che a questo corrisponde qualora si crei
4090 un processo ordinario e non un \textit{thread}.
4091
4092 Il comportamento di \func{clone}, che si riflette sulle caratteristiche del
4093 nuovo processo da essa creato, è controllato principalmente
4094 dall'argomento \param{flags}, che deve essere specificato come maschera
4095 binaria, ottenuta con un OR aritmetico di una delle costanti del seguente
4096 elenco, che illustra quelle attualmente disponibili:\footnote{si fa
4097   riferimento al momento della stesura di questa sezione, cioè con il kernel
4098   3.2.}
4099
4100 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
4101
4102 \item[\const{CLONE\_CHILD\_CLEARTID}] cancella il valore del \ids{TID}
4103   all'indirizzo dato dall'argomento \param{ctid}, eseguendo un riattivazione
4104   del \textit{futex} (vedi sez.~\ref{sec:xxx_futex}) a quell'indirizzo; questo
4105   flag viene utilizzato dalla librerie di gestione dei \textit{thread}.
4106 \item[\const{CLONE\_CHILD\_SETTID}] scrive il \ids{TID} del \textit{thread}
4107   figlio all'indirizzo dato dall'argomento \param{ctid}. Questo flag viene
4108   utilizzato dalla librerie di gestione dei \textit{thread}.
4109 \item[\const{CLONE\_FILES}] se impostato il nuovo processo condividerà con il
4110   padre la \textit{file descriptor table} (vedi sez.~\ref{sec:file_fd}),
4111   questo significa che ogni \textit{file descriptor} aperto da un processo
4112   verrà visto anche dall'altro e che ogni chiusura o cambiamento dei
4113   \textit{file descriptor flag} di un \textit{file descriptor} verrà per
4114   entrambi.
4115
4116   Se non viene impostato il processo figlio eredita una copia della
4117   \textit{file descriptor table} del padre e vale la semantica classica della
4118   gestione dei \textit{file descriptor}, che costituisce il comportamento
4119   ordinario di un sistema unix-like e che illustreremo in dettaglio in
4120   sez.~\ref{sec:file_shared_access}.
4121
4122 \item[\const{CLONE\_FS}] se questo flag viene impostato il nuovo processo
4123   condividerà con il padre le informazioni relative all'albero dei file, ed in
4124   particolare avrà la stessa radice (vedi sez.~\ref{sec:file_chroot}), la
4125   stessa directory di lavoro (vedi sez.~\ref{sec:file_work_dir}) e la stessa
4126   \textit{umask} (sez.~\ref{sec:file_perm_management}). Una modifica di una
4127   qualunque di queste caratteristiche in un processo, avrà effetto anche
4128   sull'altro. Se assente il nuovo processo riceverà una copia delle precedenti
4129   informazioni, che saranno così indipendenti per i due processi, come avviene
4130   nel comportamento ordinario di un sistema unix-like.
4131
4132 \item[\const{CLONE\_IO}]
4133 \item[\const{CLONE\_NEWIPC}]
4134 \item[\const{CLONE\_NEWNET}]
4135 \item[\const{CLONE\_NEWNS}]
4136 \item[\const{CLONE\_NEWPID}]
4137 \item[\const{CLONE\_NEWUTS}]
4138 \item[\const{CLONE\_PARENT}]
4139 \item[\const{CLONE\_PARENT\_SETTID}]
4140 \item[\const{CLONE\_PID}]
4141 \item[\const{CLONE\_PTRACE}]
4142 \item[\const{CLONE\_SETTLS}]
4143 \item[\const{CLONE\_SIGHAND}]
4144 \item[\const{CLONE\_STOPPED}]
4145 \item[\const{CLONE\_SYSVSEM}]
4146 \item[\const{CLONE\_THREAD}]
4147 \item[\const{CLONE\_UNTRACED}]
4148 \item[\const{CLONE\_VFORK}]
4149 \item[\const{CLONE\_VM}]
4150 \end{basedescript}
4151
4152
4153 %TODO trattare unshare, vedi anche http://lwn.net/Articles/532748/
4154
4155
4156 %TODO trattare kcmp aggiunta con il kernel 3.5, vedi
4157 % https://lwn.net/Articles/478111/
4158
4159 \subsection{La funzione \func{ptrace}}
4160 \label{sec:process_ptrace}
4161
4162 Da fare
4163
4164 % TODO: trattare PTRACE_SEIZE, aggiunta con il kernel 3.1
4165 % TODO: trattare PTRACE_O_EXITKILL, aggiunta con il kernel 3.8 (vedi
4166 % http://lwn.net/Articles/529060/)
4167 % TODO: trattare PTRACE_GETSIGMASK e PTRACE_SETSIGMASK introdotte con il
4168 % kernel 3.11
4169 % TODO: trattare PTRACE_O_SUSPEND_SECCOMP, aggiunta con il kernel 4.3, vedi
4170 % http://lwn.net/Articles/656675/
4171
4172 \subsection{La gestione delle operazioni in virgola mobile}
4173 \label{sec:process_fenv}
4174
4175 Da fare.
4176
4177 % TODO eccezioni ed arrotondamenti per la matematica in virgola mobile
4178 % consultare la manpage di fenv, math_error, fpclassify, matherr, isgreater,
4179 % isnan, nan, INFINITY
4180
4181
4182 \subsection{L'accesso alle porte di I/O}
4183 \label{sec:process_io_port}
4184
4185 %
4186 % TODO l'I/O sulle porte di I/O
4187 % consultare le manpage di ioperm, iopl e outb
4188 % non c'entra nulla qui, va trovato un altro posto (altri meccanismi di I/O in
4189 % fileintro ?)
4190
4191 Da fare
4192
4193
4194 %\subsection{La gestione di architetture a nodi multipli}
4195 %\label{sec:process_NUMA}
4196
4197 % TODO trattare i cpuset, che attiene anche a NUMA, e che possono essere usati
4198 % per associare l'uso di gruppi di processori a gruppi di processi (vedi
4199 % manpage omonima)
4200 % TODO trattare getcpu, che attiene anche a NUMA, mettere qui anche
4201 % sched_getcpu, che potrebbe essere indipendente ma richiama getcpu
4202
4203 %TODO trattare le funzionalità per il NUMA
4204 % vedi man numa e, mbind, get_mempolicy, set_mempolicy,
4205 % le pagine di manuale relative
4206 % vedere anche dove metterle...
4207
4208 % \subsection{La gestione dei moduli}
4209 % \label{sec:kernel_modules}
4210
4211 % da fare
4212
4213 %TODO trattare init_module e finit_module (quest'ultima introdotta con il
4214 %kernel 3.8)
4215
4216 %%%% Altre cose di cui non è chiara la collocazione:
4217
4218 %TODO trattare membarrier, introdotta con il kernel 4.3
4219 % vedi http://lwn.net/Articles/369567/ http://lwn.net/Articles/369640/
4220 % http://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/commit/?id=5b25b13ab08f616efd566347d809b4ece54570d1
4221
4222 \section{Problematiche di programmazione multitasking}
4223 \label{sec:proc_multi_prog}
4224
4225 Benché i processi siano strutturati in modo da apparire il più possibile come
4226 indipendenti l'uno dall'altro, nella programmazione in un sistema multitasking
4227 occorre tenere conto di una serie di problematiche che normalmente non
4228 esistono quando si ha a che fare con un sistema in cui viene eseguito un solo
4229 programma alla volta.
4230
4231 Per questo motivo, essendo questo argomento di carattere generale, ci è parso
4232 opportuno introdurre sinteticamente queste problematiche, che ritroveremo a
4233 più riprese in capitoli successivi, in questa sezione conclusiva del capitolo
4234 in cui abbiamo affrontato la gestione dei processi, sottolineando come esse
4235 diventino cogenti quando invece si usano i \textit{thread}.
4236
4237
4238 \subsection{Le operazioni atomiche}
4239 \label{sec:proc_atom_oper}
4240
4241 La nozione di \textsl{operazione atomica} deriva dal significato greco della
4242 parola atomo, cioè indivisibile; si dice infatti che un'operazione è atomica
4243 quando si ha la certezza che, qualora essa venga effettuata, tutti i passaggi
4244 che devono essere compiuti per realizzarla verranno eseguiti senza possibilità
4245 di interruzione in una fase intermedia.
4246
4247 In un ambiente multitasking il concetto è essenziale, dato che un processo può
4248 essere interrotto in qualunque momento dal kernel che mette in esecuzione un
4249 altro processo o dalla ricezione di un segnale. Occorre pertanto essere
4250 accorti nei confronti delle possibili \textit{race condition} (vedi
4251 sez.~\ref{sec:proc_race_cond}) derivanti da operazioni interrotte in una fase
4252 in cui non erano ancora state completate.
4253
4254 Nel caso dell'interazione fra processi la situazione è molto più semplice, ed
4255 occorre preoccuparsi della atomicità delle operazioni solo quando si ha a che
4256 fare con meccanismi di intercomunicazione (che esamineremo in dettaglio in
4257 cap.~\ref{cha:IPC}) o nelle operazioni con i file (vedremo alcuni esempi in
4258 sez.~\ref{sec:file_shared_access}). In questi casi in genere l'uso delle
4259 appropriate funzioni di libreria per compiere le operazioni necessarie è
4260 garanzia sufficiente di atomicità in quanto le \textit{system call} con cui
4261 esse sono realizzate non possono essere interrotte (o subire interferenze
4262 pericolose) da altri processi.
4263
4264 Nel caso dei segnali invece la situazione è molto più delicata, in quanto lo
4265 stesso processo, e pure alcune \textit{system call}, possono essere interrotti
4266 in qualunque momento, e le operazioni di un eventuale \textit{signal handler}
4267 sono compiute nello stesso spazio di indirizzi del processo. Per questo, anche
4268 il solo accesso o l'assegnazione di una variabile possono non essere più
4269 operazioni atomiche (torneremo su questi aspetti in
4270 sez.~\ref{sec:sig_adv_control}).
4271
4272 Qualora invece si usino i \textit{thread}, in cui lo spazio degli indirizzi è
4273 condiviso, il problema è sempre presente, perché qualunque \textit{thread} può
4274 interromperne un altro in qualunque momento e l'atomicità di qualunque
4275 operazione è messa in discussione, per cui l'assenza di eventuali \textit{race
4276   condition} (vedi sez.~\ref{sec:proc_race_cond}) deve essere sempre
4277 verificata nei minimi dettagli.
4278
4279 In questo caso il sistema provvede un tipo di dato, il \type{sig\_atomic\_t},
4280 il cui accesso è assicurato essere atomico.  In pratica comunque si può
4281 assumere che, in ogni piattaforma su cui è implementato Linux, il tipo
4282 \ctyp{int}, gli altri interi di dimensione inferiore ed i puntatori sono
4283 atomici. Non è affatto detto che lo stesso valga per interi di dimensioni
4284 maggiori (in cui l'accesso può comportare più istruzioni in assembler) o per
4285 le strutture di dati. In tutti questi casi è anche opportuno marcare come
4286 \direct{volatile} le variabili che possono essere interessate ad accesso
4287 condiviso, onde evitare problemi con le ottimizzazioni del codice.
4288
4289
4290
4291 \subsection{Le \textit{race condition} ed i \textit{deadlock}}
4292 \label{sec:proc_race_cond}
4293
4294 \itindbeg{race~condition}
4295
4296 Si definiscono \textit{race condition} tutte quelle situazioni in cui processi
4297 diversi operano su una risorsa comune, ed in cui il risultato viene a
4298 dipendere dall'ordine in cui essi effettuano le loro operazioni. Il caso
4299 tipico è quello di un'operazione che viene eseguita da un processo in più
4300 passi, e può essere compromessa dall'intervento di un altro processo che
4301 accede alla stessa risorsa quando ancora non tutti i passi sono stati
4302 completati.
4303
4304 Dato che in un sistema multitasking ogni processo può essere interrotto in
4305 qualunque momento per farne subentrare un altro in esecuzione, niente può
4306 assicurare un preciso ordine di esecuzione fra processi diversi o che una
4307 sezione di un programma possa essere eseguita senza interruzioni da parte di
4308 altri. Queste situazioni comportano pertanto errori estremamente subdoli e
4309 difficili da tracciare, in quanto nella maggior parte dei casi tutto
4310 funzionerà regolarmente, e solo occasionalmente si avranno degli errori.
4311
4312 Per questo occorre essere ben consapevoli di queste problematiche, e del fatto
4313 che l'unico modo per evitarle è quello di riconoscerle come tali e prendere
4314 gli adeguati provvedimenti per far sì che non si verifichino. Casi tipici di
4315 \textit{race condition} si hanno quando diversi processi accedono allo stesso
4316 file, o nell'accesso a meccanismi di intercomunicazione come la memoria
4317 condivisa.
4318
4319 \index{sezione~critica|(}
4320
4321 In questi casi, se non si dispone della possibilità di eseguire atomicamente
4322 le operazioni necessarie, occorre che quelle parti di codice in cui si
4323 compiono le operazioni sulle risorse condivise, quelle che in genere vengono
4324 denominate ``\textsl{sezioni critiche}'' del programma, siano opportunamente
4325 protette da meccanismi di sincronizzazione (vedremo alcune problematiche di
4326 questo tipo in cap.~\ref{cha:IPC}).
4327
4328 \index{sezione~critica|)}
4329
4330 Nel caso dei \textit{thread} invece la situazione è molto più delicata e
4331 sostanzialmente qualunque accesso in memoria (a buffer, variabili o altro) può
4332 essere soggetto a \textit{race condition} dato potrebbe essere interrotto in
4333 qualunque momento da un altro \textit{thread}. In tal caso occorre pianificare
4334 con estrema attenzione l'uso delle variabili ed utilizzare i vari meccanismi
4335 di sincronizzazione che anche in questo caso sono disponibili (torneremo su
4336 queste problematiche di questo tipo in cap.~\ref{sez:thread_xxx})
4337
4338 \itindbeg{deadlock}
4339
4340 Un caso particolare di \textit{race condition} sono poi i cosiddetti
4341 \textit{deadlock} (traducibile in \textsl{condizione di stallo}), che
4342 particolarmente gravi in quanto comportano spesso il blocco completo di un
4343 servizio, e non il fallimento di una singola operazione. Per definizione un
4344 \textit{deadlock} è una situazione in cui due o più processi non sono più in
4345 grado di proseguire perché ciascuno aspetta il risultato di una operazione che
4346 dovrebbe essere eseguita dall'altro.
4347
4348 L'esempio tipico di una situazione che può condurre ad un
4349 \textit{deadlock} è quello in cui un flag di
4350 ``\textsl{occupazione}'' viene rilasciato da un evento asincrono (come un
4351 segnale o un altro processo) fra il momento in cui lo si è controllato
4352 (trovandolo occupato) e la successiva operazione di attesa per lo sblocco. In
4353 questo caso, dato che l'evento di sblocco del flag è avvenuto senza che ce ne
4354 accorgessimo proprio fra il controllo e la messa in attesa, quest'ultima
4355 diventerà perpetua (da cui il nome di \textit{deadlock}).
4356
4357 In tutti questi casi è di fondamentale importanza il concetto di atomicità
4358 visto in sez.~\ref{sec:proc_atom_oper}; questi problemi infatti possono essere
4359 risolti soltanto assicurandosi, quando essa sia richiesta, che sia possibile
4360 eseguire in maniera atomica le operazioni necessarie.
4361
4362 \itindend{race~condition}
4363 \itindend{deadlock}
4364
4365
4366 \subsection{Le funzioni rientranti}
4367 \label{sec:proc_reentrant}
4368
4369 \index{funzioni!rientranti|(}
4370
4371 Si dice \textsl{rientrante} una funzione che può essere interrotta in
4372 qualunque punto della sua esecuzione ed essere chiamata una seconda volta da
4373 un altro \textit{thread} di esecuzione senza che questo comporti nessun
4374 problema nell'esecuzione della stessa. La problematica è comune nella
4375 programmazione \textit{multi-thread}, ma si hanno gli stessi problemi quando
4376 si vogliono chiamare delle funzioni all'interno dei gestori dei segnali.
4377
4378 Fintanto che una funzione opera soltanto con le variabili locali è rientrante;
4379 queste infatti vengono allocate nello \textit{stack}, ed un'altra invocazione
4380 non fa altro che allocarne un'altra copia. Una funzione può non essere
4381 rientrante quando opera su memoria che non è nello \textit{stack}.  Ad esempio
4382 una funzione non è mai rientrante se usa una variabile globale o statica.
4383
4384 Nel caso invece la funzione operi su un oggetto allocato dinamicamente, la
4385 cosa viene a dipendere da come avvengono le operazioni: se l'oggetto è creato
4386 ogni volta e ritornato indietro la funzione può essere rientrante, se invece
4387 esso viene individuato dalla funzione stessa due chiamate alla stessa funzione
4388 potranno interferire quando entrambe faranno riferimento allo stesso oggetto.
4389 Allo stesso modo una funzione può non essere rientrante se usa e modifica un
4390 oggetto che le viene fornito dal chiamante: due chiamate possono interferire
4391 se viene passato lo stesso oggetto; in tutti questi casi occorre molta cura da
4392 parte del programmatore.
4393
4394 In genere le funzioni di libreria non sono rientranti, molte di esse ad
4395 esempio utilizzano variabili statiche, la \acr{glibc} però mette a
4396 disposizione due macro di compilatore, \macro{\_REENTRANT} e
4397 \macro{\_THREAD\_SAFE}, la cui definizione attiva le versioni rientranti di
4398 varie funzioni di libreria, che sono identificate aggiungendo il suffisso
4399 \code{\_r} al nome della versione normale.
4400
4401 \index{funzioni!rientranti|)}
4402
4403
4404 % LocalWords:  multitasking like VMS child process identifier pid sez shell fig
4405 % LocalWords:  parent kernel init pstree keventd kswapd table struct linux call
4406 % LocalWords:  nell'header scheduler system interrupt timer HZ asm Hertz clock
4407 % LocalWords:  l'alpha tick fork wait waitpid exit exec image glibc int pgid ps
4408 % LocalWords:  sid thread Ingo Molnar ppid getpid getppid sys unistd LD threads
4409 % LocalWords:  void tempnam pathname sibling cap errno EAGAIN ENOMEM
4410 % LocalWords:  stack read only copy write tab client spawn forktest sleep PATH
4411 % LocalWords:  source LIBRARY scheduling race condition printf descriptor dup
4412 % LocalWords:  close group session tms lock vfork execve BSD stream main abort
4413 % LocalWords:  SIGABRT SIGCHLD SIGHUP foreground SIGCONT termination signal ANY
4414 % LocalWords:  handler kill EINTR POSIX options WNOHANG ECHILD option WUNTRACED
4415 % LocalWords:  dump bits rusage getrusage heap const filename argv envp EACCES
4416 % LocalWords:  filesystem noexec EPERM suid sgid root nosuid ENOEXEC ENOENT ELF
4417 % LocalWords:  ETXTBSY EINVAL ELIBBAD BIG EFAULT EIO ENAMETOOLONG ELOOP ENOTDIR
4418 % LocalWords:  ENFILE EMFILE argc execl path execv execle execlp execvp vector
4419 % LocalWords:  list environ NULL umask utime cutime ustime fcntl linker
4420 % LocalWords:  opendir libc interpreter FreeBSD capabilities mandatory access
4421 % LocalWords:  control MAC SELinux security modules LSM superuser uid gid saved
4422 % LocalWords:  effective euid egid dell' fsuid fsgid getuid geteuid getgid SVr
4423 % LocalWords:  getegid IDS NFS setuid setgid all' logout utmp screen xterm TODO
4424 % LocalWords:  setreuid setregid FIXME ruid rgid seteuid setegid setresuid size
4425 % LocalWords:  setresgid getresuid getresgid value result argument setfsuid DAC
4426 % LocalWords:  setfsgid NGROUPS sysconf getgroups getgrouplist groups ngroups
4427 % LocalWords:  setgroups initgroups patch LIDS CHOWN OVERRIDE Discrectionary PF
4428 % LocalWords:  SEARCH chattr sticky NOATIME socket domain immutable append mmap
4429 % LocalWords:  broadcast multicast multicasting memory locking mlock mlockall
4430 % LocalWords:  shmctl ioperm iopl chroot ptrace accounting swap reboot hangup
4431 % LocalWords:  vhangup mknod lease permitted inherited inheritable bounding AND
4432 % LocalWords:  capability capget capset header ESRCH undef version obj clear PT
4433 % LocalWords:  pag ssize length proc capgetp preemptive cache runnable  contest
4434 % LocalWords:  SIGSTOP soft slice nice niceness counter which SC switch side
4435 % LocalWords:  getpriority who setpriority RTLinux RTAI Adeos fault FIFO  COUNT
4436 % LocalWords:  yield Robin setscheduler policy param OTHER priority setparam to
4437 % LocalWords:  min getparam getscheduler interval robin ENOSYS fifo ping long
4438 % LocalWords:  affinity setaffinity unsigned mask cpu NUMA CLR ISSET SETSIZE RR
4439 % LocalWords:  getaffinity assembler deadlock REENTRANT SAFE tgz MYPGRP l'OR rr
4440 % LocalWords:  WIFEXITED WEXITSTATUS WIFSIGNALED WTERMSIG WCOREDUMP WIFSTOPPED
4441 % LocalWords:  WSTOPSIG opt char INTERP arg SIG IGN DFL mascheck grp FOWNER RAW
4442 % LocalWords:  FSETID SETPCAP BIND SERVICE ADMIN PACKET IPC OWNER MODULE RAWIO
4443 % LocalWords:  PACCT RESOURCE TTY CONFIG SETFCAP hdrp datap libcap lcap text tp
4444 % LocalWords:  get ncap caps CapInh CapPrm fffffeff CapEff getcap STAT dall'I
4445 % LocalWords:  inc PRIO SUSv PRGR prio SysV SunOS Ultrix sched timespec len sig
4446 % LocalWords:  cpusetsize cpuset atomic tickless redirezione WCONTINUED stopped
4447 % LocalWords:  waitid NOCLDSTOP ENOCHLD WIFCONTINUED ifdef endif idtype siginfo
4448 % LocalWords:  infop ALL WEXITED WSTOPPED WNOWAIT signo CLD EXITED KILLED page
4449 % LocalWords:  CONTINUED sources forking Spawned successfully executing exiting
4450 % LocalWords:  next cat for COMMAND pts bash defunct TRAPPED DUMPED PR effects
4451 % LocalWords:  SIGKILL static RLIMIT preemption PREEMPT VOLUNTARY IDLE RTPRIO
4452 % LocalWords:  completely fair compat uniform CFQ queuing elevator dev cfq RT
4453 % LocalWords:  documentation block syscall ioprio IPRIO CLASS class best effort
4454 % LocalWords:  refresh semop dnotify MADV DONTFORK prctl WCLONE WALL big mount
4455 % LocalWords:  WNOTHREAD DUMPABLE KEEPCAPS IRIX CAPBSET endianness endian flags
4456 % LocalWords:  little PPC PowerPC FPEMU NOPRINT SIGFPE FPEXC point FP SW malloc
4457 % LocalWords:  exception EXC ENABLE OVF overflow UND underflow RES INV DISABLED
4458 % LocalWords:  NONRECOV ASYNC KEEP securebits NAME NUL PDEATHSIG SECCOMP VM FS
4459 % LocalWords:  secure computing sigreturn TIMING STATISTICAL TSC MCE conditions
4460 % LocalWords:  timestamp Stamp SIGSEGV UNALIGN SIGBUS MCEERR AO failure early
4461 % LocalWords:  namespace vsyscall SETTID FILES NEWIPC NEWNET NEWNS NEWPID ptid
4462 % LocalWords:  NEWUTS SETTLS SIGHAND SYSVSEM UNTRACED tls ctid CLEARTID panic
4463 % LocalWords:  loader EISDIR SIGTRAP uninterrutible killable EQUAL sizeof XOR
4464 % LocalWords:  destset srcset ALLOC num cpus setsize emacs pager getty TID
4465
4466 %%% Local Variables:
4467 %%% mode: latex
4468 %%% TeX-master: "gapil"
4469 %%% End: