cd67422efa01678ba5381ef41c64a0b1f11860d2
[gapil.git] / prochand.tex
1 %% prochand.tex
2 %%
3 %% Copyright (C) 2000-2015 by Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione dei processi}
13 \label{cha:process_handling}
14
15 Come accennato nell'introduzione in un sistema unix-like tutte le operazioni
16 vengono svolte tramite opportuni processi.  In sostanza questi ultimi vengono
17 a costituire l'unità base per l'allocazione e l'uso delle risorse del sistema.
18
19 Nel precedente capitolo abbiamo esaminato il funzionamento di un processo come
20 unità a se stante, in questo esamineremo il funzionamento dei processi
21 all'interno del sistema. Saranno cioè affrontati i dettagli della creazione e
22 della terminazione dei processi, della gestione dei loro attributi e
23 privilegi, e di tutte le funzioni a questo connesse. Infine nella sezione
24 finale introdurremo alcune problematiche generiche della programmazione in
25 ambiente multitasking.
26
27
28 \section{Le funzioni di base della gestione dei processi}
29 \label{sec:proc_handling}
30
31 In questa sezione tratteremo le problematiche della gestione dei processi
32 all'interno del sistema, illustrandone tutti i dettagli.  Inizieremo con una
33 panoramica dell'architettura dei processi, tratteremo poi le funzioni
34 elementari che permettono di leggerne gli identificatori, per poi passare alla
35 spiegazione delle funzioni base che si usano per la creazione e la
36 terminazione dei processi, e per la messa in esecuzione degli altri programmi.
37
38
39 \subsection{L'architettura della gestione dei processi}
40 \label{sec:proc_hierarchy}
41
42 A differenza di quanto avviene in altri sistemi, ad esempio nel VMS la
43 generazione di nuovi processi è un'operazione privilegiata, una delle
44 caratteristiche fondanti di Unix, che esamineremo in dettaglio più avanti, è
45 che qualunque processo può a sua volta generarne altri. Ogni processo è
46 identificato presso il sistema da un numero univoco, il cosiddetto
47 \itindex{Process~ID~(PID)} \textit{Process ID} o, più brevemente, \ids{PID},
48 assegnato in forma progressiva (vedi sez.~\ref{sec:proc_pid}) quando il
49 processo viene creato.
50
51 Una seconda caratteristica di un sistema unix-like è che la generazione di un
52 processo è un'operazione separata rispetto al lancio di un programma. In
53 genere la sequenza è sempre quella di creare un nuovo processo, il quale
54 eseguirà, in un passo successivo, il programma desiderato: questo è ad esempio
55 quello che fa la shell quando mette in esecuzione il programma che gli
56 indichiamo nella linea di comando.
57
58 Una terza caratteristica del sistema è che ogni processo è sempre stato
59 generato da un altro processo, il processo generato viene chiamato
60 \textit{processo figlio} (\textit{child process}) mentre quello che lo ha
61 viene chiamato \textsl{processo padre} (\textit{parent process}). Questo vale
62 per tutti i processi, con una sola eccezione, dato che ci deve essere un punto
63 di partenza esiste un processo speciale (che normalmente è \cmd{/sbin/init}),
64 che come abbiamo accennato in sez.~\ref{sec:intro_kern_and_sys} viene lanciato
65 dal kernel alla conclusione della fase di avvio. Essendo questo il primo
66 processo lanciato dal sistema ha sempre il \ids{PID} uguale a 1 e non è figlio
67 di nessun altro processo.
68
69 Ovviamente \cmd{init} è un processo speciale che in genere si occupa di far
70 partire tutti gli altri processi necessari al funzionamento del sistema,
71 inoltre \cmd{init} è essenziale per svolgere una serie di compiti
72 amministrativi nelle operazioni ordinarie del sistema (torneremo su alcuni di
73 essi in sez.~\ref{sec:proc_termination}) e non può mai essere terminato. La
74 struttura del sistema comunque consente di lanciare al posto di \cmd{init}
75 qualunque altro programma, e in casi di emergenza (ad esempio se il file di
76 \cmd{init} si fosse corrotto) è ad esempio possibile lanciare una shell al suo
77 posto.\footnote{la cosa si fa passando la riga \cmd{init=/bin/sh} come
78   parametro di avvio del kernel, l'argomento è di natura sistemistica e
79   trattato in sez.~5.3 di \cite{AGL}.}
80
81 \begin{figure}[!htb]
82   \footnotesize
83 \begin{Console}
84 [piccardi@gont piccardi]$ \textbf{pstree -n} 
85 init-+-keventd
86      |-kapm-idled
87      |-kreiserfsd
88      |-portmap
89      |-syslogd
90      |-klogd
91      |-named
92      |-rpc.statd
93      |-gpm
94      |-inetd
95      |-junkbuster
96      |-master-+-qmgr
97      |        `-pickup
98      |-sshd
99      |-xfs
100      |-cron
101      |-bash---startx---xinit-+-XFree86
102      |                       `-WindowMaker-+-ssh-agent
103      |                                     |-wmtime
104      |                                     |-wmmon
105      |                                     |-wmmount
106      |                                     |-wmppp
107      |                                     |-wmcube
108      |                                     |-wmmixer
109      |                                     |-wmgtemp
110      |                                     |-wterm---bash---pstree
111      |                                     `-wterm---bash-+-emacs
112      |                                                    `-man---pager
113      |-5*[getty]
114      |-snort
115      `-wwwoffled
116 \end{Console}
117 %$
118   \caption{L'albero dei processi, così come riportato dal comando
119     \cmd{pstree}.}
120   \label{fig:proc_tree}
121 \end{figure}
122
123 Dato che tutti i processi attivi nel sistema sono comunque generati da
124 \cmd{init} o da uno dei suoi figli si possono classificare i processi con la
125 relazione padre/figlio in un'organizzazione gerarchica ad albero. In
126 fig.~\ref{fig:proc_tree} si è mostrato il risultato del comando \cmd{pstree}
127 che permette di visualizzare questa struttura, alla cui base c'è \cmd{init}
128 che è progenitore di tutti gli altri processi.\footnote{in realtà questo non è
129   del tutto vero, in Linux, specialmente nelle versioni più recenti del
130   kernel, ci sono alcuni processi speciali (come \cmd{keventd}, \cmd{kswapd},
131   ecc.) che pur comparendo nei comandi come figli di \cmd{init}, o con
132   \ids{PID} successivi ad uno, sono in realtà processi interni al kernel e che
133   non rientrano in questa classificazione.}
134
135 Il kernel mantiene una tabella dei processi attivi, la cosiddetta
136 \itindex{process~table} \textit{process table}. Per ciascun processo viene
137 mantenuta una voce in questa tabella, costituita da una struttura
138 \kstruct{task\_struct}, che contiene tutte le informazioni rilevanti per quel
139 processo. Tutte le strutture usate a questo scopo sono dichiarate
140 nell'\textit{header file} \file{linux/sched.h}, ed uno schema semplificato,
141 che riporta la struttura delle principali informazioni contenute nella
142 \struct{task\_struct} (che in seguito incontreremo a più riprese), è mostrato
143 in fig.~\ref{fig:proc_task_struct}.
144
145 \begin{figure}[!htb]
146   \centering \includegraphics[width=14cm]{img/task_struct}
147   \caption{Schema semplificato dell'architettura delle strutture usate dal
148     kernel nella gestione dei processi.}
149   \label{fig:proc_task_struct}
150 \end{figure}
151
152 % TODO la task_struct è cambiata per qualche dettaglio vedi anche
153 % http://www.ibm.com/developerworks/linux/library/l-linux-process-management/
154 % TODO completare la parte su quando viene chiamato lo scheduler.
155
156 \itindbeg{scheduler}
157
158 Come accennato in sez.~\ref{sec:intro_unix_struct} è lo \textit{scheduler} che
159 decide quale processo mettere in esecuzione; esso viene eseguito in occasione
160 di dell'invocazione di ogni \textit{system call} ed per ogni interrupt
161 dall'hardware oltre che in una serie di altre occasioni, e può essere anche
162 attivato esplicitamente. Il timer di sistema provvede comunque a che esso sia
163 invocato periodicamente, generando un interrupt periodico secondo una
164 frequenza predeterminata, specificata dalla costante \const{HZ} del kernel
165 (torneremo su questo argomento in sez.~\ref{sec:sys_unix_time}), che assicura
166 che lo \textit{scheduler} venga comunque eseguito ad intervalli regolari e
167 possa prendere le sue decisioni.
168
169 A partire dal kernel 2.6.21 è stato introdotto anche un meccanismo
170 completamente diverso, detto \textit{tickless}, in cui non c'è più una
171 interruzione periodica con frequenza prefissata, ma ad ogni chiamata del timer
172 viene programmata l'interruzione successiva sulla base di una stima; in questo
173 modo si evita di dover eseguire un migliaio di interruzioni al secondo anche
174 su macchine che non stanno facendo nulla, con un forte risparmio nell'uso
175 dell'energia da parte del processore che può essere messo in stato di
176 sospensione anche per lunghi periodi di tempo.
177
178 Indipendentemente dalle motivazioni per cui questo avviene, ogni volta che
179 viene eseguito lo \textit{scheduler} effettua il calcolo delle priorità dei
180 vari processi attivi (torneremo su questo in sez.~\ref{sec:proc_priority}) e
181 stabilisce quale di essi debba essere posto in esecuzione fino alla successiva
182 invocazione.
183
184 \itindend{scheduler}
185
186 \subsection{Gli identificatori dei processi}
187 \label{sec:proc_pid}
188
189 Come accennato nella sezione precedente ogni processo viene identificato dal
190 sistema da un numero identificativo univoco, il \textit{process ID} o
191 \ids{PID}. Questo è un tipo di dato standard, \type{pid\_t} che in genere è un
192 intero con segno (nel caso di Linux e della \acr{glibc} il tipo usato è
193 \ctyp{int}).
194
195 Il \ids{PID} viene assegnato in forma progressiva ogni volta che un nuovo
196 processo viene creato,\footnote{in genere viene assegnato il numero successivo
197   a quello usato per l'ultimo processo creato, a meno che questo numero non
198   sia già utilizzato per un altro \ids{PID}, \acr{pgid} o \acr{sid} (vedi
199   sez.~\ref{sec:sess_proc_group}).} fino ad un limite che, essendo il
200 tradizionalmente il \ids{PID} un numero positivo memorizzato in un intero a 16
201 bit, arriva ad un massimo di 32768.  Oltre questo valore l'assegnazione
202 riparte dal numero più basso disponibile a partire da un minimo di
203 300,\footnote{questi valori, fino al kernel 2.4.x, erano definiti dalla macro
204   \const{PID\_MAX} nei file \file{threads.h} e \file{fork.c} dei sorgenti del
205   kernel, con il 2.6.x e la nuova interfaccia per i \itindex{thread}
206   \textit{thread} anche il meccanismo di allocazione dei \ids{PID} è stato
207   modificato ed il valore massimo è impostabile attraverso il file
208   \sysctlfile{kernel/pid\_max} e di default vale 32768.} che serve a
209 riservare i \ids{PID} più bassi ai processi eseguiti direttamente dal kernel.
210 Per questo motivo, come visto in sez.~\ref{sec:proc_hierarchy}, il processo di
211 avvio (\cmd{init}) ha sempre il \ids{PID} uguale a uno.
212
213 Tutti i processi inoltre memorizzano anche il \ids{PID} del genitore da cui
214 sono stati creati, questo viene chiamato in genere \ids{PPID} (da
215 \itindex{Parent~Process~ID~(PPID)} \textit{Parent Process ID}).  Questi due
216 identificativi possono essere ottenuti usando le due funzioni di sistema
217 \funcd{getpid} e \funcd{getppid}, i cui prototipi sono:
218
219 \begin{funcproto}{ 
220 \fhead{sys/types.h}
221 \fhead{unistd.h}
222 \fdecl{pid\_t getpid(void)}
223 \fdesc{Restituisce il \ids{PID} del processo corrente..} 
224 \fdecl{pid\_t getppid(void)}
225 \fdesc{Restituisce il \ids{PID} del padre del processo corrente.} 
226 }
227 {Entrambe le funzioni non riportano condizioni di errore.}   
228 \end{funcproto}
229
230 \noindent esempi dell'uso di queste funzioni sono riportati in
231 fig.~\ref{fig:proc_fork_code}, nel programma \file{fork\_test.c}.
232
233 Il fatto che il \ids{PID} sia un numero univoco per il sistema lo rende un
234 candidato per generare ulteriori indicatori associati al processo di cui
235 diventa possibile garantire l'unicità: ad esempio in alcune implementazioni la
236 funzione \func{tempnam} (si veda sez.~\ref{sec:file_temp_file}) usa il
237 \ids{PID} per generare un \textit{pathname} univoco, che non potrà essere
238 replicato da un altro processo che usi la stessa funzione. Questo utilizzo
239 però può risultare pericoloso, un \ids{PID} infatti è univoco solo fintanto
240 che un processo è attivo, una volta terminato esso potrà essere riutilizzato
241 da un processo completamente diverso, e di questo bisogna essere ben
242 consapevoli.
243
244 Tutti i processi figli dello stesso processo padre sono detti
245 \textit{sibling}, questa è una delle relazioni usate nel \textsl{controllo di
246   sessione}, in cui si raggruppano i processi creati su uno stesso terminale,
247 o relativi allo stesso login. Torneremo su questo argomento in dettaglio in
248 cap.~\ref{cha:session}, dove esamineremo gli altri identificativi associati ad
249 un processo e le varie relazioni fra processi utilizzate per definire una
250 sessione.
251
252 Oltre al \ids{PID} e al \ids{PPID}, e a quelli che vedremo in
253 sez.~\ref{sec:sess_proc_group}, relativi al controllo di sessione, ad ogni
254 processo vengono associati degli ulteriori identificatori ed in particolare
255 quelli che vengono usati per il controllo di accesso.  Questi servono per
256 determinare se un processo può eseguire o meno le operazioni richieste, a
257 seconda dei privilegi e dell'identità di chi lo ha posto in esecuzione;
258 l'argomento è complesso e sarà affrontato in dettaglio in
259 sez.~\ref{sec:proc_perms}.
260
261
262 \subsection{La funzione \func{fork} e le funzioni di creazione dei processi}
263 \label{sec:proc_fork}
264
265 La funzione di sistema \funcd{fork} è la funzione fondamentale della gestione
266 dei processi: come si è detto tradizionalmente l'unico modo di creare un nuovo
267 processo era attraverso l'uso di questa funzione,\footnote{in realtà oggi la
268   \textit{system call} usata da Linux per creare nuovi processi è \func{clone}
269   (vedi \ref{sec:process_clone}), anche perché a partire dalla \acr{glibc}
270   2.3.3 non viene più usata la \textit{system call} originale, ma la stessa
271   \func{fork} viene implementata tramite \func{clone}, cosa che consente una
272   migliore interazione coi \textit{thread}.} essa quindi riveste un ruolo
273 centrale tutte le volte che si devono scrivere programmi che usano il
274 multitasking.\footnote{oggi questa rilevanza, con la diffusione dell'uso dei
275   \textit{thread} che tratteremo al cap.~\ref{cha:threads}, è in parte minore,
276   ma \func{fork} resta comunque la funzione principale per la creazione di
277   processi.} Il prototipo della funzione è:
278
279 \begin{funcproto}{ 
280 \fhead{unistd.h}
281 \fdecl{pid\_t fork(void)}
282 \fdesc{Crea un nuovo processo.} 
283 }
284 {La funzione ritorna il \ids{PID} del figlio al padre e $0$ al figlio in caso 
285   di successo e $-1$ al padre senza creare il figlio per un errore,
286   nel qual caso \var{errno} assumerà uno dei valori: 
287   \begin{errlist}
288   \item[\errcode{EAGAIN}] non ci sono risorse sufficienti per creare un altro
289     processo (per allocare la tabella delle pagine e le strutture del task) o
290     si è esaurito il numero di processi disponibili.
291   \item[\errcode{ENOMEM}] non è stato possibile allocare la memoria per le
292     strutture necessarie al kernel per creare il nuovo processo.
293   \end{errlist}}
294 \end{funcproto}
295
296 Dopo il successo dell'esecuzione di una \func{fork} sia il processo padre che
297 il processo figlio continuano ad essere eseguiti normalmente a partire
298 dall'istruzione successiva alla \func{fork}. Il processo figlio è una copia del
299 padre, e riceve una copia dei \index{segmento!testo} segmenti di testo,
300 \index{segmento!dati} dati e dello \itindex{stack} \textit{stack} (vedi
301 sez.~\ref{sec:proc_mem_layout}), ed esegue esattamente lo stesso codice del
302 padre. Si tenga presente però che la memoria è copiata e non condivisa,
303 pertanto padre e figlio vedranno variabili diverse e le eventuali modifiche
304 saranno totalmente indipendenti.
305
306 Per quanto riguarda la gestione della memoria, in generale il
307 \index{segmento!testo} segmento di testo, che è identico per i due processi, è
308 condiviso e tenuto in sola lettura per il padre e per i figli. Per gli altri
309 segmenti Linux utilizza la tecnica del \itindex{copy~on~write} \textit{copy on
310   write}. Questa tecnica comporta che una pagina di memoria viene
311 effettivamente copiata per il nuovo processo solo quando ci viene effettuata
312 sopra una scrittura, e si ha quindi una reale differenza fra padre e figlio.
313 In questo modo si rende molto più efficiente il meccanismo della creazione di
314 un nuovo processo, non essendo più necessaria la copia di tutto lo spazio
315 degli indirizzi virtuali del padre, ma solo delle pagine di memoria che sono
316 state modificate, e solo al momento della modifica stessa.
317
318 La differenza che si ha nei due processi è che nel processo padre il valore di
319 ritorno della funzione \func{fork} è il \ids{PID} del processo figlio, mentre
320 nel figlio è zero; in questo modo il programma può identificare se viene
321 eseguito dal padre o dal figlio.  Si noti come la funzione \func{fork} ritorni
322 due volte, una nel padre e una nel figlio.
323
324 La scelta di questi valori di ritorno non è casuale, un processo infatti può
325 avere più figli, ed il valore di ritorno di \func{fork} è l'unico modo che gli
326 permette di identificare quello appena creato. Al contrario un figlio ha
327 sempre un solo padre, il cui \ids{PID} può sempre essere ottenuto con
328 \func{getppid}, come spiegato in sez.~\ref{sec:proc_pid}, per cui si usa il
329 valore nullo, che non è il \ids{PID} di nessun processo.
330
331 Normalmente la chiamata a \func{fork} può fallire solo per due ragioni: o ci
332 sono già troppi processi nel sistema, il che di solito è sintomo che
333 qualcos'altro non sta andando per il verso giusto, o si è ecceduto il limite
334 sul numero totale di processi permessi all'utente, argomento che tratteremo in
335 dettaglio in sez.~\ref{sec:sys_resource_limit}.
336
337 L'uso di \func{fork} avviene secondo due modalità principali; la prima è
338 quella in cui all'interno di un programma si creano processi figli cui viene
339 affidata l'esecuzione di una certa sezione di codice, mentre il processo padre
340 ne esegue un'altra. È il caso tipico dei programmi server (il modello
341 \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}) in cui il
342 padre riceve ed accetta le richieste da parte dei programmi client, per
343 ciascuna delle quali pone in esecuzione un figlio che è incaricato di fornire
344 il servizio.
345
346 La seconda modalità è quella in cui il processo vuole eseguire un altro
347 programma; questo è ad esempio il caso della shell. In questo caso il processo
348 crea un figlio la cui unica operazione è quella di fare una \func{exec} (di
349 cui parleremo in sez.~\ref{sec:proc_exec}) subito dopo la \func{fork}.
350
351 Alcuni sistemi operativi (il VMS ad esempio) combinano le operazioni di questa
352 seconda modalità (una \func{fork} seguita da una \func{exec}) in un'unica
353 operazione che viene chiamata \textit{spawn}. Nei sistemi unix-like è stato
354 scelto di mantenere questa separazione, dato che, come per la prima modalità
355 d'uso, esistono numerosi scenari in cui si può usare una \func{fork} senza
356 aver bisogno di eseguire una \func{exec}. 
357
358 Inoltre, anche nel caso della seconda modalità d'uso, avere le due funzioni
359 separate permette al figlio di cambiare alcune caratteristiche del processo
360 (maschera dei segnali, redirezione dell'output, utente per conto del cui viene
361 eseguito, e molto altro su cui torneremo in seguito) prima della \func{exec},
362 rendendo così relativamente facile intervenire sulle le modalità di esecuzione
363 del nuovo programma.
364
365 \begin{figure}[!htb]
366   \footnotesize \centering
367   \begin{minipage}[c]{\codesamplewidth}
368   \includecodesample{listati/fork_test.c}
369   \end{minipage}
370   \normalsize
371   \caption{Esempio di codice per la creazione di nuovi processi (da
372     \file{fork\_test.c}).}
373   \label{fig:proc_fork_code}
374 \end{figure}
375
376 In fig.~\ref{fig:proc_fork_code} è riportato il corpo del codice del programma
377 di esempio \cmd{forktest}, che permette di illustrare molte caratteristiche
378 dell'uso della funzione \func{fork}. Il programma crea un numero di figli
379 specificato da linea di comando, e prende anche alcune opzioni per indicare
380 degli eventuali tempi di attesa in secondi (eseguiti tramite la funzione
381 \func{sleep}) per il padre ed il figlio (con \cmd{forktest -h} si ottiene la
382 descrizione delle opzioni). Il codice completo, compresa la parte che gestisce
383 le opzioni a riga di comando, è disponibile nel file \file{fork\_test.c},
384 distribuito insieme agli altri sorgenti degli esempi su
385 \url{http://gapil.truelite.it/gapil_source.tgz}.
386
387 Decifrato il numero di figli da creare, il ciclo principale del programma
388 (\texttt{\small 24-40}) esegue in successione la creazione dei processi figli
389 controllando il successo della chiamata a \func{fork} (\texttt{\small
390   25-29}); ciascun figlio (\texttt{\small 31-34}) si limita a stampare il
391 suo numero di successione, eventualmente attendere il numero di secondi
392 specificato e scrivere un messaggio prima di uscire. Il processo padre invece
393 (\texttt{\small 36-38}) stampa un messaggio di creazione, eventualmente
394 attende il numero di secondi specificato, e procede nell'esecuzione del ciclo;
395 alla conclusione del ciclo, prima di uscire, può essere specificato un altro
396 periodo di attesa.
397
398 Se eseguiamo il comando, che è preceduto dall'istruzione \code{export
399   LD\_LIBRARY\_PATH=./} per permettere l'uso delle librerie dinamiche, senza
400 specificare attese (come si può notare in (\texttt{\small 17-19}) i valori
401 predefiniti specificano di non attendere), otterremo come risultato sul
402 terminale:
403 \begin{Console}
404 [piccardi@selidor sources]$ \textbf{export LD_LIBRARY_PATH=./; ./forktest 3}
405 Process 1963: forking 3 child
406 Spawned 1 child, pid 1964 
407 Child 1 successfully executing
408 Child 1, parent 1963, exiting
409 Go to next child 
410 Spawned 2 child, pid 1965 
411 Child 2 successfully executing
412 Child 2, parent 1963, exiting
413 Go to next child 
414 Child 3 successfully executing
415 Child 3, parent 1963, exiting
416 Spawned 3 child, pid 1966 
417 Go to next child 
418 \end{Console}
419 %$
420
421 Esaminiamo questo risultato: una prima conclusione che si può trarre è che non
422 si può dire quale processo fra il padre ed il figlio venga eseguito per primo
423 dopo la chiamata a \func{fork}; dall'esempio si può notare infatti come nei
424 primi due cicli sia stato eseguito per primo il padre (con la stampa del
425 \ids{PID} del nuovo processo) per poi passare all'esecuzione del figlio
426 (completata con i due avvisi di esecuzione ed uscita), e tornare
427 all'esecuzione del padre (con la stampa del passaggio al ciclo successivo),
428 mentre la terza volta è stato prima eseguito il figlio (fino alla conclusione)
429 e poi il padre.
430
431 In generale l'ordine di esecuzione dipenderà, oltre che dall'algoritmo di
432 \textit{scheduling} usato dal kernel, dalla particolare situazione in cui si
433 trova la macchina al momento della chiamata, risultando del tutto
434 impredicibile.  Eseguendo più volte il programma di prova e producendo un
435 numero diverso di figli, si sono ottenute situazioni completamente diverse,
436 compreso il caso in cui il processo padre ha eseguito più di una \func{fork}
437 prima che uno dei figli venisse messo in esecuzione.
438
439 Pertanto non si può fare nessuna assunzione sulla sequenza di esecuzione delle
440 istruzioni del codice fra padre e figli, né sull'ordine in cui questi potranno
441 essere messi in esecuzione. Se è necessaria una qualche forma di precedenza
442 occorrerà provvedere ad espliciti meccanismi di sincronizzazione, pena il
443 rischio di incorrere nelle cosiddette \itindex{race~condition} \textit{race
444   condition} (vedi sez.~\ref{sec:proc_race_cond}).
445
446 In realtà con l'introduzione dei kernel della serie 2.6 lo \textit{scheduler}
447 è stato modificato per eseguire sempre per primo il figlio.\footnote{i
448   risultati precedenti infatti sono stati ottenuti usando un kernel della
449   serie 2.4.}  Questa è una ottimizzazione adottata per evitare che il padre,
450 effettuando per primo una operazione di scrittura in memoria, attivasse il
451 meccanismo del \itindex{copy~on~write} \textit{copy on write}, operazione
452 inutile qualora il figlio venga creato solo per eseguire una \func{exec} su
453 altro programma che scarta completamente lo spazio degli indirizzi e rende
454 superflua la copia della memoria modificata dal padre. Eseguendo sempre per
455 primo il figlio la \func{exec} verrebbe effettuata subito, con la certezza di
456 utilizzare \itindex{copy~on~write} \textit{copy on write} solo quando
457 necessario.
458
459 Con il kernel 2.6.32 però il comportamento è stato nuovamente cambiato,
460 stavolta facendo eseguire per primo sempre il padre. Si è realizzato infatti
461 che l'eventualità prospettata per la scelta precedente era comunque molto
462 improbabile, mentre l'esecuzione immediata del padre presenta sempre il
463 vantaggio di poter utilizzare immediatamente tutti i dati che sono nella cache
464 della CPU e nella unità di gestione della memoria virtuale senza doverli
465 invalidare, cosa che per i processori moderni, che hanno linee di cache
466 interne molto profonde, avrebbe un forte impatto sulle prestazioni.
467
468 Allora anche se quanto detto in precedenza vale come comportamento effettivo
469 dei programmi soltanto per i kernel fino alla serie 2.4, per mantenere la
470 portabilità con altri kernel unix-like, e con i diversi comportamenti adottati
471 dalle Linux nelle versioni successive, è opportuno non fare affidamento su
472 nessun tipo comportamento predefinito e non dare per assunta l'esecuzione
473 preventiva del padre o del figlio.
474
475 Si noti poi come dopo la \func{fork}, essendo i segmenti di memoria utilizzati
476 dai singoli processi completamente indipendenti, le modifiche delle variabili
477 nei processi figli, come l'incremento di \var{i} in (\texttt{\small 31}), sono
478 visibili solo a loro, (ogni processo vede solo la propria copia della
479 memoria), e non hanno alcun effetto sul valore che le stesse variabili hanno
480 nel processo padre ed in eventuali altri processi figli che eseguano lo stesso
481 codice.
482
483 Un secondo aspetto molto importante nella creazione dei processi figli è
484 quello dell'interazione dei vari processi con i file. Ne parleremo qui anche
485 se buona parte dei concetti relativi ai file verranno trattati più avanti
486 (principalmente in sez.~\ref{sec:file_unix_interface}). Per illustrare meglio
487 quello che avviene si può redirigere su un file l'output del programma di
488 test, quello che otterremo è:
489 \begin{Console}
490 [piccardi@selidor sources]$ \textbf{./forktest 3 > output}
491 [piccardi@selidor sources]$ \textbf{cat output}
492 Process 1967: forking 3 child
493 Child 1 successfully executing
494 Child 1, parent 1967, exiting
495 Test for forking 3 child
496 Spawned 1 child, pid 1968 
497 Go to next child 
498 Child 2 successfully executing
499 Child 2, parent 1967, exiting
500 Test for forking 3 child
501 Spawned 1 child, pid 1968 
502 Go to next child 
503 Spawned 2 child, pid 1969 
504 Go to next child 
505 Child 3 successfully executing
506 Child 3, parent 1967, exiting
507 Test for forking 3 child
508 Spawned 1 child, pid 1968 
509 Go to next child 
510 Spawned 2 child, pid 1969 
511 Go to next child 
512 Spawned 3 child, pid 1970 
513 Go to next child 
514 \end{Console}
515 che come si vede è completamente diverso da quanto ottenevamo sul terminale.
516
517 Il comportamento delle varie funzioni di interfaccia con i file è analizzato
518 in gran dettaglio in sez.~\ref{sec:file_unix_interface} per l'interfaccia
519 nativa Unix ed in sez.~\ref{sec:files_std_interface} per la standardizzazione
520 adottata nelle librerie del linguaggio C e valida per qualunque sistema
521 operativo. 
522
523 Qui basta accennare che si sono usate le funzioni standard della libreria del
524 C che prevedono l'output bufferizzato. Il punto è che questa bufferizzazione
525 (che tratteremo in dettaglio in sez.~\ref{sec:file_buffering}) varia a seconda
526 che si tratti di un file su disco, in cui il buffer viene scaricato su disco
527 solo quando necessario, o di un terminale, in cui il buffer viene scaricato ad
528 ogni carattere di a capo.
529
530 Nel primo esempio allora avevamo che, essendovi un a capo nella stringa
531 stampata, ad ogni chiamata a \func{printf} il buffer veniva scaricato, per cui
532 le singole righe comparivano a video subito dopo l'esecuzione della
533 \func{printf}. Ma con la redirezione su file la scrittura non avviene più alla
534 fine di ogni riga e l'output resta nel buffer. 
535
536 Dato che ogni figlio riceve una copia della memoria del padre, esso riceverà
537 anche quanto c'è nel buffer delle funzioni di I/O, comprese le linee scritte
538 dal padre fino allora. Così quando il buffer viene scritto su disco all'uscita
539 del figlio, troveremo nel file anche tutto quello che il processo padre aveva
540 scritto prima della sua creazione. E alla fine del file (dato che in questo
541 caso il padre esce per ultimo) troveremo anche l'output completo del padre.
542
543 L'esempio ci mostra un altro aspetto fondamentale dell'interazione con i file,
544 valido anche per l'esempio precedente, ma meno evidente: il fatto cioè che non
545 solo processi diversi possono scrivere in contemporanea sullo stesso file
546 (l'argomento dell'accesso concorrente ai file è trattato in dettaglio in
547 sez.~\ref{sec:file_shared_access}), ma anche che, a differenza di quanto
548 avviene per le variabili in memoria, la posizione corrente sul file è
549 condivisa fra il padre e tutti i processi figli.
550
551 Quello che succede è che quando lo \textit{standard output}\footnote{si chiama
552   così il file su cui di default un programma scrive i suoi dati in uscita,
553   tratteremo l'argomento in dettaglio in sez.~\ref{sec:file_fd}.} del padre
554 viene rediretto come si è fatto nell'esempio, lo stesso avviene anche per
555 tutti i figli. La funzione \func{fork} infatti ha la caratteristica di
556 duplicare nei processi figli tutti i \textit{file descriptor} (vedi
557 sez.~\ref{sec:file_fd}) dei file aperti nel processo padre (allo stesso modo
558 in cui lo fa la funzione \func{dup}, trattata in sez.~\ref{sec:file_dup}), il
559 che comporta che padre e figli condividono le stesse voci della
560 \itindex{file~table} \textit{file table} (tratteremo in dettaglio questi
561 termini in sez.~\ref{sec:file_shared_access}) fra cui c'è anche la posizione
562 corrente nel file.
563
564 In questo modo se un processo scrive su un file aggiornerà la posizione
565 corrente sulla \itindex{file~table} \textit{file table}, e tutti gli altri
566 processi, che vedono la stessa \itindex{file~table} \textit{file table},
567 vedranno il nuovo valore. In questo modo si evita, in casi come quello appena
568 mostrato in cui diversi processi scrivono sullo stesso file, che l'output
569 successivo di un processo vada a sovrapporsi a quello dei precedenti: l'output
570 potrà risultare mescolato, ma non ci saranno parti perdute per via di una
571 sovrascrittura.
572
573 Questo tipo di comportamento è essenziale in tutti quei casi in cui il padre
574 crea un figlio e attende la sua conclusione per proseguire, ed entrambi
575 scrivono sullo stesso file. Un caso tipico di questo comportamento è la shell
576 quando lancia un programma.  In questo modo, anche se lo standard output viene
577 rediretto, il padre potrà sempre continuare a scrivere in coda a quanto
578 scritto dal figlio in maniera automatica; se così non fosse ottenere questo
579 comportamento sarebbe estremamente complesso necessitando di una qualche forma
580 di comunicazione fra i due processi per far riprendere al padre la scrittura
581 al punto giusto.
582
583 In generale comunque non è buona norma far scrivere più processi sullo stesso
584 file senza una qualche forma di sincronizzazione in quanto, come visto anche
585 con il nostro esempio, le varie scritture risulteranno mescolate fra loro in
586 una sequenza impredicibile. Per questo le modalità con cui in genere si usano
587 i file dopo una \func{fork} sono sostanzialmente due:
588 \begin{enumerate*}
589 \item Il processo padre aspetta la conclusione del figlio. In questo caso non
590   è necessaria nessuna azione riguardo ai file, in quanto la sincronizzazione
591   della posizione corrente dopo eventuali operazioni di lettura e scrittura
592   effettuate dal figlio è automatica.
593 \item L'esecuzione di padre e figlio procede indipendentemente. In questo caso
594   ciascuno dei due processi deve chiudere i file che non gli servono una volta
595   che la \func{fork} è stata eseguita, per evitare ogni forma di interferenza.
596 \end{enumerate*}
597
598 Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
599 proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
600 comune dopo l'esecuzione di una \func{fork} è la seguente:
601 \begin{itemize*}
602 \item i file aperti e gli eventuali flag di \textit{close-on-exec} impostati
603   (vedi sez.~\ref{sec:proc_exec} e sez.~\ref{sec:file_fcntl_ioctl});
604 \item gli identificatori per il controllo di accesso: l'\textsl{user-ID
605     reale}, il \textsl{group-ID reale}, l'\textsl{user-ID effettivo}, il
606   \textsl{group-ID effettivo} ed i \textsl{group-ID supplementari} (vedi
607   sez.~\ref{sec:proc_access_id});
608 \item gli identificatori per il controllo di sessione: il
609   \itindex{process~group} \textit{process group-ID} e il \textit{session id}
610   ed il terminale di controllo (vedi sez.~\ref{sec:sess_proc_group});
611 \item la \index{directory~di~lavoro} directory di lavoro e la directory radice
612   (vedi sez.~\ref{sec:file_work_dir} e sez.~\ref{sec:file_chroot});
613 \item la maschera dei permessi di creazione dei file (vedi
614   sez.~\ref{sec:file_perm_management});
615 \item la \index{maschera~dei~segnali} maschera dei segnali bloccati (vedi
616   sez.~\ref{sec:sig_sigmask}) e le azioni installate (vedi
617   sez.~\ref{sec:sig_gen_beha});
618 \item i segmenti di memoria condivisa agganciati al processo (vedi
619   sez.~\ref{sec:ipc_sysv_shm});
620 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
621 \item il valori di \textit{nice}, le priorità real-time e le affinità di
622   processore (vedi sez.~\ref{sec:proc_sched_stand},
623   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
624 \item le variabili di ambiente (vedi sez.~\ref{sec:proc_environ}).
625 \item l'insieme dei descrittori associati alle code di messaggi POSIX (vedi
626   sez.~\ref{sec:ipc_posix_mq}) che vengono copiate come i \textit{file
627     descriptor}, questo significa che entrambi condivideranno gli stessi flag.
628 \end{itemize*}
629
630 Oltre a quelle relative ad un diverso spazio degli indirizzi (e una memoria
631 totalmente indipendente) le differenze fra padre e figlio dopo l'esecuzione di
632 una \func{fork} invece sono:\footnote{a parte le ultime quattro, relative a
633   funzionalità specifiche di Linux, le altre sono esplicitamente menzionate
634   dallo standard POSIX.1-2001.}
635 \begin{itemize*}
636 \item il valore di ritorno di \func{fork};
637 \item il \ids{PID} (\textit{process id}), quello del figlio viene assegnato ad
638   un nuovo valore univoco;
639 \item il \ids{PPID} (\textit{parent process id}), quello del figlio viene
640   impostato al \ids{PID} del padre;
641 \item i valori dei tempi di esecuzione (vedi sez.~\ref{sec:sys_cpu_times}) e
642   delle risorse usate (vedi sez.~\ref{sec:sys_resource_use}), che nel figlio
643   sono posti a zero;
644 \item i \textit{lock} sui file (vedi sez.~\ref{sec:file_locking}) e sulla
645   memoria (vedi sez.~\ref{sec:proc_mem_lock}), che non vengono ereditati dal
646   figlio;
647 \item gli allarmi, i timer (vedi sez.~\ref{sec:sig_alarm_abort}) ed i segnali
648   pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che per il figlio vengono
649   cancellati.
650 \item le operazioni di I/O asincrono in corso (vedi
651   sez.~\ref{sec:file_asyncronous_io}) che non vengono ereditate dal figlio;
652 \item gli aggiustamenti fatti dal padre ai semafori con \func{semop} (vedi
653   sez.~\ref{sec:ipc_sysv_sem}).
654 \item le notifiche sui cambiamenti delle directory con \textit{dnotify} (vedi
655   sez.~\ref{sec:sig_notification}), che non vengono ereditate dal figlio;
656 \item le mappature di memoria marcate come \const{MADV\_DONTFORK} (vedi
657   sez.~\ref{sec:file_memory_map}) che non vengono ereditate dal figlio;
658 \item l'impostazione con \func{prctl} (vedi sez.~\ref{sec:process_prctl}) che
659   notifica al figlio la terminazione del padre viene cancellata se presente
660   nel padre;
661 \item il segnale di terminazione del figlio è sempre \signal{SIGCHLD} anche
662   qualora nel padre fosse stato modificato (vedi sez.~\ref{sec:process_clone}). 
663 \end{itemize*}
664
665 Una seconda funzione storica usata per la creazione di un nuovo processo è
666 \funcm{vfork}, che è esattamente identica a \func{fork} ed ha la stessa
667 semantica e gli stessi errori; la sola differenza è che non viene creata la
668 tabella delle pagine né la struttura dei task per il nuovo processo. Il
669 processo padre è posto in attesa fintanto che il figlio non ha eseguito una
670 \func{execve} o non è uscito con una \func{\_exit}. Il figlio condivide la
671 memoria del padre (e modifiche possono avere effetti imprevedibili) e non deve
672 ritornare o uscire con \func{exit} ma usare esplicitamente \func{\_exit}.
673
674 Questa funzione è un rimasuglio dei vecchi tempi in cui eseguire una
675 \func{fork} comportava anche la copia completa del segmento dati del processo
676 padre, che costituiva un inutile appesantimento in tutti quei casi in cui la
677 \func{fork} veniva fatta solo per poi eseguire una \func{exec}. La funzione
678 venne introdotta in BSD per migliorare le prestazioni.
679
680 Dato che Linux supporta il \itindex{copy~on~write} \textit{copy on write} la
681 perdita di prestazioni è assolutamente trascurabile, e l'uso di questa
682 funzione, che resta un caso speciale della \textit{system call} \func{clone}
683 (che tratteremo in dettaglio in sez.~\ref{sec:process_clone}) è deprecato; per
684 questo eviteremo di trattarla ulteriormente.
685
686
687 \subsection{La conclusione di un processo}
688 \label{sec:proc_termination}
689
690 In sez.~\ref{sec:proc_conclusion} abbiamo già affrontato le modalità con cui
691 chiudere un programma, ma dall'interno del programma stesso. Avendo a che fare
692 con un sistema \textit{multitasking} resta da affrontare l'argomento dal punto
693 di vista di come il sistema gestisce la conclusione dei processi.
694
695 Abbiamo visto in sez.~\ref{sec:proc_conclusion} le tre modalità con cui un
696 programma viene terminato in maniera normale: la chiamata di \func{exit}, che
697 esegue le funzioni registrate per l'uscita e chiude gli \textit{stream} e poi
698 esegue \func{\_exit}, il ritorno dalla funzione \code{main} equivalente alla
699 chiamata di \func{exit}, e la chiamata diretta a \func{\_exit}, che passa
700 direttamente alle operazioni di terminazione del processo da parte del kernel.
701
702 Ma abbiamo accennato che oltre alla conclusione normale esistono anche delle
703 modalità di conclusione anomala. Queste sono in sostanza due: il programma può
704 chiamare la funzione \func{abort} (vedi sez.~\ref{sec:sig_alarm_abort}) per
705 invocare una chiusura anomala, o essere terminato da un segnale (torneremo sui
706 segnali in cap.~\ref{cha:signals}).  In realtà anche la prima modalità si
707 riconduce alla seconda, dato che \func{abort} si limita a generare il segnale
708 \signal{SIGABRT}.
709
710 Qualunque sia la modalità di conclusione di un processo, il kernel esegue
711 comunque una serie di operazioni di terminazione: chiude tutti i file aperti,
712 rilascia la memoria che stava usando, e così via; l'elenco completo delle
713 operazioni eseguite alla chiusura di un processo è il seguente:
714 \begin{itemize*}
715 \item tutti i \textit{file descriptor} (vedi sez.~\ref{sec:file_fd}) sono
716   chiusi;
717 \item viene memorizzato lo stato di terminazione del processo;
718 \item ad ogni processo figlio viene assegnato un nuovo padre (in genere
719   \cmd{init});
720 \item viene inviato il segnale \signal{SIGCHLD} al processo padre (vedi
721   sez.~\ref{sec:sig_sigchld});
722 \item se il processo è un leader di sessione ed il suo terminale di controllo
723   è quello della sessione viene mandato un segnale di \signal{SIGHUP} a tutti i
724   processi del gruppo di \textit{foreground} e il terminale di controllo viene
725   disconnesso (vedi sez.~\ref{sec:sess_ctrl_term});
726 \item se la conclusione di un processo rende orfano un \textit{process
727     group} ciascun membro del gruppo viene bloccato, e poi gli vengono
728   inviati in successione i segnali \signal{SIGHUP} e \signal{SIGCONT}
729   (vedi ancora sez.~\ref{sec:sess_ctrl_term}).
730 \end{itemize*}
731
732 \itindbeg{termination~status} 
733
734 Oltre queste operazioni è però necessario poter disporre di un meccanismo
735 ulteriore che consenta di sapere come la terminazione è avvenuta: dato che in
736 un sistema unix-like tutto viene gestito attraverso i processi, il meccanismo
737 scelto consiste nel riportare lo \itindex{termination~status} \textsl{stato di
738   terminazione} (il cosiddetto \textit{termination status}) al processo padre.
739
740 Nel caso di conclusione normale, abbiamo visto in
741 sez.~\ref{sec:proc_conclusion} che lo stato di uscita del processo viene
742 caratterizzato tramite il valore del cosiddetto \textit{exit status}, cioè il
743 valore passato come argomento alle funzioni \func{exit} o \func{\_exit} o il
744 valore di ritorno per \code{main}.  Ma se il processo viene concluso in
745 maniera anomala il programma non può specificare nessun \textit{exit status},
746 ed è il kernel che deve generare autonomamente il \textit{termination status}
747 per indicare le ragioni della conclusione anomala.
748
749 Si noti la distinzione fra \textit{exit status} e \textit{termination status}:
750 quello che contraddistingue lo stato di chiusura del processo e viene
751 riportato attraverso le funzioni \func{wait} o \func{waitpid} (vedi
752 sez.~\ref{sec:proc_wait}) è sempre quest'ultimo; in caso di conclusione
753 normale il kernel usa il primo (nel codice eseguito da \func{\_exit}) per
754 produrre il secondo.
755
756 La scelta di riportare al padre lo stato di terminazione dei figli, pur
757 essendo l'unica possibile, comporta comunque alcune complicazioni: infatti se
758 alla sua creazione è scontato che ogni nuovo processo abbia un padre, non è
759 detto che sia così alla sua conclusione, dato che il padre potrebbe essere già
760 terminato; si potrebbe avere cioè quello che si chiama un processo
761 \textsl{orfano}.
762
763 Questa complicazione viene superata facendo in modo che il processo orfano
764 venga \textsl{adottato} da \cmd{init}, o meglio dal processo con \ids{PID} 1,
765 cioè quello lanciato direttamente dal kernel all'avvio, che sta alla base
766 dell'albero dei processi visto in sez.~\ref{sec:proc_hierarchy} e che anche
767 per questo motivo ha un ruolo essenziale nel sistema e non può mai
768 terminare.\footnote{almeno non senza un blocco completo del sistema, in caso
769   di terminazione o di non esecuzione di \cmd{init} infatti il kernel si
770   blocca con un cosiddetto \textit{kernel panic}, dato che questo è un errore
771   fatale.}
772
773 Come già accennato quando un processo termina, il kernel controlla se è il
774 padre di altri processi in esecuzione: in caso positivo allora il \ids{PPID}
775 di tutti questi processi verrà sostituito dal kernel con il \ids{PID} di
776 \cmd{init}, cioè con 1. In questo modo ogni processo avrà sempre un padre (nel
777 caso possiamo parlare di un padre \textsl{adottivo}) cui riportare il suo
778 stato di terminazione.  
779
780 Come verifica di questo comportamento possiamo eseguire il nostro programma
781 \cmd{forktest} imponendo a ciascun processo figlio due secondi di attesa prima
782 di uscire, il risultato è:
783 \begin{Console}
784 [piccardi@selidor sources]$ \textbf{./forktest -c2 3}
785 Process 1972: forking 3 child
786 Spawned 1 child, pid 1973 
787 Child 1 successfully executing
788 Go to next child 
789 Spawned 2 child, pid 1974 
790 Child 2 successfully executing
791 Go to next child 
792 Child 3 successfully executing
793 Spawned 3 child, pid 1975 
794 Go to next child 
795
796 [piccardi@selidor sources]$ Child 3, parent 1, exiting
797 Child 2, parent 1, exiting
798 Child 1, parent 1, exiting
799 \end{Console}
800 come si può notare in questo caso il processo padre si conclude prima dei
801 figli, tornando alla shell, che stampa il prompt sul terminale: circa due
802 secondi dopo viene stampato a video anche l'output dei tre figli che
803 terminano, e come si può notare in questo caso, al contrario di quanto visto
804 in precedenza, essi riportano 1 come \ids{PPID}.
805
806 Altrettanto rilevante è il caso in cui il figlio termina prima del padre,
807 perché non è detto che il padre possa ricevere immediatamente lo stato di
808 terminazione, quindi il kernel deve comunque conservare una certa quantità di
809 informazioni riguardo ai processi che sta terminando.
810
811 Questo viene fatto mantenendo attiva la voce nella tabella dei processi, e
812 memorizzando alcuni dati essenziali, come il \ids{PID}, i tempi di CPU usati
813 dal processo (vedi sez.~\ref{sec:sys_unix_time}) e lo stato di terminazione,
814 mentre la memoria in uso ed i file aperti vengono rilasciati immediatamente. 
815
816 I processi che sono terminati, ma il cui stato di terminazione non è stato
817 ancora ricevuto dal padre sono chiamati \itindex{zombie} \textit{zombie}, essi
818 restano presenti nella tabella dei processi ed in genere possono essere
819 identificati dall'output di \cmd{ps} per la presenza di una \texttt{Z} nella
820 colonna che ne indica lo stato (vedi tab.~\ref{tab:proc_proc_states}). Quando
821 il padre effettuerà la lettura dello stato di terminazione anche questa
822 informazione, non più necessaria, verrà scartata ed il processo potrà
823 considerarsi completamente concluso.
824
825 Possiamo utilizzare il nostro programma di prova per analizzare anche questa
826 condizione: lanciamo il comando \cmd{forktest} in \textit{background} (vedi
827 sez.~\ref{sec:sess_job_control}), indicando al processo padre di aspettare 10
828 secondi prima di uscire. In questo caso, usando \cmd{ps} sullo stesso
829 terminale (prima dello scadere dei 10 secondi) otterremo:
830 \begin{Console}
831 [piccardi@selidor sources]$ \textbf{ps T}
832   PID TTY      STAT   TIME COMMAND
833   419 pts/0    S      0:00 bash
834   568 pts/0    S      0:00 ./forktest -e10 3
835   569 pts/0    Z      0:00 [forktest <defunct>]
836   570 pts/0    Z      0:00 [forktest <defunct>]
837   571 pts/0    Z      0:00 [forktest <defunct>]
838   572 pts/0    R      0:00 ps T
839 \end{Console}
840 %$
841 e come si vede, dato che non si è fatto nulla per riceverne lo stato di
842 terminazione, i tre processi figli sono ancora presenti pur essendosi
843 conclusi, con lo stato di \itindex{zombie} \textit{zombie} e l'indicazione che
844 sono terminati (la scritta \texttt{defunct}).
845
846 La possibilità di avere degli \itindex{zombie} \textit{zombie} deve essere
847 tenuta sempre presente quando si scrive un programma che deve essere mantenuto
848 in esecuzione a lungo e creare molti processi figli. In questo caso si deve
849 sempre avere cura di far leggere al programma l'eventuale stato di uscita di
850 tutti i figli. Una modalità comune di farlo è attraverso l'utilizzo di un
851 apposito \textit{signal handler} che chiami la funzione \func{wait}, (vedi
852 sez.~\ref{sec:proc_wait}), ne esamineremo in dettaglio un esempio
853 (fig.~\ref{fig:sig_sigchld_handl}) in sez.~\ref{sec:sig_sigchld}.
854
855 La lettura degli stati di uscita è necessaria perché anche se gli
856 \itindex{zombie} \textit{zombie} non consumano risorse di memoria o
857 processore, occupano comunque una voce nella tabella dei processi e se li si
858 lasciano accumulare a lungo quest'ultima potrebbe esaurirsi, con la
859 conseguente impossibilità di lanciare nuovi processi.
860
861 Si noti tuttavia che quando un processo adottato da \cmd{init} termina, non
862 diviene mai uno \itindex{zombie} \textit{zombie}. Questo perché una delle
863 funzioni di \cmd{init} è appunto quella di chiamare la funzione \func{wait}
864 per i processi a cui fa da padre, completandone la terminazione. Questo è
865 quanto avviene anche quando, come nel caso del precedente esempio con
866 \cmd{forktest}, il padre termina con dei figli in stato di \itindex{zombie}
867 \textit{zombie}. Questi scompaiono quando, alla terminazione del padre dopo i
868 secondi programmati, tutti figli che avevamo generato, e che erano diventati
869 \itindex{zombie} \textit{zombie}, vengono adottati da \cmd{init}, il quale
870 provvede a completarne la terminazione.
871
872 Si tenga presente infine che siccome gli \itindex{zombie} \textit{zombie} sono
873 processi già terminati, non c'è modo di eliminarli con il comando \cmd{kill} o
874 inviandogli un qualunque segnale di terminazione (l'argomento è trattato in
875 sez.~\ref{sec:sig_termination}). Qualora ci si trovi in questa situazione
876 l'unica possibilità di cancellarli dalla tabella dei processi è quella di
877 terminare il processo che li ha generati e che non sta facendo il suo lavoro,
878 in modo che \cmd{init} possa adottarli e concluderne correttamente la
879 terminazione. 
880
881 Si tenga anche presente che la presenza di \textit{zombie} nella tabella dei
882 processi non è sempre indice di un qualche malfunzionamento, in una macchina
883 con molto carico infatti può esservi una presenza temporanea dovuta al fatto
884 che il processo padre ancora non ha avuto il tempo di gestirli. 
885
886 \subsection{Le funzioni di attesa e ricezione degli stati di uscita}
887 \label{sec:proc_wait}
888
889 Uno degli usi più comuni delle capacità multitasking di un sistema unix-like
890 consiste nella creazione di programmi di tipo server, in cui un processo
891 principale attende le richieste che vengono poi soddisfatte da una serie di
892 processi figli. 
893
894 Si è già sottolineato al paragrafo precedente come in questo caso diventi
895 necessario gestire esplicitamente la conclusione dei figli onde evitare di
896 riempire di \itindex{zombie} \textit{zombie} la tabella dei
897 processi. Tratteremo in questa sezione le funzioni di sistema deputate a
898 questo compito; la prima è \funcd{wait} ed il suo prototipo è:
899
900 \begin{funcproto}{ 
901 \fhead{sys/types.h}
902 \fhead{sys/wait.h}
903 \fdecl{pid\_t wait(int *status)}
904 \fdesc{Attende la terminazione di un processo.} 
905 }
906 {La funzione ritorna il \ids{PID} del figlio in caso di successo e $-1$ per un
907   errore, nel qual caso \var{errno} assumerà uno dei valori:
908   \begin{errlist}
909   \item[\errcode{ECHILD}] il processo non ha nessun figlio di cui attendere
910     uno stato di terminazione.
911   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
912   \end{errlist}}
913 \end{funcproto}
914
915 Questa funzione è presente fin dalle prime versioni di Unix ed è quella usata
916 tradizionalmente per attendere la terminazione dei figli. La funzione sospende
917 l'esecuzione del processo corrente e ritorna non appena un qualunque processo
918 figlio termina. Se un figlio è già terminato prima della sua chiamata la
919 funzione ritorna immediatamente, se più processi figli sono già terminati
920 occorrerà continuare a chiamare la funzione più volte fintanto che non si è
921 recuperato lo stato di terminazione di tutti quanti.
922
923 Al ritorno della funzione lo stato di terminazione del figlio viene salvato
924 (come \itindex{value~result~argument} \textit{value result argument}) nella
925 variabile puntata da \param{status} e tutte le risorse del kernel relative al
926 processo (vedi sez.~\ref{sec:proc_termination}) vengono rilasciate.  Nel caso
927 un processo abbia più figli il valore di ritorno della funzione sarà impostato
928 al \ids{PID} del processo di cui si è ricevuto lo stato di terminazione, cosa
929 che permette di identificare qual è il figlio che è terminato.
930
931 \itindend{termination~status} 
932
933 Questa funzione ha il difetto di essere poco flessibile, in quanto ritorna
934 all'uscita di un qualunque processo figlio. Nelle occasioni in cui è
935 necessario attendere la conclusione di uno specifico processo fra tutti quelli
936 esistenti occorre predisporre un meccanismo che tenga conto di tutti processi
937 che sono terminati, e provveda a ripetere la chiamata alla funzione nel caso
938 il processo cercato non risulti fra questi. Se infatti il processo cercato è
939 già terminato e se è già ricevuto lo stato di uscita senza registrarlo, la
940 funzione non ha modo di accorgersene, e si continuerà a chiamarla senza
941 accorgersi che quanto interessava è già accaduto.
942
943 Per questo motivo lo standard POSIX.1 ha introdotto una seconda funzione che
944 effettua lo stesso servizio, ma dispone di una serie di funzionalità più
945 ampie, legate anche al controllo di sessione (si veda
946 sez.~\ref{sec:sess_job_control}).  Dato che è possibile ottenere lo stesso
947 comportamento di \func{wait}\footnote{in effetti il codice
948   \code{wait(\&status)} è del tutto equivalente a \code{waitpid(WAIT\_ANY,
949     \&status, 0)}.} si consiglia di utilizzare sempre questa nuova funzione di
950 sistema, \funcd{waitpid}, il cui prototipo è:
951
952 \begin{funcproto}{ 
953 \fhead{sys/types.h}
954 \fhead{sys/wait.h}
955 \fdecl{pid\_t waitpid(pid\_t pid, int *status, int options)}
956 \fdesc{Attende il cambiamento di stato di un processo figlio.} 
957 }
958 {La funzione ritorna il \ids{PID} del processo che ha cambiato stato in caso
959   di successo, o 0 se è stata specificata l'opzione \const{WNOHANG} e il
960   processo non è uscito e $-1$ per un errore, nel qual caso \var{errno}
961   assumerà uno dei valori:
962   \begin{errlist}
963   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
964     non è figlio del processo chiamante.
965   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
966     la funzione è stata interrotta da un segnale.
967   \item[\errcode{EINVAL}] si è specificato un valore non valido per
968     l'argomento \param{options}.
969   \end{errlist}}
970 \end{funcproto}
971
972 La prima differenza fra le due funzioni è che con \func{waitpid} si può
973 specificare in maniera flessibile quale processo attendere, sulla base del
974 valore fornito dall'argomento \param{pid}, questo può assumere diversi valori,
975 secondo lo specchietto riportato in tab.~\ref{tab:proc_waidpid_pid}, dove si
976 sono riportate anche le costanti definite per indicare alcuni di essi. 
977
978 \begin{table}[!htb]
979   \centering
980   \footnotesize
981   \begin{tabular}[c]{|c|c|p{8cm}|}
982     \hline
983     \textbf{Valore} & \textbf{Costante} &\textbf{Significato}\\
984     \hline
985     \hline
986     $<-1$& --               & Attende per un figlio il cui
987                               \itindex{process~group} \textit{process group}
988                               (vedi sez.~\ref{sec:sess_proc_group}) è uguale
989                               al valore assoluto di \param{pid}.\\ 
990     $-1$&\const{WAIT\_ANY}  & Attende per un figlio qualsiasi, usata in
991                               questa maniera senza specificare nessuna opzione
992                               è equivalente a \func{wait}.\\ 
993     $ 0$&\const{WAIT\_MYPGRP}&Attende per un figlio il cui
994                               \itindex{process~group} \textit{process group}
995                               (vedi sez.~\ref{sec:sess_proc_group}) è
996                               uguale a quello del processo chiamante.\\ 
997     $>0$& --                & Attende per un figlio il cui \ids{PID} è uguale
998                               al valore di \param{pid}.\\
999     \hline
1000   \end{tabular}
1001   \caption{Significato dei valori dell'argomento \param{pid} della funzione
1002     \func{waitpid}.}
1003   \label{tab:proc_waidpid_pid}
1004 \end{table}
1005
1006 Il comportamento di \func{waitpid} può inoltre essere modificato passando alla
1007 funzione delle opportune opzioni tramite l'argomento \param{options}; questo
1008 deve essere specificato come maschera binaria delle costanti riportati nella
1009 prima parte in tab.~\ref{tab:proc_waitpid_options} che possono essere
1010 combinate fra loro con un OR aritmetico. Nella seconda parte della stessa
1011 tabella si sono riportati anche alcune opzioni non standard specifiche di
1012 Linux, che consentono un controllo più dettagliato per i processi creati con
1013 la \textit{system call} generica \func{clone} (vedi
1014 sez.~\ref{sec:process_clone}) e che vengono usati principalmente per la
1015 gestione della terminazione dei \itindex{thread} \textit{thread} (vedi
1016 sez.~\ref{sec:thread_xxx}).
1017
1018 \begin{table}[!htb]
1019   \centering
1020   \footnotesize
1021   \begin{tabular}[c]{|l|p{8cm}|}
1022     \hline
1023     \textbf{Costante} & \textbf{Descrizione}\\
1024     \hline
1025     \hline
1026     \const{WNOHANG}   & La funzione ritorna immediatamente anche se non è
1027                         terminato nessun processo figlio.\\
1028     \const{WUNTRACED} & Ritorna anche quando un processo figlio è stato
1029                         fermato.\\ 
1030     \const{WCONTINUED}& Ritorna anche quando un processo figlio che era stato
1031                         fermato ha ripreso l'esecuzione (disponibile solo a
1032                         partire dal kernel 2.6.10).\\
1033     \hline
1034     \const{\_\_WCLONE}& Attende solo per i figli creati con \func{clone} 
1035                         (vedi sez.~\ref{sec:process_clone}), vale a dire
1036                         processi che non emettono nessun segnale 
1037                         o emettono un segnale diverso da \signal{SIGCHLD} alla
1038                         terminazione, il default è attendere soltanto i
1039                         processi figli ordinari ignorando quelli creati da
1040                         \func{clone}.\\
1041     \const{\_\_WALL}  & Attende per qualunque figlio, sia ordinario che creato
1042                         con  \func{clone}, se specificata insieme a
1043                         \const{\_\_WCLONE} quest'ultima viene ignorata. \\
1044     \const{\_\_WNOTHREAD}& Non attende per i figli di altri \textit{thread}
1045                         dello stesso \textit{thread group}, questo era il
1046                         comportamento di default del kernel 2.4 che non
1047                         supportava la possibilità, divenuta il default a
1048                         partire dal 2.6, di attendere un qualunque figlio
1049                         appartenente allo stesso \textit{thread group}. \\
1050     \hline
1051   \end{tabular}
1052   \caption{Costanti che identificano i bit dell'argomento \param{options}
1053     della funzione \func{waitpid}.} 
1054   \label{tab:proc_waitpid_options}
1055 \end{table}
1056
1057
1058 L'uso dell'opzione \const{WNOHANG} consente di prevenire il blocco della
1059 funzione qualora nessun figlio sia uscito o non si siano verificate le altre
1060 condizioni per l'uscita della funzione. in tal caso. In tal caso la funzione,
1061 invece di restituire il \ids{PID} del processo (che è sempre un intero
1062 positivo) ritornerà un valore nullo.
1063
1064 Le altre due opzioni, \const{WUNTRACED} e \const{WCONTINUED}, consentono
1065 rispettivamente di tracciare non la terminazione di un processo, ma il fatto
1066 che esso sia stato fermato, o fatto ripartire, e sono utilizzate per la
1067 gestione del controllo di sessione (vedi sez.~\ref{sec:sess_job_control}).
1068
1069 Nel caso di \const{WUNTRACED} la funzione ritorna, restituendone il \ids{PID},
1070 quando un processo figlio entra nello stato \textit{stopped}\footnote{in
1071   realtà viene notificato soltanto il caso in cui il processo è stato fermato
1072   da un segnale di stop (vedi sez.~\ref{sec:sess_ctrl_term}), e non quello in
1073   cui lo stato \textit{stopped} è dovuto all'uso di \func{ptrace} (vedi
1074   sez.~\ref{sec:process_ptrace}).} (vedi tab.~\ref{tab:proc_proc_states}),
1075 mentre con \const{WCONTINUED} la funzione ritorna quando un processo in stato
1076 \textit{stopped} riprende l'esecuzione per la ricezione del segnale
1077 \signal{SIGCONT} (l'uso di questi segnali per il controllo di sessione è
1078 trattato in sez.~\ref{sec:sess_ctrl_term}).
1079
1080 La terminazione di un processo figlio (così come gli altri eventi osservabili
1081 con \func{waitpid}) è chiaramente un evento asincrono rispetto all'esecuzione
1082 di un programma e può avvenire in un qualunque momento. Per questo motivo,
1083 come accennato nella sezione precedente, una delle azioni prese dal kernel
1084 alla conclusione di un processo è quella di mandare un segnale di
1085 \signal{SIGCHLD} al padre. L'azione predefinita (si veda
1086 sez.~\ref{sec:sig_base}) per questo segnale è di essere ignorato, ma la sua
1087 generazione costituisce il meccanismo di comunicazione asincrona con cui il
1088 kernel avverte il processo padre che uno dei suoi figli è terminato.
1089
1090 Il comportamento delle funzioni è però cambiato nel passaggio dal kernel 2.4
1091 al kernel 2.6, quest'ultimo infatti si è adeguato alle prescrizioni dello
1092 standard POSIX.1-2001 e come da esso richiesto se \signal{SIGCHLD} viene
1093 ignorato, o se si imposta il flag di \const{SA\_NOCLDSTOP} nella ricezione
1094 dello stesso (si veda sez.~\ref{sec:sig_sigaction}) i processi figli che
1095 terminano non diventano \textit{zombie} e sia \func{wait} che \func{waitpid}
1096 si bloccano fintanto che tutti i processi figli non sono terminati, dopo di
1097 che falliscono con un errore di \errcode{ENOCHLD}.\footnote{questo è anche il
1098   motivo per cui le opzioni \const{WUNTRACED} e \const{WCONTINUED} sono
1099   utilizzabili soltanto qualora non si sia impostato il flag di
1100   \const{SA\_NOCLDSTOP} per il segnale \signal{SIGCHLD}.}
1101
1102 Con i kernel della serie 2.4 e tutti i kernel delle serie precedenti entrambe
1103 le funzioni di attesa ignorano questa prescrizione e si comportano sempre
1104 nello stesso modo,\footnote{lo standard POSIX.1 originale infatti lascia
1105   indefinito il comportamento di queste funzioni quando \signal{SIGCHLD} viene
1106   ignorato.} indipendentemente dal fatto \signal{SIGCHLD} sia ignorato o meno:
1107 attendono la terminazione di un processo figlio e ritornano il relativo
1108 \ids{PID} e lo stato di terminazione nell'argomento \param{status}.
1109
1110 In generale in un programma non si vuole essere forzati ad attendere la
1111 conclusione di un processo figlio per proseguire l'esecuzione, specie se tutto
1112 questo serve solo per leggerne lo stato di chiusura (ed evitare eventualmente
1113 la presenza di \itindex{zombie} \textit{zombie}).  Per questo la modalità più
1114 comune di chiamare queste funzioni è quella di utilizzarle all'interno di un
1115 \textit{signal handler} (vedremo un esempio di come gestire \signal{SIGCHLD}
1116 con i segnali in sez.~\ref{sec:sig_example}). In questo caso infatti, dato che
1117 il segnale è generato dalla terminazione di un figlio, avremo la certezza che
1118 la chiamata a \func{waitpid} non si bloccherà.
1119
1120 Come accennato sia \func{wait} che \func{waitpid} restituiscono lo stato di
1121 terminazione del processo tramite il puntatore \param{status}, e se non
1122 interessa memorizzare lo stato si può passare un puntatore nullo. Il valore
1123 restituito da entrambe le funzioni dipende dall'implementazione, ma
1124 tradizionalmente gli 8 bit meno significativi sono riservati per memorizzare
1125 lo \itindex{exit~status} stato di uscita del processo, e gli altri per
1126 indicare il segnale che ha causato la terminazione (in caso di conclusione
1127 anomala), uno per indicare se è stato generato un \itindex{core~dump}
1128 \textit{core dump} (vedi sez.~\ref{sec:sig_standard}), ecc.\footnote{le
1129   definizioni esatte si possono trovare in \file{<bits/waitstatus.h>} ma
1130   questo file non deve mai essere usato direttamente, esso viene incluso
1131   attraverso \file{<sys/wait.h>}.}
1132
1133 \begin{table}[!htb]
1134   \centering
1135   \footnotesize
1136   \begin{tabular}[c]{|l|p{10cm}|}
1137     \hline
1138     \textbf{Macro} & \textbf{Descrizione}\\
1139     \hline
1140     \hline
1141     \macro{WIFEXITED}\texttt{(s)}   & Condizione vera (valore non nullo) per
1142                                       un processo figlio che sia terminato
1143                                       normalmente. \\ 
1144     \macro{WEXITSTATUS}\texttt{(s)} & Restituisce gli otto bit meno
1145                                       significativi dello stato di uscita del
1146                                       processo (passato attraverso
1147                                       \func{\_exit}, \func{exit} o come valore
1148                                       di ritorno di \code{main}); può essere
1149                                       valutata solo se \val{WIFEXITED} ha
1150                                       restituito un valore non nullo.\\ 
1151     \macro{WIFSIGNALED}\texttt{(s)} & Condizione vera se il processo figlio è
1152                                       terminato in maniera anomala a causa di
1153                                       un segnale che non è stato catturato
1154                                       (vedi sez.~\ref{sec:sig_notification}).\\ 
1155     \macro{WTERMSIG}\texttt{(s)}    & Restituisce il numero del segnale che ha
1156                                       causato la terminazione anomala del
1157                                       processo; può essere valutata solo se
1158                                       \val{WIFSIGNALED} ha restituito un
1159                                       valore non nullo.\\
1160     \macro{WCOREDUMP}\texttt{(s)}   & Vera se il processo terminato ha
1161                                       generato un file di \itindex{core~dump}
1162                                       \textit{core dump}; può essere valutata
1163                                       solo se \val{WIFSIGNALED} ha restituito
1164                                       un valore non nullo.\footnotemark \\
1165     \macro{WIFSTOPPED}\texttt{(s)}  & Vera se il processo che ha causato il
1166                                       ritorno di \func{waitpid} è bloccato;
1167                                       l'uso è possibile solo con
1168                                       \func{waitpid} avendo specificato
1169                                       l'opzione \const{WUNTRACED}.\\
1170     \macro{WSTOPSIG}\texttt{(s)}    & Restituisce il numero del segnale che ha
1171                                       bloccato il processo; può essere
1172                                       valutata solo se \val{WIFSTOPPED} ha
1173                                       restituito un valore non nullo. \\ 
1174     \macro{WIFCONTINUED}\texttt{(s)}& Vera se il processo che ha causato il
1175                                       ritorno è stato riavviato da un
1176                                       \signal{SIGCONT} (disponibile solo a
1177                                       partire dal kernel 2.6.10).\\
1178     \hline
1179   \end{tabular}
1180   \caption{Descrizione delle varie macro di preprocessore utilizzabili per 
1181     verificare lo stato di terminazione \var{s} di un processo.}
1182   \label{tab:proc_status_macro}
1183 \end{table}
1184
1185 \footnotetext{questa macro non è definita dallo standard POSIX.1-2001, ma è
1186   presente come estensione sia in Linux che in altri Unix, deve essere
1187   pertanto utilizzata con attenzione (ad esempio è il caso di usarla in un
1188   blocco \texttt{\#ifdef WCOREDUMP ... \#endif}.}
1189
1190 Lo standard POSIX.1 definisce una serie di macro di preprocessore da usare per
1191 analizzare lo stato di uscita. Esse sono definite sempre in
1192 \file{<sys/wait.h>} ed elencate in tab.~\ref{tab:proc_status_macro}. Si tenga
1193 presente che queste macro prevedono che gli si passi come parametro la
1194 variabile di tipo \ctyp{int} puntata dall'argomento \param{status} restituito
1195 da \func{wait} o \func{waitpid}.
1196
1197 Si tenga conto che nel caso di conclusione anomala il valore restituito da
1198 \val{WTERMSIG} può essere confrontato con le costanti che identificano i
1199 segnali definite in \headfile{signal.h} ed elencate in
1200 tab.~\ref{tab:sig_signal_list}, e stampato usando le apposite funzioni
1201 trattate in sez.~\ref{sec:sig_strsignal}.
1202
1203 A partire dal kernel 2.6.9, sempre in conformità allo standard POSIX.1-2001, è
1204 stata introdotta una nuova funzione di attesa che consente di avere un
1205 controllo molto più preciso sui possibili cambiamenti di stato dei processi
1206 figli e più dettagli sullo stato di uscita; la funzione di sistema è
1207 \funcd{waitid} ed il suo prototipo è:
1208
1209 \begin{funcproto}{ 
1210 \fhead{sys/types.h}
1211 \fhead{sys/wait.h}
1212 \fdecl{int waitid(idtype\_t idtype, id\_t id, siginfo\_t *infop, int options)}
1213 \fdesc{Attende il cambiamento di stato di un processo figlio.} 
1214 }
1215 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1216   caso \var{errno} assumerà uno dei valori:
1217   \begin{errlist}
1218   \item[\errcode{ECHILD}] il processo specificato da \param{pid} non esiste o
1219     non è figlio del processo chiamante.
1220   \item[\errcode{EINTR}] non è stata specificata l'opzione \const{WNOHANG} e
1221     la funzione è stata interrotta da un segnale.
1222   \item[\errcode{EINVAL}] si è specificato un valore non valido per
1223     l'argomento \param{options}.
1224   \end{errlist}}
1225 \end{funcproto}
1226
1227 La funzione prevede che si specifichi quali processi si intendono osservare
1228 usando i due argomenti \param{idtype} ed \param{id}; il primo indica se ci si
1229 vuole porre in attesa su un singolo processo, un gruppo di processi o un
1230 processo qualsiasi, e deve essere specificato secondo uno dei valori di
1231 tab.~\ref{tab:proc_waitid_idtype}; il secondo indica, a seconda del valore del
1232 primo, quale processo o quale gruppo di processi selezionare.
1233
1234 \begin{table}[!htb]
1235   \centering
1236   \footnotesize
1237   \begin{tabular}[c]{|l|p{8cm}|}
1238     \hline
1239     \textbf{Valore} & \textbf{Descrizione}\\
1240     \hline
1241     \hline
1242     \const{P\_PID} & Indica la richiesta di attendere per un processo figlio
1243                      il cui \ids{PID} corrisponda al valore dell'argomento
1244                      \param{id}.\\
1245     \const{P\_PGID}& Indica la richiesta di attendere per un processo figlio
1246                      appartenente al \textit{process group} (vedi
1247                      sez.~\ref{sec:sess_proc_group}) il cui \acr{pgid}
1248                      corrisponda al valore dell'argomento \param{id}.\\
1249     \const{P\_ALL} & Indica la richiesta di attendere per un processo figlio
1250                      generico, il valore dell'argomento \param{id} viene
1251                      ignorato.\\
1252     \hline
1253   \end{tabular}
1254   \caption{Costanti per i valori dell'argomento \param{idtype} della funzione
1255     \func{waitid}.}
1256   \label{tab:proc_waitid_idtype}
1257 \end{table}
1258
1259 Come per \func{waitpid} anche il comportamento di \func{waitid} è
1260 controllato dall'argomento \param{options}, da specificare come maschera
1261 binaria dei valori riportati in tab.~\ref{tab:proc_waitid_options}. Benché
1262 alcuni di questi siano identici come significato ed effetto ai precedenti di
1263 tab.~\ref{tab:proc_waitpid_options}, ci sono delle differenze significative:
1264 in questo caso si dovrà specificare esplicitamente l'attesa della terminazione
1265 di un processo impostando l'opzione \const{WEXITED}, mentre il precedente
1266 \const{WUNTRACED} è sostituito da \const{WSTOPPED}.  Infine è stata aggiunta
1267 l'opzione \const{WNOWAIT} che consente una lettura dello stato mantenendo il
1268 processo in attesa di ricezione, così che una successiva chiamata possa di
1269 nuovo riceverne lo stato.
1270
1271 \begin{table}[!htb]
1272   \centering
1273   \footnotesize
1274   \begin{tabular}[c]{|l|p{8cm}|}
1275     \hline
1276     \textbf{Valore} & \textbf{Descrizione}\\
1277     \hline
1278     \hline
1279     \const{WEXITED}   & Ritorna quando un processo figlio è terminato.\\
1280     \const{WNOHANG}   & Ritorna immediatamente anche se non c'è niente da
1281                         notificare.\\ 
1282     \const{WSTOPPED} &  Ritorna quando un processo figlio è stato fermato.\\
1283     \const{WCONTINUED}& Ritorna quando un processo figlio che era stato
1284                         fermato ha ripreso l'esecuzione.\\
1285     \const{WNOWAIT}   & Lascia il processo ancora in attesa di ricezione, così
1286                         che una successiva chiamata possa di nuovo riceverne
1287                         lo stato.\\
1288     \hline
1289   \end{tabular}
1290   \caption{Costanti che identificano i bit dell'argomento \param{options}
1291     della funzione \func{waitid}.} 
1292   \label{tab:proc_waitid_options}
1293 \end{table}
1294
1295 La funzione \func{waitid} restituisce un valore nullo in caso di successo, e
1296 $-1$ in caso di errore; viene restituito un valore nullo anche se è stata
1297 specificata l'opzione \const{WNOHANG} e la funzione è ritornata immediatamente
1298 senza che nessun figlio sia terminato. Pertanto per verificare il motivo del
1299 ritorno della funzione occorre analizzare le informazioni che essa
1300 restituisce; queste, al contrario delle precedenti \func{wait} e
1301 \func{waitpid} che usavano un semplice valore numerico, sono ritornate in una
1302 struttura di tipo \struct{siginfo\_t} (vedi fig.~\ref{fig:sig_siginfo_t})
1303 all'indirizzo puntato dall'argomento \param{infop}.
1304
1305 Tratteremo nei dettagli la struttura \struct{siginfo\_t} ed il significato dei
1306 suoi vari campi in sez.~\ref{sec:sig_sigaction}, per quanto ci interessa qui
1307 basta dire che al ritorno di \func{waitid} verranno avvalorati i seguenti
1308 campi:
1309 \begin{basedescript}{\desclabelwidth{2.0cm}}
1310 \item[\var{si\_pid}] con il \ids{PID} del figlio.
1311 \item[\var{si\_uid}] con l'\textsl{user-ID reale} (vedi
1312   sez.~\ref{sec:proc_perms}) del figlio.
1313 \item[\var{si\_signo}] con \signal{SIGCHLD}.
1314 \item[\var{si\_status}] con lo stato di uscita del figlio o con il segnale che
1315   lo ha terminato, fermato o riavviato.
1316 \item[\var{si\_code}] con uno fra \const{CLD\_EXITED}, \const{CLD\_KILLED},
1317   \const{CLD\_STOPPED}, \const{CLD\_CONTINUED}, \const{CLD\_TRAPPED} e
1318   \const{CLD\_DUMPED} a indicare la ragione del ritorno della funzione, il cui
1319   significato è, nell'ordine: uscita normale, terminazione da segnale,
1320   processo fermato, processo riavviato, processo terminato in
1321   \itindex{core~dump} \textit{core dump} (vedi sez.~\ref{sec:sig_standard}).
1322 \end{basedescript}
1323
1324 Infine Linux, seguendo un'estensione di BSD, supporta altre due funzioni per
1325 la lettura dello stato di terminazione di un processo, analoghe alle
1326 precedenti ma che prevedono un ulteriore argomento attraverso il quale il
1327 kernel può restituire al padre informazioni sulle risorse (vedi
1328 sez.~\ref{sec:sys_res_limits}) usate dal processo terminato e dai vari figli.
1329 Le due funzioni di sistema sono \funcd{wait3} e \funcd{wait4}, che diventano
1330 accessibili definendo la macro \macro{\_USE\_BSD}, i loro prototipi sono:
1331
1332 \begin{funcproto}{ 
1333 \fhead{sys/types.h}
1334 \fhead{sys/times.h}
1335 \fhead{sys/resource.h}
1336 \fhead{sys/wait.h}
1337 \fdecl{int wait3(int *status, int options, struct rusage *rusage)}
1338 \fdecl{int wait4(pid\_t pid, int *status, int options, struct rusage *rusage)}
1339 \fdesc{Attende il cambiamento di stato di un processo figlio, riportando l'uso
1340   delle risorse.} 
1341 }
1342 {La funzione ha gli stessi valori di ritorno e codici di errore di
1343   \func{waitpid}. }
1344 \end{funcproto}
1345
1346 La funzione \func{wait4} è identica \func{waitpid} sia nel comportamento che
1347 per i valori dei primi tre argomenti, ma in più restituisce nell'argomento
1348 aggiuntivo \param{rusage} un sommario delle risorse usate dal processo. Questo
1349 argomento è una struttura di tipo \struct{rusage} definita in
1350 \headfile{sys/resource.h}, che viene utilizzata anche dalla funzione
1351 \func{getrusage} per ottenere le risorse di sistema usate da un processo. La
1352 sua definizione è riportata in fig.~\ref{fig:sys_rusage_struct} e ne
1353 tratteremo in dettaglio il significato sez.~\ref{sec:sys_resource_use}. La
1354 funzione \func{wait3} è semplicemente un caso particolare di (e con Linux
1355 viene realizzata con la stessa \textit{system call}), ed è equivalente a
1356 chiamare \code{wait4(-1, \&status, opt, rusage)}, per questo motivo è ormai
1357 deprecata in favore di \func{wait4}.
1358
1359
1360
1361 \subsection{La famiglia delle funzioni \func{exec} per l'esecuzione dei
1362   programmi}
1363 \label{sec:proc_exec}
1364
1365 Abbiamo già detto che una delle modalità principali con cui si utilizzano i
1366 processi in Unix è quella di usarli per lanciare nuovi programmi: questo viene
1367 fatto attraverso una delle funzioni della famiglia \func{exec}. Quando un
1368 processo chiama una di queste funzioni esso viene completamente sostituito dal
1369 nuovo programma, il \ids{PID} del processo non cambia, dato che non viene
1370 creato un nuovo processo, la funzione semplicemente rimpiazza lo
1371 \itindex{stack} \textit{stack}, i \index{segmento!dati} dati ed il
1372 \index{segmento!testo} testo del processo corrente con un nuovo programma
1373 letto da disco, eseguendo il \itindex{link-loader} \textit{link-loader} con
1374 gli effetti illustrati in sez.~\ref{sec:proc_main}.
1375
1376 Ci sono sei diverse versioni di \func{exec} (per questo la si è chiamata
1377 famiglia di funzioni) che possono essere usate per questo compito, in realtà
1378 (come mostrato in fig.~\ref{fig:proc_exec_relat}), tutte queste funzioni sono
1379 tutte varianti che consentono di invocare in modi diversi, semplificando il
1380 passaggio degli argomenti, la funzione di sistema \funcd{execve}, il cui
1381 prototipo è:
1382
1383 \begin{funcproto}{ 
1384 \fhead{unistd.h}
1385 \fdecl{int execve(const char *filename, char *const argv[], char *const envp[])}
1386 \fdesc{Esegue un programma.} 
1387 }
1388 {La funzione ritorna solo in caso di errore, restituendo $-1$, nel qual
1389  caso \var{errno} assumerà uno dei valori:
1390 \begin{errlist}
1391   \item[\errcode{EACCES}] il file o l'interprete non file ordinari, o non sono
1392     eseguibili, o il file è su un filesystem montato con l'opzione
1393     \cmd{noexec}, o manca  il permesso di attraversamento di una delle
1394     directory del \textit{pathname}.
1395   \item[\errcode{EINVAL}] l'eseguibile ELF ha più di un segmento
1396     \const{PF\_INTERP}, cioè chiede di essere eseguito da più di un
1397     interprete.
1398   \item[\errcode{ELIBBAD}] un interprete ELF non è in un formato
1399     riconoscibile.
1400   \item[\errcode{ENOEXEC}] il file è in un formato non eseguibile o non
1401     riconosciuto come tale, o compilato per un'altra architettura.
1402   \item[\errcode{ENOENT}] il file o una delle librerie dinamiche o l'interprete
1403     necessari per eseguirlo non esistono.
1404   \item[\errcode{EPERM}] il file ha i bit \itindex{suid~bit} \acr{suid} o
1405     \itindex{sgid~bit} \acr{sgid} e l'utente non è root, ed il processo viene
1406     tracciato, oppure il filesystem è montato con l'opzione \cmd{nosuid}.
1407   \item[\errcode{ETXTBSY}] l'eseguibile è aperto in scrittura da uno o più
1408     processi. 
1409   \item[\errcode{E2BIG}] la lista degli argomenti è troppo grande.
1410   \end{errlist}
1411   ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{EISDIR}, \errval{ELOOP},
1412   \errval{EMFILE}, \errval{ENAMETOOLONG}, \errval{ENFILE}, \errval{ENOMEM},
1413   \errval{ENOTDIR} nel loro significato generico.  }
1414 \end{funcproto}
1415
1416 La funzione \func{execve} esegue il programma o lo script indicato dal
1417 \textit{pathname} \param{filename}, passandogli la lista di argomenti indicata
1418 da \param{argv} e come ambiente la lista di stringhe indicata
1419 da \param{envp}. Entrambe le liste devono essere terminate da un puntatore
1420 nullo. I vettori degli argomenti e dell'ambiente possono essere acceduti dal
1421 nuovo programma quando la sua funzione \code{main} è dichiarata nella forma
1422 \code{main(int argc, char *argv[], char *envp[])}. Si tenga presente per il
1423 passaggio degli argomenti e dell'ambiente esistono comunque dei limiti, su cui
1424 torneremo in sez.~\ref{sec:sys_res_limits}).
1425 % TODO aggiungere la parte sul numero massimo di argomenti, da man execve
1426
1427 In caso di successo la funzione non ritorna, in quanto al posto del programma
1428 chiamante viene eseguito il nuovo programma indicato da \param{filename}. Se
1429 il processo corrente è tracciato con \func{ptrace} (vedi
1430 sez.~\ref{sec:process_ptrace}) in caso di successo viene emesso il segnale
1431 \signal{SIGTRAP}.
1432
1433 Le altre funzioni della famiglia (\funcd{execl}, \funcd{execv},
1434 \funcd{execle}, \funcd{execlp}, \funcd{execvp}) servono per fornire all'utente
1435 una serie di possibili diverse interfacce nelle modalità di passaggio degli
1436 argomenti all'esecuzione del nuovo programma. I loro prototipi sono:
1437
1438 \begin{funcproto}{ 
1439 \fhead{unistd.h}
1440 \fdecl{int execl(const char *path, const char *arg, ...)}
1441 \fdecl{int execv(const char *path, char *const argv[])}
1442 \fdecl{int execle(const char *path, const char *arg, ..., char * const envp[])}
1443 \fdecl{int execlp(const char *file, const char *arg, ...)}
1444 \fdecl{int execvp(const char *file, char *const argv[])}
1445 \fdesc{Eseguono un programma.} 
1446 }
1447 {Le funzioni ritornano solo in caso di errore, restituendo $-1$, i codici di
1448   errore sono gli stessi di \func{execve}.
1449 }
1450 \end{funcproto}
1451
1452 Tutte le funzioni mettono in esecuzione nel processo corrente il programma
1453 indicati nel primo argomento. Gli argomenti successivi consentono di
1454 specificare gli argomenti e l'ambiente che saranno ricevuti dal nuovo
1455 processo. Per capire meglio le differenze fra le funzioni della famiglia si può
1456 fare riferimento allo specchietto riportato in
1457 tab.~\ref{tab:proc_exec_scheme}. La relazione fra le funzioni è invece
1458 illustrata in fig.~\ref{fig:proc_exec_relat}.
1459
1460 \begin{table}[!htb]
1461   \footnotesize
1462   \centering
1463   \begin{tabular}[c]{|l|c|c|c||c|c|c|}
1464     \hline
1465     \multicolumn{1}{|c|}{\textbf{Caratteristiche}} & 
1466     \multicolumn{6}{|c|}{\textbf{Funzioni}} \\
1467     \hline
1468     &\func{execl}\texttt{ }&\func{execlp}&\func{execle}
1469     &\func{execv}\texttt{ }& \func{execvp}& \func{execve} \\
1470     \hline
1471     \hline
1472     argomenti a lista    &$\bullet$&$\bullet$&$\bullet$&&& \\
1473     argomenti a vettore  &&&&$\bullet$&$\bullet$&$\bullet$\\
1474     \hline
1475     filename completo     &$\bullet$&&$\bullet$&$\bullet$&&$\bullet$\\ 
1476     ricerca su \var{PATH} &&$\bullet$&&&$\bullet$& \\
1477     \hline
1478     ambiente a vettore   &&&$\bullet$&&&$\bullet$ \\
1479     uso di \var{environ} &$\bullet$&$\bullet$&&$\bullet$&$\bullet$& \\
1480     \hline
1481   \end{tabular}
1482   \caption{Confronto delle caratteristiche delle varie funzioni della 
1483     famiglia \func{exec}.}
1484   \label{tab:proc_exec_scheme}
1485 \end{table}
1486
1487 La prima differenza fra le funzioni riguarda le modalità di passaggio dei
1488 valori che poi andranno a costituire gli argomenti a linea di comando (cioè i
1489 valori di \param{argv} e \param{argc} visti dalla funzione \code{main} del
1490 programma chiamato). Queste modalità sono due e sono riassunte dagli mnemonici
1491 ``\texttt{v}'' e ``\texttt{l}'' che stanno rispettivamente per \textit{vector}
1492 e \textit{list}.
1493
1494 Nel primo caso gli argomenti sono passati tramite il vettore di puntatori
1495 \var{argv[]} a stringhe terminate con zero che costituiranno gli argomenti a
1496 riga di comando, questo vettore \emph{deve} essere terminato da un puntatore
1497 nullo. Nel secondo caso le stringhe degli argomenti sono passate alla funzione
1498 come lista di puntatori, nella forma:
1499 \includecodesnip{listati/char_list.c}
1500 che deve essere terminata da un puntatore nullo.  In entrambi i casi vale la
1501 convenzione che il primo argomento (\var{arg0} o \var{argv[0]}) viene usato
1502 per indicare il nome del file che contiene il programma che verrà eseguito.
1503
1504 \begin{figure}[!htb]
1505   \centering \includegraphics[width=9cm]{img/exec_rel}
1506   \caption{La interrelazione fra le sei funzioni della famiglia \func{exec}.}
1507   \label{fig:proc_exec_relat}
1508 \end{figure}
1509
1510 La seconda differenza fra le funzioni riguarda le modalità con cui si
1511 specifica il programma che si vuole eseguire. Con lo mnemonico ``\texttt{p}''
1512 si indicano le due funzioni che replicano il comportamento della shell nello
1513 specificare il comando da eseguire; quando l'argomento \param{file} non
1514 contiene una ``\texttt{/}'' esso viene considerato come un nome di programma,
1515 e viene eseguita automaticamente una ricerca fra i file presenti nella lista
1516 di directory specificate dalla variabile di ambiente \envvar{PATH}. Il file
1517 che viene posto in esecuzione è il primo che viene trovato. Se si ha un errore
1518 relativo a permessi di accesso insufficienti (cioè l'esecuzione della
1519 sottostante \func{execve} ritorna un \errcode{EACCES}), la ricerca viene
1520 proseguita nelle eventuali ulteriori directory indicate in \envvar{PATH}; solo
1521 se non viene trovato nessun altro file viene finalmente restituito
1522 \errcode{EACCES}.  Le altre quattro funzioni si limitano invece a cercare di
1523 eseguire il file indicato dall'argomento \param{path}, che viene interpretato
1524 come il \textit{pathname} del programma.
1525
1526 La terza differenza è come viene passata la lista delle variabili di ambiente.
1527 Con lo mnemonico ``\texttt{e}'' vengono indicate quelle funzioni che
1528 necessitano di un vettore di parametri \var{envp[]} analogo a quello usato per
1529 gli argomenti a riga di comando (terminato quindi da un \val{NULL}), le altre
1530 usano il valore della variabile \var{environ} (vedi
1531 sez.~\ref{sec:proc_environ}) del processo di partenza per costruire
1532 l'ambiente.
1533
1534 Oltre a mantenere lo stesso \ids{PID}, il nuovo programma fatto partire da una
1535 delle funzioni della famiglia \func{exec} mantiene la gran parte delle
1536 proprietà del processo chiamante; una lista delle più significative è la
1537 seguente:
1538 \begin{itemize*}
1539 \item il \textit{process id} (\ids{PID}) ed il \textit{parent process id}
1540   (\ids{PPID});
1541 \item l'\textsl{user-ID reale}, il \textsl{group-ID reale} ed i
1542   \textsl{group-ID supplementari} (vedi sez.~\ref{sec:proc_access_id});
1543 \item la directory radice e la \index{directory~di~lavoro} directory di lavoro
1544   corrente (vedi sez.~\ref{sec:file_work_dir});
1545 \item la maschera di creazione dei file \itindex{umask} (\textit{umask}, vedi
1546   sez.~\ref{sec:file_perm_management}) ed i \textit{lock} sui file (vedi
1547   sez.~\ref{sec:file_locking});
1548 \item il valori di \textit{nice}, le priorità real-time e le affinità di
1549   processore (vedi sez.~\ref{sec:proc_sched_stand};
1550   sez.~\ref{sec:proc_real_time} e sez.~\ref{sec:proc_sched_multiprocess});
1551 \item il \textit{session ID} (\acr{sid}) ed il \itindex{process~group}
1552   \textit{process group ID} (\acr{pgid}), vedi sez.~\ref{sec:sess_proc_group};
1553 \item il terminale di controllo (vedi sez.~\ref{sec:sess_ctrl_term});
1554 \item il tempo restante ad un allarme (vedi sez.~\ref{sec:sig_alarm_abort});
1555 \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
1556 \item i valori delle variabili \var{tms\_utime}, \var{tms\_stime};
1557   \var{tms\_cutime}, \var{tms\_ustime} (vedi sez.~\ref{sec:sys_cpu_times});
1558 % TODO ===========Importante=============
1559 % TODO questo sotto è incerto, verificare
1560 % TODO ===========Importante=============
1561 \item la \index{maschera~dei~segnali} maschera dei segnali (si veda
1562   sez.~\ref{sec:sig_sigmask}). 
1563 \end{itemize*}
1564
1565 Una serie di proprietà del processo originale, che non avrebbe senso mantenere
1566 in un programma che esegue un codice completamente diverso in uno spazio di
1567 indirizzi totalmente indipendente e ricreato da zero, vengono perse con
1568 l'esecuzione di una \func{exec}. Lo standard POSIX.1-2001 prevede che le
1569 seguenti proprietà non vengano preservate:
1570 \begin{itemize*}
1571 \item l'insieme dei segnali pendenti (vedi sez.~\ref{sec:sig_gen_beha}), che
1572   viene cancellato;
1573 \item gli eventuali stack alternativi per i segnali (vedi
1574   sez.~\ref{sec:sig_specific_features});
1575 \item i \textit{directory stream} (vedi sez.~\ref{sec:file_dir_read}), che
1576   vengono chiusi;
1577 \item le mappature dei file in memoria (vedi sez.~\ref{sec:file_memory_map});
1578 \item i segmenti di memoria condivisa SysV (vedi sez.~\ref{sec:ipc_sysv_shm})
1579   e POSIX (vedi sez.~\ref{sec:ipc_posix_shm});
1580 \item i \itindex{memory~locking} \textit{memory lock} (vedi
1581   sez.~\ref{sec:proc_mem_lock});
1582 \item le funzioni registrate all'uscita (vedi sez.~\ref{sec:proc_atexit});
1583 \item i semafori e le code di messaggi POSIX (vedi
1584   sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq});
1585 \item i timer POSIX (vedi sez.~\ref{sec:sig_timer_adv}).
1586 \end{itemize*}
1587
1588 Inoltre i segnali che sono stati impostati per essere ignorati nel processo
1589 chiamante mantengono la stessa impostazione pure nel nuovo programma, ma tutti
1590 gli altri segnali, ed in particolare quelli per i quali è stato installato un
1591 gestore vengono impostati alla loro azione predefinita (vedi
1592 sez.~\ref{sec:sig_gen_beha}). Un caso speciale è il segnale \signal{SIGCHLD}
1593 che, quando impostato a \const{SIG\_IGN}, potrebbe anche essere reimpostato a
1594 \const{SIG\_DFL}. Lo standard POSIX.1-2001 prevede che questo comportamento
1595 sia deciso dalla singola implementazione, quella di Linux è di non modificare
1596 l'impostazione precedente.
1597
1598 Oltre alle precedenti, che sono completamente generali e disponibili anche su
1599 altri sistemi unix-like, esistono altre proprietà dei processi, attinenti alle
1600 caratteristiche specifiche di Linux, che non vengono preservate
1601 nell'esecuzione della funzione \func{exec}, queste sono:
1602 \begin{itemize*}
1603 \item le operazioni di I/O asincrono (vedi sez.~\ref{sec:file_asyncronous_io})
1604   pendenti vengono cancellate;
1605 \item le \textit{capabilities} vengono modificate come
1606   illustrato in sez.~\ref{sec:proc_capabilities};
1607 \item tutti i \textit{thread} tranne il chiamante (vedi
1608   sez.~\ref{sec:thread_xxx}) sono cancellati e tutti gli oggetti ad essi
1609   relativi (vedi sez.~\ref{sec:thread_xxx}) rimossi;
1610 \item viene impostato il flag \const{PR\_SET\_DUMPABLE} di \func{prctl} (vedi
1611   sez.~\ref{sec:process_prctl}) a meno che il programma da eseguire non sia
1612   \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} (vedi
1613   sez.~\ref{sec:proc_access_id});
1614 \item il flag \const{PR\_SET\_KEEPCAPS} di \func{prctl} (vedi
1615   sez.~\ref{sec:process_prctl}) viene cancellato;
1616 \item il nome del processo viene impostato al nome del file contenente il
1617   programma messo in esecuzione;
1618 \item il segnale di terminazione viene reimpostato a \signal{SIGCHLD};
1619 \item l'ambiente viene reinizializzato impostando le variabili attinenti alla
1620   localizzazione al valore di default POSIX. 
1621 \end{itemize*}
1622
1623 \itindbeg{close-on-exec}
1624
1625 La gestione dei file aperti nel passaggio al nuovo programma lanciato con
1626 \func{exec} dipende dal valore che ha il flag di \textit{close-on-exec} (vedi
1627 sez.~\ref{sec:file_fcntl_ioctl}) per ciascun \textit{file descriptor}. I file
1628 per cui è impostato vengono chiusi, tutti gli altri file restano
1629 aperti. Questo significa che il comportamento predefinito è che i file restano
1630 aperti attraverso una \func{exec}, a meno di una chiamata esplicita a
1631 \func{fcntl} che imposti il suddetto flag.  Per le directory, lo standard
1632 POSIX.1 richiede che esse vengano chiuse attraverso una \func{exec}, in genere
1633 questo è fatto dalla funzione \func{opendir} (vedi
1634 sez.~\ref{sec:file_dir_read}) che effettua da sola l'impostazione del flag di
1635 \textit{close-on-exec} sulle directory che apre, in maniera trasparente
1636 all'utente.
1637
1638 \itindend{close-on-exec}
1639
1640
1641 Il comportamento della funzione in relazione agli identificatori relativi al
1642 controllo di accesso verrà trattato in dettaglio in sez.~\ref{sec:proc_perms},
1643 qui è sufficiente anticipare (si faccia riferimento a
1644 sez.~\ref{sec:proc_access_id} per la definizione di questi identificatori)
1645 come l'\textsl{user-ID reale} ed il \textsl{group-ID reale} restano sempre gli
1646 stessi, mentre l'\textsl{user-ID salvato} ed il \textsl{group-ID salvato}
1647 vengono impostati rispettivamente all'\textsl{user-ID effettivo} ed il
1648 \textsl{group-ID effettivo}. Questi ultimi normalmente non vengono modificati,
1649 a meno che il file di cui viene chiesta l'esecuzione non abbia o il
1650 \itindex{suid~bit} \acr{suid} bit o lo \itindex{sgid~bit} \acr{sgid} bit
1651 impostato, in questo caso l'\textsl{user-ID effettivo} ed il \textsl{group-ID
1652   effettivo} vengono impostati rispettivamente all'utente o al gruppo cui il
1653 file appartiene.
1654
1655 Se il file da eseguire è in formato \emph{a.out} e necessita di librerie
1656 condivise, viene lanciato il \textit{linker} dinamico \cmd{/lib/ld.so} prima
1657 del programma per caricare le librerie necessarie ed effettuare il link
1658 dell'eseguibile; il formato è ormai in completo disuso, per cui è molto
1659 probabile che non il relativo supporto non sia disponibile. Se il programma è
1660 in formato ELF per caricare le librerie dinamiche viene usato l'interprete
1661 indicato nel segmento \const{PT\_INTERP} previsto dal formato stesso, in
1662 genere questo è \sysfile{/lib/ld-linux.so.1} per programmi collegati con la
1663 \acr{libc5}, e \sysfile{/lib/ld-linux.so.2} per programmi collegati con la
1664 \acr{glibc}.
1665
1666 Infine nel caso il programma che si vuole eseguire sia uno script e non un
1667 binario, questo deve essere un file di testo che deve iniziare con una linea
1668 nella forma:
1669 \begin{Example}
1670 #!/path/to/interpreter [argomenti]
1671 \end{Example}
1672 dove l'interprete indicato deve essere un eseguibile binario e non un altro
1673 script, che verrà chiamato come se si fosse eseguito il comando
1674 \cmd{interpreter [argomenti] filename}. 
1675
1676 Si tenga presente che con Linux quanto viene scritto come \texttt{argomenti}
1677 viene passato all'interprete come un unico argomento con una unica stringa di
1678 lunghezza massima di 127 caratteri e se questa dimensione viene ecceduta la
1679 stringa viene troncata; altri Unix hanno dimensioni massime diverse, e diversi
1680 comportamenti, ad esempio FreeBSD esegue la scansione della riga e la divide
1681 nei vari argomenti e se è troppo lunga restituisce un errore di
1682 \const{ENAMETOOLONG}; una comparazione dei vari comportamenti sui diversi
1683 sistemi unix-like si trova su
1684 \url{http://www.in-ulm.de/~mascheck/various/shebang/}.
1685
1686 Con la famiglia delle \func{exec} si chiude il novero delle funzioni su cui è
1687 basata la gestione tradizionale dei processi in Unix: con \func{fork} si crea
1688 un nuovo processo, con \func{exec} si lancia un nuovo programma, con
1689 \func{exit} e \func{wait} si effettua e verifica la conclusione dei
1690 processi. Tutte le altre funzioni sono ausiliarie e servono per la lettura e
1691 l'impostazione dei vari parametri connessi ai processi.
1692
1693
1694
1695 \section{Il controllo di accesso}
1696 \label{sec:proc_perms}
1697
1698 In questa sezione esamineremo le problematiche relative al controllo di
1699 accesso dal punto di vista dei processi; vedremo quali sono gli identificatori
1700 usati, come questi possono essere modificati nella creazione e nel lancio di
1701 nuovi processi, le varie funzioni per la loro manipolazione diretta e tutte le
1702 problematiche connesse ad una gestione accorta dei privilegi.
1703
1704
1705 \subsection{Gli identificatori del controllo di accesso}
1706 \label{sec:proc_access_id}
1707
1708 Come accennato in sez.~\ref{sec:intro_multiuser} il modello base\footnote{in
1709   realtà già esistono estensioni di questo modello base, che lo rendono più
1710   flessibile e controllabile, come le \textit{capabilities} illustrate in
1711   sez.~\ref{sec:proc_capabilities}, le ACL per i file (vedi
1712   sez.~\ref{sec:file_ACL}) o il \textit{Mandatory Access Control} di
1713   \textit{SELinux}; inoltre basandosi sul lavoro effettuato con
1714   \textit{SELinux}, a partire dal kernel 2.5.x, è iniziato lo sviluppo di una
1715   infrastruttura di sicurezza, i \textit{Linux Security Modules}, o LSM, in
1716   grado di fornire diversi agganci a livello del kernel per modularizzare
1717   tutti i possibili controlli di accesso, cosa che ha permesso di realizzare
1718   diverse alternative a \textit{SELinux}.} 
1719 di sicurezza di un sistema unix-like è fondato sui concetti di utente e
1720 gruppo, e sulla separazione fra l'amministratore (\textsl{root}, detto spesso
1721 anche \textit{superuser}) che non è sottoposto a restrizioni, ed il resto
1722 degli utenti, per i quali invece vengono effettuati i vari controlli di
1723 accesso.
1724
1725 Abbiamo già accennato come il sistema associ ad ogni utente e gruppo due
1726 identificatori univoci, lo \itindex{User~ID~(PID)} \textsl{User-ID}
1727 (abbreviato in \ids{UID}) ed il \itindex{Group~ID~(PID)} \textsl{Group-ID}
1728 (abbreviato in \ids{GID}). Questi servono al kernel per identificare uno
1729 specifico utente o un gruppo di utenti, per poi poter controllare che essi
1730 siano autorizzati a compiere le operazioni richieste.  Ad esempio in
1731 sez.~\ref{sec:file_access_control} vedremo come ad ogni file vengano associati
1732 un utente ed un gruppo (i suoi \textsl{proprietari}, indicati appunto tramite
1733 un \ids{UID} ed un \ids{GID}) che vengono controllati dal kernel nella
1734 gestione dei permessi di accesso.
1735
1736 Dato che tutte le operazioni del sistema vengono compiute dai processi, è
1737 evidente che per poter implementare un controllo sulle operazioni occorre
1738 anche poter identificare chi è che ha lanciato un certo programma, e pertanto
1739 anche a ciascun processo dovrà essere associato un utente e un gruppo.
1740
1741 Un semplice controllo di una corrispondenza fra identificativi non garantisce
1742 però sufficiente flessibilità per tutti quei casi in cui è necessario poter
1743 disporre di privilegi diversi, o dover impersonare un altro utente per un
1744 limitato insieme di operazioni. Per questo motivo in generale tutti i sistemi
1745 unix-like prevedono che i processi abbiano almeno due gruppi di
1746 identificatori, chiamati rispettivamente \textit{real} ed \textit{effective}
1747 (cioè \textsl{reali} ed \textsl{effettivi}). Nel caso di Linux si aggiungono
1748 poi altri due gruppi, il \textit{saved} (\textsl{salvati}) ed il
1749 \textit{filesystem} (\textsl{di filesystem}), secondo la situazione illustrata
1750 in tab.~\ref{tab:proc_uid_gid}.
1751
1752 \begin{table}[htb]
1753   \footnotesize
1754   \centering
1755   \begin{tabular}[c]{|c|c|l|p{7cm}|}
1756     \hline
1757     \textbf{Suffisso} & \textbf{Gruppo} & \textbf{Denominazione} 
1758                                         & \textbf{Significato} \\ 
1759     \hline
1760     \hline
1761     \texttt{uid} & \textit{real} & \textsl{user-ID reale} 
1762                  & Indica l'utente che ha lanciato il programma.\\ 
1763     \texttt{gid} & '' &\textsl{group-ID reale} 
1764                  & Indica il gruppo principale dell'utente che ha lanciato 
1765                    il programma.\\ 
1766     \hline
1767     \texttt{euid}& \textit{effective} &\textsl{user-ID effettivo} 
1768                  & Indica l'utente usato nel controllo di accesso.\\ 
1769     \texttt{egid}& '' & \textsl{group-ID effettivo} 
1770                  & Indica il gruppo usato nel controllo di accesso.\\ 
1771     --           & -- & \textsl{group-ID supplementari} 
1772                  & Indicano gli ulteriori gruppi cui l'utente appartiene.\\ 
1773     \hline
1774     --           & \textit{saved} & \textsl{user-ID salvato} 
1775                  & Mantiene una copia dell'\acr{euid} iniziale.\\ 
1776     --           & '' & \textsl{group-ID salvato} 
1777                  & Mantiene una copia dell'\acr{egid} iniziale.\\ 
1778     \hline
1779     \texttt{fsuid}& \textit{filesystem} &\textsl{user-ID di filesystem} 
1780                  & Indica l'utente effettivo per l'accesso al filesystem. \\ 
1781     \texttt{fsgid}& '' & \textsl{group-ID di filesystem} 
1782                  & Indica il gruppo effettivo per l'accesso al filesystem.\\ 
1783     \hline
1784   \end{tabular}
1785   \caption{Identificatori di utente e gruppo associati a ciascun processo con
1786     indicazione dei suffissi usati dalle varie funzioni di manipolazione.}
1787   \label{tab:proc_uid_gid}
1788 \end{table}
1789
1790 Al primo gruppo appartengono l'\ids{UID} \textsl{reale} ed il \ids{GID}
1791 \textsl{reale}: questi vengono impostati al login ai valori corrispondenti
1792 all'utente con cui si accede al sistema (e relativo gruppo principale).
1793 Servono per l'identificazione dell'utente e normalmente non vengono mai
1794 cambiati. In realtà vedremo (in sez.~\ref{sec:proc_setuid}) che è possibile
1795 modificarli, ma solo ad un processo che abbia i privilegi di amministratore;
1796 questa possibilità è usata proprio dal programma \cmd{login} che, una volta
1797 completata la procedura di autenticazione, lancia una shell per la quale
1798 imposta questi identificatori ai valori corrispondenti all'utente che entra
1799 nel sistema.
1800
1801 Al secondo gruppo appartengono l'\ids{UID} \textsl{effettivo} e il \ids{GID}
1802 \textsl{effettivo}, a cui si aggiungono gli eventuali \ids{GID}
1803 \textsl{supplementari} dei gruppi dei quali l'utente fa parte.  Questi sono
1804 invece gli identificatori usati nelle verifiche dei permessi del processo e
1805 per il controllo di accesso ai file (argomento affrontato in dettaglio in
1806 sez.~\ref{sec:file_perm_overview}).
1807
1808 Questi identificatori normalmente sono identici ai corrispondenti del gruppo
1809 \textit{real} tranne nel caso in cui, come accennato in
1810 sez.~\ref{sec:proc_exec}, il programma che si è posto in esecuzione abbia i
1811 bit \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid} impostati
1812 (il significato di questi bit è affrontato in dettaglio in
1813 sez.~\ref{sec:file_special_perm}). In questo caso essi saranno impostati
1814 all'utente e al gruppo proprietari del file. Questo consente, per programmi in
1815 cui ci sia questa necessità, di dare a qualunque utente i privilegi o i
1816 permessi di un altro, compreso l'amministratore.
1817
1818 Come nel caso del \ids{PID} e del \ids{PPID}, anche tutti questi
1819 identificatori possono essere ottenuti da un programma attraverso altrettante
1820 funzioni di sistema dedicate alla loro lettura, queste sono \funcd{getuid},
1821 \funcd{geteuid}, \funcd{getgid} e \funcd{getegid}, ed i loro prototipi sono:
1822
1823 \begin{funcproto}{ 
1824 \fhead{unistd.h}
1825 \fhead{sys/types.h}
1826 \fdecl{uid\_t getuid(void)}
1827 \fdesc{Legge l'\ids{UID} reale del processo corrente.} 
1828 \fdecl{uid\_t geteuid(void)}
1829 \fdesc{Legge l'\ids{UID} effettivo del processo corrente.} 
1830 \fdecl{gid\_t getgid(void)}
1831 \fdesc{Legge il \ids{GID} reale del processo corrente.} 
1832 \fdecl{gid\_t getegid(void)}
1833 \fdesc{Legge il \ids{GID} effettivo del processo corrente.}
1834 }
1835 {Le funzioni ritornano i rispettivi identificativi del processo corrente, e
1836   non sono previste condizioni di errore.}
1837 \end{funcproto}
1838
1839 In generale l'uso di privilegi superiori, ottenibile con un \ids{UID}
1840 \textsl{effettivo} diverso da quello reale, deve essere limitato il più
1841 possibile, per evitare abusi e problemi di sicurezza, per questo occorre anche
1842 un meccanismo che consenta ad un programma di rilasciare gli eventuali
1843 maggiori privilegi necessari, una volta che si siano effettuate le operazioni
1844 per i quali erano richiesti, e a poterli eventualmente recuperare in caso
1845 servano di nuovo.
1846
1847 Questo in Linux viene fatto usando altri due gruppi di identificatori, il
1848 \textit{saved} ed il \textit{filesystem}. Il primo gruppo è lo stesso usato in
1849 SVr4, e previsto dallo standard POSIX quando è definita la costante
1850 \macro{\_POSIX\_SAVED\_IDS},\footnote{in caso si abbia a cuore la portabilità
1851   del programma su altri Unix è buona norma controllare sempre la
1852   disponibilità di queste funzioni controllando se questa costante è
1853   definita.} il secondo gruppo è specifico di Linux e viene usato per
1854 migliorare la sicurezza con NFS (il \textit{Network File System}, protocollo
1855 che consente di accedere ai file via rete).
1856
1857 L'\ids{UID} \textsl{salvato} ed il \ids{GID} \textsl{salvato} sono copie
1858 dell'\ids{UID} \textsl{effettivo} e del \ids{GID} \textsl{effettivo} del
1859 processo padre, e vengono impostati dalla funzione \func{exec} all'avvio del
1860 processo, come copie dell'\ids{UID} \textsl{effettivo} e del \ids{GID}
1861 \textsl{effettivo} dopo che questi sono stati impostati tenendo conto di
1862 eventuali \itindex{suid~bit} \acr{suid} o \itindex{sgid~bit} \acr{sgid}.  Essi
1863 quindi consentono di tenere traccia di quale fossero utente e gruppo effettivi
1864 all'inizio dell'esecuzione di un nuovo programma.
1865
1866 L'\ids{UID} \textsl{di filesystem} e il \ids{GID} \textsl{di filesystem} sono
1867 un'estensione introdotta in Linux per rendere più sicuro l'uso di NFS
1868 (torneremo sull'argomento in sez.~\ref{sec:proc_setuid}). Essi sono una
1869 replica dei corrispondenti identificatori del gruppo \textit{effective}, ai
1870 quali si sostituiscono per tutte le operazioni di verifica dei permessi
1871 relativi ai file (trattate in sez.~\ref{sec:file_perm_overview}).  Ogni
1872 cambiamento effettuato sugli identificatori effettivi viene automaticamente
1873 riportato su di essi, per cui in condizioni normali si può tranquillamente
1874 ignorarne l'esistenza, in quanto saranno del tutto equivalenti ai precedenti.
1875
1876
1877 \subsection{Le funzioni di gestione degli identificatori dei processi}
1878 \label{sec:proc_setuid}
1879
1880 Le funzioni di sistema più comuni che vengono usate per cambiare identità
1881 (cioè utente e gruppo di appartenenza) ad un processo, e che come accennato in
1882 sez.~\ref{sec:proc_access_id} seguono la semantica POSIX che prevede
1883 l'esistenza dell'\ids{UID} salvato e del \ids{GID} salvato, sono
1884 rispettivamente \funcd{setuid} e \funcd{setgid}; i loro prototipi sono:
1885
1886 \begin{funcproto}{ 
1887 \fhead{unistd.h}
1888 \fhead{sys/types.h}
1889 \fdecl{int setuid(uid\_t uid)}
1890 \fdesc{Imposta l'\ids{UID} del processo corrente.} 
1891 \fdecl{int setgid(gid\_t gid)}
1892 \fdesc{Imposta il \ids{GID} del processo corrente.} 
1893 }
1894 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1895 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
1896 }
1897 \end{funcproto}
1898
1899 Il funzionamento di queste due funzioni è analogo, per cui considereremo solo
1900 la prima, la seconda si comporta esattamente allo stesso modo facendo
1901 riferimento al \ids{GID} invece che all'\ids{UID}.  Gli eventuali \ids{GID}
1902 supplementari non vengono modificati.
1903
1904 L'effetto della chiamata è diverso a seconda dei privilegi del processo; se
1905 l'\ids{UID} effettivo è zero (cioè è quello dell'amministratore di sistema)
1906 allora tutti gli identificatori (\textit{real}, \textit{effective} e
1907 \textit{saved}) vengono impostati al valore specificato da \param{uid},
1908 altrimenti viene impostato solo l'\ids{UID} effettivo, e soltanto se il valore
1909 specificato corrisponde o all'\ids{UID} reale o all'\ids{UID} salvato. Negli
1910 altri casi viene segnalato un errore con \errcode{EPERM}.
1911
1912 Come accennato l'uso principale di queste funzioni è quello di poter
1913 consentire ad un programma con i bit \itindex{suid~bit} \acr{suid} o
1914 \itindex{sgid~bit} \acr{sgid} impostati (vedi
1915 sez.~\ref{sec:file_special_perm}) di riportare l'\ids{UID} effettivo a quello
1916 dell'utente che ha lanciato il programma, effettuare il lavoro che non
1917 necessita di privilegi aggiuntivi, ed eventualmente tornare indietro.
1918
1919 Come esempio per chiarire l'uso di queste funzioni prendiamo quello con cui
1920 viene gestito l'accesso al file \sysfile{/var/run/utmp}.  In questo file viene
1921 registrato chi sta usando il sistema al momento corrente; chiaramente non può
1922 essere lasciato aperto in scrittura a qualunque utente, che potrebbe
1923 falsificare la registrazione. Per questo motivo questo file (e l'analogo
1924 \sysfile{/var/log/wtmp} su cui vengono registrati login e logout) appartengono
1925 ad un gruppo dedicato (in genere \acr{utmp}) ed i programmi che devono
1926 accedervi (ad esempio tutti i programmi di terminale in X, o il programma
1927 \cmd{screen} che crea terminali multipli su una console) appartengono a questo
1928 gruppo ed hanno il bit \acr{sgid} impostato.
1929
1930 Quando uno di questi programmi (ad esempio \cmd{xterm}) viene lanciato, la
1931 situazione degli identificatori è la seguente:
1932 \begin{eqnarray*}
1933   \label{eq:1}
1934   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (del chiamante)} \\
1935   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1936   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp}}
1937 \end{eqnarray*}
1938 in questo modo, dato che il \textsl{group-ID effettivo} è quello giusto, il
1939 programma può accedere a \sysfile{/var/run/utmp} in scrittura ed aggiornarlo.
1940 A questo punto il programma può eseguire una \code{setgid(getgid())} per
1941 impostare il \textsl{group-ID effettivo} a quello dell'utente (e dato che il
1942 \textsl{group-ID reale} corrisponde la funzione avrà successo), in questo modo
1943 non sarà possibile lanciare dal terminale programmi che modificano detto file,
1944 in tal caso infatti la situazione degli identificatori sarebbe:
1945 \begin{eqnarray*}
1946   \label{eq:2}
1947   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (invariato)}  \\
1948   \textsl{group-ID effettivo}  &=& \textrm{\ids{GID}} \\
1949   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1950 \end{eqnarray*}
1951 e ogni processo lanciato dal terminale avrebbe comunque \ids{GID} come
1952 \textsl{group-ID effettivo}. All'uscita dal terminale, per poter di nuovo
1953 aggiornare lo stato di \sysfile{/var/run/utmp} il programma eseguirà una
1954 \code{setgid(utmp)} (dove \var{utmp} è il valore numerico associato al gruppo
1955 \acr{utmp}, ottenuto ad esempio con una precedente \func{getegid}), dato che
1956 in questo caso il valore richiesto corrisponde al \textsl{group-ID salvato} la
1957 funzione avrà successo e riporterà la situazione a:
1958 \begin{eqnarray*}
1959   \label{eq:3}
1960   \textsl{group-ID reale}      &=& \textrm{\ids{GID} (invariato)}  \\
1961   \textsl{group-ID effettivo}  &=& \textrm{\acr{utmp}} \\
1962   \textsl{group-ID salvato}    &=& \textrm{\acr{utmp} (invariato)}
1963 \end{eqnarray*}
1964 consentendo l'accesso a \sysfile{/var/run/utmp}.
1965
1966 Occorre però tenere conto che tutto questo non è possibile con un processo con
1967 i privilegi di amministratore, in tal caso infatti l'esecuzione di una
1968 \func{setuid} comporta il cambiamento di tutti gli identificatori associati al
1969 processo, rendendo impossibile riguadagnare i privilegi di amministratore.
1970 Questo comportamento è corretto per l'uso che ne fa \cmd{login} una volta che
1971 crea una nuova shell per l'utente, ma quando si vuole cambiare soltanto
1972 l'\ids{UID} effettivo del processo per cedere i privilegi occorre
1973 ricorrere ad altre funzioni.
1974
1975 Le due funzioni di sistema \funcd{setreuid} e \funcd{setregid} derivano da BSD
1976 che, non supportando (almeno fino alla versione 4.3+BSD) gli identificatori
1977 del gruppo \textit{saved}, le usa per poter scambiare fra di loro
1978 \textit{effective} e \textit{real}; i rispettivi prototipi sono:
1979
1980 \begin{funcproto}{ 
1981 \fhead{unistd.h}
1982 \fhead{sys/types.h}
1983 \fdecl{int setreuid(uid\_t ruid, uid\_t euid)}
1984 \fdesc{Imposta \ids{UID} reale e \ids{UID} effettivo del processo corrente.} 
1985 \fdecl{int setregid(gid\_t rgid, gid\_t egid)}
1986 \fdesc{Imposta \ids{GID} reale e \ids{GID} effettivo del processo corrente.} 
1987 }
1988 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
1989 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
1990 }
1991 \end{funcproto}
1992
1993 Le due funzioni sono identiche, quanto diremo per la prima riguardo gli
1994 \ids{UID} si applica alla seconda per i \ids{GID}.  La funzione
1995 \func{setreuid} imposta rispettivamente l'\ids{UID} reale e l'\ids{UID}
1996 effettivo del processo corrente ai valori specificati da \param{ruid}
1997 e \param{euid}.  I processi non privilegiati possono impostare solo valori che
1998 corrispondano o al loro \ids{UID} effettivo o a quello reale o a quello
1999 salvato, valori diversi comportano il fallimento della chiamata.
2000 L'amministratore invece può specificare un valore qualunque.  Specificando un
2001 argomento di valore $-1$ l'identificatore corrispondente verrà lasciato
2002 inalterato.
2003
2004 Con queste funzioni si possono scambiare fra loro gli \ids{UID} reale ed
2005 effettivo, e pertanto è possibile implementare un comportamento simile a
2006 quello visto in precedenza per \func{setgid}, cedendo i privilegi con un primo
2007 scambio, e recuperandoli, una volta eseguito il lavoro non privilegiato, con
2008 un secondo scambio.
2009
2010 In questo caso però occorre porre molta attenzione quando si creano nuovi
2011 processi nella fase intermedia in cui si sono scambiati gli identificatori, in
2012 questo caso infatti essi avranno un \ids{UID} reale privilegiato, che dovrà
2013 essere esplicitamente eliminato prima di porre in esecuzione un nuovo
2014 programma, occorrerà cioè eseguire un'altra chiamata dopo la \func{fork} e
2015 prima della \func{exec} per uniformare l'\ids{UID} reale a quello effettivo,
2016 perché in caso contrario il nuovo programma potrebbe a sua volta effettuare
2017 uno scambio e riottenere dei privilegi non previsti.
2018
2019 Lo stesso problema di propagazione dei privilegi ad eventuali processi figli
2020 si pone anche per l'\ids{UID} salvato. Ma la funzione \func{setreuid} deriva
2021 da un'implementazione di sistema che non ne prevede la presenza, e quindi non
2022 è possibile usarla per correggere la situazione come nel caso precedente. Per
2023 questo motivo in Linux tutte le volte che si imposta un qualunque valore
2024 diverso da quello dall'\ids{UID} reale corrente, l'\ids{UID} salvato viene
2025 automaticamente uniformato al valore dell'\ids{UID} effettivo.
2026
2027 Altre due funzioni di sistema, \funcd{seteuid} e \funcd{setegid}, sono
2028 un'estensione dello standard POSIX.1, ma sono comunque supportate dalla
2029 maggior parte degli Unix, esse vengono usate per cambiare gli identificatori
2030 del gruppo \textit{effective} ed i loro prototipi sono:
2031
2032 \begin{funcproto}{ 
2033 \fhead{unistd.h}
2034 \fhead{sys/types.h}
2035 \fdecl{int seteuid(uid\_t uid)}
2036 \fdesc{Imposta l'\ids{UID} effettivo del processo corrente.} 
2037 \fdecl{int setegid(gid\_t gid)}
2038 \fdesc{Imposta il \ids{GID} effettivo del processo corrente.} 
2039 }
2040 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2041 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
2042 }
2043 \end{funcproto}
2044
2045 Ancora una volta le due funzioni sono identiche, e quanto diremo per la prima
2046 riguardo gli \ids{UID} si applica allo stesso modo alla seconda per i
2047 \ids{GID}. Con \func{seteuid} gli utenti normali possono impostare l'\ids{UID}
2048 effettivo solo al valore dell'\ids{UID} reale o dell'\ids{UID} salvato,
2049 l'amministratore può specificare qualunque valore. Queste funzioni sono usate
2050 per permettere all'amministratore di impostare solo l'\ids{UID} effettivo,
2051 dato che l'uso normale di \func{setuid} comporta l'impostazione di tutti gli
2052 identificatori.
2053  
2054 Le due funzioni di sistema \funcd{setresuid} e \funcd{setresgid} sono invece
2055 un'estensione introdotta in Linux (a partire dal kernel 2.1.44) e permettono
2056 un completo controllo su tutti e tre i gruppi di identificatori
2057 (\textit{real}, \textit{effective} e \textit{saved}), i loro prototipi sono:
2058
2059 \begin{funcproto}{ 
2060 \fhead{unistd.h}
2061 \fhead{sys/types.h}
2062 \fdecl{int setresuid(uid\_t ruid, uid\_t euid, uid\_t suid)}
2063 \fdesc{Imposta l'\ids{UID} reale, effettivo e salvato del processo corrente.} 
2064 \fdecl{int setresgid(gid\_t rgid, gid\_t egid, gid\_t sgid)}
2065 \fdesc{Imposta il \ids{GID} reale, effettivo e salvato del processo corrente.} 
2066 }
2067 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2068 caso \var{errno} può assumere solo il valore \errcode{EPERM}.
2069 }
2070 \end{funcproto}
2071
2072 Di nuovo le due funzioni sono identiche e quanto detto per la prima riguardo
2073 gli \ids{UID} si applica alla seconda per i \ids{GID}.  La funzione
2074 \func{setresuid} imposta l'\ids{UID} reale, l'\ids{UID} effettivo e
2075 l'\ids{UID} salvato del processo corrente ai valori specificati
2076 rispettivamente dagli argomenti \param{ruid}, \param{euid} e \param{suid}.  I
2077 processi non privilegiati possono cambiare uno qualunque degli\ids{UID} solo
2078 ad un valore corrispondente o all'\ids{UID} reale, o a quello effettivo o a
2079 quello salvato, l'amministratore può specificare i valori che vuole. Un valore
2080 di $-1$ per un qualunque argomento lascia inalterato l'identificatore
2081 corrispondente.
2082
2083 Per queste funzioni di sistema esistono anche due controparti,
2084 \funcd{getresuid} e \funcd{getresgid},\footnote{le funzioni non sono standard,
2085   anche se appaiono in altri kernel, su Linux sono presenti dal kernel 2.1.44
2086   e con le versioni della \acr{glibc} a partire dalla 2.3.2, definendo la
2087   macro \macro{\_GNU\_SOURCE}.} che permettono di leggere in blocco i vari
2088 identificatori; i loro prototipi sono:
2089
2090 \begin{funcproto}{ 
2091 \fhead{unistd.h}
2092 \fhead{sys/types.h}
2093 \fdecl{int getresuid(uid\_t *ruid, uid\_t *euid, uid\_t *suid)}
2094 \fdesc{Legge l'\ids{UID} reale, effettivo e salvato del processo corrente.} 
2095 \fdecl{int getresgid(gid\_t *rgid, gid\_t *egid, gid\_t *sgid)}
2096 \fdesc{Legge il \ids{GID} reale, effettivo e salvato del processo corrente.} 
2097 }
2098 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2099   caso \var{errno} può assumere solo il valore \errcode{EFAULT} se gli
2100   indirizzi delle variabili di ritorno non sono validi.  }
2101 \end{funcproto}
2102
2103 Anche queste funzioni sono un'estensione specifica di Linux, e non richiedono
2104 nessun privilegio. I valori sono restituiti negli argomenti, che vanno
2105 specificati come puntatori (è un altro esempio di
2106 \itindex{value~result~argument} \textit{value result argument}). Si noti che
2107 queste funzioni sono le uniche in grado di leggere gli identificatori del
2108 gruppo \textit{saved}.
2109
2110 Infine le funzioni \func{setfsuid} e \func{setfsgid} servono per impostare gli
2111 identificatori del gruppo \textit{filesystem} che sono usati da Linux per il
2112 controllo dell'accesso ai file.  Come già accennato in
2113 sez.~\ref{sec:proc_access_id} Linux definisce questo ulteriore gruppo di
2114 identificatori, che in circostanze normali sono assolutamente equivalenti a
2115 quelli del gruppo \textit{effective}, dato che ogni cambiamento di questi
2116 ultimi viene immediatamente riportato su di essi.
2117
2118 C'è un solo caso in cui si ha necessità di introdurre una differenza fra gli
2119 identificatori dei gruppi \textit{effective} e \textit{filesystem}, ed è per
2120 ovviare ad un problema di sicurezza che si presenta quando si deve
2121 implementare un server NFS. 
2122
2123 Il server NFS infatti deve poter cambiare l'identificatore con cui accede ai
2124 file per assumere l'identità del singolo utente remoto, ma se questo viene
2125 fatto cambiando l'\ids{UID} effettivo o l'\ids{UID} reale il server si espone
2126 alla ricezione di eventuali segnali ostili da parte dell'utente di cui ha
2127 temporaneamente assunto l'identità.  Cambiando solo l'\ids{UID} di filesystem
2128 si ottengono i privilegi necessari per accedere ai file, mantenendo quelli
2129 originari per quanto riguarda tutti gli altri controlli di accesso, così che
2130 l'utente non possa inviare segnali al server NFS.
2131
2132 Le due funzioni di sistema usate per cambiare questi identificatori sono
2133 \funcd{setfsuid} e \funcd{setfsgid}, ed ovviamente sono specifiche di Linux e
2134 non devono essere usate se si intendono scrivere programmi portabili; i loro
2135 prototipi sono:
2136
2137 \begin{funcproto}{ 
2138 \fhead{sys/fsuid.h}
2139 \fdecl{int setfsuid(uid\_t fsuid)}
2140 \fdesc{Imposta l'\ids{UID} di filesystem del processo corrente.} 
2141 \fdecl{int setfsgid(gid\_t fsgid)}
2142 \fdesc{Legge il \ids{GID} di filesystem del processo corrente.} 
2143 }
2144 {Le funzioni restituiscono il nuovo valore dell'identificativo in caso di
2145   successo e quello corrente per un errore, in questo caso non viene però
2146   impostato nessun codice di errore in \var{errno}.}
2147 \end{funcproto}
2148
2149 Le due funzioni sono analoghe ed usano il valore passato come argomento per
2150 effettuare l'impostazione dell'identificativo.  Le funzioni hanno successo
2151 solo se il processo chiamante ha i privilegi di amministratore o, per gli
2152 altri utenti, se il valore specificato coincide con uno dei di quelli del
2153 gruppo \textit{real}, \textit{effective} o \textit{saved}.
2154
2155
2156 \subsection{Le funzioni per la gestione dei gruppi associati a un processo}
2157 \label{sec:proc_setgroups}
2158
2159 Le ultime funzioni che esamineremo sono quelle che permettono di operare sui
2160 gruppi supplementari cui un utente può appartenere. Ogni processo può avere
2161 almeno \const{NGROUPS\_MAX} gruppi supplementari\footnote{il numero massimo di
2162   gruppi secondari può essere ottenuto con \func{sysconf} (vedi
2163   sez.~\ref{sec:sys_limits}), leggendo il parametro
2164   \texttt{\_SC\_NGROUPS\_MAX}.} in aggiunta al gruppo primario; questi vengono
2165 ereditati dal processo padre e possono essere cambiati con queste funzioni.
2166
2167 La funzione di sistema che permette di leggere i gruppi supplementari
2168 associati ad un processo è \funcd{getgroups}; questa funzione è definita nello
2169 standard POSIX.1, ed il suo prototipo è:
2170
2171 \begin{funcproto}{ 
2172 \fhead{sys/types.h}
2173 \fhead{unistd.h}
2174 \fdecl{int getgroups(int size, gid\_t list[])}
2175 \fdesc{Legge gli identificatori dei gruppi supplementari.} 
2176 }
2177 {La funzione ritorna il numero di gruppi letti in caso di successo e $-1$ per
2178   un errore, nel qual caso \var{errno} assumerà uno dei valori:
2179 \begin{errlist}
2180 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2181 \item[\errcode{EINVAL}] il valore di \param{size} è diverso da zero ma
2182   minore del numero di gruppi supplementari del processo.
2183 \end{errlist}}
2184 \end{funcproto}
2185
2186 La funzione legge gli identificatori dei gruppi supplementari del processo sul
2187 vettore \param{list} che deve essere di dimensione pari a \param{size}. Non è
2188 specificato se la funzione inserisca o meno nella lista il \ids{GID} effettivo
2189 del processo. Se si specifica un valore di \param{size} uguale a $0$ allora
2190 l'argomento \param{list} non viene modificato, ma si ottiene il numero di
2191 gruppi supplementari.
2192
2193 Una seconda funzione, \funcd{getgrouplist}, può invece essere usata per
2194 ottenere tutti i gruppi a cui appartiene utente identificato per nome; il suo
2195 prototipo è:
2196
2197 \begin{funcproto}{ 
2198 \fhead{grp.h}
2199 \fdecl{int getgrouplist(const char *user, gid\_t group, gid\_t *groups, int
2200   *ngroups)} 
2201 \fdesc{Legge i gruppi cui appartiene un utente.} 
2202 }
2203 {La funzione ritorna il numero di gruppi ottenuto in caso di successo e $-1$
2204   per un errore, che avviene solo quando il numero di gruppi è maggiore di
2205   quelli specificati con \param{ngroups}.}
2206 \end{funcproto}
2207
2208 La funzione esegue una scansione del database dei gruppi (si veda
2209 sez.~\ref{sec:sys_user_group}) per leggere i gruppi supplementari dell'utente
2210 specificato per nome (e non con un \ids{UID}) nella stringa passata con
2211 l'argomento \param{user}. Ritorna poi nel vettore \param{groups} la lista dei
2212 \ids{GID} dei gruppi a cui l'utente appartiene. Si noti che \param{ngroups},
2213 che in ingresso deve indicare la dimensione di \param{group}, è passato come
2214 \itindex{value~result~argument} \textit{value result argument} perché, qualora
2215 il valore specificato sia troppo piccolo, la funzione ritorna $-1$, passando
2216 comunque indietro il numero dei gruppi trovati, in modo da poter ripetere la
2217 chiamata con un vettore di dimensioni adeguate.
2218
2219 Infine per impostare i gruppi supplementari di un processo ci sono due
2220 funzioni, che possono essere usate solo se si hanno i privilegi di
2221 amministratore.\footnote{e più precisamente se si ha la \textit{capability}
2222   \macro{CAP\_SETGID}.} La prima delle due è la funzione di sistema
2223 \funcd{setgroups},\footnote{la funzione è definita in BSD e SRv4, ma a
2224   differenza di \func{getgroups} non è stata inclusa in POSIX.1-2001, per
2225   poterla utilizzare deve essere definita la macro \macro{\_BSD\_SOURCE}.} ed
2226 il suo prototipo è:
2227
2228 \begin{funcproto}{ 
2229 \fhead{grp.h}
2230 \fdecl{int setgroups(size\_t size, gid\_t *list)}
2231 \fdesc{Imposta i gruppi supplementari del processo.} 
2232 }
2233 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2234 caso \var{errno} assumerà uno dei valori:
2235 \begin{errlist}
2236 \item[\errcode{EFAULT}] \param{list} non ha un indirizzo valido.
2237 \item[\errcode{EINVAL}] il valore di \param{size} è maggiore del valore
2238     massimo consentito di gruppi supplementari.
2239 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2240 \end{errlist}}
2241 \end{funcproto}
2242
2243 La funzione imposta i gruppi supplementari del processo corrente ai valori
2244 specificati nel vettore passato con l'argomento \param{list}, di dimensioni
2245 date dall'argomento \param{size}. Il numero massimo di gruppi supplementari
2246 che si possono impostare è un parametro di sistema, che può essere ricavato
2247 con le modalità spiegate in sez.~\ref{sec:sys_characteristics}.
2248
2249 Se invece si vogliono impostare i gruppi supplementari del processo a quelli
2250 di un utente specifico, si può usare la funzione \funcd{initgroups} il cui
2251 prototipo è:
2252
2253 \begin{funcproto}{ 
2254 \fhead{sys/types.h}
2255 \fhead{grp.h}
2256 \fdecl{int initgroups(const char *user, gid\_t group)}
2257 \fdesc{Inizializza la lista dei gruppi supplementari.} 
2258 }
2259 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2260 caso \var{errno} assumerà uno dei valori:
2261 \begin{errlist}
2262 \item[\errcode{ENOMEM}] non c'è memoria sufficiente per allocare lo spazio per
2263   informazioni dei gruppi.
2264 \item[\errcode{EPERM}] il processo non ha i privilegi di amministratore.
2265 \end{errlist}}
2266 \end{funcproto}
2267
2268 La funzione esegue la scansione del database dei gruppi (usualmente
2269 \conffile{/etc/group}) cercando i gruppi di cui è membro l'utente \param{user}
2270 (di nuovo specificato per nome e non per \ids{UID}) con cui costruisce una
2271 lista di gruppi supplementari, a cui aggiunge anche
2272 \param{group}, infine imposta questa lista per il processo corrente usando
2273 \func{setgroups}.  Si tenga presente che sia \func{setgroups} che
2274 \func{initgroups} non sono definite nello standard POSIX.1 e che pertanto non
2275 è possibile utilizzarle quando si definisce \macro{\_POSIX\_SOURCE} o si
2276 compila con il flag \cmd{-ansi}, è pertanto meglio evitarle se si vuole
2277 scrivere codice portabile.
2278
2279  
2280 \section{La gestione della priorità dei processi}
2281 \label{sec:proc_priority}
2282
2283 In questa sezione tratteremo più approfonditamente i meccanismi con il quale
2284 lo \textit{scheduler} assegna la CPU ai vari processi attivi.  In particolare
2285 prenderemo in esame i vari meccanismi con cui viene gestita l'assegnazione del
2286 tempo di CPU, ed illustreremo le varie funzioni di gestione. Tratteremo infine
2287 anche le altre priorità dei processi (come quelle per l'accesso a disco)
2288 divenute disponibili con i kernel più recenti.
2289
2290
2291 \subsection{I meccanismi di \textit{scheduling}}
2292 \label{sec:proc_sched}
2293
2294 \itindbeg{scheduler}
2295
2296 La scelta di un meccanismo che sia in grado di distribuire in maniera efficace
2297 il tempo di CPU per l'esecuzione dei processi è sempre una questione delicata,
2298 ed oggetto di numerose ricerche; in generale essa dipende in maniera
2299 essenziale anche dal tipo di utilizzo che deve essere fatto del sistema, per
2300 cui non esiste un meccanismo che sia valido per tutti gli usi.
2301
2302 La caratteristica specifica di un sistema multitasking come Linux è quella del
2303 cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
2304   multitasking}: questo significa che al contrario di altri sistemi (che usano
2305 invece il cosiddetto \itindex{cooperative~multitasking} \textit{cooperative
2306   multitasking}) non sono i singoli processi, ma il kernel stesso a decidere
2307 quando la CPU deve essere passata ad un altro processo. Come accennato in
2308 sez.~\ref{sec:proc_hierarchy} questa scelta viene eseguita da una sezione
2309 apposita del kernel, lo \textit{scheduler}, il cui scopo è quello di
2310 distribuire al meglio il tempo di CPU fra i vari processi.
2311
2312 La cosa è resa ancora più complicata dal fatto che con le architetture
2313 multi-processore si deve anche scegliere quale sia la CPU più opportuna da
2314 utilizzare.\footnote{nei processori moderni la presenza di ampie cache può
2315   rendere poco efficiente trasferire l'esecuzione di un processo da una CPU ad
2316   un'altra, per cui effettuare la migliore scelta fra le diverse CPU non è
2317   banale.}  Tutto questo comunque appartiene alle sottigliezze
2318 dell'implementazione del kernel; dal punto di vista dei programmi che girano
2319 in \textit{user space}, anche quando si hanno più processori (e dei processi
2320 che sono eseguiti davvero in contemporanea), le politiche di
2321 \textit{scheduling} riguardano semplicemente l'allocazione della risorsa
2322 \textsl{tempo di esecuzione}, la cui assegnazione sarà governata dai
2323 meccanismi di scelta delle priorità che restano gli stessi indipendentemente
2324 dal numero di processori.
2325
2326 Si tenga conto poi che i processi non devono solo eseguire del codice: ad
2327 esempio molto spesso saranno impegnati in operazioni di I/O, o potranno
2328 venire bloccati da un comando dal terminale, o sospesi per un certo periodo di
2329 tempo.  In tutti questi casi la CPU diventa disponibile ed è compito dello
2330 kernel provvedere a mettere in esecuzione un altro processo.
2331
2332 Tutte queste possibilità sono caratterizzate da un diverso \textsl{stato} del
2333 processo, in Linux un processo può trovarsi in uno degli stati riportati in
2334 tab.~\ref{tab:proc_proc_states}; ma soltanto i processi che sono nello stato
2335 \textit{runnable} concorrono per l'esecuzione. Questo vuol dire che, qualunque
2336 sia la sua priorità, un processo non potrà mai essere messo in esecuzione
2337 fintanto che esso si trova in uno qualunque degli altri stati.
2338
2339 \begin{table}[htb]
2340   \footnotesize
2341   \centering
2342   \begin{tabular}[c]{|p{2.4cm}|c|p{9cm}|}
2343     \hline
2344     \textbf{Stato} & \texttt{STAT} & \textbf{Descrizione} \\
2345     \hline
2346     \hline
2347     \textit{runnable}& \texttt{R} & Il processo è in esecuzione o è pronto ad
2348                                     essere eseguito (cioè è in attesa che gli
2349                                     venga assegnata la CPU).\\
2350     \textit{sleep}   & \texttt{S} & Il processo  è in attesa di un
2351                                     risposta dal sistema, ma può essere 
2352                                     interrotto da un segnale.\\
2353     \textit{uninterrutible sleep}& \texttt{D} & Il  processo è in
2354                                     attesa di un risposta dal sistema (in 
2355                                     genere per I/O), e non può essere
2356                                     interrotto in nessuna circostanza.\\
2357     \textit{stopped} & \texttt{T} & Il processo è stato fermato con un
2358                                     \signal{SIGSTOP}, o è tracciato.\\
2359     \textit{zombie}\itindex{zombie}& \texttt{Z} & Il processo è terminato ma il
2360                                     suo stato di terminazione non è ancora
2361                                     stato letto dal padre.\\
2362     \textit{killable}& \texttt{D} & Un nuovo stato introdotto con il kernel
2363                                     2.6.25, sostanzialmente identico
2364                                     all'\textit{uninterrutible sleep} con la
2365                                     sola differenza che il processo può
2366                                     terminato con \signal{SIGKILL} (usato per
2367                                     lo più per NFS).\\ 
2368     \hline
2369   \end{tabular}
2370   \caption{Elenco dei possibili stati di un processo in Linux, nella colonna
2371     \texttt{STAT} si è riportata la corrispondente lettera usata dal comando 
2372     \cmd{ps} nell'omonimo campo.}
2373   \label{tab:proc_proc_states}
2374 \end{table}
2375
2376 Si deve quindi tenere presente che l'utilizzo della CPU è soltanto una delle
2377 risorse che sono necessarie per l'esecuzione di un programma, e a seconda
2378 dello scopo del programma non è detto neanche che sia la più importante, dato
2379 che molti programmi dipendono in maniera molto più critica dall'I/O. Per
2380 questo motivo non è affatto detto che dare ad un programma la massima priorità
2381 di esecuzione abbia risultati significativi in termini di prestazioni.
2382
2383 Il meccanismo tradizionale di \textit{scheduling} di Unix (che tratteremo in
2384 sez.~\ref{sec:proc_sched_stand}) è sempre stato basato su delle
2385 \textsl{priorità dinamiche}, in modo da assicurare che tutti i processi, anche
2386 i meno importanti, potessero ricevere un po' di tempo di CPU. In sostanza
2387 quando un processo ottiene la CPU la sua priorità viene diminuita. In questo
2388 modo alla fine, anche un processo con priorità iniziale molto bassa, finisce
2389 per avere una priorità sufficiente per essere eseguito.
2390
2391 Lo standard POSIX.1b però ha introdotto il concetto di \textsl{priorità
2392   assoluta}, (chiamata anche \textsl{priorità statica}, in contrapposizione
2393 alla normale priorità dinamica), per tenere conto dei sistemi
2394 \textit{real-time},\footnote{per sistema \textit{real-time} si intende un
2395   sistema in grado di eseguire operazioni in un tempo ben determinato; in
2396   genere si tende a distinguere fra l'\textit{hard real-time} in cui è
2397   necessario che i tempi di esecuzione di un programma siano determinabili con
2398   certezza assoluta (come nel caso di meccanismi di controllo di macchine,
2399   dove uno sforamento dei tempi avrebbe conseguenze disastrose), e
2400   \textit{soft-real-time} in cui un occasionale sforamento è ritenuto
2401   accettabile.} in cui è vitale che i processi che devono essere eseguiti in
2402 un determinato momento non debbano aspettare la conclusione di altri che non
2403 hanno questa necessità.
2404
2405 Il concetto di priorità assoluta dice che quando due processi si contendono
2406 l'esecuzione, vince sempre quello con la priorità assoluta più alta.
2407 Ovviamente questo avviene solo per i processi che sono pronti per essere
2408 eseguiti (cioè nello stato \textit{runnable}).  La priorità assoluta viene in
2409 genere indicata con un numero intero, ed un valore più alto comporta una
2410 priorità maggiore. Su questa politica di \textit{scheduling} torneremo in
2411 sez.~\ref{sec:proc_real_time}.
2412
2413 In generale quello che succede in tutti gli Unix moderni è che ai processi
2414 normali viene sempre data una priorità assoluta pari a zero, e la decisione di
2415 assegnazione della CPU è fatta solo con il meccanismo tradizionale della
2416 priorità dinamica. In Linux tuttavia è possibile assegnare anche una priorità
2417 assoluta, nel qual caso un processo avrà la precedenza su tutti gli altri di
2418 priorità inferiore, che saranno eseguiti solo quando quest'ultimo non avrà
2419 bisogno della CPU.
2420
2421
2422 \subsection{Il meccanismo di \textit{scheduling} standard}
2423 \label{sec:proc_sched_stand}
2424
2425 A meno che non si abbiano esigenze specifiche,\footnote{per alcune delle quali
2426   sono state introdotte delle varianti specifiche.} l'unico meccanismo di
2427 \textit{scheduling} con il quale si avrà a che fare è quello tradizionale, che
2428 prevede solo priorità dinamiche. È di questo che, di norma, ci si dovrà
2429 preoccupare nella programmazione.  Come accennato in Linux i processi ordinari
2430 hanno tutti una priorità assoluta nulla; quello che determina quale, fra tutti
2431 i processi in attesa di esecuzione, sarà eseguito per primo, è la cosiddetta
2432 \textsl{priorità dinamica},\footnote{quella che viene mostrata nella colonna
2433   \texttt{PR} del comando \texttt{top}.} che è chiamata così proprio perché
2434 varia nel corso dell'esecuzione di un processo.
2435
2436 Il meccanismo usato da Linux è in realtà piuttosto complesso,\footnote{e
2437   dipende strettamente dalla versione di kernel; in particolare a partire
2438   dalla serie 2.6.x lo \textit{scheduler} è stato riscritto completamente, con
2439   molte modifiche susseguitesi per migliorarne le prestazioni, per un certo
2440   periodo ed è stata anche introdotta la possibilità di usare diversi
2441   algoritmi, selezionabili sia in fase di compilazione, che, nelle versioni
2442   più recenti, all'avvio (addirittura è stato ideato un sistema modulare che
2443   permette di cambiare lo \textit{scheduler} a sistema attivo).} ma a grandi
2444 linee si può dire che ad ogni processo è assegnata una \textit{time-slice},
2445 cioè un intervallo di tempo (letteralmente una fetta) per il quale, a meno di
2446 eventi esterni, esso viene eseguito senza essere interrotto.  Inoltre la
2447 priorità dinamica viene calcolata dallo \textit{scheduler} a partire da un
2448 valore iniziale che viene \textsl{diminuito} tutte le volte che un processo è
2449 in stato \textit{runnable} ma non viene posto in esecuzione.\footnote{in
2450   realtà il calcolo della priorità dinamica e la conseguente scelta di quale
2451   processo mettere in esecuzione avviene con un algoritmo molto più
2452   complicato, che tiene conto anche della \textsl{interattività} del processo,
2453   utilizzando diversi fattori, questa è una brutale semplificazione per
2454   rendere l'idea del funzionamento, per una trattazione più dettagliata, anche
2455   se non aggiornatissima, dei meccanismi di funzionamento dello
2456   \textit{scheduler} si legga il quarto capitolo di \cite{LinKernDev}.} Lo
2457 \textit{scheduler} infatti mette sempre in esecuzione, fra tutti i processi in
2458 stato \textit{runnable}, quello che ha il valore di priorità dinamica più
2459 basso.\footnote{con le priorità dinamiche il significato del valore numerico
2460   ad esse associato è infatti invertito, un valore più basso significa una
2461   priorità maggiore.} Il fatto che questo valore venga diminuito quando un
2462 processo non viene posto in esecuzione pur essendo pronto, significa che la
2463 priorità dei processi che non ottengono l'uso del processore viene
2464 progressivamente incrementata, così che anche questi alla fine hanno la
2465 possibilità di essere eseguiti.
2466
2467 Sia la dimensione della \textit{time-slice} che il valore di partenza della
2468 priorità dinamica sono determinate dalla cosiddetta \textit{nice} (o
2469 \textit{niceness}) del processo.\footnote{questa è una delle tante proprietà
2470   che ciascun processo si porta dietro, essa viene ereditata dai processi
2471   figli e mantenuta attraverso una \func{exec}; fino alla serie 2.4 essa era
2472   mantenuta nell'omonimo campo \texttt{nice} della \texttt{task\_struct}, con
2473   la riscrittura dello \textit{scheduler} eseguita nel 2.6 viene mantenuta nel
2474   campo \texttt{static\_prio} come per le priorità statiche.} L'origine del
2475 nome di questo parametro sta nel fatto che generalmente questo viene usato per
2476 \textsl{diminuire} la priorità di un processo, come misura di cortesia nei
2477 confronti degli altri.  I processi infatti vengono creati dal sistema con un
2478 valore nullo e nessuno è privilegiato rispetto agli altri. Specificando un
2479 valore di \textit{nice} positivo si avrà una \textit{time-slice} più breve ed
2480 un valore di priorità dinamica iniziale più alto, mentre un valore negativo
2481 darà una \textit{time-slice} più lunga ed un valore di priorità dinamica
2482 iniziale più basso.
2483
2484 Esistono diverse funzioni che consentono di indicare un valore di
2485 \textit{nice} di un processo; la più semplice è \funcd{nice}, che opera sul
2486 processo corrente, il suo prototipo è:
2487
2488 \begin{funcproto}{ 
2489 \fhead{unistd.h}
2490 \fdecl{int nice(int inc)}
2491 \fdesc{Aumenta il valore di \textit{nice} del processo corrente.} 
2492 }
2493 {La funzione ritorna il nuovo valore di \textit{nice} in caso di successo e
2494   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2495 \begin{errlist}
2496   \item[\errcode{EPERM}] non si ha il permesso di specificare un valore
2497     di \param{inc} negativo. 
2498 \end{errlist}}
2499 \end{funcproto}
2500
2501 L'argomento \param{inc} indica l'incremento da effettuare rispetto al valore
2502 di \textit{nice} corrente, che può assumere valori compresi fra
2503 \const{PRIO\_MIN} e \const{PRIO\_MAX}; nel caso di Linux sono fra $-20$ e
2504 $19$,\footnote{in realtà l'intervallo varia a seconda delle versioni di
2505   kernel, ed è questo a partire dal kernel 1.3.43, anche se oggi si può avere
2506   anche l'intervallo fra $-20$ e $20$.} ma per \param{inc} si può specificare
2507 un valore qualunque, positivo o negativo, ed il sistema provvederà a troncare
2508 il risultato nell'intervallo consentito. Valori positivi comportano maggiore
2509 \textit{cortesia} e cioè una diminuzione della priorità, valori negativi
2510 comportano invece un aumento della priorità. Con i kernel precedenti il 2.6.12
2511 solo l'amministratore\footnote{o un processo con la \textit{capability}
2512   \const{CAP\_SYS\_NICE}, vedi sez.~\ref{sec:proc_capabilities}.} può
2513 specificare valori negativi di \param{inc} che permettono di aumentare la
2514 priorità di un processo, a partire da questa versione è consentito anche agli
2515 utenti normali alzare (entro certi limiti, che vedremo in
2516 sez.~\ref{sec:sys_resource_limit}) la priorità dei propri processi.
2517
2518 Gli standard SUSv2 e POSIX.1 prevedono che la funzione ritorni il nuovo valore
2519 di \textit{nice} del processo; tuttavia la \textit{system call} di Linux non
2520 segue questa convenzione e restituisce sempre $0$ in caso di successo e $-1$
2521 in caso di errore; questo perché $-1$ è anche un valore di \textit{nice}
2522 legittimo e questo comporta una confusione con una eventuale condizione di
2523 errore. La \textit{system call} originaria inoltre non consente, se non dotati
2524 di adeguati privilegi, di diminuire un valore di \textit{nice} precedentemente
2525 innalzato.
2526  
2527 Fino alla \acr{glibc} 2.2.4 la funzione di libreria riportava direttamente il
2528 risultato dalla \textit{system call}, violando lo standard, per cui per
2529 ottenere il nuovo valore occorreva una successiva chiamata alla funzione
2530 \func{getpriority}. A partire dalla \acr{glibc} 2.2.4 \func{nice} è stata
2531 reimplementata e non viene più chiamata la omonima \textit{system call}, con
2532 questa versione viene restituito come valore di ritorno il valore di
2533 \textit{nice}, come richiesto dallo standard.\footnote{questo viene fatto
2534   chiamando al suo interno \func{setpriority}, che tratteremo a breve.}  In
2535 questo caso l'unico modo per rilevare in maniera affidabile una condizione di
2536 errore è quello di azzerare \var{errno} prima della chiamata della funzione e
2537 verificarne il valore quando \func{nice} restituisce $-1$.
2538
2539 Per leggere il valore di \textit{nice} di un processo occorre usare la
2540 funzione di sistema \funcd{getpriority}, derivata da BSD; il suo prototipo è:
2541
2542 \begin{funcproto}{ 
2543 \fhead{sys/time.h}
2544 \fhead{sys/resource.h}
2545 \fdecl{int getpriority(int which, int who)}
2546 \fdesc{Legge un valore di \textit{nice}.} 
2547 }
2548 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2549 caso \var{errno} assumerà uno dei valori:
2550 \begin{errlist}
2551 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2552     elencati in tab.~\ref{tab:proc_getpriority}.
2553 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2554   \param{which} e \param{who}.
2555 \end{errlist}}
2556 \end{funcproto}
2557
2558 La funzione permette, a seconda di quanto specificato
2559 nell'argomento \param{which}, di leggere il valore di \textit{nice} di un
2560 processo, di un gruppo di processi (vedi sez.~\ref{sec:sess_proc_group}) o di
2561 un utente indicato dall'argomento \param{who}. Nelle vecchie versioni può
2562 essere necessario includere anche \headfile{sys/time.h}, questo non è più
2563 necessario con versioni recenti delle librerie, ma è comunque utile per
2564 portabilità.
2565
2566 I valori possibili per \param{which}, ed il tipo di valore che occorre usare
2567 in corrispondenza per \param{who} solo elencati nella legenda di
2568 tab.~\ref{tab:proc_getpriority} insieme ai relativi significati. Usare un
2569 valore nullo per \param{who} indica, a seconda della corrispondente
2570 indicazione usata per \param{which} il processo, il gruppo di processi o
2571 l'utente correnti.
2572
2573 \begin{table}[htb]
2574   \centering
2575   \footnotesize
2576   \begin{tabular}[c]{|c|c|l|}
2577     \hline
2578     \param{which} & \param{who} & \textbf{Significato} \\
2579     \hline
2580     \hline
2581     \const{PRIO\_PROCESS} & \type{pid\_t} & processo  \\
2582     \const{PRIO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
2583                                             \textit{process group}\\ 
2584     \const{PRIO\_USER}    & \type{uid\_t} & utente \\
2585     \hline
2586   \end{tabular}
2587   \caption{Legenda del valore dell'argomento \param{which} e del tipo
2588     dell'argomento \param{who} delle funzioni \func{getpriority} e
2589     \func{setpriority} per le tre possibili scelte.}
2590   \label{tab:proc_getpriority}
2591 \end{table}
2592
2593 In caso di una indicazione che faccia riferimento a più processi, la funzione
2594 restituisce la priorità più alta (cioè il valore più basso) fra quelle dei
2595 processi corrispondenti. Come per \func{nice} $-1$ è un valore possibile
2596 corretto, per cui di nuovo per poter rilevare una condizione di errore è
2597 necessario cancellare sempre \var{errno} prima della chiamata alla funzione e
2598 quando si ottiene un valore di ritorno uguale a $-1$ per verificare che essa
2599 resti uguale a zero.
2600
2601 Analoga a \func{getpriority} è la funzione di sistema \funcd{setpriority} che
2602 permette di impostare la priorità di uno o più processi; il suo prototipo è:
2603
2604 \begin{funcproto}{ 
2605 \fhead{sys/time.h}
2606 \fhead{sys/resource.h}
2607 \fdecl{int setpriority(int which, int who, int prio)}
2608 \fdesc{Imposta un valore di \textit{nice}.} 
2609 }
2610 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2611 caso \var{errno} assumerà uno dei valori:
2612 \begin{errlist}
2613 \item[\errcode{EACCES}] si è richiesto un aumento di priorità senza avere
2614   sufficienti privilegi.
2615 \item[\errcode{EINVAL}] il valore di \param{which} non è uno di quelli
2616   elencati in tab.~\ref{tab:proc_getpriority}.
2617 \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha
2618   cercato di modificare la priorità di un processo di un altro utente.
2619 \item[\errcode{ESRCH}] non c'è nessun processo che corrisponda ai valori di
2620   \param{which} e \param{who}.
2621 \end{errlist}}
2622 \end{funcproto}
2623
2624 La funzione imposta la priorità dinamica al valore specificato da \param{prio}
2625 per tutti i processi indicati dagli argomenti \param{which} e \param{who}, per
2626 i quali valgono le stesse considerazioni fatte per \func{getpriority} e lo
2627 specchietto di tab.~\ref{tab:proc_getpriority}. 
2628
2629 In questo caso come valore di \param{prio} deve essere specificato il valore
2630 di \textit{nice} da assegnare, e non un incremento (positivo o negativo) come
2631 nel caso di \func{nice}, nell'intervallo fra \const{PRIO\_MIN} ($-20$) e
2632 \const{PRIO\_MAX} ($19$). La funzione restituisce il valore di \textit{nice}
2633 assegnato in caso di successo e $-1$ in caso di errore, e come per \func{nice}
2634 anche in questo caso per rilevare un errore occorre sempre porre a zero
2635 \var{errno} prima della chiamata della funzione, essendo $-1$ un valore di
2636 \textit{nice} valido.
2637
2638 Si tenga presente che solo l'amministratore\footnote{o più precisamente un
2639   processo con la \textit{capability} \const{CAP\_SYS\_NICE}, vedi
2640   sez.~\ref{sec:proc_capabilities}.} ha la possibilità di modificare
2641 arbitrariamente le priorità di qualunque processo. Un utente normale infatti
2642 può modificare solo la priorità dei suoi processi ed in genere soltanto
2643 diminuirla.  Fino alla versione di kernel 2.6.12 Linux ha seguito le
2644 specifiche dello standard SUSv3, e come per tutti i sistemi derivati da SysV
2645 veniva richiesto che l'\ids{UID} reale o quello effettivo del processo
2646 chiamante corrispondessero all'\ids{UID} reale (e solo a quello) del processo
2647 di cui si intendeva cambiare la priorità. A partire dalla versione 2.6.12 è
2648 stata adottata la semantica in uso presso i sistemi derivati da BSD (SunOS,
2649 Ultrix, *BSD), in cui la corrispondenza può essere anche con l'\ids{UID}
2650 effettivo.
2651
2652 Sempre a partire dal kernel 2.6.12 è divenuto possibile anche per gli utenti
2653 ordinari poter aumentare la priorità dei propri processi specificando un
2654 valore di \param{prio} negativo. Questa operazione non è possibile però in
2655 maniera indiscriminata, ed in particolare può essere effettuata solo
2656 nell'intervallo consentito dal valore del limite \const{RLIMIT\_NICE}
2657 (torneremo su questo in sez.~\ref{sec:sys_resource_limit}).
2658
2659 Infine nonostante i valori siano sempre rimasti gli stessi, il significato del
2660 valore di \textit{nice} è cambiato parecchio nelle progressive riscritture
2661 dello \textit{scheduler} di Linux, ed in particolare a partire dal kernel
2662 2.6.23 l'uso di diversi valori di \textit{nice} ha un impatto molto più forte
2663 nella distribuzione della CPU ai processi. Infatti se viene comunque calcolata
2664 una priorità dinamica per i processi che non ricevono la CPU così che anche
2665 essi possano essere messi in esecuzione, un alto valore di \textit{nice}
2666 corrisponde comunque ad una \textit{time-slice} molto piccola che non cresce
2667 comunque, per cui un processo a bassa priorità avrà davvero scarse possibilità
2668 di essere eseguito in presenza di processi attivi a priorità più alta.
2669
2670
2671
2672 \subsection{Il meccanismo di \textit{scheduling real-time}}
2673 \label{sec:proc_real_time}
2674
2675 Come spiegato in sez.~\ref{sec:proc_sched} lo standard POSIX.1b ha introdotto
2676 le priorità assolute per permettere la gestione di processi real-time. In
2677 realtà nel caso di Linux non si tratta di un vero \textit{hard real-time}, in
2678 quanto in presenza di eventuali interrupt il kernel interrompe l'esecuzione di
2679 un processo qualsiasi sia la sua priorità,\footnote{questo a meno che non si
2680   siano installate le patch di RTLinux, RTAI o Adeos, con i quali è possibile
2681   ottenere un sistema effettivamente \textit{hard real-time}. In tal caso
2682   infatti gli interrupt vengono intercettati dall'interfaccia
2683   \textit{real-time} (o nel caso di Adeos gestiti dalle code del nano-kernel),
2684   in modo da poterli controllare direttamente qualora ci sia la necessità di
2685   avere un processo con priorità più elevata di un \textit{interrupt
2686     handler}.} mentre con l'incorrere in un \itindex{page~fault} \textit{page
2687   fault} si possono avere ritardi non previsti.  Se l'ultimo problema può
2688 essere aggirato attraverso l'uso delle funzioni di controllo della memoria
2689 virtuale (vedi sez.~\ref{sec:proc_mem_lock}), il primo non è superabile e può
2690 comportare ritardi non prevedibili riguardo ai tempi di esecuzione di
2691 qualunque processo.
2692
2693 Nonostante questo, ed in particolare con una serie di miglioramenti che sono
2694 stati introdotti nello sviluppo del kernel,\footnote{in particolare a partire
2695   dalla versione 2.6.18 sono stati inserite nel kernel una serie di modifiche
2696   che consentono di avvicinarsi sempre di più ad un vero e proprio sistema
2697   \textit{real-time} estendendo il concetto di \textit{preemption} alle
2698   operazioni dello stesso kernel; esistono vari livelli a cui questo può
2699   essere fatto, ottenibili attivando in fase di compilazione una fra le
2700   opzioni \texttt{CONFIG\_PREEMPT\_NONE}, \texttt{CONFIG\_PREEMPT\_VOLUNTARY}
2701   e \texttt{CONFIG\_PREEMPT\_DESKTOP}.} si può arrivare ad una ottima
2702 approssimazione di sistema \textit{real-time} usando le priorità assolute.
2703 Occorre farlo però con molta attenzione: se si dà ad un processo una priorità
2704 assoluta e questo finisce in un loop infinito, nessun altro processo potrà
2705 essere eseguito, ed esso sarà mantenuto in esecuzione permanentemente
2706 assorbendo tutta la CPU e senza nessuna possibilità di riottenere l'accesso al
2707 sistema. Per questo motivo è sempre opportuno, quando si lavora con processi
2708 che usano priorità assolute, tenere attiva una shell cui si sia assegnata la
2709 massima priorità assoluta, in modo da poter essere comunque in grado di
2710 rientrare nel sistema.
2711
2712 Quando c'è un processo con priorità assoluta lo \textit{scheduler} lo metterà
2713 in esecuzione prima di ogni processo normale. In caso di più processi sarà
2714 eseguito per primo quello con priorità assoluta più alta. Quando ci sono più
2715 processi con la stessa priorità assoluta questi vengono tenuti in una coda e
2716 tocca al kernel decidere quale deve essere eseguito.  Il meccanismo con cui
2717 vengono gestiti questi processi dipende dalla politica di \textit{scheduling}
2718 che si è scelta; lo standard ne prevede due:
2719 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
2720 \item[\textit{First In First Out} (FIFO)] Il processo viene eseguito
2721   fintanto che non cede volontariamente la CPU (con la funzione
2722   \func{sched\_yield}), si blocca, finisce o viene interrotto da un processo a
2723   priorità più alta. Se il processo viene interrotto da uno a priorità più
2724   alta esso resterà in cima alla lista e sarà il primo ad essere eseguito
2725   quando i processi a priorità più alta diverranno inattivi. Se invece lo si
2726   blocca volontariamente sarà posto in coda alla lista (ed altri processi con
2727   la stessa priorità potranno essere eseguiti).
2728 \item[\textit{Round Robin} (RR)] Il comportamento è del tutto analogo a quello
2729   precedente, con la sola differenza che ciascun processo viene eseguito al
2730   massimo per un certo periodo di tempo (la cosiddetta \textit{time-slice})
2731   dopo di che viene automaticamente posto in fondo alla coda dei processi con
2732   la stessa priorità. In questo modo si ha comunque una esecuzione a turno di
2733   tutti i processi, da cui il nome della politica. Solo i processi con la
2734   stessa priorità ed in stato \textit{runnable} entrano nel
2735   \textsl{girotondo}.
2736 \end{basedescript}
2737
2738 Lo standard POSIX.1-2001 prevede una funzione che consenta sia di modificare
2739 le politiche di \textit{scheduling}, passando da \textit{real-time} a
2740 ordinarie o viceversa, che di specificare, in caso di politiche
2741 \textit{real-time}, la eventuale priorità statica; la funzione di sistema è
2742 \funcd{sched\_setscheduler} ed il suo prototipo è:
2743
2744 \begin{funcproto}{ 
2745 \fhead{sched.h}
2746 \fdecl{int sched\_setscheduler(pid\_t pid, int policy, const struct
2747   sched\_param *p)}
2748 \fdesc{Imposta priorità e politica di \textit{scheduling}.} 
2749 }
2750 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2751 caso \var{errno} assumerà uno dei valori:
2752 \begin{errlist}
2753     \item[\errcode{EINVAL}] il valore di \param{policy} non esiste o il
2754       relativo valore di \param{p} non è valido per la politica scelta.
2755     \item[\errcode{EPERM}] il processo non ha i privilegi per attivare la
2756       politica richiesta.
2757     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2758  \end{errlist}}
2759 \end{funcproto}
2760
2761 La funzione esegue l'impostazione per il processo specificato dall'argomento
2762 \param{pid}, un valore nullo di questo argomento esegue l'impostazione per il
2763 processo corrente.  La politica di \textit{scheduling} è specificata
2764 dall'argomento \param{policy} i cui possibili valori sono riportati in
2765 tab.~\ref{tab:proc_sched_policy}; la parte alta della tabella indica le
2766 politiche \textit{real-time}, quella bassa le politiche ordinarie. Un valore
2767 negativo per \param{policy} mantiene la politica di \textit{scheduling}
2768 corrente.
2769
2770 \begin{table}[htb]
2771   \centering
2772   \footnotesize
2773   \begin{tabular}[c]{|l|p{6cm}|}
2774     \hline
2775     \textbf{Politica}  & \textbf{Significato} \\
2776     \hline
2777     \hline
2778     \const{SCHED\_FIFO} & \textit{Scheduling real-time} con politica
2779                           \textit{FIFO}. \\
2780     \const{SCHED\_RR}   & \textit{Scheduling real-time} con politica
2781                           \textit{Round Robin}. \\ 
2782     \hline
2783     \const{SCHED\_OTHER}& \textit{Scheduling} ordinario.\\
2784     \const{SCHED\_BATCH}& \textit{Scheduling} ordinario con l'assunzione
2785                           ulteriore di lavoro \textit{CPU
2786                             intensive} (dal kernel 2.6.16).\\ 
2787     \const{SCHED\_IDLE} & \textit{Scheduling} di priorità estremamente
2788                           bassa (dal kernel 2.6.23).\\
2789     \hline
2790   \end{tabular}
2791   \caption{Valori dell'argomento \param{policy} per la funzione
2792     \func{sched\_setscheduler}.}
2793   \label{tab:proc_sched_policy}
2794 \end{table}
2795
2796 % TODO Aggiungere SCHED_DEADLINE, sulla nuova politica di scheduling aggiunta
2797 % con il kernel 3.14, vedi anche Documentation/scheduler/sched-deadline.txt e
2798 % http://lwn.net/Articles/575497/
2799
2800 Con le versioni più recenti del kernel sono state introdotte anche delle
2801 varianti sulla politica di \textit{scheduling} tradizionale per alcuni carichi
2802 di lavoro specifici, queste due nuove politiche sono specifiche di Linux e non
2803 devono essere usate se si vogliono scrivere programmi portabili.
2804
2805 La politica \const{SCHED\_BATCH} è una variante della politica ordinaria con
2806 la sola differenza che i processi ad essa soggetti non ottengono, nel calcolo
2807 delle priorità dinamiche fatto dallo \textit{scheduler}, il cosiddetto bonus
2808 di interattività che mira a favorire i processi che si svegliano dallo stato
2809 di \textit{sleep}.\footnote{cosa che accade con grande frequenza per i
2810   processi interattivi, dato che essi sono per la maggior parte del tempo in
2811   attesa di dati in ingresso da parte dell'utente.} La si usa pertanto, come
2812 indica il nome, per processi che usano molta CPU (come programmi di calcolo)
2813 che in questo modo sono leggermente sfavoriti rispetto ai processi interattivi
2814 che devono rispondere a dei dati in ingresso, pur non perdendo il loro valore
2815 di \textit{nice}.
2816
2817 La politica \const{SCHED\_IDLE} invece è una politica dedicata ai processi che
2818 si desidera siano eseguiti con la più bassa priorità possibile, ancora più
2819 bassa di un processo con il minimo valore di \textit{nice}. In sostanza la si
2820 può utilizzare per processi che devono essere eseguiti se non c'è niente altro
2821 da fare. Va comunque sottolineato che anche un processo \const{SCHED\_IDLE}
2822 avrà comunque una sua possibilità di utilizzo della CPU, sia pure in
2823 percentuale molto bassa.
2824
2825 Qualora si sia richiesta una politica \textit{real-time} il valore della
2826 priorità statica viene impostato attraverso la struttura
2827 \struct{sched\_param}, riportata in fig.~\ref{fig:sig_sched_param}, il cui
2828 solo campo attualmente definito è \var{sched\_priority}. Il campo deve
2829 contenere il valore della priorità statica da assegnare al processo; lo
2830 standard prevede che questo debba essere assegnato all'interno di un
2831 intervallo fra un massimo ed un minimo che nel caso di Linux sono
2832 rispettivamente 1 e 99.
2833
2834 \begin{figure}[!htbp]
2835   \footnotesize \centering
2836   \begin{minipage}[c]{0.5\textwidth}
2837     \includestruct{listati/sched_param.c}
2838   \end{minipage} 
2839   \normalsize 
2840   \caption{La struttura \structd{sched\_param}.} 
2841   \label{fig:sig_sched_param}
2842 \end{figure}
2843
2844 I processi con politica di \textit{scheduling} ordinaria devono sempre
2845 specificare un valore nullo di \var{sched\_priority} altrimenti si avrà un
2846 errore \errcode{EINVAL}, questo valore infatti non ha niente a che vedere con
2847 la priorità dinamica determinata dal valore di \textit{nice}, che deve essere
2848 impostato con le funzioni viste in precedenza.
2849
2850 Lo standard POSIX.1b prevede inoltre che l'intervallo dei valori delle
2851 priorità statiche possa essere ottenuto con le funzioni di sistema
2852 \funcd{sched\_get\_priority\_max} e \funcd{sched\_get\_priority\_min}, i cui
2853 prototipi sono:
2854
2855 \begin{funcproto}{ 
2856 \fhead{sched.h}
2857 \fdecl{int sched\_get\_priority\_max(int policy)}
2858 \fdesc{Legge il valore massimo di una priorità statica.} 
2859 \fdecl{int sched\_get\_priority\_min(int policy)}
2860 \fdesc{Legge il valore minimo di una priorità statica.} 
2861 }
2862 {Le funzioni ritornano il valore della priorità in caso di successo e $-1$ per
2863   un errore, nel qual caso \var{errno} assumerà il valore:
2864 \begin{errlist}
2865 \item[\errcode{EINVAL}] il valore di \param{policy} non è valido.
2866 \end{errlist}}
2867 \end{funcproto}
2868
2869 Le funzioni ritornano rispettivamente i due valori della massima e minima
2870 priorità statica possano essere ottenuti per una delle politiche di
2871 \textit{scheduling} \textit{real-time} indicata dall'argomento \param{policy}.
2872
2873 Si tenga presente che quando si imposta una politica di \textit{scheduling}
2874 real-time per un processo o se ne cambia la priorità statica questo viene
2875 messo in cima alla lista dei processi con la stessa priorità; questo comporta
2876 che verrà eseguito subito, interrompendo eventuali altri processi con la
2877 stessa priorità in quel momento in esecuzione.
2878
2879 Il kernel mantiene i processi con la stessa priorità assoluta in una lista, ed
2880 esegue sempre il primo della lista, mentre un nuovo processo che torna in
2881 stato \textit{runnable} viene sempre inserito in coda alla lista. Se la
2882 politica scelta è \const{SCHED\_FIFO} quando il processo viene eseguito viene
2883 automaticamente rimesso in coda alla lista, e la sua esecuzione continua
2884 fintanto che non viene bloccato da una richiesta di I/O, o non rilascia
2885 volontariamente la CPU (in tal caso, tornando nello stato \textit{runnable}
2886 sarà reinserito in coda alla lista); l'esecuzione viene ripresa subito solo
2887 nel caso che esso sia stato interrotto da un processo a priorità più alta.
2888
2889 Solo un processo con i privilegi di amministratore\footnote{più precisamente
2890   con la capacità \const{CAP\_SYS\_NICE}, vedi
2891   sez.~\ref{sec:proc_capabilities}.} può impostare senza restrizioni priorità
2892 assolute diverse da zero o politiche \const{SCHED\_FIFO} e
2893 \const{SCHED\_RR}. Un utente normale può modificare solo le priorità di
2894 processi che gli appartengono; è cioè richiesto che l'\ids{UID} effettivo del
2895 processo chiamante corrisponda all'\ids{UID} reale o effettivo del processo
2896 indicato con \param{pid}.
2897
2898 Fino al kernel 2.6.12 gli utenti normali non potevano impostare politiche
2899 \textit{real-time} o modificare la eventuale priorità statica di un loro
2900 processo. A partire da questa versione è divenuto possibile anche per gli
2901 utenti normali usare politiche \textit{real-time} fintanto che la priorità
2902 assoluta che si vuole impostare è inferiore al limite \const{RLIMIT\_RTPRIO}
2903 (vedi sez.~\ref{sec:sys_resource_limit}) ad essi assegnato. 
2904
2905 Unica eccezione a questa possibilità sono i processi \const{SCHED\_IDLE}, che
2906 non possono cambiare politica di \textit{scheduling} indipendentemente dal
2907 valore di \const{RLIMIT\_RTPRIO}. Inoltre, in caso di processo già sottoposto
2908 ad una politica \textit{real-time}, un utente può sempre, indipendentemente
2909 dal valore di \const{RLIMIT\_RTPRIO}, diminuirne la priorità o portarlo ad una
2910 politica ordinaria.
2911
2912 Se si intende operare solo sulla priorità statica di un processo si possono
2913 usare le due funzioni di sistema \funcd{sched\_setparam} e
2914 \funcd{sched\_getparam} che consentono rispettivamente di impostarne e
2915 leggerne il valore, i loro prototipi sono:
2916
2917 \begin{funcproto}{
2918 \fhead{sched.h}
2919 \fdecl{int sched\_setparam(pid\_t pid, const struct sched\_param *param)}
2920 \fdesc{Imposta la priorità statica di un processo.} 
2921 \fdecl{int sched\_getparam(pid\_t pid, struct sched\_param *param)}
2922 \fdesc{Legge la priorità statica di un processo.} 
2923 }
2924 {Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual
2925 caso \var{errno} assumerà uno dei valori:
2926 \begin{errlist}
2927 \item[\errcode{EINVAL}] il valore di \param{param} non ha senso per la
2928   politica usata dal processo.
2929 \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2930   l'operazione.
2931 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2932 \end{errlist}}
2933 \end{funcproto}
2934
2935 Le funzioni richiedono di indicare nell'argomento \param{pid} il processo su
2936 cui operare e usano l'argomento \param{param} per mantenere il valore della
2937 priorità dinamica. Questo è ancora una struttura \struct{sched\_param} ed
2938 assume gli stessi valori già visti per \func{sched\_setscheduler}.
2939
2940 L'uso di \func{sched\_setparam}, compresi i controlli di accesso che vi si
2941 applicano, è del tutto equivalente a quello di \func{sched\_setscheduler} con
2942 argomento \param{policy} uguale a $-1$. Come per \func{sched\_setscheduler}
2943 specificando $0$ come valore dell'argomento \param{pid} si opera sul processo
2944 corrente. Benché la funzione sia utilizzabile anche con processi sottoposti a
2945 politica ordinaria essa ha senso soltanto per quelli \textit{real-time}, dato
2946 che per i primi la priorità statica può essere soltanto nulla.  La
2947 disponibilità di entrambe le funzioni può essere verificata controllando la
2948 macro \macro{\_POSIX\_PRIORITY\_SCHEDULING} che è definita nell'\textit{header
2949   file} \headfile{sched.h}.
2950
2951 Se invece si vuole sapere quale è politica di \textit{scheduling} di un
2952 processo si può usare la funzione di sistema \funcd{sched\_getscheduler}, il
2953 cui prototipo è:
2954
2955 \begin{funcproto}{ 
2956 \fhead{sched.h}
2957 \fdecl{int sched\_getscheduler(pid\_t pid)}
2958 \fdesc{Legge la politica di \textit{scheduling}.} 
2959 }
2960 {La funzione ritorna la politica di \textit{scheduling}  in caso di successo e
2961   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2962 \begin{errlist}
2963     \item[\errcode{EPERM}] non si hanno privilegi sufficienti per eseguire
2964       l'operazione.
2965     \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2966 \end{errlist}}
2967 \end{funcproto}
2968
2969 La funzione restituisce il valore, secondo quanto elencato in
2970 tab.~\ref{tab:proc_sched_policy}, della politica di \textit{scheduling} per il
2971 processo specificato dall'argomento \param{pid}, se questo è nullo viene
2972 restituito il valore relativo al processo chiamante.
2973
2974 L'ultima funzione di sistema che permette di leggere le informazioni relative
2975 ai processi real-time è \funcd{sched\_rr\_get\_interval}, che permette di
2976 ottenere la lunghezza della \textit{time-slice} usata dalla politica
2977 \textit{round robin}; il suo prototipo è:
2978
2979 \begin{funcproto}{ 
2980 \fhead{sched.h}
2981 \fdecl{int sched\_rr\_get\_interval(pid\_t pid, struct timespec *tp)}
2982 \fdesc{Legge la durata della \textit{time-slice} per lo \textit{scheduling}
2983   \textit{round robin}.}  
2984 }
2985 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2986 caso \var{errno} assumerà uno dei valori:
2987 \begin{errlist}
2988 \item[\errcode{EINVAL}] l'argomento \param{pid} non è valido. 
2989 \item[\errcode{ENOSYS}] la \textit{system call} non è presente (solo per
2990   kernel arcaici).
2991 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
2992 \end{errlist}
2993 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
2994 \end{funcproto}
2995
2996 La funzione restituisce nell'argomento \param{tp} come una struttura
2997 \struct{timespec}, (la cui definizione si può trovare in
2998 fig.~\ref{fig:sys_timeval_struct}) il valore dell'intervallo di tempo usato
2999 per la politica \textit{round robin} dal processo indicato da \ids{PID}. Il
3000 valore dipende dalla versione del kernel, a lungo infatti questo intervallo di
3001 tempo era prefissato e non modificabile ad un valore di 150 millisecondi,
3002 restituito indipendentemente dal \ids{PID} indicato. 
3003
3004 Con kernel recenti però è possibile ottenere una variazione della
3005 \textit{time-slice}, modificando il valore di \textit{nice} del processo
3006 (anche se questo non incide assolutamente sulla priorità statica) che come
3007 accennato in precedenza modifica il valore assegnato alla \textit{time-slice}
3008 di un processo ordinario, che però viene usato anche dai processi
3009 \textit{real-time}.
3010
3011 Come accennato ogni processo può rilasciare volontariamente la CPU in modo da
3012 consentire agli altri processi di essere eseguiti; la funzione di sistema che
3013 consente di fare tutto questo è \funcd{sched\_yield}, il cui prototipo è:
3014
3015 \begin{funcproto}{ 
3016 \fhead{sched.h}
3017 \fdecl{int sched\_yield(void)}
3018 \fdesc{Rilascia volontariamente l'esecuzione.} 
3019 }
3020 {La funzione ritorna $0$ in caso di successo e teoricamente $-1$ per un
3021   errore, ma su Linux ha sempre successo.}
3022 \end{funcproto}
3023
3024
3025 Questa funzione ha un utilizzo effettivo soltanto quando si usa lo
3026 \textit{scheduling} \textit{real-time}, e serve a far sì che il processo
3027 corrente rilasci la CPU, in modo da essere rimesso in coda alla lista dei
3028 processi con la stessa priorità per permettere ad un altro di essere eseguito;
3029 se però il processo è l'unico ad essere presente sulla coda l'esecuzione non
3030 sarà interrotta. In genere usano questa funzione i processi con politica
3031 \const{SCHED\_FIFO}, per permettere l'esecuzione degli altri processi con pari
3032 priorità quando la sezione più urgente è finita.
3033
3034 La funzione può essere utilizzata anche con processi che usano lo
3035 \textit{scheduling} ordinario, ma in questo caso il comportamento non è ben
3036 definito, e dipende dall'implementazione. Fino al kernel 2.6.23 questo
3037 comportava che i processi venissero messi in fondo alla coda di quelli attivi,
3038 con la possibilità di essere rimessi in esecuzione entro breve tempo, con
3039 l'introduzione del \textit{Completely Fair Scheduler} questo comportamento è
3040 cambiato ed un processo che chiama la funzione viene inserito nella lista dei
3041 processi inattivo, con un tempo molto maggiore.\footnote{è comunque possibile
3042   ripristinare un comportamento analogo al precedente scrivendo il valore 1
3043   nel file \sysctlfile{kernel/sched\_compat\_yield}.}
3044
3045 L'uso delle funzione nella programmazione ordinaria può essere utile e
3046 migliorare le prestazioni generali del sistema quando si è appena rilasciata
3047 una risorsa contesa con altri processi, e si vuole dare agli altri una
3048 possibilità di approfittarne mettendoli in esecuzione, ma chiamarla senza
3049 necessità, specie se questo avviene ripetutamente all'interno di un qualche
3050 ciclo, può avere invece un forte impatto negativo per la generazione di
3051 \itindex{contest~switch} \textit{contest switch} inutili.
3052
3053
3054 \subsection{Il controllo dello \textit{scheduler} per i sistemi
3055   multiprocessore}
3056 \label{sec:proc_sched_multiprocess}
3057
3058 Con il supporto dei sistemi multiprocessore sono state introdotte delle
3059 funzioni che permettono di controllare in maniera più dettagliata la scelta di
3060 quale processore utilizzare per eseguire un certo programma. Uno dei problemi
3061 che si pongono nei sistemi multiprocessore è infatti quello del cosiddetto
3062 \index{effetto~ping-pong} \textsl{effetto ping-pong}. Può accadere cioè che lo
3063 \textit{scheduler}, quando riavvia un processo precedentemente interrotto
3064 scegliendo il primo processore disponibile, lo faccia eseguire da un
3065 processore diverso rispetto a quello su cui era stato eseguito in
3066 precedenza. Se il processo passa da un processore all'altro in questo modo,
3067 cosa che avveniva abbastanza di frequente con i kernel della seria 2.4.x, si
3068 ha l'\textsl{effetto ping-pong}.
3069
3070 Questo tipo di comportamento può generare dei seri problemi di prestazioni;
3071 infatti tutti i processori moderni utilizzano una memoria interna (la
3072 \textit{cache}) contenente i dati più usati, che permette di evitare di
3073 eseguire un accesso (molto più lento) alla memoria principale sulla scheda
3074 madre.  Chiaramente un processo sarà favorito se i suoi dati sono nella cache
3075 del processore, ma è ovvio che questo può essere vero solo per un processore
3076 alla volta, perché in presenza di più copie degli stessi dati su più
3077 processori, non si potrebbe determinare quale di questi ha la versione dei
3078 dati aggiornata rispetto alla memoria principale.
3079
3080 Questo comporta che quando un processore inserisce un dato nella sua cache,
3081 tutti gli altri processori che hanno lo stesso dato devono invalidarlo, e
3082 questa operazione è molto costosa in termini di prestazioni. Il problema
3083 diventa serio quando si verifica l'\textsl{effetto ping-pong}, in tal caso
3084 infatti un processo \textsl{rimbalza} continuamente da un processore all'altro
3085 e si ha una continua invalidazione della cache, che non diventa mai
3086 disponibile.
3087
3088 \itindbeg{CPU~affinity}
3089
3090 Per ovviare a questo tipo di problemi è nato il concetto di \textsl{affinità
3091   di processore} (o \textit{CPU affinity}); la possibilità cioè di far sì che
3092 un processo possa essere assegnato per l'esecuzione sempre allo stesso
3093 processore. Lo \textit{scheduler} dei kernel della serie 2.4.x aveva una
3094 scarsa \textit{CPU affinity}, e \index{effetto~ping-pong} l'effetto ping-pong
3095 era comune; con il nuovo \textit{scheduler} dei kernel della 2.6.x questo
3096 problema è stato risolto ed esso cerca di mantenere il più possibile ciascun
3097 processo sullo stesso processore.
3098
3099 In certi casi però resta l'esigenza di poter essere sicuri che un processo sia
3100 sempre eseguito dallo stesso processore,\footnote{quella che viene detta
3101   \textit{hard CPU affinity}, in contrasto con quella fornita dallo
3102   \textit{scheduler}, detta \textit{soft CPU affinity}, che di norma indica
3103   solo una preferenza, non un requisito assoluto.} e per poter risolvere
3104 questo tipo di problematiche nei nuovi kernel\footnote{le due \textit{system
3105     call} per la gestione della \textit{CPU affinity} sono state introdotte
3106   nel kernel 2.5.8, e le corrispondenti funzioni di sistema nella
3107   \textsl{glibc} 2.3.} è stata introdotta l'opportuna infrastruttura ed una
3108 nuova \textit{system call} che permette di impostare su quali processori far
3109 eseguire un determinato processo attraverso una \textsl{maschera di
3110   affinità}. La corrispondente funzione di sistema è
3111 \funcd{sched\_setaffinity} ed il suo prototipo è:
3112
3113 \index{insieme~di~processori|(}
3114
3115 \begin{funcproto}{ 
3116 \fhead{sched.h}
3117 \fdecl{int sched\_setaffinity(pid\_t pid, size\_t setsize, 
3118   cpu\_set\_t *mask)}
3119 \fdesc{Imposta la maschera di affinità di un processo.} 
3120 }
3121 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3122 caso \var{errno} assumerà uno dei valori:
3123 \begin{errlist}
3124 \item[\errcode{EINVAL}] il valore di \param{mask} contiene riferimenti a
3125   processori non esistenti nel sistema o a cui non è consentito l'accesso.
3126 \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
3127   eseguire l'operazione.
3128 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3129 \end{errlist}
3130 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3131 \end{funcproto}
3132
3133 Questa funzione e la corrispondente \func{sched\_getaffinity} hanno una storia
3134 abbastanza complessa, la sottostante \textit{system call} infatti prevede
3135 l'uso di due soli argomenti (per il pid e l'indicazione della maschera dei
3136 processori), che corrispondono al fatto che l'implementazione effettiva usa
3137 una semplice maschera binaria. Quando le funzioni vennero incluse nella
3138 \acr{glibc} assunsero invece un prototipo simile a quello mostrato però con il
3139 secondo argomento di tipo \ctyp{unsigned int}. A complicare la cosa si
3140 aggiunge il fatto che nella versione 2.3.3 della \acr{glibc} detto argomento
3141 venne stato eliminato, per poi essere ripristinato nella versione 2.3.4 nella
3142 forma attuale.\footnote{pertanto se la vostra pagina di manuale non è
3143   aggiornata, o usate quella particolare versione della \acr{glibc}, potrete
3144   trovare indicazioni diverse, il prototipo illustrato è quello riportato
3145   nella versione corrente (maggio 2008) delle pagine di manuale e
3146   corrispondente alla definizione presente in \headfile{sched.h}.}
3147
3148 La funzione imposta, con l'uso del valore contenuto all'indirizzo
3149 \param{mask}, l'insieme dei processori sui quali deve essere eseguito il
3150 processo identificato tramite il valore passato in \param{pid}. Come in
3151 precedenza il valore nullo di \param{pid} indica il processo corrente.  Per
3152 poter utilizzare questa funzione sono richiesti i privilegi di amministratore
3153 (è necessaria la capacità \const{CAP\_SYS\_NICE}) altrimenti essa fallirà con
3154 un errore di \errcode{EPERM}. Una volta impostata una maschera di affinità,
3155 questa viene ereditata attraverso una \func{fork}, in questo modo diventa
3156 possibile legare automaticamente un gruppo di processi ad un singolo
3157 processore.
3158
3159 Nell'uso comune, almeno con i kernel successivi alla serie 2.6.x, l'uso di
3160 questa funzione non è necessario, in quanto è lo \textit{scheduler} stesso che
3161 provvede a mantenere al meglio l'affinità di processore. Esistono però
3162 esigenze particolari, ad esempio quando un processo (o un gruppo di processi)
3163 è utilizzato per un compito importante (ad esempio per applicazioni
3164 \textit{real-time} o la cui risposta è critica) e si vuole la massima
3165 velocità, e con questa interfaccia diventa possibile selezionare gruppi di
3166 processori utilizzabili in maniera esclusiva.  Lo stesso dicasi quando
3167 l'accesso a certe risorse (memoria o periferiche) può avere un costo diverso a
3168 seconda del processore, come avviene nelle architetture NUMA
3169 (\textit{Non-Uniform Memory Access}).
3170
3171 Infine se un gruppo di processi accede alle stesse risorse condivise (ad
3172 esempio una applicazione con più \itindex{thread} \textit{thread}) può avere
3173 senso usare lo stesso processore in modo da sfruttare meglio l'uso della sua
3174 cache; questo ovviamente riduce i benefici di un sistema multiprocessore
3175 nell'esecuzione contemporanea dei \itindex{thread} \textit{thread}, ma in
3176 certi casi (quando i \itindex{thread} \textit{thread} sono inerentemente
3177 serializzati nell'accesso ad una risorsa) possono esserci sufficienti vantaggi
3178 nell'evitare la perdita della cache da rendere conveniente l'uso dell'affinità
3179 di processore.
3180
3181 Dato che il numero di processori può variare a seconda delle architetture, per
3182 semplificare l'uso dell'argomento \param{mask} la \acr{glibc} ha introdotto un
3183 apposito dato di tipo, \type{cpu\_set\_t},\footnote{questa è una estensione
3184   specifica della \acr{glibc}, da attivare definendo la macro
3185   \macro{\_GNU\_SOURCE}, non esiste infatti una standardizzazione per questo
3186   tipo di interfaccia e POSIX al momento non prevede nulla al riguardo.} che
3187 permette di identificare un insieme di processori. Il dato è normalmente una
3188 maschera binaria: nei casi più comuni potrebbe bastare un intero a 32 bit, in
3189 cui ogni bit corrisponde ad un processore, ma oggi esistono architetture in
3190 cui questo numero può non essere sufficiente, e per questo è stato creato
3191 questo \index{tipo!opaco} tipo opaco e una interfaccia di gestione che
3192 permette di usare a basso livello un tipo di dato qualunque rendendosi
3193 indipendenti dal numero di bit e dalla loro disposizione.  Per questo le
3194 funzioni richiedono anche che oltre all'insieme di processori si indichi anche
3195 la dimensione dello stesso con l'argomento \param{setsize}, per il quale, se
3196 non si usa l'allocazione dinamica che vedremo a breve, ed è in genere
3197 sufficiente passare il valore \code{sizeof(cpu\_set\_t)}.
3198
3199 L'interfaccia di gestione degli insiemi di processori, oltre alla definizione
3200 del tipo \type{cpu\_set\_t}, prevede una serie di macro di preprocessore per
3201 la manipolazione degli stessi. Quelle di base, che consentono rispettivamente
3202 di svuotare un insieme, di aggiungere o togliere un processore o di verificare
3203 se esso è già presente in un insieme, sono le seguenti:
3204
3205 {\centering
3206 \vspace{3pt}
3207 \begin{funcbox}{ 
3208 \fhead{sched.h}
3209 \fdecl{void \macro{CPU\_ZERO}(cpu\_set\_t *set)}
3210 \fdesc{Inizializza un insieme di processori vuoto \param{set}.} 
3211 \fdecl{void \macro{CPU\_SET}(int cpu, cpu\_set\_t *set)}
3212 \fdesc{Inserisce il processore \param{cpu} nell'insieme di processori \param{set}.} 
3213 \fdecl{void \macro{CPU\_CLR}(int cpu, cpu\_set\_t *set)}
3214 \fdesc{Rimuove il processore \param{cpu} nell'insieme di processori \param{set}.} 
3215 \fdecl{int \macro{CPU\_ISSET}(int cpu, cpu\_set\_t *set)}
3216 \fdesc{Controlla se il processore \param{cpu} è nell'insieme di processori \param{set}.} 
3217 }
3218 \end{funcbox}}
3219
3220 Queste macro che sono ispirate dalle analoghe usate per gli insiemi di
3221 \textit{file descriptor} (vedi sez.~\ref{sec:file_select}) e sono state
3222 introdotte con la versione 2.3.3 della \acr{glibc}. Tutte richiedono che si
3223 specifichi il numero di una CPU nell'argomento \param{cpu}, ed un insieme su
3224 cui operare. L'unica che ritorna un risultato è \macro{CPU\_ISSET}, che
3225 restituisce un intero da usare come valore logico (zero se la CPU non è
3226 presente, diverso da zero se è presente).
3227
3228 Si tenga presente che trattandosi di macro l'argomento \param{cpu} può essere
3229 valutato più volte. Questo significa ad esempio che non si può usare al suo
3230 posto una funzione o un'altra macro, altrimenti queste verrebbero eseguite più
3231 volte, l'argomento cioè non deve avere \textsl{effetti collaterali} (in gergo
3232 \itindex{side~effects} \textit{side effects}).\footnote{nel linguaggio C si
3233   parla appunto di \textit{side effects} quando si usano istruzioni la cui
3234   valutazione comporta effetti al di fuori dell'istruzione stessa, come il
3235   caso indicato in cui si passa una funzione ad una macro che usa l'argomento
3236   al suo interno più volte, o si scrivono espressioni come \code{a=a++} in cui
3237   non è chiaro se prima avvenga l'incremento e poi l'assegnazione, ed il cui
3238   risultato dipende dall'implementazione del compilatore.}
3239
3240 Le CPU sono numerate da zero (che indica la prima disponibile) fino ad
3241 un numero massimo che dipende dalla architettura hardware. La costante
3242 \const{CPU\_SETSIZE} indica il numero massimo di processori che possono far
3243 parte di un insieme (al momento vale sempre 1024), e costituisce un limite
3244 massimo al valore dell'argomento \param{cpu}.
3245 Dalla versione 2.6 della \acr{glibc} alle precedenti macro è stata aggiunta,
3246 per contare il numero di processori in un insieme, l'ulteriore:
3247
3248 {\centering
3249 \vspace{3pt}
3250 \begin{funcbox}{ 
3251 \fhead{sched.h}
3252 \fdecl{int \macro{CPU\_COUNT}(cpu\_set\_t *set)}
3253 \fdesc{Conta il numero di processori presenti nell'insieme \param{set}.} 
3254 }
3255 \end{funcbox}}
3256
3257 A partire dalla versione 2.7 della \acr{glibc} sono state introdotte altre
3258 macro che consentono ulteriori manipolazioni, in particolare si possono
3259 compiere delle operazioni logiche sugli insiemi di processori con:
3260
3261 {\centering
3262 \vspace{3pt}
3263 \begin{funcbox}{ 
3264 \fhead{sched.h}
3265 \fdecl{void \macro{CPU\_AND}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3266 \fdesc{Esegue l'AND logico di due insiemi di processori.} 
3267 \fdecl{void \macro{CPU\_OR}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3268 \fdesc{Esegue l'OR logico di due insiemi di processori.} 
3269 \fdecl{void \macro{CPU\_XOR}(cpu\_set\_t *destset, cpu\_set\_t *srcset1, cpu\_set\_t *srcset2)}
3270 \fdesc{Esegue lo XOR logico di due insiemi di processori.} 
3271 \fdecl{int \macro{CPU\_EQUAL}(cpu\_set\_t *set1, cpu\_set\_t *set2)}
3272 \fdesc{Verifica se due insiemi di processori sono uguali.} 
3273 }
3274 \end{funcbox}}
3275
3276 Le prime tre macro richiedono due insiemi di partenza, \param{srcset1}
3277 e \param{srcset2} e forniscono in un terzo insieme \param{destset} (che può
3278 essere anche lo stesso di uno dei precedenti) il risultato della rispettiva
3279 operazione logica sui contenuti degli stessi. In sostanza con \macro{CPU\_AND}
3280 si otterrà come risultato l'insieme che contiene le CPU presenti in entrambi
3281 gli insiemi di partenza, con \macro{CPU\_OR} l'insieme che contiene le CPU
3282 presenti in uno qualunque dei due insiemi di partenza, e con \macro{CPU\_XOR}
3283 l'insieme che contiene le CPU presenti presenti in uno solo dei due insiemi di
3284 partenza. Infine \macro{CPU\_EQUAL} confronta due insiemi ed è l'unica che
3285 restituisce un intero, da usare come valore logico che indica se sono
3286 identici o meno.
3287
3288 Inoltre, sempre a partire dalla versione 2.7 della \acr{glibc}, è stata
3289 introdotta la possibilità di una allocazione dinamica degli insiemi di
3290 processori, per poterli avere di dimensioni corrispondenti al numero di CPU
3291 effettivamente in gioco, senza dover fare riferimento necessariamente alla
3292 precedente dimensione preimpostata di 1024. Per questo motivo sono state
3293 definite tre ulteriori macro, che consentono rispettivamente di allocare,
3294 disallocare ed ottenere la dimensione in byte di un insieme di processori:
3295
3296 {\centering
3297 \vspace{3pt}
3298 \begin{funcbox}{ 
3299 \fhead{sched.h}
3300 \fdecl{cpu\_set\_t * \macro{CPU\_ALLOC}(num\_cpus)}
3301 \fdesc{Alloca dinamicamente un insieme di processori di dimensione voluta.} 
3302 \fdecl{void \macro{CPU\_FREE}(cpu\_set\_t *set)}
3303 \fdesc{Disalloca un insieme di processori allocato dinamicamente.} 
3304 \fdecl{size\_t \macro{CPU\_ALLOC\_SIZE}(num\_cpus)}
3305 \fdesc{Ritorna la dimensione di un insieme di processori allocato dinamicamente.} 
3306 }
3307 \end{funcbox}}
3308
3309 La prima macro, \macro{CPU\_ALLOC}, restituisce il puntatore ad un insieme di
3310 processori in grado di contenere almeno \param{num\_cpus} che viene allocato
3311 dinamicamente. Ogni insieme così allocato dovrà essere disallocato con
3312 \macro{CPU\_FREE} passandogli un puntatore ottenuto da una precedente
3313 \macro{CPU\_ALLOC}. La terza macro, \macro{CPU\_ALLOC\_SIZE}, consente di
3314 ottenere la dimensione in byte di un insieme allocato dinamicamente che
3315 contenga \param{num\_cpus} processori.
3316
3317 Dato che le dimensioni effettive possono essere diverse le macro di gestione e
3318 manipolazione che abbiamo trattato in precedenza non si applicano agli insiemi
3319 allocati dinamicamente, per i quali dovranno sono state definite altrettante
3320 macro equivalenti contraddistinte dal suffisso \texttt{\_S}, che effettuano le
3321 stesse operazioni, ma richiedono in più un argomento
3322 aggiuntivo \param{setsize} che deve essere assegnato al valore ottenuto con
3323 \macro{CPU\_ALLOC\_SIZE}. Questo stesso valore deve essere usato per l'omonimo
3324 argomento delle funzioni \func{sched\_setaffinity} o \func{sched\_getaffinity}
3325 quando si vuole usare per l'argomento che indica la maschera di affinità un
3326 insieme di processori allocato dinamicamente.
3327
3328 \index{insieme~di~processori|)}
3329
3330 A meno di non aver utilizzato \func{sched\_setaffinity}, in condizioni
3331 ordinarie la maschera di affinità di un processo è preimpostata dal sistema in
3332 modo che esso possa essere eseguito su qualunque processore. Se ne può
3333 comunque ottenere il valore corrente usando la funzione di sistema
3334 \funcd{sched\_getaffinity}, il cui prototipo è:
3335
3336 \begin{funcproto}{ 
3337 \fhead{sched.h}
3338 \fdecl{int sched\_getaffinity (pid\_t pid, size\_t setsize, 
3339   cpu\_set\_t *mask)}
3340 \fdesc{Legge la maschera di affinità di un processo.} 
3341 }
3342 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3343 caso \var{errno} assumerà uno dei valori:
3344 \begin{errlist}
3345 \item[\errcode{EINVAL}] \param{setsize} è più piccolo delle dimensioni
3346   della maschera di affinità usata dal kernel.
3347 \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
3348 \end{errlist}
3349 ed inoltre anche \errval{EFAULT} nel suo significato generico.}
3350 \end{funcproto}
3351
3352 La funzione restituirà all'indirizzo specificato da \param{mask} il valore
3353 della maschera di affinità del processo indicato dall'argomento \param{pid}
3354 (al solito un valore nullo indica il processo corrente) così da poterla
3355 riutilizzare per una successiva reimpostazione.
3356
3357 È chiaro che queste funzioni per la gestione dell'affinità hanno significato
3358 soltanto su un sistema multiprocessore, esse possono comunque essere
3359 utilizzate anche in un sistema con un processore singolo, nel qual caso però
3360 non avranno alcun risultato effettivo.
3361
3362 \itindend{scheduler}
3363 \itindend{CPU~affinity}
3364
3365
3366 \subsection{Le priorità per le operazioni di I/O}
3367 \label{sec:io_priority}
3368
3369 A lungo l'unica priorità usata per i processi è stata quella relativa
3370 all'assegnazione dell'uso del processore. Ma il processore non è l'unica
3371 risorsa che i processi devono contendersi, un'altra, altrettanto importante
3372 per le prestazioni, è quella dell'accesso a disco. Per questo motivo nello
3373 sviluppo del kernel sono stati introdotti diversi \textit{I/O scheduler} in
3374 grado di distribuire in maniera opportuna questa risorsa ai vari processi.
3375
3376 Fino al kernel 2.6.17 era possibile soltanto differenziare le politiche
3377 generali di gestione, scegliendo di usare un diverso \textit{I/O scheduler}. A
3378 partire da questa versione, con l'introduzione dello \textit{scheduler} CFQ
3379 (\textit{Completely Fair Queuing}) è divenuto possibile, qualora si usi questo
3380 \textit{scheduler}, impostare anche delle diverse priorità di accesso per i
3381 singoli processi.\footnote{al momento (kernel 2.6.31), le priorità di I/O sono
3382   disponibili soltanto per questo \textit{scheduler}.}
3383
3384 La scelta di uno \textit{scheduler} di I/O si può fare in maniera generica per
3385 tutto il sistema all'avvio del kernel con il parametro di avvio
3386 \texttt{elevator},\footnote{per la trattazione dei parametri di avvio del
3387   kernel si rimanda al solito alla sez.~5.3 di \cite{AGL}.} cui assegnare il
3388 nome dello \textit{scheduler}, ma se ne può anche indicare uno specifico per
3389 l'accesso al singolo disco scrivendo nel file
3390 \texttt{/sys/block/\textit{<dev>}/queue/scheduler} (dove
3391 \texttt{\textit{<dev>}} è il nome del dispositivo associato al disco).
3392
3393 Gli \textit{scheduler} disponibili sono mostrati dal contenuto dello stesso
3394 file che riporta fra parentesi quadre quello attivo, il default in tutti i
3395 kernel recenti è proprio il \texttt{cfq},\footnote{nome con cui si indica
3396   appunto lo \textit{scheduler} CFQ.} che supporta le priorità. Per i dettagli
3397 sulle caratteristiche specifiche degli altri \textit{scheduler}, la cui
3398 discussione attiene a problematiche di ambito sistemistico, si consulti la
3399 documentazione nella directory \texttt{Documentation/block/} dei sorgenti del
3400 kernel.
3401
3402 Una volta che si sia impostato lo \textit{scheduler} CFQ ci sono due
3403 specifiche \textit{system call}, specifiche di Linux, che consentono di
3404 leggere ed impostare le priorità di I/O.\footnote{se usate in corrispondenza
3405   ad uno \textit{scheduler} diverso il loro utilizzo non avrà alcun effetto.}
3406 Dato che non esiste una interfaccia diretta nella \acr{glibc} per queste due
3407 funzioni\footnote{almeno al momento della scrittura di questa sezione, con la
3408   versione 2.11 della \acr{glibc}.} occorrerà invocarle tramite la funzione
3409 \func{syscall} (come illustrato in sez.~\ref{sec:proc_syscall}). Le due
3410 \textit{system call} sono \funcd{ioprio\_get} ed \funcd{ioprio\_set}; i
3411 rispettivi prototipi sono:
3412
3413 \begin{funcproto}{ 
3414 \fhead{linux/ioprio.h}
3415 \fdecl{int ioprio\_get(int which, int who)}
3416 \fdesc{Legge la priorità di I/O di un processo.} 
3417 \fdecl{int ioprio\_set(int which, int who, int ioprio)}
3418 \fdesc{Imposta la priorità di I/O di un processo.} 
3419 }
3420 {Le funzioni ritornano rispettivamente un intero positivo o 0 in caso di
3421   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
3422   valori:
3423 \begin{errlist}
3424 \item[\errcode{EINVAL}] i valori di \param{which} o di \param{ioprio} non
3425   sono validi. 
3426 \item[\errcode{EPERM}] non si hanno i privilegi per eseguire
3427   l'impostazione (solo per \func{ioprio\_set}). 
3428 \item[\errcode{ESRCH}] non esiste un processo corrispondente alle indicazioni.
3429 \end{errlist}}
3430 \end{funcproto}
3431
3432 Le funzioni leggono o impostano la priorità di I/O sulla base dell'indicazione
3433 dei due argomenti \param{which} e \param{who} che hanno lo stesso significato
3434 già visto per gli omonimi argomenti di \func{getpriority} e
3435 \func{setpriority}. Anche in questo caso si deve specificare il valore
3436 di \param{which} tramite le opportune costanti riportate in
3437 tab.~\ref{tab:ioprio_args} che consentono di indicare un singolo processo, i
3438 processi di un \textit{process group} (tratteremo questo argomento in
3439 sez.~\ref{sec:sess_proc_group}) o tutti i processi di un utente.
3440
3441 \begin{table}[htb]
3442   \centering
3443   \footnotesize
3444   \begin{tabular}[c]{|c|c|l|}
3445     \hline
3446     \param{which} & \param{who} & \textbf{Significato} \\
3447     \hline
3448     \hline
3449     \const{IPRIO\_WHO\_PROCESS} & \type{pid\_t} & processo\\
3450     \const{IPRIO\_WHO\_PRGR}    & \type{pid\_t} & \itindex{process~group}
3451                                                   \textit{process group}\\ 
3452     \const{IPRIO\_WHO\_USER}    & \type{uid\_t} & utente\\
3453     \hline
3454   \end{tabular}
3455   \caption{Legenda del valore dell'argomento \param{which} e del tipo
3456     dell'argomento \param{who} delle funzioni \func{ioprio\_get} e
3457     \func{ioprio\_set} per le tre possibili scelte.}
3458   \label{tab:ioprio_args}
3459 \end{table}
3460
3461 In caso di successo \func{ioprio\_get} restituisce un intero positivo che
3462 esprime il valore della priorità di I/O, questo valore è una maschera binaria
3463 composta da due parti, una che esprime la \textsl{classe} di
3464 \textit{scheduling} di I/O del processo, l'altra che esprime, quando la classe
3465 di \textit{scheduling} lo prevede, la priorità del processo all'interno della
3466 classe stessa. Questo stesso formato viene utilizzato per indicare il valore
3467 della priorità da impostare con l'argomento \param{ioprio} di
3468 \func{ioprio\_set}.
3469 \begin{table}[htb]
3470   \centering
3471   \footnotesize
3472   \begin{tabular}[c]{|l|p{8cm}|}
3473     \hline
3474     \textbf{Macro} & \textbf{Significato}\\
3475     \hline
3476     \hline
3477     \macro{IOPRIO\_PRIO\_CLASS}\texttt{(\textit{value})}
3478                                 & Dato il valore di una priorità come
3479                                   restituito da \func{ioprio\_get} estrae il
3480                                   valore della classe.\\
3481     \macro{IOPRIO\_PRIO\_DATA}\texttt{(\textit{value})}
3482                                 & Dato il valore di una priorità come
3483                                   restituito da \func{ioprio\_get} estrae il
3484                                   valore della priorità.\\
3485     \macro{IOPRIO\_PRIO\_VALUE}\texttt{(\textit{class},\textit{prio})}
3486                                 & Dato un valore di priorità ed una classe
3487                                   ottiene il valore numerico da passare a
3488                                   \func{ioprio\_set}.\\
3489     \hline
3490   \end{tabular}
3491   \caption{Le macro per la gestione dei valori numerici .}
3492   \label{tab:IOsched_class_macro}
3493 \end{table}
3494
3495
3496 Per la gestione dei valori che esprimono le priorità di I/O sono state
3497 definite delle opportune macro di preprocessore, riportate in
3498 tab.~\ref{tab:IOsched_class_macro}. I valori delle priorità si ottengono o si
3499 impostano usando queste macro.  Le prime due si usano con il valore restituito
3500 da \func{ioprio\_get} e per ottenere rispettivamente la classe di
3501 \textit{scheduling}\footnote{restituita dalla macro con i valori di
3502   tab.~\ref{tab:IOsched_class}.} e l'eventuale valore della priorità. La terza
3503 macro viene invece usata per creare un valore di priorità da usare come
3504 argomento di \func{ioprio\_set} per eseguire una impostazione.
3505
3506 \begin{table}[htb]
3507   \centering
3508   \footnotesize
3509   \begin{tabular}[c]{|l|l|}
3510     \hline
3511     \textbf{Classe}  & \textbf{Significato} \\
3512     \hline
3513     \hline
3514     \const{IOPRIO\_CLASS\_RT}  & \textit{Scheduling} di I/O \textit{real-time}.\\ 
3515     \const{IOPRIO\_CLASS\_BE}  & \textit{Scheduling} di I/O ordinario.\\ 
3516     \const{IOPRIO\_CLASS\_IDLE}& \textit{Scheduling} di I/O di priorità minima.\\
3517     \hline
3518   \end{tabular}
3519   \caption{Costanti che identificano le classi di \textit{scheduling} di I/O.}
3520   \label{tab:IOsched_class}
3521 \end{table}
3522
3523 Le classi di \textit{scheduling} previste dallo \textit{scheduler} CFQ sono
3524 tre, e ricalcano tre diverse modalità di distribuzione delle risorse analoghe
3525 a quelle già adottate anche nel funzionamento dello \textit{scheduler} del
3526 processore. Ciascuna di esse è identificata tramite una opportuna costante,
3527 secondo quanto riportato in tab.~\ref{tab:IOsched_class}.
3528
3529 La classe di priorità più bassa è \const{IOPRIO\_CLASS\_IDLE}; i processi in
3530 questa classe riescono ad accedere a disco soltanto quando nessun altro
3531 processo richiede l'accesso. Occorre pertanto usarla con molta attenzione,
3532 perché un processo in questa classe può venire completamente bloccato quando
3533 ci sono altri processi in una qualunque delle altre due classi che stanno
3534 accedendo al disco. Quando si usa questa classe non ha senso indicare un
3535 valore di priorità, dato che in questo caso non esiste nessuna gerarchia e la
3536 priorità è identica, la minima possibile, per tutti i processi.
3537
3538 La seconda classe di priorità di I/O è \const{IOPRIO\_CLASS\_BE} (il nome sta
3539 per \textit{best-effort}) che è quella usata ordinariamente da tutti
3540 processi. In questo caso esistono priorità diverse che consentono di
3541 assegnazione di una maggiore banda passante nell'accesso a disco ad un
3542 processo rispetto agli altri, con meccanismo simile a quello dei valori di
3543 \textit{nice} in cui si evita che un processo a priorità più alta possa
3544 bloccare indefinitamente quelli a priorità più bassa. In questo caso però le
3545 diverse priorità sono soltanto otto, indicate da un valore numerico fra 0 e 7
3546 e come per \textit{nice} anche in questo caso un valore più basso indica una
3547 priorità maggiore. 
3548
3549
3550 Infine la classe di priorità di I/O \textit{real-time}
3551 \const{IOPRIO\_CLASS\_RT} ricalca le omonime priorità di processore: un
3552 processo in questa classe ha sempre la precedenza nell'accesso a disco
3553 rispetto a tutti i processi delle altre classi e di un processo nella stessa
3554 classe ma con priorità inferiore, ed è pertanto in grado di bloccare
3555 completamente tutti gli altri. Anche in questo caso ci sono 8 priorità diverse
3556 con un valore numerico fra 0 e 7, con una priorità più elevata per valori più
3557 bassi.
3558
3559 In generale nel funzionamento ordinario la priorità di I/O di un processo
3560 viene impostata in maniera automatica nella classe \const{IOPRIO\_CLASS\_BE}
3561 con un valore ottenuto a partire dal corrispondente valore di \textit{nice}
3562 tramite la formula: $\mathtt{\mathit{prio}}=(\mathtt{\mathit{nice}}+20)/5$. Un
3563 utente ordinario può modificare con \func{ioprio\_set} soltanto le priorità
3564 dei processi che gli appartengono,\footnote{per la modifica delle priorità di
3565   altri processi occorrono privilegi amministrativi, ed in particolare la
3566   capacità \const{CAP\_SYS\_NICE} (vedi sez.~\ref{sec:proc_capabilities}).}
3567 cioè quelli il cui \ids{UID} reale corrisponde all'\ids{UID} reale o effettivo
3568 del chiamante. Data la possibilità di ottenere un blocco totale del sistema,
3569 solo l'amministratore\footnote{o un processo con la capacità
3570   \const{CAP\_SYS\_ADMIN} (vedi sez.~\ref{sec:proc_capabilities}).} può
3571 impostare un processo ad una priorità di I/O nella classe
3572 \const{IOPRIO\_CLASS\_RT}, lo stesso privilegio era richiesto anche per la
3573 classe \const{IOPRIO\_CLASS\_IDLE} fino al kernel 2.6.24, ma dato che in
3574 questo caso non ci sono effetti sugli altri processi questo limite è stato
3575 rimosso a partire dal kernel 2.6.25.
3576
3577 %TODO verificare http://lwn.net/Articles/355987/
3578
3579 \section{Funzioni di gestione avanzata}
3580 \label{sec:proc_advanced_control}
3581
3582 Nelle precedenti sezioni si sono trattate la gran parte delle funzioni che
3583 attengono alla gestione ordinaria dei processi e delle loro proprietà più
3584 comuni. Tratteremo qui alcune \textit{system call} dedicate alla gestione di
3585 funzionalità dei processi molto specifiche ed avanzate, il cui uso è in genere
3586 piuttosto ridotto. Trattandosi di problematiche abbastanza complesse, che
3587 spesso presuppongono la conoscenza di altri argomenti trattati nel seguito
3588 della guida, si può saltare questa sezione in una prima lettura, tornando su
3589 di essa in un secondo tempo.
3590
3591
3592 \subsection{La funzione \func{prctl}}
3593 \label{sec:process_prctl}
3594
3595 Benché la gestione ordinaria possa essere effettuata attraverso le funzioni
3596 che abbiamo già esaminato nelle sezioni precedenti, esistono una serie di
3597 proprietà e caratteristiche particolari dei processi non coperte da esse, per
3598 la cui gestione è stata predisposta una apposita \textit{system call} che
3599 fornisce una interfaccia generica per tutte le operazioni specialistiche. La
3600 funzione di sistema è \funcd{prctl} ed il suo prototipo è:\footnote{la
3601   funzione non è standardizzata ed è specifica di Linux, anche se ne esiste
3602   una analoga in IRIX; è stata introdotta con il kernel 2.1.57.}
3603
3604 \begin{funcproto}{ 
3605 \fhead{sys/prctl.h}
3606 \fdecl{int prctl(int option, unsigned long arg2, unsigned long arg3, unsigned
3607   long arg4, \\
3608 \phantom{int prctl(}unsigned long arg5)}
3609 \fdesc{Esegue una operazione speciale sul processo corrente.} 
3610 }
3611 {La funzione ritorna $0$ o un valore positivo dipendente dall'operazione in
3612   caso di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà
3613   valori diversi a seconda del tipo di operazione richiesta (in genere
3614   \errval{EINVAL} o \errval{EPERM}).}
3615 \end{funcproto}
3616
3617 La funzione ritorna un valore nullo o positivo in caso di successo e $-1$ in
3618 caso di errore; il significato degli argomenti della funzione successivi al
3619 primo, il valore di ritorno in caso di successo, il tipo di errore restituito
3620 in \var{errno} dipendono dall'operazione eseguita, indicata tramite il primo
3621 argomento, \param{option}. Questo è un valore intero che identifica
3622 l'operazione, e deve essere specificato con l'uso di una delle costanti
3623 predefinite del seguente elenco, che illustra quelle disponibili al
3624 momento:\footnote{alla stesura di questa sezione, cioè con il kernel 3.2.}
3625
3626 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
3627 \item[\const{PR\_CAPBSET\_READ}] Controlla la disponibilità di una delle
3628   \textit{capability} (vedi sez.~\ref{sec:proc_capabilities}). La funzione
3629   ritorna 1 se la capacità specificata nell'argomento \param{arg2} (con una
3630   delle costanti di tab.~\ref{tab:proc_capabilities}) è presente nel
3631   \textit{capabilities bounding set} del processo e zero altrimenti,
3632   se \param{arg2} non è un valore valido si avrà un errore di \errval{EINVAL}.
3633   Introdotta a partire dal kernel 2.6.25.
3634
3635 \item[\const{PR\_CAPBSET\_DROP}] Rimuove permanentemente una delle
3636   \textit{capabilities} (vedi sez.~\ref{sec:proc_capabilities}) dal processo e
3637   da tutti i suoi discendenti. La funzione cancella la capacità specificata
3638   nell'argomento \param{arg2} con una delle costanti di
3639   tab.~\ref{tab:proc_capabilities} dal \textit{capabilities bounding set} del
3640   processo. L'operazione richiede i privilegi di amministratore (la capacità
3641   \const{CAP\_SETPCAP}), altrimenti la chiamata fallirà con un errore di
3642   \errcode{EPERM}; se il valore di \param{arg2} non è valido o se il supporto
3643   per le \textit{file capabilities} non è stato compilato nel kernel la
3644   chiamata fallirà con un errore di \errval{EINVAL}. Introdotta a partire dal
3645   kernel 2.6.25.
3646
3647 \item[\const{PR\_SET\_DUMPABLE}] Imposta il flag che determina se la
3648   terminazione di un processo a causa di un segnale per il quale è prevista la
3649   generazione di un file di \itindex{core~dump} \textit{core dump} (vedi
3650   sez.~\ref{sec:sig_standard}) lo genera effettivamente. In genere questo flag
3651   viene attivato automaticamente, ma per evitare problemi di sicurezza (la
3652   generazione di un file da parte di processi privilegiati può essere usata
3653   per sovrascriverne altri) viene cancellato quando si mette in esecuzione un
3654   programma con i bit \acr{suid} e \acr{sgid} attivi (vedi
3655   sez.~\ref{sec:file_special_perm}) o con l'uso delle funzioni per la modifica
3656   degli \ids{UID} dei processi (vedi sez.~\ref{sec:proc_setuid}). 
3657
3658   L'operazione è stata introdotta a partire dal kernel 2.3.20, fino al kernel
3659   2.6.12 e per i kernel successivi al 2.6.17 era possibile usare solo un
3660   valore 0 di \param{arg2} per disattivare il flag ed un valore 1 per
3661   attivarlo. Nei kernel dal 2.6.13 al 2.6.17 è stato supportato anche il
3662   valore 2, che causava la generazione di un \itindex{core~dump} \textit{core
3663     dump} leggibile solo dall'amministratore, ma questa funzionalità è stata
3664   rimossa per motivi di sicurezza, in quanto consentiva ad un utente normale
3665   di creare un file di \textit{core dump} appartenente all'amministratore in
3666   directory dove l'utente avrebbe avuto permessi di accesso.
3667
3668 \item[\const{PR\_GET\_DUMPABLE}] Ottiene come valore di ritorno della funzione
3669   lo stato corrente del flag che controlla la effettiva generazione dei
3670   \itindex{core~dump} \textit{core dump}. Introdotta a partire dal kernel
3671   2.3.20.
3672
3673 \item[\const{PR\_SET\_ENDIAN}] Imposta la \itindex{endianness}
3674   \textit{endianness} del processo chiamante secondo il valore fornito
3675   in \param{arg2}. I valori possibili sono sono: \const{PR\_ENDIAN\_BIG}
3676   (\textit{big endian}), \const{PR\_ENDIAN\_LITTLE} (\textit{little endian}),
3677   e \const{PR\_ENDIAN\_PPC\_LITTLE} (lo pseudo \textit{little endian} del
3678   PowerPC). Introdotta a partire dal kernel 2.6.18, solo per architettura
3679   PowerPC.
3680
3681 \item[\const{PR\_GET\_ENDIAN}] Ottiene il valore della \itindex{endianness}
3682   \textit{endianness} del processo chiamante, salvato sulla variabile puntata
3683   da \param{arg2} che deve essere passata come di tipo ``\ctyp{int
3684     *}''. Introdotta a partire dal kernel 2.6.18, solo su PowerPC.
3685
3686 \item[\const{PR\_SET\_FPEMU}] Imposta i bit di controllo per l'emulazione
3687   della virgola mobile su architettura ia64, secondo il valore
3688   di \param{arg2}, si deve passare \const{PR\_FPEMU\_NOPRINT} per emulare in
3689   maniera trasparente l'accesso alle operazioni in virgola mobile, o
3690   \const{PR\_FPEMU\_SIGFPE} per non emularle ed inviare il segnale
3691   \signal{SIGFPE} (vedi sez.~\ref{sec:sig_prog_error}). Introdotta a partire
3692   dal kernel 2.4.18, solo su architettura ia64.
3693
3694 \item[\const{PR\_GET\_FPEMU}] Ottiene il valore dei flag di controllo
3695   dell'emulazione della virgola mobile, salvato all'indirizzo puntato
3696   da \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3697   partire dal kernel 2.4.18, solo su architettura ia64.
3698
3699 \item[\const{PR\_SET\_FPEXC}] Imposta la modalità delle eccezioni in virgola
3700   mobile (\textit{floating-point exception mode}) al valore di \param{arg2}.
3701   I valori possibili sono: 
3702   \begin{itemize*}
3703   \item \const{PR\_FP\_EXC\_SW\_ENABLE} per usare FPEXC per le eccezioni,
3704   \item \const{PR\_FP\_EXC\_DIV} per la divisione per zero in virgola mobile,
3705   \item \const{PR\_FP\_EXC\_OVF} per gli overflow,
3706   \item \const{PR\_FP\_EXC\_UND} per gli underflow,
3707   \item \const{PR\_FP\_EXC\_RES} per risultati non esatti,
3708   \item \const{PR\_FP\_EXC\_INV} per operazioni invalide,
3709   \item \const{PR\_FP\_EXC\_DISABLED} per disabilitare le eccezioni,
3710   \item \const{PR\_FP\_EXC\_NONRECOV} per usare la modalità di eccezione
3711     asincrona non recuperabile,
3712   \item \const{PR\_FP\_EXC\_ASYNC} per usare la modalità di eccezione
3713     asincrona recuperabile,
3714   \item \const{PR\_FP\_EXC\_PRECISE} per la modalità precisa di
3715     eccezione.\footnote{trattasi di gestione specialistica della gestione
3716       delle eccezioni dei calcoli in virgola mobile che, i cui dettagli al
3717       momento vanno al di là dello scopo di questo testo.}
3718   \end{itemize*}
3719 Introdotta a partire dal kernel 2.4.21, solo su PowerPC.
3720
3721 \item[\const{PR\_GET\_FPEXC}] Ottiene il valore della modalità delle eccezioni
3722   delle operazioni in virgola mobile, salvata all'indirizzo
3723   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''.  Introdotta
3724   a partire dal kernel 2.4.21, solo su PowerPC.
3725
3726 \item[\const{PR\_SET\_KEEPCAPS}] Consente di controllare quali
3727   \textit{capabilities} vengono cancellate quando si esegue un cambiamento di
3728   \ids{UID} del processo (per i dettagli si veda
3729   sez.~\ref{sec:proc_capabilities}, in particolare quanto illustrato a
3730   pag.~\pageref{sec:capability-uid-transition}). Un valore nullo (il default)
3731   per \param{arg2} comporta che vengano cancellate, il valore 1 che vengano
3732   mantenute, questo valore viene sempre cancellato attraverso una \func{exec}.
3733   L'uso di questo flag è stato sostituito, a partire dal kernel 2.6.26, dal
3734   flag \const{SECURE\_KEEP\_CAPS} dei \itindex{securebits} \textit{securebits}
3735   (vedi l'uso di \const{PR\_SET\_SECUREBITS} più avanti). Introdotta a partire
3736   dal kernel 2.2.18.
3737
3738 \item[\const{PR\_GET\_KEEPCAPS}] Ottiene come valore di ritorno della funzione
3739   il valore del flag di controllo delle \textit{capabilities} impostato con
3740   \const{PR\_SET\_KEEPCAPS}. Introdotta a partire dal kernel 2.2.18.
3741
3742 \item[\const{PR\_SET\_NAME}] Imposta il nome del processo chiamante alla
3743   stringa puntata da \param{arg2}, che deve essere di tipo ``\ctyp{char *}''. Il
3744   nome può essere lungo al massimo 16 caratteri, e la stringa deve essere
3745   terminata da NUL se più corta.  Introdotta a partire dal kernel 2.6.9.
3746
3747 \item[\const{PR\_GET\_NAME}] Ottiene il nome del processo chiamante nella
3748   stringa puntata da \param{arg2}, che deve essere di tipo ``\ctyp{char *}'';
3749   si devono allocare per questo almeno 16 byte, e il nome sarà terminato da
3750   NUL se più corto. Introdotta a partire dal kernel 2.6.9.
3751
3752 \item[\const{PR\_SET\_PDEATHSIG}] Consente di richiedere l'emissione di un
3753   segnale, che sarà ricevuto dal processo chiamante, in occorrenza della
3754   terminazione del proprio processo padre; in sostanza consente di invertire
3755   il ruolo di \signal{SIGCHLD}. Il valore di \param{arg2} deve indicare il
3756   numero del segnale, o 0 per disabilitare l'emissione. Il valore viene
3757   automaticamente cancellato per un processo figlio creato con \func{fork}.
3758   Introdotta a partire dal kernel 2.1.57.
3759
3760 \item[\const{PR\_GET\_PDEATHSIG}] Ottiene il valore dell'eventuale segnale
3761   emesso alla terminazione del padre, salvato all'indirizzo
3762   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3763   partire dal kernel 2.3.15.
3764
3765 \item[\const{PR\_SET\_SECCOMP}] Imposta il cosiddetto
3766   \itindex{secure~computing~mode} \textit{secure computing mode} per il
3767   processo corrente. Prevede come unica possibilità che \param{arg2} sia
3768   impostato ad 1. Una volta abilitato il \itindex{secure~computing~mode}
3769   \textit{secure computing mode} il processo potrà utilizzare soltanto un
3770   insieme estremamente limitato di \textit{system call}: \func{read},
3771   \func{write}, \func{\_exit} e \funcm{sigreturn}. Ogni altra \textit{system
3772     call} porterà all'emissione di un \signal{SIGKILL} (vedi
3773   sez.~\ref{sec:sig_termination}).  Il \textit{secure computing mode} è stato
3774   ideato per fornire un supporto per l'esecuzione di codice esterno non fidato
3775   e non verificabile a scopo di calcolo;\footnote{lo scopo è quello di poter
3776     vendere la capacità di calcolo della proprio macchina ad un qualche
3777     servizio di calcolo distribuito senza comprometterne la sicurezza
3778     eseguendo codice non sotto il proprio controllo.} in genere i dati vengono
3779   letti o scritti grazie ad un socket o una pipe, e per evitare problemi di
3780   sicurezza non sono possibili altre operazioni se non quelle citate.
3781   Introdotta a partire dal kernel 2.6.23, disponibile solo se si è abilitato
3782   il supporto nel kernel con \texttt{CONFIG\_SECCOMP}.
3783
3784 % TODO a partire dal kernel 3.5 è stato introdotto la possibilità di usare un
3785 % terzo argomento se il secondo è SECCOMP_MODE_FILTER, vedi
3786 % Documentation/prctl/seccomp_filter.txt 
3787 % vedi anche http://lwn.net/Articles/600250/
3788
3789 % TODO a partire dal kernel 3.17 è stata introdotta la nuova syscall seccomp,
3790 % vedi http://lwn.net/Articles/600250/ e http://lwn.net/Articles/603321/
3791
3792 \item[\const{PR\_GET\_SECCOMP}] Ottiene come valore di ritorno della funzione
3793   lo stato corrente del \textit{secure computing mode}, al momento attuale la
3794   funzione è totalmente inutile in quanto l'unico valore ottenibile è 0, dato
3795   che la chiamata di questa funzione in \itindex{secure~computing~mode}
3796   \textit{secure computing mode} comporterebbe l'emissione di
3797   \signal{SIGKILL}, è stata comunque definita per eventuali estensioni future.
3798   Introdotta a partire dal kernel 2.6.23.
3799
3800 \item[\const{PR\_SET\_SECUREBITS}] Imposta i \itindex{securebits}
3801   \textit{securebits} per il processo chiamante al valore indicato
3802   da \param{arg2}; per i dettagli sul significato dei \textit{securebits} si
3803   veda sez.~\ref{sec:proc_capabilities}, ed in particolare i valori di
3804   tab.~\ref{tab:securebits_values} e la relativa trattazione. L'operazione
3805   richiede i privilegi di amministratore (la capacità \const{CAP\_SETPCAP}),
3806   altrimenti la chiamata fallirà con un errore di \errval{EPERM}. Introdotta a
3807   partire dal kernel 2.6.26.
3808
3809 \item[\const{PR\_GET\_SECUREBITS}] Ottiene come valore di ritorno della
3810   funzione l'impostazione corrente per i \itindex{securebits}
3811   \textit{securebits}. Introdotta a partire dal kernel 2.6.26.
3812
3813 \item[\const{PR\_SET\_TIMING}] Imposta il metodo di temporizzazione del
3814   processo da indicare con il valore di \param{arg2}, attualmente i valori
3815   possibili sono due, con \const{PR\_TIMING\_STATISTICAL} si usa il metodo
3816   statistico tradizionale, con \const{PR\_TIMING\_TIMESTAMP} il più accurato
3817   basato su dei \textit{timestamp}, quest'ultimo però non è ancora
3818   implementato ed il suo uso comporta la restituzione di un errore di
3819   \errval{EINVAL}. Introdotta a partire dal kernel 2.6.0-test4.
3820
3821 \item[\const{PR\_GET\_TIMING}] Ottiene come valore di ritorno della funzione
3822   il metodo di temporizzazione del processo attualmente in uso (uno dei due
3823   valori citati per \const{PR\_SET\_TIMING}). Introdotta a partire dal kernel
3824   2.6.0-test4.
3825
3826 \item[\const{PR\_SET\_TSC}] Imposta il flag che indica se il processo
3827   chiamante può leggere il registro di processore contenente il contatore dei
3828   \textit{timestamp} (TSC, o \textit{Time Stamp Counter}) da indicare con il
3829   valore di \param{arg2}. Si deve specificare \const{PR\_TSC\_ENABLE} per
3830   abilitare la lettura o \const{PR\_TSC\_SIGSEGV} per disabilitarla con la
3831   generazione di un segnale di \signal{SIGSEGV} (vedi
3832   sez.~\ref{sec:sig_prog_error}). La lettura viene automaticamente
3833   disabilitata se si attiva il \itindex{secure~computing~mode} \textit{secure
3834     computing mode}.  Introdotta a partire dal kernel 2.6.26, solo su x86.
3835
3836 \item[\const{PR\_GET\_TSC}] Ottiene il valore del flag che controlla la
3837   lettura del contattore dei \textit{timestamp}, salvato all'indirizzo
3838   puntato \param{arg2}, che deve essere di tipo ``\ctyp{int *}''. Introdotta a
3839   partire dal kernel 2.6.26, solo su x86.
3840 % articoli sul TSC e relativi problemi: http://lwn.net/Articles/209101/,
3841 % http://blog.cr0.org/2009/05/time-stamp-counter-disabling-oddities.html,
3842 % http://en.wikipedia.org/wiki/Time_Stamp_Counter 
3843
3844 \item[\const{PR\_SET\_UNALIGN}] Imposta la modalità di controllo per l'accesso
3845   a indirizzi di memoria non allineati, che in varie architetture risultano
3846   illegali, da indicare con il valore di \param{arg2}. Si deve specificare il
3847   valore \const{PR\_UNALIGN\_NOPRINT} per ignorare gli accessi non allineati,
3848   ed il valore \const{PR\_UNALIGN\_SIGBUS} per generare un segnale di
3849   \signal{SIGBUS} (vedi sez.~\ref{sec:sig_prog_error}) in caso di accesso non
3850   allineato.  Introdotta con diverse versioni su diverse architetture.
3851
3852 \item[\const{PR\_GET\_UNALIGN}] Ottiene il valore della modalità di controllo
3853   per l'accesso a indirizzi di memoria non allineati, salvato all'indirizzo
3854   puntato \param{arg2}, che deve essere di tipo \code{(int *)}. Introdotta con
3855   diverse versioni su diverse architetture.
3856 \item[\const{PR\_MCE\_KILL}] Imposta la politica di gestione degli errori
3857   dovuti a corruzione della memoria per problemi hardware. Questo tipo di
3858   errori vengono riportati dall'hardware di controllo della RAM e vengono
3859   gestiti dal kernel,\footnote{la funzionalità è disponibile solo sulle
3860     piattaforme più avanzate che hanno il supporto hardware per questo tipo di
3861     controlli.} ma devono essere opportunamente riportati ai processi che
3862   usano quella parte di RAM che presenta errori; nel caso specifico questo
3863   avviene attraverso l'emissione di un segnale di \signal{SIGBUS} (vedi
3864   sez.~\ref{sec:sig_prog_error}).\footnote{in particolare viene anche
3865     impostato il valore di \var{si\_code} in \struct{siginfo\_t} a
3866     \const{BUS\_MCEERR\_AO}; per il significato di tutto questo si faccia
3867     riferimento alla trattazione di sez.~\ref{sec:sig_sigaction}.}
3868
3869   Il comportamento di default prevede che per tutti i processi si applichi la
3870   politica generale di sistema definita nel file
3871   \sysctlfile{vm/memory\_failure\_early\_kill}, ma specificando
3872   per \param{arg2} il valore \const{PR\_MCE\_KILL\_SET} è possibile impostare
3873   con il contenuto di \param{arg3} una politica specifica del processo
3874   chiamante. Si può tornare alla politica di default del sistema utilizzando
3875   invece per \param{arg2} il valore \const{PR\_MCE\_KILL\_CLEAR}. In tutti i
3876   casi, per compatibilità con eventuali estensioni future, tutti i valori
3877   degli argomenti non utilizzati devono essere esplicitamente posti a zero,
3878   pena il fallimento della chiamata con un errore di \errval{EINVAL}.
3879   
3880   In caso di impostazione di una politica specifica del processo con
3881   \const{PR\_MCE\_KILL\_SET} i valori di \param{arg3} possono essere soltanto
3882   due, che corrispondono anche al valore che si trova nell'impostazione
3883   generale di sistema di \texttt{memory\_failure\_early\_kill}, con
3884   \const{PR\_MCE\_KILL\_EARLY} si richiede l'emissione immediata di
3885   \signal{SIGBUS} non appena viene rilevato un errore, mentre con
3886   \const{PR\_MCE\_KILL\_LATE} il segnale verrà inviato solo quando il processo
3887   tenterà un accesso alla memoria corrotta. Questi due valori corrispondono
3888   rispettivamente ai valori 1 e 0 di
3889   \texttt{memory\_failure\_early\_kill}.\footnote{in sostanza nel primo caso
3890     viene immediatamente inviato il segnale a tutti i processi che hanno la
3891     memoria corrotta mappata all'interno del loro spazio degli indirizzi, nel
3892     secondo caso prima la pagina di memoria viene tolta dallo spazio degli
3893     indirizzi di ciascun processo, mentre il segnale viene inviato solo quei
3894     processi che tentano di accedervi.} Si può usare per \param{arg3} anche un
3895   terzo valore, \const{PR\_MCE\_KILL\_DEFAULT}, che corrisponde a impostare
3896   per il processo la politica di default.\footnote{si presume la politica di
3897     default corrente, in modo da non essere influenzati da un eventuale
3898     successivo cambiamento della stessa.} Introdotta a partire dal kernel
3899   2.6.32.
3900 \item[\const{PR\_MCE\_KILL\_GET}] Ottiene come valore di ritorno della
3901   funzione la politica di gestione degli errori dovuti a corruzione della
3902   memoria. Tutti gli argomenti non utilizzati (al momento tutti) devono essere
3903   nulli pena la ricezione di un errore di \errval{EINVAL}. Introdotta a
3904   partire dal kernel 2.6.32.
3905 % TODO: verificare questa parte
3906 \item[\const{PR\_SET\_CHILD\_SUBREAPER}] Imposta il processo indicato con il
3907   \ids{PID} specificato da \param{arg2} come nuovo ``\textsl{genitore
3908     adottivo}'' per tutti i processi discendenti del chiamante che
3909   diventeranno orfani, sostituendo in questo ruolo \cmd{init} (si ricordi
3910   quanto illustrato in sez.~\ref{sec:proc_termination}). Introdotta a partire
3911   dal kernel 3.4.
3912 \item[\const{PR\_GET\_CHILD\_SUBREAPER}] Ottiene il \ids{PID} del processo a
3913   cui vengono assegnati come figli gli orfani del processo
3914   corrente. Introdotta a partire dal kernel 3.4.
3915   % TODO documentare PR_SET_SECCOMP introdotto a partire dal kernel 3.5. Vedi:
3916   % * Documentation/prctl/seccomp_filter.txt
3917   % * http://lwn.net/Articles/475043/
3918
3919
3920 % TODO documentare PR_MPX_INIT e PR_MPX_RELEASE, vedi
3921 % http://lwn.net/Articles/582712/ 
3922
3923 % TODO documentare PR_SET_MM_MAP aggiunta con il kernel 3.18, per impostare i
3924 % parametri di base del layout dello spazio di indirizzi di un processo (area
3925 % codice e dati, stack, brack pointer ecc. vedi
3926 % http://git.kernel.org/linus/f606b77f1a9e362451aca8f81d8f36a3a112139e 
3927
3928
3929 \label{sec:prctl_operation}
3930 \end{basedescript}
3931
3932
3933
3934 \subsection{La \textit{system call} \func{clone}}
3935 \label{sec:process_clone}
3936
3937 La funzione tradizionale con cui creare un nuovo processo in un sistema
3938 Unix-like, come illustrato in sez.~\ref{sec:proc_fork}, è \func{fork}, ma con
3939 l'introduzione del supporto del kernel per i \textit{thread} (vedi
3940 cap.~\ref{cha:threads}), si è avuta la necessità di una interfaccia che
3941 consentisse un maggiore controllo sulla modalità con cui vengono creati nuovi
3942 processi, che poi è stata utilizzata anche per fornire supporto per le
3943 tecnologie di virtualizzazione dei processi (i cosiddetti \textit{container}).
3944
3945 Per questo l'interfaccia per la creazione di un nuovo processo è stata
3946 delegata ad una nuova \textit{system call}, \funcm{sys\_clone}, che consente
3947 di reimplementare anche la tradizionale \func{fork}. In realtà in questo caso
3948 più che di nuovi processi si può parlare della creazioni di nuovi
3949 ``\textit{task}'' del kernel che possono assumere la veste sia di un processo
3950 classico isolato dagli altri come quelli trattati finora, che di un
3951 \textit{thread} in cui la memoria viene condivisa fra il processo chiamante ed
3952 il nuovo processo creato, come quelli che vedremo in
3953 sez.~\ref{sec:linux_thread}. Per evitare confusione fra \textit{thread} e
3954 processi ordinari, abbiamo deciso di usare la nomenclatura \textit{task} per
3955 indicare la unità di esecuzione generica messa a disposizione del kernel che
3956 \texttt{sys\_clone} permette di creare.
3957
3958 Oltre a questo la funzione consente, ad uso delle nuove funzionalità di
3959 virtualizzazione dei processi, di creare nuovi \textit{namespace} per una
3960 serie di proprietà generali dei processi (come l'elenco dei \ids{PID},
3961 l'albero dei file, i \itindex{mount~point} \textit{mount point}, la rete,
3962 ecc.), che consentono di creare gruppi di processi che vivono in una sorta di
3963 spazio separato dagli altri, che costituisce poi quello che viene chiamato un
3964 \textit{container}.
3965
3966 La \textit{system call} richiede soltanto due argomenti: il
3967 primo, \param{flags}, consente di controllare le modalità di creazione del
3968 nuovo \textit{task}, il secondo, \param{child\_stack}, imposta l'indirizzo
3969 dello \itindex{stack} \textit{stack} per il nuovo \textit{task}, e deve essere
3970 indicato quando si intende creare un \textit{thread}. L'esecuzione del
3971 programma creato da \func{sys\_clone} riprende, come per \func{fork}, da
3972 dopo l'esecuzione della stessa.
3973
3974 La necessità di avere uno \itindex{stack} \textit{stack} alternativo c'è solo
3975 quando si intende creare un \textit{thread}, in tal caso infatti il nuovo
3976 \textit{task} vede esattamente la stessa memoria del \textit{task}
3977 ``\textsl{padre}'',\footnote{in questo caso per padre si intende semplicemente
3978   il \textit{task} che ha eseguito \func{sys\_clone} rispetto al \textit{task}
3979   da essa creato, senza nessuna delle implicazioni che il concetto ha per i
3980   processi.} e nella sua esecuzione alla prima chiamata di una funzione
3981 andrebbe a scrivere sullo \textit{stack} usato anche dal padre (si ricordi
3982 quanto visto in sez.~\ref{sec:proc_mem_layout} riguardo all'uso dello
3983 \textit{stack}).
3984
3985 Per evitare di doversi garantire contro la evidente possibilità di
3986 \itindex{race~condition} \textit{race condition} che questa situazione
3987 comporta (vedi sez.~\ref{sec:proc_race_cond} per una spiegazione della
3988 problematica) è necessario che il chiamante allochi preventivamente un'area di
3989 memoria.  In genere lo si fa con una \func{malloc} che allochi un buffer che
3990 la funzione imposterà come \textit{stack} del nuovo processo, avendo
3991 ovviamente cura di non utilizzarlo direttamente nel processo chiamante.
3992
3993 In questo modo i due \textit{task} avranno degli \textit{stack} indipendenti e
3994 non si dovranno affrontare problematiche di \itindex{race~condition}
3995 \textit{race condition}.  Si tenga presente inoltre che in molte architetture
3996 di processore lo \textit{stack} cresce verso il basso, pertanto in tal caso
3997 non si dovrà specificare per \param{child\_stack} il puntatore restituito da
3998 \func{malloc}, ma un puntatore alla fine del buffer da essa allocato.
3999
4000 Dato che tutto ciò è necessario solo per i \textit{thread} che condividono la
4001 memoria, la \textit{system call}, a differenza della funzione di libreria che
4002 vedremo a breve, consente anche di passare per \param{child\_stack} il valore
4003 \val{NULL}, che non imposta un nuovo \textit{stack}. Se infatti si crea un
4004 processo, questo ottiene un suo nuovo spazio degli indirizzi (è sottinteso
4005 cioè che non si stia usando il flag \const{CLONE\_VM} che vedremo a breve) ed
4006 in questo caso si applica la semantica del \itindex{copy~on~write}
4007 \textit{copy on write} illustrata in sez.~\ref{sec:proc_fork}, per cui le
4008 pagine dello \textit{stack} verranno automaticamente copiate come le altre e
4009 il nuovo processo avrà un suo \textit{stack} totalmente indipendente da quello
4010 del padre.
4011
4012 Dato che l'uso principale della nuova \textit{system call} è quello relativo
4013 alla creazione dei \textit{thread}, la \acr{glibc} definisce una funzione di
4014 libreria con una sintassi diversa, orientata a questo scopo, e la
4015 \textit{system call} resta accessibile solo se invocata esplicitamente come
4016 visto in sez.~\ref{sec:proc_syscall}.\footnote{ed inoltre per questa
4017   \textit{system call} non è disponibile la chiamata veloce con
4018   \texttt{vsyscall}.} La funzione di libreria si chiama semplicemente
4019 \funcd{clone} ed il suo prototipo è:
4020
4021 \begin{funcproto}{ 
4022 \fhead{sched.h}
4023 \fdecl{int clone(int (*fn)(void *), void *child\_stack, int flags, void *arg,
4024   ...  \\
4025 \phantom{int clone(}/* pid\_t *ptid, struct user\_desc *tls, pid\_t *ctid */ )}
4026 \fdesc{Crea un nuovo processo o \textit{thread}.} 
4027 }
4028 {La funzione ritorna il \textit{Thread ID} assegnato al nuovo processo in caso
4029   di successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
4030   valori: 
4031 \begin{errlist}
4032     \item[\errcode{EAGAIN}] sono già in esecuzione troppi processi.
4033     \item[\errcode{EINVAL}] si è usata una combinazione non valida di flag o
4034       un valore nullo per \param{child\_stack}.
4035     \item[\errcode{ENOMEM}] non c'è memoria sufficiente per creare una nuova
4036       \struct{task\_struct} o per copiare le parti del contesto del chiamante
4037       necessarie al nuovo \textit{task}.
4038     \item[\errcode{EPERM}] non si hanno i privilegi di amministratore
4039       richiesti dai flag indicati.
4040 \end{errlist}}
4041 \end{funcproto}
4042
4043 % NOTE: una pagina con la descrizione degli argomenti:
4044 % * http://www.lindevdoc.org/wiki/Clone 
4045
4046 La funzione prende come primo argomento \param{fn} il puntatore alla funzione
4047 che verrà messa in esecuzione nel nuovo processo, che può avere un unico
4048 argomento di tipo puntatore a \ctyp{void}, il cui valore viene passato dal
4049 terzo argomento \param{arg}. Per quanto il precedente prototipo possa
4050 intimidire nella sua espressione, in realtà l'uso è molto semplice basterà
4051 definire una qualunque funzione \param{fn} che restituisce un intero ed ha
4052 come argomento un puntatore a \ctyp{void}, e \code{fn(arg)} sarà eseguita in
4053 un nuovo processo.
4054
4055 Il nuovo processo resterà in esecuzione fintanto che la funzione \param{fn}
4056 non ritorna, o esegue \func{exit} o viene terminata da un segnale. Il valore
4057 di ritorno della funzione (o quello specificato con \func{exit}) verrà
4058 utilizzato come stato di uscita della funzione. I tre
4059 argomenti \param{ptid}, \param{tls} e \param{ctid} sono opzionali e sono
4060 presenti solo a partire dal kernel 2.6 e sono stati aggiunti come supporto per
4061 le funzioni di gestione dei \textit{thread} (la \textit{Native Thread Posix
4062   Library}, vedi sez.~\ref{sec:linux_ntpl}) nella \acr{glibc}, essi vengono
4063 utilizzati soltanto se si sono specificati rispettivamente i flag
4064 \const{CLONE\_PARENT\_SETTID}, \const{CLONE\_SETTLS} e
4065 \const{CLONE\_CHILD\_SETTID}. 
4066
4067 La funzione ritorna un l'identificatore del nuovo \textit{task}, denominato
4068 \texttt{Thread ID} (da qui in avanti \ids{TID}) il cui significato è analogo
4069 al \ids{PID} dei normali processi e che a questo corrisponde qualora si crei
4070 un processo ordinario e non un \textit{thread}.
4071
4072 Il comportamento di \func{clone}, che si riflette sulle caratteristiche del
4073 nuovo processo da essa creato, è controllato principalmente
4074 dall'argomento \param{flags}, che deve essere specificato come maschera
4075 binaria, ottenuta con un OR aritmetico di una delle costanti del seguente
4076 elenco, che illustra quelle attualmente disponibili:\footnote{si fa
4077   riferimento al momento della stesura di questa sezione, cioè con il kernel
4078   3.2.}
4079
4080 \begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}}
4081
4082 \item[\const{CLONE\_CHILD\_CLEARTID}] cancella il valore del \ids{TID}
4083   all'indirizzo dato dall'argomento \param{ctid}, eseguendo un riattivazione
4084   del \textit{futex} (vedi sez.~\ref{sec:xxx_futex}) a quell'indirizzo; questo
4085   flag viene utilizzato dalla librerie di gestione dei \textit{thread}.
4086 \item[\const{CLONE\_CHILD\_SETTID}] scrive il \ids{TID} del \textit{thread}
4087   figlio all'indirizzo dato dall'argomento \param{ctid}. Questo flag viene
4088   utilizzato dalla librerie di gestione dei \textit{thread}.
4089 \item[\const{CLONE\_FILES}] se impostato il nuovo processo condividerà con il
4090   padre la \itindex{file~descriptor~table} \textit{file descriptor table}
4091   (vedi sez.~\ref{sec:file_fd}), questo significa che ogni \textit{file
4092     descriptor} aperto da un processo verrà visto anche dall'altro e che ogni
4093   chiusura o cambiamento dei \textit{file descriptor flag} di un \textit{file
4094     descriptor} verrà per entrambi.
4095
4096   Se non viene impostato il processo figlio eredita una copia della
4097   \itindex{file~descriptor~table} \textit{file descriptor table} del padre e
4098   vale la semantica classica della gestione dei \textit{file descriptor}, che
4099   costituisce il comportamento ordinario di un sistema unix-like e che
4100   illustreremo in dettaglio in sez.~\ref{sec:file_shared_access}.
4101
4102 \item[\const{CLONE\_FS}] se questo flag viene impostato il nuovo processo
4103   condividerà con il padre le informazioni 
4104
4105 \item[\const{CLONE\_IO}]
4106 \item[\const{CLONE\_NEWIPC}]
4107 \item[\const{CLONE\_NEWNET}]
4108 \item[\const{CLONE\_NEWNS}]
4109 \item[\const{CLONE\_NEWPID}]
4110 \item[\const{CLONE\_NEWUTS}]
4111 \item[\const{CLONE\_PARENT}]
4112 \item[\const{CLONE\_PARENT\_SETTID}]
4113 \item[\const{CLONE\_PID}]
4114 \item[\const{CLONE\_PTRACE}]
4115 \item[\const{CLONE\_SETTLS}]
4116 \item[\const{CLONE\_SIGHAND}]
4117 \item[\const{CLONE\_STOPPED}]
4118 \item[\const{CLONE\_SYSVSEM}]
4119 \item[\const{CLONE\_THREAD}]
4120 \item[\const{CLONE\_UNTRACED}]
4121 \item[\const{CLONE\_VFORK}]
4122 \item[\const{CLONE\_VM}]
4123 \end{basedescript}
4124
4125
4126 %TODO trattare unshare, vedi anche http://lwn.net/Articles/532748/
4127
4128
4129 %TODO trattare kcmp aggiunta con il kernel 3.5, vedi
4130 % https://lwn.net/Articles/478111/
4131
4132 \subsection{La funzione \func{ptrace}}
4133 \label{sec:process_ptrace}
4134
4135 Da fare
4136
4137 % TODO: trattare PTRACE_SEIZE, aggiunta con il kernel 3.1
4138 % TODO: trattare PTRACE_O_EXITKILL, aggiunta con il kernel 3.8 (vedi
4139 % http://lwn.net/Articles/529060/) 
4140 % TODO: trattare PTRACE_GETSIGMASK e PTRACE_SETSIGMASK introdotte con il
4141 % kernel 3.11
4142
4143
4144
4145 \subsection{La gestione delle operazioni in virgola mobile}
4146 \label{sec:process_fenv}
4147
4148 Da fare.
4149
4150 % TODO eccezioni ed arrotondamenti per la matematica in virgola mobile 
4151 % consultare la manpage di fenv, math_error, fpclassify, matherr, isgreater,
4152 % isnan, nan, INFINITY
4153
4154
4155 \subsection{L'accesso alle porte di I/O}
4156 \label{sec:process_io_port}
4157
4158 %
4159 % TODO l'I/O sulle porte di I/O 
4160 % consultare le manpage di ioperm, iopl e outb
4161 % non c'entra nulla qui, va trovato un altro posto (altri meccanismi di I/O in
4162 % fileintro ?)
4163
4164 Da fare
4165
4166
4167 %\subsection{La gestione di architetture a nodi multipli}
4168 %\label{sec:process_NUMA}
4169
4170 % TODO trattare i cpuset, che attiene anche a NUMA, e che possono essere usati
4171 % per associare l'uso di gruppi di processori a gruppi di processi (vedi
4172 % manpage omonima)
4173 % TODO trattare getcpu, che attiene anche a NUMA, mettere qui anche
4174 % sched_getcpu, che potrebbe essere indipendente ma richiama getcpu
4175
4176 %TODO trattare le funzionalità per il NUMA
4177 % vedi man numa e, mbind, get_mempolicy, set_mempolicy, 
4178 % le pagine di manuale relative
4179 % vedere anche dove metterle...
4180
4181 % \subsection{La gestione dei moduli}
4182 % \label{sec:kernel_modules}
4183
4184 % da fare
4185
4186 %TODO trattare init_module e finit_module (quest'ultima introdotta con il
4187 %kernel 3.8)
4188
4189
4190
4191 \section{Problematiche di programmazione multitasking}
4192 \label{sec:proc_multi_prog}
4193
4194 Benché i processi siano strutturati in modo da apparire il più possibile come
4195 indipendenti l'uno dall'altro, nella programmazione in un sistema multitasking
4196 occorre tenere conto di una serie di problematiche che normalmente non
4197 esistono quando si ha a che fare con un sistema in cui viene eseguito un solo
4198 programma alla volta. 
4199
4200 Per questo motivo, essendo questo argomento di carattere generale, ci è parso
4201 opportuno introdurre sinteticamente queste problematiche, che ritroveremo a
4202 più riprese in capitoli successivi, in questa sezione conclusiva del capitolo
4203 in cui abbiamo affrontato la gestione dei processi, sottolineando come esse
4204 diventino cogenti quando invece si usano i \textit{thread}.
4205
4206
4207 \subsection{Le operazioni atomiche}
4208 \label{sec:proc_atom_oper}
4209
4210 La nozione di \textsl{operazione atomica} deriva dal significato greco della
4211 parola atomo, cioè indivisibile; si dice infatti che un'operazione è atomica
4212 quando si ha la certezza che, qualora essa venga effettuata, tutti i passaggi
4213 che devono essere compiuti per realizzarla verranno eseguiti senza possibilità
4214 di interruzione in una fase intermedia.
4215
4216 In un ambiente multitasking il concetto è essenziale, dato che un processo può
4217 essere interrotto in qualunque momento dal kernel che mette in esecuzione un
4218 altro processo o dalla ricezione di un segnale. Occorre pertanto essere
4219 accorti nei confronti delle possibili \itindex{race~condition} \textit{race
4220   condition} (vedi sez.~\ref{sec:proc_race_cond}) derivanti da operazioni
4221 interrotte in una fase in cui non erano ancora state completate.
4222
4223 Nel caso dell'interazione fra processi la situazione è molto più semplice, ed
4224 occorre preoccuparsi della atomicità delle operazioni solo quando si ha a che
4225 fare con meccanismi di intercomunicazione (che esamineremo in dettaglio in
4226 cap.~\ref{cha:IPC}) o nelle operazioni con i file (vedremo alcuni esempi in
4227 sez.~\ref{sec:file_shared_access}). In questi casi in genere l'uso delle
4228 appropriate funzioni di libreria per compiere le operazioni necessarie è
4229 garanzia sufficiente di atomicità in quanto le \textit{system call} con cui
4230 esse sono realizzate non possono essere interrotte (o subire interferenze
4231 pericolose) da altri processi.
4232
4233 Nel caso dei segnali invece la situazione è molto più delicata, in quanto lo
4234 stesso processo, e pure alcune \textit{system call}, possono essere interrotti
4235 in qualunque momento, e le operazioni di un eventuale \textit{signal handler}
4236 sono compiute nello stesso spazio di indirizzi del processo. Per questo, anche
4237 il solo accesso o l'assegnazione di una variabile possono non essere più
4238 operazioni atomiche (torneremo su questi aspetti in
4239 sez.~\ref{sec:sig_adv_control}).
4240
4241 Qualora invece si usino i \textit{thread}, in cui lo spazio degli indirizzi è
4242 condiviso, il problema è sempre presente, perché qualunque \textit{thread} può
4243 interromperne un altro in qualunque momento e l'atomicità di qualunque
4244 operazione è messa in discussione, per cui l'assenza di eventuali
4245 \itindex{race~condition} \textit{race condition} deve essere sempre verificata
4246 nei minimi dettagli.
4247
4248 In questo caso il sistema provvede un tipo di dato, il \type{sig\_atomic\_t},
4249 il cui accesso è assicurato essere atomico.  In pratica comunque si può
4250 assumere che, in ogni piattaforma su cui è implementato Linux, il tipo
4251 \ctyp{int}, gli altri interi di dimensione inferiore ed i puntatori sono
4252 atomici. Non è affatto detto che lo stesso valga per interi di dimensioni
4253 maggiori (in cui l'accesso può comportare più istruzioni in assembler) o per
4254 le strutture di dati. In tutti questi casi è anche opportuno marcare come
4255 \direct{volatile} le variabili che possono essere interessate ad accesso
4256 condiviso, onde evitare problemi con le ottimizzazioni del codice.
4257
4258
4259
4260 \subsection{Le \textit{race condition} ed i \textit{deadlock}}
4261 \label{sec:proc_race_cond}
4262
4263 \itindbeg{race~condition}
4264
4265 Si definiscono \textit{race condition} tutte quelle situazioni in cui processi
4266 diversi operano su una risorsa comune, ed in cui il risultato viene a
4267 dipendere dall'ordine in cui essi effettuano le loro operazioni. Il caso
4268 tipico è quello di un'operazione che viene eseguita da un processo in più
4269 passi, e può essere compromessa dall'intervento di un altro processo che
4270 accede alla stessa risorsa quando ancora non tutti i passi sono stati
4271 completati.
4272
4273 Dato che in un sistema multitasking ogni processo può essere interrotto in
4274 qualunque momento per farne subentrare un altro in esecuzione, niente può
4275 assicurare un preciso ordine di esecuzione fra processi diversi o che una
4276 sezione di un programma possa essere eseguita senza interruzioni da parte di
4277 altri. Queste situazioni comportano pertanto errori estremamente subdoli e
4278 difficili da tracciare, in quanto nella maggior parte dei casi tutto
4279 funzionerà regolarmente, e solo occasionalmente si avranno degli errori. 
4280
4281 Per questo occorre essere ben consapevoli di queste problematiche, e del fatto
4282 che l'unico modo per evitarle è quello di riconoscerle come tali e prendere
4283 gli adeguati provvedimenti per far sì che non si verifichino. Casi tipici di
4284 \textit{race condition} si hanno quando diversi processi accedono allo stesso
4285 file, o nell'accesso a meccanismi di intercomunicazione come la memoria
4286 condivisa. 
4287
4288 In questi casi, se non si dispone della possibilità di eseguire atomicamente
4289 le operazioni necessarie, occorre che quelle parti di codice in cui si
4290 compiono le operazioni sulle risorse condivise (le cosiddette
4291 \index{sezione~critica} \textsl{sezioni critiche}) del programma, siano
4292 opportunamente protette da meccanismi di sincronizzazione (torneremo su queste
4293 problematiche di questo tipo in cap.~\ref{cha:IPC}).
4294
4295 Nel caso dei \textit{thread} invece la situazione è molto più delicata e
4296 sostanzialmente qualunque accesso in memoria (a buffer, variabili o altro) può
4297 essere soggetto a \textit{race condition} dato potrebbe essere interrotto in
4298 qualunque momento da un altro \textit{thread}. In tal caso occorre pianificare
4299 con estrema attenzione l'uso delle variabili ed utilizzare i vari meccanismi
4300 di sincronizzazione che anche in questo caso sono disponibili (torneremo su
4301 queste problematiche di questo tipo in cap.~\ref{sez:thread_xxx})
4302
4303 \itindbeg{deadlock} Un caso particolare di \textit{race condition} sono poi i
4304 cosiddetti \textit{deadlock} (traducibile in \textsl{condizione di stallo}),
4305 che particolarmente gravi in quanto comportano spesso il blocco completo di un
4306 servizio, e non il fallimento di una singola operazione. Per definizione un
4307 \textit{deadlock} è una situazione in cui due o più processi non sono più in
4308 grado di proseguire perché ciascuno aspetta il risultato di una operazione che
4309 dovrebbe essere eseguita dall'altro.
4310
4311 L'esempio tipico di una situazione che può condurre ad un
4312 \textit{deadlock} è quello in cui un flag di
4313 ``\textsl{occupazione}'' viene rilasciato da un evento asincrono (come un
4314 segnale o un altro processo) fra il momento in cui lo si è controllato
4315 (trovandolo occupato) e la successiva operazione di attesa per lo sblocco. In
4316 questo caso, dato che l'evento di sblocco del flag è avvenuto senza che ce ne
4317 accorgessimo proprio fra il controllo e la messa in attesa, quest'ultima
4318 diventerà perpetua (da cui il nome di \textit{deadlock}).
4319
4320 In tutti questi casi è di fondamentale importanza il concetto di atomicità
4321 visto in sez.~\ref{sec:proc_atom_oper}; questi problemi infatti possono essere
4322 risolti soltanto assicurandosi, quando essa sia richiesta, che sia possibile
4323 eseguire in maniera atomica le operazioni necessarie.
4324
4325 \itindend{race~condition}
4326 \itindend{deadlock}
4327
4328
4329 \subsection{Le funzioni rientranti}
4330 \label{sec:proc_reentrant}
4331
4332 \index{funzioni!rientranti|(}
4333
4334 Si dice \textsl{rientrante} una funzione che può essere interrotta in
4335 qualunque punto della sua esecuzione ed essere chiamata una seconda volta da
4336 un altro \itindex{thread} \textit{thread} di esecuzione senza che questo
4337 comporti nessun problema nell'esecuzione della stessa. La problematica è
4338 comune nella programmazione \itindex{thread} \textit{multi-thread}, ma si
4339 hanno gli stessi problemi quando si vogliono chiamare delle funzioni
4340 all'interno dei gestori dei segnali.
4341
4342 Fintanto che una funzione opera soltanto con le variabili locali è rientrante;
4343 queste infatti vengono allocate nello \itindex{stack} \textit{stack}, ed
4344 un'altra invocazione non fa altro che allocarne un'altra copia. Una funzione
4345 può non essere rientrante quando opera su memoria che non è nello
4346 \itindex{stack} \textit{stack}.  Ad esempio una funzione non è mai rientrante
4347 se usa una \index{variabili!globali} variabile globale o
4348 \index{variabili!statiche} statica.
4349
4350 Nel caso invece la funzione operi su un oggetto allocato dinamicamente, la
4351 cosa viene a dipendere da come avvengono le operazioni: se l'oggetto è creato
4352 ogni volta e ritornato indietro la funzione può essere rientrante, se invece
4353 esso viene individuato dalla funzione stessa due chiamate alla stessa funzione
4354 potranno interferire quando entrambe faranno riferimento allo stesso oggetto.
4355 Allo stesso modo una funzione può non essere rientrante se usa e modifica un
4356 oggetto che le viene fornito dal chiamante: due chiamate possono interferire
4357 se viene passato lo stesso oggetto; in tutti questi casi occorre molta cura da
4358 parte del programmatore.
4359
4360 In genere le funzioni di libreria non sono rientranti, molte di esse ad
4361 esempio utilizzano \index{variabili!statiche} variabili statiche, la
4362 \acr{glibc} però mette a disposizione due macro di compilatore,
4363 \macro{\_REENTRANT} e \macro{\_THREAD\_SAFE}, la cui definizione attiva le
4364 versioni rientranti di varie funzioni di libreria, che sono identificate
4365 aggiungendo il suffisso \code{\_r} al nome della versione normale.
4366
4367 \index{funzioni!rientranti|)}
4368
4369
4370 % LocalWords:  multitasking like VMS child process identifier pid sez shell fig
4371 % LocalWords:  parent kernel init pstree keventd kswapd table struct linux call
4372 % LocalWords:  nell'header scheduler system interrupt timer HZ asm Hertz clock
4373 % LocalWords:  l'alpha tick fork wait waitpid exit exec image glibc int pgid ps
4374 % LocalWords:  sid thread Ingo Molnar ppid getpid getppid sys unistd LD threads
4375 % LocalWords:  void tempnam pathname sibling cap errno EAGAIN ENOMEM
4376 % LocalWords:  stack read only copy write tab client spawn forktest sleep PATH
4377 % LocalWords:  source LIBRARY scheduling race condition printf descriptor dup
4378 % LocalWords:  close group session tms lock vfork execve BSD stream main abort
4379 % LocalWords:  SIGABRT SIGCHLD SIGHUP foreground SIGCONT termination signal ANY
4380 % LocalWords:  handler kill EINTR POSIX options WNOHANG ECHILD option WUNTRACED
4381 % LocalWords:  dump bits rusage getrusage heap const filename argv envp EACCES
4382 % LocalWords:  filesystem noexec EPERM suid sgid root nosuid ENOEXEC ENOENT ELF
4383 % LocalWords:  ETXTBSY EINVAL ELIBBAD BIG EFAULT EIO ENAMETOOLONG ELOOP ENOTDIR
4384 % LocalWords:  ENFILE EMFILE argc execl path execv execle execlp execvp vector
4385 % LocalWords:  list environ NULL umask utime cutime ustime fcntl linker
4386 % LocalWords:  opendir libc interpreter FreeBSD capabilities mandatory access
4387 % LocalWords:  control MAC SELinux security modules LSM superuser uid gid saved
4388 % LocalWords:  effective euid egid dell' fsuid fsgid getuid geteuid getgid SVr
4389 % LocalWords:  getegid IDS NFS setuid setgid all' logout utmp screen xterm TODO
4390 % LocalWords:  setreuid setregid FIXME ruid rgid seteuid setegid setresuid size
4391 % LocalWords:  setresgid getresuid getresgid value result argument setfsuid DAC
4392 % LocalWords:  setfsgid NGROUPS sysconf getgroups getgrouplist groups ngroups
4393 % LocalWords:  setgroups initgroups patch LIDS CHOWN OVERRIDE Discrectionary PF
4394 % LocalWords:  SEARCH chattr sticky NOATIME socket domain immutable append mmap
4395 % LocalWords:  broadcast multicast multicasting memory locking mlock mlockall
4396 % LocalWords:  shmctl ioperm iopl chroot ptrace accounting swap reboot hangup
4397 % LocalWords:  vhangup mknod lease permitted inherited inheritable bounding AND
4398 % LocalWords:  capability capget capset header ESRCH undef version obj clear PT
4399 % LocalWords:  pag ssize length proc capgetp preemptive cache runnable  contest
4400 % LocalWords:  SIGSTOP soft slice nice niceness counter which SC switch side
4401 % LocalWords:  getpriority who setpriority RTLinux RTAI Adeos fault FIFO  COUNT
4402 % LocalWords:  yield Robin setscheduler policy param OTHER priority setparam to
4403 % LocalWords:  min getparam getscheduler interval robin ENOSYS fifo ping long
4404 % LocalWords:  affinity setaffinity unsigned mask cpu NUMA CLR ISSET SETSIZE RR
4405 % LocalWords:  getaffinity assembler deadlock REENTRANT SAFE tgz MYPGRP l'OR rr
4406 % LocalWords:  WIFEXITED WEXITSTATUS WIFSIGNALED WTERMSIG WCOREDUMP WIFSTOPPED
4407 % LocalWords:  WSTOPSIG opt char INTERP arg SIG IGN DFL mascheck grp FOWNER RAW
4408 % LocalWords:  FSETID SETPCAP BIND SERVICE ADMIN PACKET IPC OWNER MODULE RAWIO
4409 % LocalWords:  PACCT RESOURCE TTY CONFIG SETFCAP hdrp datap libcap lcap text tp
4410 % LocalWords:  get ncap caps CapInh CapPrm fffffeff CapEff getcap STAT dall'I
4411 % LocalWords:  inc PRIO SUSv PRGR prio SysV SunOS Ultrix sched timespec len sig
4412 % LocalWords:  cpusetsize cpuset atomic tickless redirezione WCONTINUED stopped
4413 % LocalWords:  waitid NOCLDSTOP ENOCHLD WIFCONTINUED ifdef endif idtype siginfo
4414 % LocalWords:  infop ALL WEXITED WSTOPPED WNOWAIT signo CLD EXITED KILLED page
4415 % LocalWords:  CONTINUED sources forking Spawned successfully executing exiting
4416 % LocalWords:  next cat for COMMAND pts bash defunct TRAPPED DUMPED PR effects
4417 % LocalWords:  SIGKILL static RLIMIT preemption PREEMPT VOLUNTARY IDLE RTPRIO
4418 % LocalWords:  completely fair compat uniform CFQ queuing elevator dev cfq RT
4419 % LocalWords:  documentation block syscall ioprio IPRIO CLASS class best effort
4420 % LocalWords:  refresh semop dnotify MADV DONTFORK prctl WCLONE WALL big mount
4421 % LocalWords:  WNOTHREAD DUMPABLE KEEPCAPS IRIX CAPBSET endianness endian flags
4422 % LocalWords:  little PPC PowerPC FPEMU NOPRINT SIGFPE FPEXC point FP SW malloc
4423 % LocalWords:  exception EXC ENABLE OVF overflow UND underflow RES INV DISABLED
4424 % LocalWords:  NONRECOV ASYNC KEEP securebits NAME NUL PDEATHSIG SECCOMP VM FS
4425 % LocalWords:  secure computing sigreturn TIMING STATISTICAL TSC MCE conditions
4426 % LocalWords:  timestamp Stamp SIGSEGV UNALIGN SIGBUS MCEERR AO failure early
4427 % LocalWords:  namespace vsyscall SETTID FILES NEWIPC NEWNET NEWNS NEWPID ptid
4428 % LocalWords:  NEWUTS SETTLS SIGHAND SYSVSEM UNTRACED tls ctid CLEARTID panic
4429 % LocalWords:  loader EISDIR SIGTRAP uninterrutible killable EQUAL sizeof XOR
4430 % LocalWords:  destset srcset ALLOC num cpus setsize emacs pager getty TID
4431  
4432 %%% Local Variables: 
4433 %%% mode: latex
4434 %%% TeX-master: "gapil"
4435 %%% End: