Riordinamento completo degli indici. Create della macro ad hoc per la

[gapil.git] / prochand.tex
diff --git a/prochand.tex b/prochand.tex

index f970dc0c93153ffef8b30e67ae40c94f245d2dab..9272a20e0bdb429978f21b24de0d56ca4cbbb6fd 100644 (file)
--- a/prochand.tex
+++ b/prochand.tex
@@ -144,8 +144,8 @@ fig.~\ref{fig:proc_task_struct}.
  \end{figure}
  
  Come accennato in sez.~\ref{sec:intro_unix_struct} è lo
-\textit{scheduler}\index{\textit{scheduler}} che decide quale processo mettere
-in esecuzione; esso viene eseguito ad ogni system call ed ad ogni
+\textit{scheduler}\itindex{scheduler} che decide quale processo mettere in
+esecuzione; esso viene eseguito ad ogni system call ed ad ogni
  interrupt,\footnote{più in una serie di altre occasioni. NDT completare questa
    parte.} (ma può essere anche attivato esplicitamente). Il timer di sistema
  provvede comunque a che esso sia invocato periodicamente, generando un
@@ -157,7 +157,7 @@ Hertz.\footnote{Il valore usuale di questa costante 
    sez.~\ref{sec:sys_unix_time}).}
  %Si ha cioè un interrupt dal timer ogni centesimo di secondo.
  
-Ogni volta che viene eseguito, lo \textit{scheduler}\index{\textit{scheduler}}
+Ogni volta che viene eseguito, lo \textit{scheduler}\itindex{scheduler}
  effettua il calcolo delle priorità dei vari processi attivi (torneremo su
  questo in sez.~\ref{sec:proc_priority}) e stabilisce quale di essi debba
  essere posto in esecuzione fino alla successiva invocazione.
@@ -267,10 +267,9 @@ fig.~\ref{fig:proc_fork_code}, nel programma \file{ForkTest.c}.
  Il fatto che il \acr{pid} sia un numero univoco per il sistema lo rende un
  candidato per generare ulteriori indicatori associati al processo di cui
  diventa possibile garantire l'unicità: ad esempio in alcune implementazioni la
-funzione \func{tmpname} (si veda sez.~\ref{sec:file_temp_file}) usa il
-\acr{pid} per generare un \index{\textit{pathname}}\textit{pathname} univoco,
-che non potrà essere replicato da un altro processo che usi la stessa
-funzione.
+funzione \func{tempnam} (si veda sez.~\ref{sec:file_temp_file}) usa il
+\acr{pid} per generare un \itindex{pathname}\textit{pathname} univoco, che non
+potrà essere replicato da un altro processo che usi la stessa funzione.
  
  Tutti i processi figli dello stesso processo padre sono detti
  \textit{sibling}, questa è una delle relazioni usate nel \textsl{controllo di
@@ -326,7 +325,7 @@ pertanto padre e figlio vedono variabili diverse.
  Per quanto riguarda la gestione della memoria, in generale il segmento di
  testo, che è identico per i due processi, è condiviso e tenuto in read-only
  per il padre e per i figli. Per gli altri segmenti Linux utilizza la tecnica
-del \textit{copy on write}\index{\textit{copy~on~write}}; questa tecnica
+del \textit{copy on write}\itindex{copy~on~write}; questa tecnica
  comporta che una pagina di memoria viene effettivamente copiata per il nuovo
  processo solo quando ci viene effettuata sopra una scrittura (e si ha quindi
  una reale differenza fra padre e figlio). In questo modo si rende molto più
@@ -442,8 +441,8 @@ Go to next child
  Esaminiamo questo risultato: una prima conclusione che si può trarre è che non
  si può dire quale processo fra il padre ed il figlio venga eseguito per
  primo\footnote{a partire dal kernel 2.5.2-pre10 è stato introdotto il nuovo
-  scheduler\index{\textit{scheduler}} di Ingo Molnar che esegue sempre per
-  primo il figlio; per mantenere la portabilità è opportuno non fare comunque
+  scheduler\itindex{scheduler} di Ingo Molnar che esegue sempre per primo il
+  figlio; per mantenere la portabilità è opportuno non fare comunque
    affidamento su questo comportamento.} dopo la chiamata a \func{fork};
  dall'esempio si può notare infatti come nei primi due cicli sia stato eseguito
  per primo il padre (con la stampa del \acr{pid} del nuovo processo) per poi
@@ -464,9 +463,8 @@ Pertanto non si pu
  istruzioni del codice fra padre e figli, né sull'ordine in cui questi potranno
  essere messi in esecuzione. Se è necessaria una qualche forma di precedenza
  occorrerà provvedere ad espliciti meccanismi di sincronizzazione, pena il
-rischio di incorrere nelle cosiddette 
-\textit{race condition}\index{\textit{race~condition}} 
-(vedi sez.~\ref{sec:proc_race_cond}).
+rischio di incorrere nelle cosiddette \textit{race
+  condition}\itindex{race~condition} (vedi sez.~\ref{sec:proc_race_cond}).
  
  Si noti inoltre che essendo i segmenti di memoria utilizzati dai singoli
  processi completamente separati, le modifiche delle variabili nei processi
@@ -571,7 +569,7 @@ file senza una qualche forma di sincronizzazione in quanto, come visto anche
  con il nostro esempio, le varie scritture risulteranno mescolate fra loro in
  una sequenza impredicibile. Per questo le modalità con cui in genere si usano
  i file dopo una \func{fork} sono sostanzialmente due:
-\begin{enumerate}
+\begin{enumerate*}
  \item Il processo padre aspetta la conclusione del figlio. In questo caso non
    è necessaria nessuna azione riguardo ai file, in quanto la sincronizzazione
    della posizione corrente dopo eventuali operazioni di lettura e scrittura
@@ -579,14 +577,14 @@ i file dopo una \func{fork} sono sostanzialmente due:
  \item L'esecuzione di padre e figlio procede indipendentemente. In questo caso
    ciascuno dei due processi deve chiudere i file che non gli servono una volta
    che la \func{fork} è stata eseguita, per evitare ogni forma di interferenza.
-\end{enumerate}
+\end{enumerate*}
  
  Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
  proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
  comune dopo l'esecuzione di una \func{fork} è la seguente:
  \begin{itemize*}
  \item i file aperti e gli eventuali flag di
-  \textit{close-on-exec}\index{\textit{close-on-exec}} impostati (vedi
+  \textit{close-on-exec}\itindex{close-on-exec} impostati (vedi
    sez.~\ref{sec:proc_exec} e sez.~\ref{sec:file_fcntl});
  \item gli identificatori per il controllo di accesso: l'\textsl{user-ID
      reale}, il \textsl{group-ID reale}, l'\textsl{user-ID effettivo}, il
@@ -603,6 +601,8 @@ comune dopo l'esecuzione di una \func{fork} 
  \item i segmenti di memoria condivisa agganciati al processo (vedi
    sez.~\ref{sec:ipc_sysv_shm});
  \item i limiti sulle risorse (vedi sez.~\ref{sec:sys_resource_limit});
+\item le priorità real-time e le affinità di processore (vedi
+  sez.~\ref{sec:proc_real_time});
  \item le variabili di ambiente (vedi sez.~\ref{sec:proc_environ}).
  \end{itemize*}
  Le differenze fra padre e figlio dopo la \func{fork} invece sono:
@@ -637,11 +637,10 @@ padre, che costituiva un inutile appesantimento in tutti quei casi in cui la
  \func{fork} veniva fatta solo per poi eseguire una \func{exec}. La funzione
  venne introdotta in BSD per migliorare le prestazioni.
  
-Dato che Linux supporta il \textit{copy on
-  write}\index{\textit{copy~on~write}} la perdita di prestazioni è
-assolutamente trascurabile, e l'uso di questa funzione (che resta un caso
-speciale della system call \func{\_\_clone}) è deprecato; per questo eviteremo
-di trattarla ulteriormente.
+Dato che Linux supporta il \textit{copy on write}\itindex{copy~on~write} la
+perdita di prestazioni è assolutamente trascurabile, e l'uso di questa
+funzione (che resta un caso speciale della system call \func{\_\_clone}) è
+deprecato; per questo eviteremo di trattarla ulteriormente.
  
  
  \subsection{La conclusione di un processo}
@@ -679,7 +678,7 @@ eseguite alla chiusura di un processo 
    sez.~\ref{sec:sig_sigchld});
  \item se il processo è un leader di sessione ed il suo terminale di controllo
    è quello della sessione viene mandato un segnale di \const{SIGHUP} a tutti i
-  processi del gruppo di foreground e il terminale di controllo viene
+  processi del gruppo di \textit{foreground} e il terminale di controllo viene
    disconnesso (vedi sez.~\ref{sec:sess_ctrl_term});
  \item se la conclusione di un processo rende orfano un \textit{process
      group} ciascun membro del gruppo viene bloccato, e poi gli vengono
@@ -769,10 +768,10 @@ informazione, non pi
  completamente conclusa.
  
  Possiamo utilizzare il nostro programma di prova per analizzare anche questa
-condizione: lanciamo il comando \cmd{forktest} in background, indicando al
-processo padre di aspettare 10 secondi prima di uscire; in questo caso, usando
-\cmd{ps} sullo stesso terminale (prima dello scadere dei 10 secondi)
-otterremo:
+condizione: lanciamo il comando \cmd{forktest} in \textit{background} (vedi
+sez.~\ref{sec:sess_job_control}), indicando al processo padre di aspettare 10
+secondi prima di uscire; in questo caso, usando \cmd{ps} sullo stesso
+terminale (prima dello scadere dei 10 secondi) otterremo:
  
  \footnotesize
  \begin{verbatim}
@@ -1187,7 +1186,7 @@ non viene trovato nessun altro file viene finalmente restituito
  
  Le altre quattro funzioni si limitano invece a cercare di eseguire il file
  indicato dall'argomento \param{path}, che viene interpretato come il
-\index{\textit{pathname}}\textit{pathname} del programma.
+\itindex{pathname}\textit{pathname} del programma.
  
  \begin{figure}[htb]
    \centering
@@ -1236,7 +1235,7 @@ speciale 
  sez.~\ref{sec:sig_gen_beha}).
  
  La gestione dei file aperti dipende dal valore che ha il flag di
-\textit{close-on-exec}\index{\textit{close-on-exec}} (vedi anche
+\textit{close-on-exec}\itindex{close-on-exec} (vedi anche
  sez.~\ref{sec:file_fcntl}) per ciascun file descriptor. I file per cui è
  impostato vengono chiusi, tutti gli altri file restano aperti. Questo
  significa che il comportamento predefinito è che i file restano aperti
@@ -1246,9 +1245,8 @@ che imposti il suddetto flag.
  Per le directory, lo standard POSIX.1 richiede che esse vengano chiuse
  attraverso una \func{exec}, in genere questo è fatto dalla funzione
  \func{opendir} (vedi sez.~\ref{sec:file_dir_read}) che effettua da sola
-l'impostazione del flag di
-\textit{close-on-exec}\index{\textit{close-on-exec}} sulle directory che apre,
-in maniera trasparente all'utente.
+l'impostazione del flag di \textit{close-on-exec}\itindex{close-on-exec} sulle
+directory che apre, in maniera trasparente all'utente.
  
  Abbiamo detto che l'\textsl{user-ID reale} ed il \textsl{group-ID reale}
  restano gli stessi all'esecuzione di \func{exec}; lo stesso vale per
@@ -1296,7 +1294,7 @@ vari parametri connessi ai processi.
  \label{sec:proc_perms}
  
  In questa sezione esamineremo le problematiche relative al controllo di
-accesso dal punto di vista del processi; vedremo quali sono gli identificatori
+accesso dal punto di vista dei processi; vedremo quali sono gli identificatori
  usati, come questi possono essere modificati nella creazione e nel lancio di
  nuovi processi, le varie funzioni per la loro manipolazione diretta e tutte le
  problematiche connesse ad una gestione accorta dei privilegi.
@@ -1334,7 +1332,7 @@ kernel nella gestione dei permessi di accesso.
  Dato che tutte le operazioni del sistema vengono compiute dai processi, è
  evidente che per poter implementare un controllo sulle operazioni occorre
  anche poter identificare chi è che ha lanciato un certo programma, e pertanto
-anche a ciascun processo dovrà essere associato ad un utente e ad un gruppo.
+anche a ciascun processo dovrà essere associato un utente e un gruppo.
  
  Un semplice controllo di una corrispondenza fra identificativi non garantisce
  però sufficiente flessibilità per tutti quei casi in cui è necessario poter
@@ -1399,7 +1397,7 @@ nel sistema.
  Al secondo gruppo appartengono lo \textsl{user-ID effettivo} ed il
  \textsl{group-ID effettivo} (a cui si aggiungono gli eventuali \textsl{group-ID
    supplementari} dei gruppi dei quali l'utente fa parte).  Questi sono invece
-gli identificatori usati nella verifiche dei permessi del processo e per il
+gli identificatori usati nelle verifiche dei permessi del processo e per il
  controllo di accesso ai file (argomento affrontato in dettaglio in
  sez.~\ref{sec:file_perm_overview}).
  
@@ -1698,8 +1696,8 @@ corrente.
  Anche queste funzioni sono un'estensione specifica di Linux, e non richiedono
  nessun privilegio. I valori sono restituiti negli argomenti, che vanno
  specificati come puntatori (è un altro esempio di
-\index{\textit{value~result~argument}}\textit{value result argument}). Si noti
-che queste funzioni sono le uniche in grado di leggere gli identificatori del
+\itindex{value~result~argument}\textit{value result argument}). Si noti che
+queste funzioni sono le uniche in grado di leggere gli identificatori del
  gruppo \textit{saved}.
  
  
@@ -1868,7 +1866,7 @@ scrivere codice portabile.
  \label{sec:proc_priority}
  
  In questa sezione tratteremo più approfonditamente i meccanismi con il quale
-lo \textit{scheduler}\index{\textit{scheduler}} assegna la CPU ai vari
+lo \textit{scheduler}\itindex{scheduler} assegna la CPU ai vari
  processi attivi.  In particolare prenderemo in esame i vari meccanismi con cui
  viene gestita l'assegnazione del tempo di CPU, ed illustreremo le varie
  funzioni di gestione.
@@ -1877,6 +1875,7 @@ funzioni di gestione.
  \subsection{I meccanismi di \textit{scheduling}}
  \label{sec:proc_sched}
  
+\itindbeg{scheduler}
  La scelta di un meccanismo che sia in grado di distribuire in maniera efficace
  il tempo di CPU per l'esecuzione dei processi è sempre una questione delicata,
  ed oggetto di numerose ricerche; in generale essa dipende in maniera
@@ -1884,13 +1883,14 @@ essenziale anche dal tipo di utilizzo che deve essere fatto del sistema, per
  cui non esiste un meccanismo che sia valido per tutti gli usi.
  
  La caratteristica specifica di un sistema multitasking come Linux è quella del
-cosiddetto \textit{prehemptive multitasking}: questo significa che al
-contrario di altri sistemi (che usano invece il cosiddetto \textit{cooperative
+cosiddetto \itindex{prehemptive~multitasking}\textit{prehemptive
+  multitasking}: questo significa che al contrario di altri sistemi (che usano
+invece il cosiddetto \itindex{cooperative~multitasking}\textit{cooperative
    multitasking}) non sono i singoli processi, ma il kernel stesso a decidere
  quando la CPU deve essere passata ad un altro processo. Come accennato in
  sez.~\ref{sec:proc_hierarchy} questa scelta viene eseguita da una sezione
-apposita del kernel, lo \textit{scheduler}\index{\textit{scheduler}}, il cui
-scopo è quello di distribuire al meglio il tempo di CPU fra i vari processi.
+apposita del kernel, lo \textit{scheduler}, il cui scopo è quello di
+distribuire al meglio il tempo di CPU fra i vari processi.
  
  La cosa è resa ancora più complicata dal fatto che con le architetture
  multi-processore si deve anche scegliere quale sia la CPU più opportuna da
@@ -2011,32 +2011,30 @@ essere eseguito, e quando un processo potr
  nell'esecuzione.
  
  Il meccanismo usato da Linux è piuttosto semplice,\footnote{in realtà nella
-  serie 2.6.x lo \textit{scheduler} è stato riscritto da zero e può usare
-  diversi algoritmi, selezionabili sia in fase di compilazione, che, nelle
-  versioni più recenti, all'avvio (addirittura è stato ideato un sistema
-  modulare che permette di cambiare lo scheduler al volo, che comunque non è
-  incluso nel kernel ufficiale).} ad ogni processo è assegnata una
-\textit{time-slice}, cioè un intervallo di tempo (letteralmente una fetta) per
-il quale esso deve essere eseguito. Il valore della \textit{time-slice} è
-controllato dalla cosiddetta \textit{nice} (o \textit{niceness}) del processo.
-Essa è contenuta nel campo \var{nice} di \struct{task\_struct}; tutti i
-processi vengono creati con lo stesso valore, ed essa specifica il valore
-della durata iniziale della \textit{time-slice} che viene assegnato ad un
-altro campo della struttura (\var{counter}) quando il processo viene eseguito
-per la prima volta e diminuito progressivamente ad ogni interruzione del
-timer.
-
-Durante la sua esecuzione lo scheduler\index{\textit{scheduler}} scandisce la
-coda dei processi in stato \textit{runnable} associando, in base al valore di
-\var{counter}, un peso ad ogni processo in attesa di esecuzione,\footnote{il
-  calcolo del peso in realtà è un po' più complicato, ad esempio nei sistemi
-  multiprocessore viene favorito un processo eseguito sulla stessa CPU, e a
-  parità del valore di \var{counter} viene favorito chi ha una priorità più
-  elevata.} chi ha il peso più alto verrà posto in esecuzione, ed il
-precedente processo sarà spostato in fondo alla coda.  Dato che ad ogni
-interruzione del timer il valore di \var{counter} del processo corrente viene
-diminuito, questo assicura che anche i processi con priorità più bassa
-verranno messi in esecuzione.
+  serie 2.6.x lo scheduler è stato riscritto da zero e può usare diversi
+  algoritmi, selezionabili sia in fase di compilazione, che, nelle versioni
+  più recenti, all'avvio (addirittura è stato ideato un sistema modulare che
+  permette di cambiare lo scheduler al volo, che comunque non è incluso nel
+  kernel ufficiale).} ad ogni processo è assegnata una \textit{time-slice},
+cioè un intervallo di tempo (letteralmente una fetta) per il quale esso deve
+essere eseguito. Il valore della \textit{time-slice} è controllato dalla
+cosiddetta \textit{nice} (o \textit{niceness}) del processo.  Essa è contenuta
+nel campo \var{nice} di \struct{task\_struct}; tutti i processi vengono creati
+con lo stesso valore, ed essa specifica il valore della durata iniziale della
+\textit{time-slice} che viene assegnato ad un altro campo della struttura
+(\var{counter}) quando il processo viene eseguito per la prima volta e
+diminuito progressivamente ad ogni interruzione del timer.
+
+Durante la sua esecuzione lo scheduler scandisce la coda dei processi in stato
+\textit{runnable} associando, in base al valore di \var{counter}, un peso ad
+ogni processo in attesa di esecuzione,\footnote{il calcolo del peso in realtà
+  è un po' più complicato, ad esempio nei sistemi multiprocessore viene
+  favorito un processo eseguito sulla stessa CPU, e a parità del valore di
+  \var{counter} viene favorito chi ha una priorità più elevata.} chi ha il
+peso più alto verrà posto in esecuzione, ed il precedente processo sarà
+spostato in fondo alla coda.  Dato che ad ogni interruzione del timer il
+valore di \var{counter} del processo corrente viene diminuito, questo assicura
+che anche i processi con priorità più bassa verranno messi in esecuzione.
  
  La priorità di un processo è così controllata attraverso il valore di
  \var{nice}, che stabilisce la durata della \textit{time-slice}; per il
@@ -2165,7 +2163,7 @@ processo qualsiasi sia la sua priorit
    Adeos gestiti dalle code del nano-kernel), in modo da poterli controllare
    direttamente qualora ci sia la necessità di avere un processo con priorità
    più elevata di un \textit{interrupt handler}.} mentre con l'incorrere in un
-page fault\index{\textit{page~fault}} si possono avere ritardi non previsti.
+\textit{page fault}\itindex{page~fault} si possono avere ritardi non previsti.
  Se l'ultimo problema può essere aggirato attraverso l'uso delle funzioni di
  controllo della memoria virtuale (vedi sez.~\ref{sec:proc_mem_lock}), il primo
  non è superabile e può comportare ritardi non prevedibili riguardo ai tempi di
@@ -2180,14 +2178,13 @@ si lavora con processi che usano priorit
  cui si sia assegnata la massima priorità assoluta, in modo da poter essere
  comunque in grado di rientrare nel sistema.
  
-Quando c'è un processo con priorità assoluta lo
-scheduler\index{\textit{scheduler}} lo metterà in esecuzione prima di ogni
-processo normale. In caso di più processi sarà eseguito per primo quello con
-priorità assoluta più alta. Quando ci sono più processi con la stessa priorità
-assoluta questi vengono tenuti in una coda e tocca al kernel decidere quale
-deve essere eseguito.  Il meccanismo con cui vengono gestiti questi processi
-dipende dalla politica di scheduling che si è scelto; lo standard ne prevede
-due:
+Quando c'è un processo con priorità assoluta lo scheduler lo metterà in
+esecuzione prima di ogni processo normale. In caso di più processi sarà
+eseguito per primo quello con priorità assoluta più alta. Quando ci sono più
+processi con la stessa priorità assoluta questi vengono tenuti in una coda e
+tocca al kernel decidere quale deve essere eseguito.  Il meccanismo con cui
+vengono gestiti questi processi dipende dalla politica di scheduling che si è
+scelto; lo standard ne prevede due:
  \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
  \item[\textit{FIFO}] \textit{First In First Out}. Il processo viene eseguito
    fintanto che non cede volontariamente la CPU (con \func{sched\_yield}), si
@@ -2256,8 +2253,8 @@ Il valore della priorit
  \struct{sched\_param} (riportata in fig.~\ref{fig:sig_sched_param}), il cui
  solo campo attualmente definito è \var{sched\_priority}, che nel caso delle
  priorità assolute deve essere specificato nell'intervallo fra un valore
-massimo ed uno minimo, che nel caso sono rispettivamente 1 e 99 (il valore
-zero è legale, ma indica i processi normali).
+massimo ed uno minimo, che nel caso sono rispettivamente 1 e 99; il valore
+nullo è legale, ma indica i processi normali.
  
  \begin{figure}[!bht]
    \footnotesize \centering
@@ -2386,7 +2383,10 @@ il suo prototipo 
  
  La funzione restituisce il valore dell'intervallo di tempo usato per la
  politica \textit{round robin} in una struttura \struct{timespec}, (la cui
-definizione si può trovare in fig.~\ref{fig:sys_timeval_struct}).
+definizione si può trovare in fig.~\ref{fig:sys_timeval_struct}). In realtà
+dato che in Linux questo intervallo di tempo è prefissato e non modificabile,
+questa funzione ritorna sempre un valore di 150 millisecondi, e non importa
+specificare il PID di un processo reale.
  
  
  Come accennato ogni processo che usa lo scheduling real-time può rilasciare
@@ -2409,33 +2409,180 @@ in modalit
  con pari priorità quando la sezione più urgente è finita.
  
  Infine con il supporto dei sistemi multiprocessore sono state introdotte delle
-funzioni che permettono di controllare ...
-
-
-\begin{functions}
-  \headdecl{sched.h}
-
-  \funcdecl{int sched\_setaffinity(pid\_t pid, unsigned int len, unsigned long
-    *mask)} 
+funzioni che permettono di controllare in maniera più dettagliata la scelta di
+quale processore utilizzare per eseguire un certo programma. Uno dei problemi
+che si pongono nei sistemi multiprocessore è infatti quello
+dell'\textsl{effetto ping-pong}.\index{effetto~ping-pong} Può accadere cioè
+che lo scheduler, quando riavvia un processo precedentemente interrotto,
+scegliendo il primo processore disponibile lo faccia eseguire da un processore
+diverso rispetto a quello su cui era stato eseguito in precedenza. Se il
+processo passa da un processore all'altro in questo modo (cosa che avveniva
+abbastanza di frequente con i kernel della seria 2.4.x) si ha
+l'\textsl{effetto ping-pong}.
+
+Questo tipo di comportamento può generare dei seri problemi di prestazioni;
+infatti tutti i processori moderni utilizzano una memoria interna (la
+\textit{cache}) contenente i dati più usati, che permette di evitare di
+eseguire un accesso (molto più lento) alla memoria principale sulla scheda
+madre.  Chiaramente un processo sarà favorito se i suoi dati sono nella cache
+del processore, ma è ovvio che questo può essere vero solo per un processore
+alla volta, perché in presenza di più copie degli stessi dati su più
+processori, non si potrebbe determinare quale di questi ha la versione dei
+dati aggiornata rispetto alla memoria principale.
+
+Questo comporta che quando un processore inserisce un dato nella sua cache,
+tutti gli altri processori che hanno lo stesso dato devono invalidarlo, e
+questa operazione è molto costosa in termini di prestazioni. Il problema
+diventa serio quando si verifica l'\textsl{effetto ping-pong}, in tal caso
+infatti un processo \textsl{rimbalza} continuamente da un processore all'altro
+e si ha una continua invalidazione della cache, che non diventa mai
+disponibile.
+
+\itindbeg{CPU~affinity}
+Per ovviare a questo tipo di problemi è nato il concetto di \textsl{affinità
+  di processore} (o \textit{CPU affinity}); la
+possibilità cioè di far sì che un processo possa essere assegnato per
+l'esecuzione sempre allo stesso processore. Lo scheduler dei kernel della
+serie 2.4.x aveva una scarsa \textit{CPU affinity}, e
+\index{effetto~ping-pong} l'effetto ping-pong era comune; con il nuovo
+scheduler dei kernel della 2.6.x questo problema è stato risolto ed esso cerca
+di mantenere il più possibile ciascun processo sullo stesso processore.
+
+In certi casi però resta l'esigenza di poter essere sicuri che un processo sia
+sempre eseguito dallo stesso processore,\footnote{quella che viene detta
+  \textit{hard CPU affinity}, in contrasto con quella fornita dallo scheduler,
+  detta \textit{soft CPU affinity}, che di norma indica solo una preferenza,
+  non un requisito assoluto.} e per poter risolvere questo tipo di
+problematiche nei nuovi kernel\footnote{le due system call per la gestione
+  della \textit{CPU affinity} sono state introdotte nel kernel 2.5.8, e le
+  funzioni di libreria nelle \textsl{glibc} 2.3.} è stata introdotta
+l'opportuna infrastruttura ed una nuova system call che permette di impostare
+su quali processori far eseguire un determinato processo attraverso una
+\textsl{maschera di affinità}. La corrispondente funzione di libreria è
+\funcd{sched\_setaffinity} ed il suo prototipo\footnote{di questa funzione (e
+  della corrispondente \func{sched\_setaffinity}) esistono versioni diverse
+  per gli argomenti successivi a \param{pid}: la prima (quella riportata nella
+  pagina di manuale) prevedeva due ulteriori argomenti di tipo
+  \texttt{unsigned int len} e \texttt{unsigned long *mask}, poi l'argomento
+  \texttt{len} è stato eliminato, successivamente si è introdotta la versione
+  riportata con però un secondo argomento di tipo \texttt{size\_t cpusetsize}
+  (anche questa citata nella pagina di manuale); la versione citata è quella
+  riportata nel manuale delle \textsl{glibc} e corripondente alla definizione
+  presente in \file{sched.h}.} è:
+\begin{prototype}{sched.h}
+  {int sched\_setaffinity (pid\_t pid, const cpu\_set\_t *cpuset)} 
    Imposta la maschera di affinità del processo \param{pid}.
-
-  \funcdecl{int sched\_getaffinity(pid\_t pid, unsigned int len, unsigned long
-    *mask)}
-  Legge la maschera di affinità del processo \param{pid}.
-
+  
    \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
      nel qual caso \var{errno} può assumere i valori:
      \begin{errlist}
      \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
-    \item[\errcode{EINVAL}] la maschera \param{mask} fa riferimento a
-      processori che non esistono o la sua lunghezza \param{len} è minore di
-      quella usata dal kernel.
+    \item[\errcode{EINVAL}] il valore di \param{cpuset} contiene riferimenti a
+      processori non esistenti nel sistema.
      \item[\errcode{EPERM}] il processo non ha i privilegi sufficienti per
        eseguire l'operazione.
    \end{errlist} 
    ed inoltre anche \errval{EFAULT}.}
+\end{prototype}
+
+La funzione imposta, con l'uso del valore contenuto all'indirizzo
+\param{cpuset}, l'insieme dei processori sui quali deve essere eseguito il
+processo identificato tramite il valore passato in \param{pid}. Come in
+precedenza il valore nullo di \param{pid} indica il processo corrente.  Per
+poter utilizzare questa funzione sono richiesti i privilegi di amministratore
+(è necessaria la capacità \const{CAP\_SYS\_NICE}) altrimenti essa fallirà con
+un errore di \errcode{EPERM}. Una volta impostata una maschera di affinità,
+questa viene ereditata attraverso una \func{fork}, in questo modo diventa
+possibile legare automaticamente un gruppo di processi ad un singolo
+processore.
+
+Nell'uso comune, almeno con i kernel della serie 2.6.x, l'uso di questa
+funzione non è necessario, in quanto è lo scheduler stesso che provvede a
+mantenere al meglio l'affinità di processore. Esistono però esigenze
+particolari, ad esempio quando un processo (o un gruppo di processi) è
+utilizzato per un compito importante (ad esempio per applicazioni real-time o
+la cui risposta è critica) e si vuole la massima velocità, con questa
+interfaccia diventa possibile selezionare gruppi di processori utilizzabili in
+maniera esclusiva.  Lo stesso dicasi quando l'accesso a certe risorse (memoria
+o periferiche) può avere un costo diverso a seconda del processore (come
+avviene nelle architetture NUMA).
+
+Infine se un gruppo di processi accede alle stesse risorse condivise (ad
+esempio una applicazione con più thread) può avere senso usare lo stesso
+processore in modo da sfruttare meglio l'uso della sua cache; questo
+ovviamente riduce i benefici di un sistema multiprocessore nell'esecuzione
+contemporanea dei thread, ma in certi casi (quando i thread sono inerentemente
+serializzati nell'accesso ad una risorsa) possono esserci sufficienti vantaggi
+nell'evitare la perdita della cache da rendere conveniente l'uso dell'affinità
+di processore.
+
+Per facilitare l'uso dell'argomento \param{cpuset} le \acr{glibc} hanno
+introdotto un apposito dato di tipo, \ctyp{cpu\_set\_t},\footnote{questa è una
+  estensione specifica delle \acr{glibc}, da attivare definendo la macro
+  \macro{\_GNU\_SOURCE}, non esiste infatti una standardardizzazione per
+  questo tipo di interfaccia e POSIX al momento non prevede nulla al
+  riguardo.} che permette di identificare un insieme di processori. Il dato è
+una maschera binaria: in generale è un intero a 32 bit in cui ogni bit
+corrisponde ad un processore, ma dato che per architetture particolari il
+numero di bit di un intero può non essere sufficiente, è stata creata questa
+che è una interfaccia generica che permette di usare a basso livello un tipo
+di dato qualunque rendendosi indipendenti dal numero di bit e dalla loro
+disposizione.
+
+Questa interfaccia, oltre alla definizione del tipo di dato apposito, prevede
+anche una serie di macro di preprocessore per la manipolazione dello stesso,
+che consentono di svuotare un insieme, aggiungere o togliere un processore da
+esso o verificare se vi è già presente:
+\begin{functions}
+  \headdecl{sched.h}
+  \funcdecl{void \macro{CPU\_ZERO}(cpu\_set\_t *set)}
+  Inizializza l'insieme (vuoto).
+
+  \funcdecl{void \macro{CPU\_SET}(int cpu, cpu\_set\_t *set)}
+  Inserisce il processore \param{cpu} nell'insieme.
+
+  \funcdecl{void \macro{CPU\_CLR}(int cpu, cpu\_set\_t *set)}
+  Rimuove il processore \param{cpu} nell'insieme.
+  
+  \funcdecl{int \macro{CPU\_ISSET}(int cpu, cpu\_set\_t *set)}
+  Controlla se il processore \param{cpu} è nell'insieme.
  \end{functions}
  
+Oltre a queste macro, simili alle analoghe usate per gli insiemi di file
+descriptor (vedi sez.~\ref{sec:file_select}) è definita la costante
+\const{CPU\_SETSIZE} che indica il numero massimo di processori che possono
+far parte dell'insieme, e che costituisce un limite massimo al valore
+dell'argomento \param{cpu}.
+
+In generale la maschera di affinità è preimpostata in modo che un processo
+possa essere eseguito su qualunque processore, se può comunque leggere il
+valore per un processo specifico usando la funzione
+\funcd{sched\_getaffinity}, il suo prototipo è:
+\begin{prototype}{sched.h}
+  {int sched\_getaffinity (pid\_t pid, const cpu\_set\_t *cpuset)} 
+  Legge la maschera di affinità del processo \param{pid}.
+  
+  \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
+    nel qual caso \var{errno} può assumere i valori:
+    \begin{errlist}
+    \item[\errcode{ESRCH}] il processo \param{pid} non esiste.
+    \item[\errcode{EFAULT}] il valore di \param{cpuset} non è un indirizzo
+      valido. 
+  \end{errlist} }
+\end{prototype}
+
+La funzione restituirà all'indirizzo specificato da \param{cpuset} il valore
+della maschera di affinità del processo, così da poterla riutilizzare per una
+successiva reimpostazione. In questo caso non sono necessari privilegi
+paricolari.  
+
+È chiaro che queste funzioni per la gestione dell'affinità hanno significato
+soltanto su un sistema multiprocessore, esse possono comunque essere
+utilizzate anche in un sistema con un processore singolo, nel qual caso però
+non avranno alcun risultato effettivo.
+\itindend{scheduler}
+\itindend{CPU~affinity}
+
  
  
  \section{Problematiche di programmazione multitasking}
@@ -2465,10 +2612,10 @@ di interruzione in una fase intermedia.
  In un ambiente multitasking il concetto è essenziale, dato che un processo può
  essere interrotto in qualunque momento dal kernel che mette in esecuzione un
  altro processo o dalla ricezione di un segnale; occorre pertanto essere
-accorti nei confronti delle possibili 
-\textit{race condition}\index{\textit{race~condition}} (vedi
-sez.~\ref{sec:proc_race_cond}) derivanti da operazioni interrotte in una fase
-in cui non erano ancora state completate.
+accorti nei confronti delle possibili \textit{race
+  condition}\itindex{race~condition} (vedi sez.~\ref{sec:proc_race_cond})
+derivanti da operazioni interrotte in una fase in cui non erano ancora state
+completate.
  
  Nel caso dell'interazione fra processi la situazione è molto più semplice, ed
  occorre preoccuparsi della atomicità delle operazioni solo quando si ha a che
@@ -2503,7 +2650,7 @@ condiviso, onde evitare problemi con le ottimizzazioni del codice.
  \subsection{Le \textit{race condition} ed i \textit{deadlock}}
  \label{sec:proc_race_cond}
  
-\index{\textit{race~condition}|(}
+\itindbeg{race~condition}
  Si definiscono \textit{race condition} tutte quelle situazioni in cui processi
  diversi operano su una risorsa comune, ed in cui il risultato viene a
  dipendere dall'ordine in cui essi effettuano le loro operazioni. Il caso
@@ -2532,7 +2679,7 @@ cui si compiono le operazioni sulle risorse condivise (le cosiddette
  opportunamente protette da meccanismi di sincronizzazione (torneremo su queste
  problematiche di questo tipo in cap.~\ref{cha:IPC}).
  
-\index{\textit{deadlock}|(} 
+\itindbeg{deadlock}
  Un caso particolare di \textit{race condition} sono poi i cosiddetti
  \textit{deadlock}, particolarmente gravi in quanto comportano spesso il blocco
  completo di un servizio, e non il fallimento di una singola operazione. Per
@@ -2554,8 +2701,8 @@ In tutti questi casi 
  visto in sez.~\ref{sec:proc_atom_oper}; questi problemi infatti possono essere
  risolti soltanto assicurandosi, quando essa sia richiesta, che sia possibile
  eseguire in maniera atomica le operazioni necessarie.
-\index{\textit{race~condition}|)}
-\index{\textit{deadlock}|)}
+\itindend{race~condition}
+\itindend{deadlock}
  
  
  \subsection{Le funzioni rientranti}