Revisioni varie, introdotto nuovo capitolo sulle funzioni di gestione

[gapil.git] / prochand.tex
diff --git a/prochand.tex b/prochand.tex

index ef6c064a0552dcbfa657378321a7ce663b38fbfb..c2af15d637ce024f93bd9c344060da9445b84e20 100644 (file)
--- a/prochand.tex
+++ b/prochand.tex
@@ -8,16 +8,20 @@ base per l'allocazione e l'uso delle risorse del sistema.
  Nel precedente capitolo abbiamo visto come funziona un singolo processo, in
  questo capitolo affronteremo i dettagli della creazione e della distruzione
  dei processi, della gestione dei loro attributi e privilegi, e di tutte le
-funzioni a questo connesse.
+funzioni a questo connesse. Infine nella sezione finale affronteremo alcune
+problematiche generiche della programmazione in ambiente multitasking.
+
  
  
  \section{Introduzione}
  \label{sec:proc_gen}
  
  Partiremo con una introduzione generale ai concetti che stanno alla base della
-gestione dei processi in unix. Introdurremo in questa sezione l'architettura
-della gestione dei processi e le sue principali caratteristiche, e daremo una
-panoramica sull'uso delle principali funzioni per la gestione dei processi.
+gestione dei processi in un sitema unix-like. Introdurremo in questa sezione
+l'architettura della gestione dei processi e le sue principali
+caratteristiche, e daremo una panoramica sull'uso delle principali funzioni
+per la gestione dei processi.
+
  
  \subsection{La gerarchia dei processi}
  \label{sec:proc_hierarchy}
@@ -377,6 +381,8 @@ periodo di attesa.
  Se eseguiamo il comando senza specificare attese (come si può notare in
  \texttt{\small 17--19} i valori di default specificano di non attendere),
  otterremo come output sul terminale:
+
+\footnotesize
  \begin{verbatim}
  [piccardi@selidor sources]$ ./forktest 3
  Process 1963: forking 3 child
@@ -393,6 +399,7 @@ Child 3, parent 1963, exiting
  Spawned 3 child, pid 1966 
  Go to next child 
  \end{verbatim} %$
+\normalsize
  
  Esaminiamo questo risultato: una prima conclusione che si può trarre è non si
  può dire quale processo fra il padre ed il figlio venga eseguito per
@@ -431,6 +438,8 @@ Un secondo aspetto molto importante nella creazione dei processi figli 
  quello dell'interazione dei vari processi con i file; per illustrarlo meglio
  proviamo a redirigere su un file l'output del nostro programma di test, quello
  che otterremo è:
+
+\footnotesize
  \begin{verbatim}
  [piccardi@selidor sources]$ ./forktest 3 > output
  [piccardi@selidor sources]$ cat output
@@ -457,6 +466,7 @@ Go to next child
  Spawned 3 child, pid 1970 
  Go to next child 
  \end{verbatim}
+\normalsize
  che come si vede è completamente diverso da quanto ottenevamo sul terminale.
  
  Il comportamento delle varie funzioni di interfaccia con i file è analizzato
@@ -527,8 +537,8 @@ sequenza impredicibile. Le modalit
  \end{enumerate}
  
  Oltre ai file aperti i processi figli ereditano dal padre una serie di altre
-proprietà comuni; in dettaglio avremo che dopo l'esecuzione di una \func{fork}
-padre e figlio avranno in comune:
+proprietà; la lista dettagliata delle proprietà che padre e figlio hanno in
+comune dopo l'esecuzione di una \func{fork} è la seguente:
  \begin{itemize*}
  \item i file aperti (e gli eventuali flag di \textit{close-on-exec} se
    settati).
@@ -548,7 +558,7 @@ padre e figlio avranno in comune:
  \item i limiti sulle risorse
  \item le variabili di ambiente (vedi \secref{sec:proc_environ}).
  \end{itemize*}
-le differenze invece sono:
+le differenze fra padree figlio dopo la \func{fork} invece sono:
  \begin{itemize*}
  \item il valore di ritorno di \func{fork}.
  \item il \textit{process id}. 
@@ -660,6 +670,8 @@ avr
  di terminazione.  Come verifica di questo comportamento possiamo eseguire il
  comando \cmd{forktest} imponendo a ciascun processo figlio due
  secondi di attesa prima di uscire, il risultato è:
+
+\footnotesize
  \begin{verbatim}
  [piccardi@selidor sources]$ ./forktest -c2 3
  Process 1972: forking 3 child
@@ -676,6 +688,7 @@ Go to next child
  Child 2, parent 1, exiting
  Child 1, parent 1, exiting
  \end{verbatim}
+\normalsize
  come si può notare in questo caso il processo padre si conclude prima dei
  figli, tornando alla shell, che stampa il prompt sul terminale: circa due
  secondi dopo viene stampato a video anche l'output dei tre figli che
@@ -705,6 +718,8 @@ condizione: lanciamo il comando \cmd{forktest} in background, indicando al
  processo padre di aspettare 10 secondi prima di uscire; in questo caso, usando
  \cmd{ps} sullo stesso terminale (prima dello scadere dei 10 secondi)
  otterremo:
+
+\footnotesize
  \begin{verbatim}
  [piccardi@selidor sources]$ ps T
    PID TTY      STAT   TIME COMMAND
@@ -715,6 +730,7 @@ otterremo:
    571 pts/0    Z      0:00 [forktest <defunct>]
    572 pts/0    R      0:00 ps T
  \end{verbatim} %$
+\normalsize 
  e come si vede, dato che non si è fatto nulla per riceverne lo stato di
  terminazione, i tre processi figli sono ancora presenti pur essendosi
  conclusi, con lo stato di zombie e l'indicazione che sono stati terminati.
@@ -744,7 +760,7 @@ di terminare il processo che li ha generati, in modo che \cmd{init} possa
  adottarli e provvedere a concludere la terminazione.
  
  
-\subsection{Le funzioni \texttt{wait} e  \texttt{waitpid}}
+\subsection{Le funzioni \func{wait} e  \func{waitpid}}
  \label{sec:proc_wait}
  
  Abbiamo già accennato come uno degli usi possibili delle capacità multitasking
@@ -775,6 +791,7 @@ caso di errore; \var{errno} pu
    \item \macro{EINTR} la funzione è stata interrotta da un segnale.
    \end{errlist}
  \end{functions}
+
  è presente fin dalle prime versioni di unix; la funzione ritorna alla
  conclusione del primo figlio (o immediatamente se un figlio è già uscito). Nel
  caso un processo abbia più figli il valore di ritorno permette di identificare
@@ -816,6 +833,7 @@ base del valore specificato tramite la variabile \var{pid}, secondo lo
  specchietto riportato in \ntab:
  \begin{table}[!htb]
    \centering
+  \footnotesize
    \begin{tabular}[c]{|c|p{10cm}|}
      \hline
      \textbf{Valore} & \textbf{Significato}\\
@@ -946,6 +964,7 @@ accessibili definendo la costante \macro{\_USE\_BSD}, sono:
    Prima versione, equivalente a \func{wait4(-1, \&status, opt, rusage)} è
    ormai deprecata in favore di \func{wait4}.
  \end{functions}
+\noindent 
  la struttura \type{rusage} è definita in \file{sys/resource.h}, e viene
  utilizzata anche dalla funzione \func{getrusage} per ottenere le risorse di
  sistema usate dal processo; in Linux è definita come:
@@ -975,7 +994,7 @@ struct rusage {
      \end{lstlisting}
    \end{minipage} 
    \normalsize 
-  \caption{La struttura \texttt{rusage} per la lettura delle informazioni dei 
+  \caption{La struttura \var{rusage} per la lettura delle informazioni dei 
      delle risorse usate da un processo.}
    \label{fig:proc_rusage_struct}
  \end{figure}
@@ -987,7 +1006,7 @@ sono mantenuti sono: \var{ru\_utime}, \var{ru\_stime}, \var{ru\_minflt},
  \var{ru\_majflt}, e \var{ru\_nswap}.
  
  
-\subsection{Le funzioni \texttt{exec}}
+\subsection{Le funzioni \func{exec}}
  \label{sec:proc_exec}
  
  Abbiamo già detto che una delle modalità principali con cui si utilizzano i
@@ -1347,8 +1366,11 @@ servano di nuovo.
  Questo in Linux viene fatto usando altri due gruppi di identificatori, il
  \textit{saved} ed il \textit{filesystem}, analoghi ai precedenti. Il primo
  gruppo è lo stesso usato in SVr4, e previsto dallo standard POSIX quando è
-definita la costante \macro{\_POSIX\_SAVED\_IDS}, il secondo gruppo è
-specifico di Linux e viene usato per migliorare la sicurezza con NFS. 
+definita la costante \macro{\_POSIX\_SAVED\_IDS}\footnote{in caso si abbia a
+  cuore la portabilità del programma su altri unix è buona norma controllare
+  sempre la disponibilità di queste funzioni controllando se questa costante è
+  definita}, il secondo gruppo è specifico di Linux e viene usato per
+migliorare la sicurezza con NFS.
  
  Il \textit{saved user id} e il \textit{saved group id} sono copie
  dell'\textit{effective user id} e dell'\textit{effective group id} del
@@ -1387,8 +1409,8 @@ seguono la sematica POSIX che prevede l'esistenza di \textit{saved user id} e
  \headdecl{unistd.h}
  \headdecl{sys/types.h}
  
-\funcdecl{int setuid(uid\_t uid)} setta l' \textit{user ID} del processo
-corrente.  
+\funcdecl{int setuid(uid\_t uid)} setta l'\textit{user ID} del processo
+corrente.
  
  \funcdecl{int setgid(gid\_t gid)} setta il \textit{group ID} del processo
  corrente.
@@ -1399,7 +1421,9 @@ l'unico errore possibile 
  
  Il funzionamento di queste due funzioni è analogo, per cui considereremo solo
  la prima; la seconda si comporta esattamente allo stesso modo facendo
-riferimento al \textit{group id} invece che all'\textit{user id}.  
+riferimento al \textit{group id} invece che all'\textit{user id}.  Gli
+eventuali \textit{supplementary group id} non vengono modificati da nessuna
+delle funzioni che tratteremo in questa sezione.
  
  
  L'effetto della chiamata è diverso a seconda dei privilegi del processo; se
@@ -1408,22 +1432,13 @@ sistema) allora tutti gli identificatatori (\textit{real}, \textit{effective}
  e \textit{saved}) vengono settati al valore specificato da \var{uid},
  altrimenti viene settato solo l'\textit{effective user id}, e soltanto se il
  valore specificato corrisponde o al \textit{real user id} o al \textit{saved
-  user id}. Negli altri casi segnalato un errore (con \macro{EPERM}).
+  user id}. Negli altri casi viene segnalato un errore (con \macro{EPERM}).
  
  Come accennato l'uso principale di queste funzioni è quello di poter
-consentire ad un programma con i bit \acr{suid} o \acr{sgid} settati, di
+consentire ad un programma con i bit \acr{suid} o \acr{sgid} settati di
  riportare l'\textit{effective user id} a quello dell'utente che ha lanciato il
-programma, per effettuare il lavoro che non necessita di privilegi aggiuntivi,
-ed eventualmente tornare indietro. 
-
-Occorre però tenere conto che tutto questo non è possibile nel caso di root,
-in tal caso infatti l'esecuzione una \func{setuid} con un \textit{effective
-  user id} uguale a zero comporta il cambiamento di tutti gli identificatori
-associati al processo rendendo impossibile riguadagnare i privilegi di
-amministratore. Questo è l'uso che ne fa \cmd{login} una volta che crea una
-nuova shell per l'utente, ma se si vuole cambiare soltanto l'\textit{effective
-  user id} occorre ricorrere ad altre funzioni (si veda ad esempio
-\secref{sec:proc_seteuid}).
+programma, effettuare il lavoro che non necessita di privilegi aggiuntivi, ed
+eventualmente tornare indietro.
  
  Come esempio per chiarire dell'uso di queste funzioni prediamo quello con cui
  viene gestito l'accesso al file \file{/var/log/utmp}.  In questo file viene
@@ -1447,10 +1462,10 @@ situazione degli identificatori 
  in questo modo, dato che l'\textit{effective group id} è quello giusto, il
  programma può accedere a \file{/var/log/utmp} in scrittura ed aggiornarlo, a
  questo punto il programma può eseguire una \func{setgid(getgid())} per settare
-l'\textit{effective group id} a quello dell'utente (ed usando il \textit{real
-  group id} la funzione avrà successo), in questo modo non sarà possibile
-lanciare dal terminale programmi che modificano detto file, in tal caso
-infatti la situazione degli identificatori sarebbe:
+l'\textit{effective group id} a quello dell'utente (e dato che il \textit{real
+  group id} corrisponde la funzione avrà successo), in questo modo non sarà
+possibile lanciare dal terminale programmi che modificano detto file, in tal
+caso infatti la situazione degli identificatori sarebbe:
  \begin{eqnarray*}
    \label{eq:2}
    \textit{real group id}      &=& \textrm{\acr{gid} (invariato)}  \\
@@ -1472,18 +1487,198 @@ avr
  \end{eqnarray*}
  consentendo l'accesso a \file{/var/log/utmp}.
  
+Occorre però tenere conto che tutto questo non è possibile con un processo con
+i privilegi di root, in tal caso infatti l'esecuzione una \func{setuid}
+comporta il cambiamento di tutti gli identificatori associati al processo,
+rendendo impossibile riguadagnare i privilegi di amministratore.  Questo
+comportamento è corretto per l'uso che ne fa \cmd{login} una volta che crea
+una nuova shell per l'utente; ma quando si vuole cambiare soltanto
+l'\textit{effective user id} del processo per cedere i privilegi occorre
+ricorrere ad altre funzioni (si veda ad esempio \secref{sec:proc_seteuid}).
+
+
+\subsection{Le funzioni \func{setreuid} e \func{setresuid}}
+\label{sec:proc_setreuid}
+
+Queste due funzioni derivano da BSD che non supportando\footnote{almeno fino
+  alla versione 4.3+BSD TODO, verificare e aggiornare la nota} i \textit{saved
+  id} le usava per poter scambiare fra di loro effective e real id. I
+prototipi sono:
+
+\begin{functions}
+\headdecl{unistd.h}
+\headdecl{sys/types.h}
+
+\funcdecl{int setreuid(uid\_t ruid, uid\_t euid)} setta il \textit{real user
+  ID} e l'\textit{effective user ID} del processo corrente ai valori
+specificati da \var{ruid} e \var{euid}.
+  
+\funcdecl{int setregid(gid\_t rgid, gid\_t egid)} setta il \textit{real group
+  ID} e l'\textit{effective group ID} del processo corrente ai valori
+specificati da \var{rgid} e \var{egid}.
+
+Le funzioni restituiscono 0 in caso di successo e -1 in caso di fallimento:
+l'unico errore possibile è \macro{EPERM}. 
+\end{functions}
+
+I processi non privileguiati possono settare i \textit{real id} soltanto ai
+valori dei loro \textit{effective id} o \textit{real id} e gli
+\textit{effective id} ai valori dei loro \textit{real id}, \textit{effective
+  id} o \textit{saved id}; valori diversi comportano il fallimento della
+chiamata; l'amministratore invece può specificare un valore qualunque.
+Specificando un valore di -1 l'identificatore corrispondente viene lasciato
+inalterato.
+
+Con queste funzione si possono scambiare fra loro \textit{real id} e
+\textit{effective id}, e pertanto è possibile implementare un comportamento
+simile a quello visto in precedenza per \func{setgid}, cedendo i privilegi con
+un primo scambio, e recuperandoli, eseguito il lavoro non privilegiato, con un
+secondo scambio.
+
+In questo caso però occorre porre molta attenzione quando si creano nuovi
+processi nella fase intermedia in cui si sono scambiati gli identificatori, in
+questo caso infatti essi avranno un \textit{real id} privilegiato, che dovrà
+essere esplicitamente eliminato prima di porre in esecuzione un nuovo
+programma (occorrerà cioè eseguire un'altra chiamata dopo la \func{fork}, e
+prima della \func{exec} per uniformare i \textit{real id} agli
+\textit{effective id}) in caso contrario quest'ultimo potrebbe a sua volta
+effettuare uno scambio e riottenere privilegi non previsti.
+
+Lo stesso problema di propagazione dei privilegi ad eventuali processi figli
+si porrebbe per i \textit{saved id}. Queste funzioni derivano da
+un'implementazione che non ne prevede la presenza, e quindi non è possibile
+usarle per correggere la situazione come nel caso precedente, per questo
+motivo tutte le volte che uno degli identificatori viene modificato ad un
+valore diverso dal precedente \textit{real id}, il \textit{saved id} viene
+sempre settato al valore dell'\textit{effective id}.
+
+
+\subsection{Le funzioni \func{setresuid} e \func{setresgid}}
+\label{sec:proc_setresuid}
+
+Queste due funzioni sono una estensione introdotta in Linux dal kernel 2.1.44,
+e permettono un completo controllo su tutti gli identificatori (\textit{real},
+\textit{effective} e \textit{saved}), i prototipi sono:
+
+\begin{functions}
+\headdecl{unistd.h}
+\headdecl{sys/types.h}
+
+\funcdecl{int setresuid(uid\_t ruid, uid\_t euid, uid\_t suid)} setta il
+\textit{real user ID}, l'\textit{effective user ID} e il \textit{saved user
+  ID} del processo corrente ai valori specificati rispettivamente da
+\var{ruid}, \var{euid} e \var{suid}.
+  
+\funcdecl{int setresgid(gid\_t rgid, gid\_t egid, gid\_t sgid)} setta il
+\textit{real group ID}, l'\textit{effective group ID} e il \textit{saved group
+  ID} del processo corrente ai valori specificati rispettivamente da
+\var{rgid}, \var{egid} e \var{sgid}.
+
+Le funzioni restituiscono 0 in caso di successo e -1 in caso di fallimento:
+l'unico errore possibile è \macro{EPERM}. 
+\end{functions}
+
+I processi non privilegiati possono cambiare uno qualunque degli
+identificatori usando uno qualunque dei valori correnti di \textit{real id},
+\textit{effective id} o \textit{saved id}, l'ammnistratore può specificare i
+valori che vuole; un valore di -1 per un qualunque parametro lascia inalterato
+l'dentificatore corrispondente.
+
+
  
  \subsection{Le funzioni \func{seteuid} e \func{setegid}}
  \label{sec:proc_seteuid}
  
+Queste funzioni sono un'estensione allo standard POSIX.1 (ma sono comunque
+supportate dalla maggior parte degli unix) e usate per cambiare gli
+\textit{effective id}; i loro prototipi sono:
  
-\subsection{Le funzioni \func{setreuid} e \func{setresuid}}
-\label{sec:proc_setreuid}
+\begin{functions}
+\headdecl{unistd.h}
+\headdecl{sys/types.h}
  
+\funcdecl{int seteuid(uid\_t uid)} setta l'\textit{effective user ID} del
+processo corrente a \var{uid}.
+
+\funcdecl{int setegid(gid\_t gid)} setta l'\textit{effective group ID} del
+processo corrente a \var{gid}.
+
+Le funzioni restituiscono 0 in caso di successo e -1 in caso di fallimento:
+l'unico errore possibile è \macro{EPERM}. 
+\end{functions}
+
+Gli utenti normali possono settare l'\textit{effective id} solo al valore del
+\textit{real id} o del \textit{saved id}, l'amministratore può specificare
+qualunque valore. Queste funzioni sono usate per permettere a root di settare
+solo l'\textit{effective id}, dato che l'uso normale di \func{setuid} comporta
+il settaggio di tutti gli identificatori.
+ 
  
  \subsection{Le funzioni \func{setfsuid} e \func{setfsgid}}
  \label{sec:proc_setfsuid}
  
+Queste funzioni sono usate per settare gli identificatori usati da Linux per
+il controllo dell'accesso ai file. Come già accennato in
+\secref{sec:proc_user_group} in Linux è definito questo ulteriore gruppo di
+identificatori, che di norma sono assolutamente equivalenti agli
+\textit{effective id}, dato che ogni cambiamento di questi ultimi viene
+immediatamente riportato sui \textit{filesystem id}.
+
+C'è un solo caso in cui si ha necessità di introdurre una differenza fra
+\textit{effective id} e \textit{filesystem id}, ed è per ovviare ad un
+problema di sicurezza che si presenta quando si deve implementare un server
+NFS. Il server NFS infatti deve poter cambiare l'identificatore con cui accede
+ai file per assumere l'identità del singolo utente remoto, ma se questo viene
+fatto cambiando l'\textit{effective id} o il \textit{real id} il server si
+espone alla ricezione di eventuali segnali ostili da parte dell'utente di cui
+ha temporaneamente assunto l'identità.  Cambiando solo il \textit{filesystem
+  id} si ottengono i privilegi necessari per accedere ai file, mantenendo
+quelli originari per quanto riguarda tutti gli altri controlli di accesso.
+
+Le due funzioni usate per cambiare questi identificatori sono \func{setfsuid}
+e \func{setfsgid}, ovviamenete sono specifiche di Linux e non devono essere
+usate se si intendono scrivere programmi portabili; i loro prototipi sono:
+
+\begin{functions}
+\headdecl{sys/fsuid.h}
+
+\funcdecl{int setfsuid(uid\_t fsuid)} setta il \textit{filesystem user ID} del
+processo corrente a \var{fsuid}.
+
+\funcdecl{int setfsgid(gid\_t fsgid)} setta l'\textit{filesystem group ID} del
+processo corrente a \var{fsgid}.
+
+Le funzioni restituiscono 0 in caso di successo e -1 in caso di fallimento:
+l'unico errore possibile è \macro{EPERM}. 
+\end{functions}
+
+Queste funzioni hanno successo solo se il processo chiamante ha i privilegi di
+amministratore o, per gli altri utenti, se il valore specificato coincide con
+uno dei \textit{real}, \textit{effective} o \textit{saved id}.
+
+
+\section{Problematiche di programmazione multitasking}
+\label{sec:proc_multi_prog}
+
+Benché i processi siano strutturati in modo da apparire il più possibile come
+indipendenti l'uno dall'altro, nella programmazione in un sistema multiutente
+occorre tenere conto di tutta una serie di problematiche che normalmente non
+esistono quando si ha a che fare con un sistema in cui viene eseguito un solo
+programma alla volta. 
+
+Pur non essendo tutto questo direttamente legato alla modalità specifica in
+cui il multitasking è implementato in un sistema unix-like, siccome la
+gestione dei processi è stata affrontata in questo capitolo, tratteremo in
+questa sezione conclusiva anche queste problematiche, esaminandone le
+caratteristiche fondamentali e le modalità con cui si affrontano.
+
+
+\subsection{Le funzioni rientranti}
+\label{sec:proc_reentrant}
+
+
+\subsection{Le operazioni atomiche}
+\label{sec:proc_atom_oper}
  
  
  \subsection{Le \textit{race condition}}
@@ -1496,3 +1691,8 @@ l'ordine di esecuzione di un processo, senza appositi meccanismi di
  sincronizzazione, non è assolutamente prevedibile, queste situazioni sono
  fonti di errori molto subdoli, che possono verificarsi solo in condizioni
  particolari e quindi difficilmente riproducibili.
+
+
+\subsection{I \textit{deadlock}}
+\label{sec:proc_deadlock}
+