13bc2c5efdb1a620ca87dfca80420e65e38a1664
[gapil.git] / session.tex
1  \chapter{Sessioni di lavoro e terminali}
2 \label{cha:session}
3
4 Esamineremo in questo capitolo i concetti base del sistema delle sessioni di
5 lavoro, vale a dire il metodo con cui il kernel gestisce l'accesso concorrente
6 al sistema da parte di più utenti, permettendo loro di eseguire più programmi
7 in contemporanea.  Nella seconda parte del capitolo tratteremo poi il
8 funzionamento dell'I/O su terminale, e delle varie peculiarità che esso viene
9 ad assumere a causa del suo stretto legame con le modalità di accesso al
10 sistema da parte degli utenti.
11
12
13 \section{Il \textit{job control}}
14 \label{sec:sess_job_control}
15
16 Viene comunemente chiamato \textit{job control} quell'insieme di funzionalità
17 il cui scopo è quello di permettere ad un utente di poter sfruttare le
18 capacità multitasking di un sistema Unix per eseguire in contemporanea più
19 processi, pur potendo accedere, di solito, ad un solo terminale,\footnote{con
20   X e con i terminali virtuali tutto questo non è più vero, dato che si può
21   accedere a molti terminali in contemporanea, ma il sistema è nato prima
22   dell'esistenza di tutto ciò.} avendo cioè un solo punto in cui si può avere
23 accesso all'input ed all'output degli stessi. 
24
25
26 \subsection{Una panoramica introduttiva}
27 \label{sec:sess_job_control_overview}
28
29 Il \textit{job control} è una caratteristica opzionale, introdotta in BSD
30 negli anni '80, e successivamente standardizzata da POSIX.1; la sua
31 disponibilità nel sistema è verificabile attraverso il controllo della macro
32 \macro{\_POSIX\_JOB\_CONTROL}. In generale il \textit{job control} richiede il
33 supporto sia da parte della shell (quasi tutte ormai lo fanno), che da parte
34 del kernel; in particolare il kernel deve assicurare sia la presenza di un
35 driver per i terminali abilitato al \textit{job control} che quella dei
36 relativi segnali illustrati in \secref{sec:sig_job_control}. 
37
38 In un sistema che supporta il \textit{job control} una volta completato il
39 login (che esamineremo in dettaglio in \secref{sec:sess_login}), l'utente avrà
40 a disposizione una shell dalla quale eseguire i comandi e potrà iniziare
41 quella che viene chiamata una \textsl{sessione}, che riunisce (vedi
42 \secref{sec:sess_proc_group}) tutti i processi eseguiti all'interno dello
43 stesso login.
44
45 Siccome la shell è collegata ad un solo terminale (il \textsl{terminale di
46   controllo}, vedi \secref{sec:sess_control_term}) solo un comando alla volta,
47 quello che viene detto in \textit{foreground}, potrà scrivere e leggere dal
48 terminale. La shell però può eseguire anche più comandi in contemporanea,
49 mandandoli in \textit{background} (si fa aggiungendo una \cmd{\&} alla fine
50 del comando), nel qual caso essi saranno eseguiti senza essere collegati al
51 terminale.
52
53 Si noti come si sia parlato di comandi e non di programmi o processi; fra le
54 funzionalità della shell infatti c'è anche quella di consentire di concatenare
55 più programmi in una sola riga di comando con le pipe, ed in tal caso verranno
56 eseguiti più programmi, inoltre, anche quando si invoca un singolo programma,
57 questo potrà sempre lanciare altri processi per eseguire dei compiti
58 specifici.
59
60 Per questo l'esecuzione di un comando può originare più di un processo; quindi
61 nella gestione del job control non si può far riferimento ai singoli processi,
62 per questo il kernel prevede la possibilità di raggruppare più processi in un
63 \textit{process group} (detto anche \textsl{raggruppamento}, vedi
64 \secref{sec:sess_proc_group}) e la shell farà sì che tutti i processi che
65 originano da una riga di comando appartengano allo stesso \textit{process
66   group}, in modo che le varie funzioni di controllo, ed i segnali inviati dal
67 terminale, possano fare riferimento ad esso.
68
69 In generale allora all'interno di una sessione avremo un eventuale (possono
70 non esserci comandi in \textit{foreground}) \textit{process group} in
71 \textit{foreground}, che riunisce i processi che possono accedere al
72 terminale, e più \textit{process group} in \textit{background}, che non
73 possono accedervi. Il job control prevede che quando un processo appartenente
74 ad un raggruppamento in \textit{background} cerca di accedere al terminale
75 questo invii a tutti i processi del raggruppamento un segnale di
76 \macro{SIGTTIN} o di \macro{SIGTTOU}, a seconda che l'accesso sia
77 rispettivamente in lettura o scrittura, bloccando (secondo il comportamento
78 di default esposto in \secref{sec:sig_job_control}) i processi.
79
80 Un comportamento analogo sia ha anche per i segnali generati dai comandi di
81 tastiera inviati dal terminale con \cmd{C-z}, \cmd{C-c}, \cmd{C-y} e
82 \verb|C-\|; questi generano rispettivamente i segnali \macro{SIGTSTP},
83 \macro{SIGINT}, \macro{SIGQUIT} e \macro{SIGTERM}, che vengono inviati a tutti
84 i processi del raggruppamento in \textit{foreground}. In particolare il primo
85 di essi, \macro{SIGTSTP}, interrompe l'esecuzione del comando, che può poi
86 essere mandato in \textit{background} con il comando \cmd{bg}. Il comando
87 \cmd{fg} consente invece di mettere in \textit{foreground} un comando
88 precedentemente lanciato in \textit{background}.
89
90 Di norma la shell si cura anche di notificare all'utente (di solito prima
91 della stampa a video del prompt) lo stato dei vari processi, essa infatti usa
92 le caratteristiche della funzione \func{waitpid} (si riveda quanto detto in
93 \secref{sec:proc_wait}) per verificare quali gruppi di processi sono bloccati
94 e quali sono terminati. 
95
96
97 \subsection{I \textit{process group} e le \textsl{sessioni}}
98 \label{sec:sess_proc_group}
99
100 Come accennato in \secref{sec:sess_job_control_overview} nel job control i
101 processi vengono raggruppati in \textit{process group} e \textit{sessioni};
102 per far questo vengono utilizzati due ulteriori identificatori (oltre quelli
103 visti in \secref{sec:proc_pid}) che il kernel associa a ciascun processo:
104 l'identificatore del \textit{process group} e l'identificatore della
105 \textsl{sessione}, che vengono indicati rispettivamente con le sigle
106 \acr{pgid} e \acr{sid}, e sono mantenuti in variabili di tipo \type{pid\_t}. I
107 valori di questi identificatori possono essere visualizzati dal comando
108 \cmd{ps} usando l'opzione \cmd{-j}.
109
110 Un \textit{process group} è pertanto definito da tutti i processi che hanno lo
111 stesso \acr{pgid}; è possibile leggere il valore di questo identificatore con
112 le funzioni \func{getpgid} e \func{getpgrp},\footnote{\func{getpgrp} è
113   definita nello standard POSIX.1, mentre \func{getpgid} è richiesta da SVr4.}
114 i cui prototipi sono:
115 \begin{functions}
116   \headdecl{unistd.h}
117
118   \funcdecl{pid\_t getpgid(pid\_t pid)} 
119   Legge il \acr{pgid} del processo \param{pid}.
120
121   \funcdecl{pid\_t getpgrp(void)}
122   Legge il \acr{pgid} del processo corrente.
123   
124   \bodydesc{Le funzioni restituiscono il \acr{pgid} del processo,
125     \func{getpgrp} ha sempre successo, mentre \func{getpgid} restituisce -1
126     ponendo \var{errno} a \macro{ESRCH} se il processo selezionato non esiste.}
127 \end{functions}
128
129 La funzione \func{getpgid} permette di specificare il \acr{pid} del processo
130 di cui si vuole sapere il \acr{pgid}; un valore nullo per \param{pid}
131 restituisce il \acr{pgid} del processo corrente; \func{getpgrp} è di norma
132 equivalente a \code{getpgid(0)}.
133
134 In maniera analoga l'identificatore della sessione può essere letto dalla
135 funzione \func{getsid}, che però nelle \acr{glibc}\footnote{la system call è
136   stata introdotta in Linux a partire dalla versione 1.3.44, il supporto nelle
137   librerie del C è iniziato dalla versione 5.2.19. La funzione non è prevista
138   da POSIX.1, che parla solo di processi leader di sessione, e non di
139   \textit{session id}.} è accessibile solo definendo \macro{\_XOPEN\_SOURCE} e
140 \macro{\_XOPEN\_SOURCE\_EXTENDED}; il suo prototipo è:
141 \begin{prototype}{unistd.h}{pid\_t getsid(pid\_t pid)}
142   Legge l'identificatore di sessione del processo \param{pid}.
143   
144   \bodydesc{La funzione restituisce l'identificatore (un numero positivo) in
145   caso di successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà
146   i valori:
147     \begin{errlist}
148     \item[\macro{ESRCH}] Il processo selezionato non esiste.
149     \item[\macro{EPERM}] In alcune implementazioni viene restituito quando il
150       processo selezionato non fa parte della stessa sessione del processo
151       corrente.
152     \end{errlist}
153   }
154 \end{prototype}
155
156 Entrambi gli identificatori vengono inizializzati alla creazione di ciascun
157 processo con lo stesso valore che hanno nel processo padre, per cui un
158 processo appena creato appartiene sempre allo stesso raggruppamento e alla
159 stessa sessione del padre. Vedremo poi come sia possibile creare più
160 \textit{process group} all'interno della stessa sessione, e spostare i
161 processi dall'uno all'altro, ma sempre all'interno di una stessa sessione.
162
163 Ciascun gruppo di processi ha sempre un processo principale, il cosiddetto
164 \textit{process group leader}, che è identificato dall'avere un \acr{pgid}
165 uguale al suo \acr{pid}, in genere questo è il primo processo del gruppo, che
166 si incarica di lanciare tutti gli altri. Un nuovo gruppo si crea con la
167 funzione \func{setpgrp},\footnote{questa è la definizione di POSIX.1, BSD
168   definisce una funzione con lo stesso nome, che però è identica a
169   \func{setpgid}; nelle \acr{glibc} viene sempre usata sempre questa
170   definizione, a meno di non richiedere esplicitamente la compatibilità
171   all'indietro con BSD, definendo la macro \macro{\_BSD\_SOURCE}.} il cui
172 prototipo è:
173 \begin{prototype}{unistd.h}{int setpgrp(void)}
174   Modifica il \acr{pgid} al valore del \acr{pid} del processo corrente.
175   
176   \bodydesc{La funzione restituisce il valore del nuovo \textit{process
177       group}.}
178 \end{prototype}
179
180 La funzione, assegnando al \acr{pgid} il valore del \acr{pid} processo
181 corrente, rende questo \textit{process leader} di un nuovo gruppo, tutti i
182 successivi processi da esso creati apparterranno (a meno di non cambiare di
183 nuovo il \acr{pgid}) al nuovo gruppo. È possibile invece spostare un processo
184 da un gruppo ad un altro con la funzione \func{setpgid}, il cui prototipo è:
185 \begin{prototype}{unistd.h}{int setpgid(pid\_t pid, pid\_t pgid)}
186   Assegna al \acr{pgid} del processo \param{pid} il valore \param{pgid}.
187   
188   \bodydesc{La funzione ritorna il valore del nuovo \textit{process group}, e
189   -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
190     \begin{errlist}
191     \item[\macro{ESRCH}] Il processo selezionato non esiste.
192     \item[\macro{EPERM}] Il cambiamento non è consentito.
193     \item[\macro{EINVAL}] Il valore di \param{pgid} è negativo.
194     \end{errlist}
195  }
196 \end{prototype}
197
198 La funzione permette di cambiare il \acr{pgid} del processo \param{pid}, ma il
199 cambiamento può essere effettuato solo se \param{pgid} indica un
200 \textit{process group} che è nella stessa sessione del processo chiamante.
201 Inoltre la funzione può essere usata soltanto sul processo corrente o su uno
202 dei suoi figli, ed in quest'ultimo caso ha successo soltanto se questo non ha
203 ancora eseguito una \func{exec}. Specificando un valore nullo per \param{pid}
204 si indica il processo corrente, mentre specificando un valore nullo per
205 \param{pgid} si imposta il \textit{process group} al valore del \acr{pid} del
206 processo selezionato; pertanto \func{setpgrp} è equivalente a \code{setpgid(0,
207   0)}.
208
209 Di norma questa funzione viene usata dalla shell quando si usano delle
210 pipeline, per mettere nello stesso process group tutti i programmi lanciati su
211 ogni linea di comando; essa viene chiamata dopo una \func{fork} sia dal
212 processo padre, per impostare il valore nel figlio, che da quest'ultimo, per
213 sé stesso, in modo che il cambiamento di \textit{process group} sia immediato
214 per entrambi; una delle due chiamate sarà ridondante, ma non potendo
215 determinare quale dei due processi viene eseguito per primo, occorre eseguirle
216 comunque entrambe per evitare di esporsi ad una race condition. 
217
218 Si noti come nessuna delle funzioni esaminate finora permetta di spostare un
219 processo da una sessione ad un altra; infatti l'unico modo di far cambiare
220 sessione ad un processo è quello di crearne una nuova con l'uso di
221 \func{setsid}; il suo prototipo è:
222 \begin{prototype}{unistd.h}{pid\_t setsid(void)}
223   Crea una nuova sessione sul processo corrente settandone \acr{sid} e
224   \acr{pgid}.
225   
226   \bodydesc{La funzione ritorna il valore del nuovo \acr{sid}, e -1 in caso di
227     errore, il solo errore possibile è \macro{EPERM}, che si ha quando il
228     \acr{pgid} e \acr{pid} del processo concidono.}
229 \end{prototype}
230
231 La funzione imposta il \acr{pgid} ed il \acr{sid} del processo corrente al
232 valore del suo \acr{pid}, creando così una nuova sessione ed un nuovo
233 \textit{process group} di cui esso diventa leader (come per i \textit{process
234   group} un processo si dice leader di sessione se il suo \acr{sid} è uguale
235 al suo \acr{pid}).  Infine il processo viene distaccato dal terminale di
236 controllo.
237
238 La funzione ha successo soltanto se il processo non è già leader per un
239 \textit{process group}, per cui di norma si esegue una \func{fork} e si esce,
240 per poi chiamare \func{setsid} nel processo figlio, in modo che, avendo questo
241 lo stesso \acr{pgid} del padre ma un \acr{pid} diverso, non ci siano
242 possibilità di errore.  Questa funzione viene usata di solito dal processo di
243 login quando si lancia una nuova shell per un utente.
244
245
246
247
248 \subsection{Il terminale di controllo}
249 \label{sec:sess_ctrl_term}
250
251 Come accennato in \secref{sec:sess_job_control_overview} ad ogni sessione di
252 lavoro è associato un terminale di controllo.  
253
254
255
256 \subsection{Dal login alla shell}
257 \label{sec:sess_login}
258
259 L'organizzazione del sistema del job control è strettamente connessa alle
260 modalità con cui un utente accede al sistema per dare comandi, collegandosi ad
261 esso con un terminale, che sia questo realmente tale, come un VT100 collegato
262 ad una seriale o virtuale, come quelli associati a schermo e tastiera o ad una
263 connessione di rete. Dato che i concetti base sono gli stessi, e dato che alla
264 fine le differenze sono\footnote{in generale nel caso di login via rete o di
265   terminali lanciati dall'interfaccia grafica cambia anche il processo da cui
266   ha origine l'esecuzione della shell.} nel device cui il kernel associa i
267 file standard (vedi \secref{sec:file_std_descr}) per l'I/O, tratteremo solo il
268 caso classico del terminale.
269
270 Abbiamo già brevemente illustrato in \secref{sec:intro_kern_and_sys} le
271 modalità con cui il sistema si avvia, e di come, a partire da \cmd{init},
272 vengano lanciati tutti gli altri processi. Adesso vedremo in maniera più
273 dettagliata le modalità con cui il sistema arriva a fornire ad un utente la
274 shell che gli permette di lanciare i suoi comandi su un terminale.
275
276 Nella maggior parte delle distribuzioni di GNU/Linux\footnote{fa eccezione la
277   distribuzione \textit{Slackware}, come alcune distribuzioni su dischetto, ed
278   altre distribuzioni dedicate a compiti limitati e specifici.}  viene usata
279 la procedura di avvio di System V; questa prevede che \cmd{init} legga dal
280 file di configurazione \file{/etc/inittab} quali programmi devono essere
281 lanciati, ed in quali modalità, a seconda del cosiddetto \textit{run level},
282 anch'esso definito nello stesso file.
283
284 Tralasciando la descrizione del sistema dei run level, (per il quale si
285 rimanda alla lettura delle pagine di manuale di \cmd{init} e di
286 \file{inittab}) quello che comunque viene sempre fatto è di eseguire almeno
287 una istanza di un programma che permetta l'accesso ad un terminale. Uno schema
288 di massima della procedura è riportato in \secref{fig:sess_term_login}.
289
290 \begin{figure}[htb]
291   \centering
292   \includegraphics[width=15cm]{img/tty_login}
293   \caption{Schema della procedura di login su un terminale.}
294   \label{fig:sess_term_login}
295 \end{figure}
296
297 Un terminale, che esso sia un terminale effettivo, attaccato ad una seriale o
298 ad un altro tipo di porta di comunicazione, o una delle console virtuali
299 associate allo schermo,  viene sempre visto attraverso attraverso un device
300 driver che ne presenta un'interfaccia comune su un apposito file di
301 dispositivo. Storicamente i primi terminali erano appunto terminali di
302 telescriventi (\textit{teletype}), da cui deriva sia il nome dell'interfaccia,
303 \textit{tty}, che quello dei relativi file di dispositivo, che sono sempre
304 della forma \texttt{/dev/tty*}.\footnote{questo vale anche per i terminali
305   associati alle connessioni di rete con \cmd{telnet} o \cmd{ssh}.}
306
307 Per controllare i terminali si usa di solito il programma \cmd{getty} (od una
308 delle sue varianti), che permette di mettersi in ascolto sugli stessi. Alla
309 radice della catena che porta ad una shell per i comandi perciò c'è sempre
310 \cmd{init} che esegue prima una \func{fork} e poi una \func{exec} per lanciare
311 una istanza di questo programma su un terminale, il tutto ripetuto per
312 ciascuno dei terminali che si hanno a disposizione (o per un certo numero di
313 essi, nel caso delle console virtuali), secondo quanto indicato
314 dall'amministratore nel file di configurazione del programma,
315 \file{/etc/inittab}.
316
317 Quando viene lanciato da \cmd{init} il programma parte con i privilegi di
318 amministratore e con un ambiente vuoto; \cmd{getty} si cura di chiamare
319 \func{setsid} per creare una nuova sessione ed un nuovo process group, e di
320 aprire il terminale in lettura sullo standard input ed in scrittura sullo
321 standard output e sullo standard error, e di effettuare, qualora servano,
322 ulteriori settaggi,\footnote{ad esempio, come qualcuno si sarà accorto
323   scrivendo un nome di login in maiuscolo, può effettuare la conversione
324   automatica dell'input in minuscolo, ponendosi in una modalità speciale che
325   non distingue fra i due tipi di caratteri (a beneficio di alcuni vecchi
326   terminali che non supportavano le minuscole).} ed infine il programma
327 stamperà un messaggio di benvenuto per poi porsi in attesa dell'immissione del
328 nome di un utente.
329
330 Una volta che si sia immesso il nome di login \cmd{getty} esegue direttamente
331 il programma \cmd{login} con una \func{exevle}, passando come argomento la
332 suddetta stringa ed un ambiente opportunamente costruito che contenga quanto
333 necessario (ad esempio di solito viene opportunamente inizializzata la
334 variabile di ambiente \texttt{TERM}) ad identificare il terminale su cui si
335 sta operando, a beneficio dei programmi che verranno lanciati in seguito.
336
337 A sua volta \cmd{login}, che mantiene i privilegi di amministratore, usa il
338 nome dell'utente per effettuare una ricerca nel database degli
339 utenti,\footnote{in genere viene chiamata \func{getpwnam}, che abbiamo visto
340   in \secref{sec:sys_user_group}, per leggere la password e gli altri dati dal
341   database degli utenti.} e richiede una password. Se l'utente non esiste o se
342 la password non corrisponde\footnote{il confronto non viene effettuato con un
343   valore in chiaro; quanto immesso da terminale viene invece a sua volta
344   criptato, ed è il risultato che viene confrontato con il valore che viene
345   mantenuto nel database degli utenti.} la richiesta viene ripetuta un certo
346 numero di volte dopo di che \cmd{login} esce ed \cmd{init} provvede a
347 rilanciare un'altra istanza di \func{getty}.
348
349 Se invece la password corrisponde a questo punto \cmd{login} esegue
350 \func{chdir} per settare la \textit{home directory} dell'utente, cambia i
351 diritti di accesso al terminale (con \func{chown} e \func{chmod}) per
352 assegnarne la titolarità all'utente ed al suo gruppo principale, assegnandogli
353 al contempo i diritti di lettura e scrittura. Inoltre il programma provvede
354 a costruire gli opportuni valori per le variabili di ambiente, come
355 \texttt{HOME}, \texttt{SHELL}, ecc. Infine attraverso l'uso di \func{setuid},
356 \func{setpid} e \func{initgroups} verrà cambiata l'identità del proprietario
357 del processo, infatti, come spiegato in \secref{sec:proc_setuid}, avendo
358 invocato tali funzioni con i privilegi di amministratore, tutti gli userid ed
359 i groupid (reali, effettivi e salvati) saranno settati a quelli dell'utente.
360
361 A questo punto \cmd{login} provvederà (fatte salve eventuali altre azioni
362 iniziali, come la stampa di messaggi di benvenuto o il controllo della posta)
363 ad eseguire con un'altra \func{exec} la shell di login, che si troverà con un
364 ambiente già pronto e con file standard di \secref{sec:file_std_descr}
365 impostati sul terminale, pronta ad eseguire i comandi fino all'uscita. Dato
366 che il processo genitore resta sempre \cmd{init} quest'ultimo provvederà,
367 ricevendo un \macro{SIGCHLD} all'uscita della shell, a rilanciare \cmd{getty}
368 per ripetere da capo tutto il procedimento.
369
370 Una volta arrivati alla 
371
372
373
374
375 \section{L'I/O su terminale}
376 \label{sec:sess_terminal_io}
377
378 Esamineremo in questa sezione le peculiarità dell'I/O su terminale, tenendo
379 conto delle 
380
381
382 %%% Local Variables: 
383 %%% mode: latex
384 %%% TeX-master: "gapil"
385 %%% End: