session.tex

   1  \chapter{Sessioni di lavoro e terminali}
   2 \label{cha:session}
   3
   4 Esamineremo in questo capitolo i concetti base del sistema delle sessioni di
   5 lavoro, vale a dire il metodo con cui il kernel gestisce l'accesso concorrente
   6 al sistema da parte di più utenti, permettendo loro di eseguire più programmi
   7 in contemporanea.  Nella seconda parte del capitolo tratteremo poi il
   8 funzionamento dell'I/O su terminale, e delle varie peculiarità che esso viene
   9 ad assumere a causa del suo stretto legame con le modalità di accesso al
  10 sistema da parte degli utenti.
  11
  12
  13 \section{Il \textit{job control}}
  14 \label{sec:sess_job_control}
  15
  16 Viene comunemente chiamato \textit{job control} quell'insieme di funzionalità
  17 il cui scopo è quello di permettere ad un utente di poter sfruttare le
  18 capacità multitasking di un sistema Unix per eseguire in contemporanea più
  19 processi, pur potendo accedere, di solito, ad un solo terminale,\footnote{con
  20   X e con i terminali virtuali tutto questo non è più vero, dato che si può
  21   accedere a molti terminali in contemporanea, ma il sistema è nato prima
  22   dell'esistenza di tutto ciò.} avendo cioè un solo punto in cui si può avere
  23 accesso all'input ed all'output degli stessi.
  24
  25
  26 \subsection{Una panoramica introduttiva}
  27 \label{sec:sess_job_control_overview}
  28
  29 Il \textit{job control} è una caratteristica opzionale, introdotta in BSD
  30 negli anni '80, e successivamente standardizzata da POSIX.1; la sua
  31 disponibilità nel sistema è verificabile attraverso il controllo della macro
  32 \macro{\_POSIX\_JOB\_CONTROL}. In generale il \textit{job control} richiede il
  33 supporto sia da parte della shell (quasi tutte ormai lo fanno), che da parte
  34 del kernel; in particolare il kernel deve assicurare sia la presenza di un
  35 driver per i terminali abilitato al \textit{job control} che quella dei
  36 relativi segnali illustrati in \secref{sec:sig_job_control}.
  37
  38 In un sistema che supporta il \textit{job control} una volta completato il
  39 login (che esamineremo in dettaglio in \secref{sec:sess_login}), l'utente avrà
  40 a disposizione una shell dalla quale eseguire i comandi e potrà iniziare
  41 quella che viene chiamata una \textsl{sessione}, che riunisce (vedi
  42 \secref{sec:sess_proc_group}) tutti i processi eseguiti all'interno dello
  43 stesso login.
  44
  45 Siccome la shell è collegata ad un solo terminale (il \textsl{terminale di
  46   controllo}, vedi \secref{sec:sess_control_term}) solo un comando alla volta,
  47 quello che viene detto in \textit{foreground}, potrà scrivere e leggere dal
  48 terminale. La shell però può eseguire anche più comandi in contemporanea,
  49 mandandoli in \textit{background} (si fa aggiungendo una \cmd{\&} alla fine
  50 del comando), nel qual caso essi saranno eseguiti senza essere collegati al
  51 terminale.
  52
  53 Si noti come si sia parlato di comandi e non di programmi o processi; fra le
  54 funzionalità della shell infatti c'è anche quella di consentire di concatenare
  55 più programmi in una sola riga di comando con le pipe, ed in tal caso verranno
  56 eseguiti più programmi, inoltre, anche quando si invoca un singolo programma,
  57 questo potrà sempre lanciare altri processi per eseguire dei compiti
  58 specifici.
  59
  60 Per questo l'esecuzione di un comando può originare più di un processo; quindi
  61 nella gestione del job control non si può far riferimento ai singoli processi,
  62 per questo il kernel prevede la possibilità di raggruppare più processi in un
  63 \textit{process group} (detto anche \textsl{raggruppamento}, vedi
  64 \secref{sec:sess_proc_group}) e la shell farà sì che tutti i processi che
  65 originano da una riga di comando appartengano allo stesso \textit{process
  66   group}, in modo che le varie funzioni di controllo, ed i segnali inviati dal
  67 terminale, possano fare riferimento ad esso.
  68
  69 In generale allora all'interno di una sessione avremo un eventuale (possono
  70 non esserci comandi in \textit{foreground}) \textit{process group} in
  71 \textit{foreground}, che riunisce i processi che possono accedere al
  72 terminale, e più \textit{process group} in \textit{background}, che non
  73 possono accedervi. Il job control prevede che quando un processo appartenente
  74 ad un raggruppamento in \textit{background} cerca di accedere al terminale
  75 questo invii a tutti i processi del raggruppamento un segnale di
  76 \macro{SIGTTIN} o di \macro{SIGTTOU}, a seconda che l'accesso sia
  77 rispettivamente in lettura o scrittura, bloccando (secondo il comportamento
  78 di default esposto in \secref{sec:sig_job_control}) i processi.
  79
  80 Un comportamento analogo sia ha anche per i segnali generati dai comandi di
  81 tastiera inviati dal terminale con \cmd{C-z}, \cmd{C-c}, \cmd{C-y} e
  82 \verb|C-\|; questi generano rispettivamente i segnali \macro{SIGTSTP},
  83 \macro{SIGINT}, \macro{SIGQUIT} e \macro{SIGTERM}, che vengono inviati a tutti
  84 i processi del raggruppamento in \textit{foreground}. In particolare il primo
  85 di essi, \macro{SIGTSTP}, interrompe l'esecuzione del comando, che può poi
  86 essere mandato in \textit{background} con il comando \cmd{bg}. Il comando
  87 \cmd{fg} consente invece di mettere in \textit{foreground} un comando
  88 precedentemente lanciato in \textit{background}.
  89
  90 Di norma la shell si cura anche di notificare all'utente (di solito prima
  91 della stampa a video del prompt) lo stato dei vari processi, essa infatti usa
  92 le caratteristiche della funzione \func{waitpid} (si riveda quanto detto in
  93 \secref{sec:proc_wait}) per verificare quali gruppi di processi sono bloccati
  94 e quali sono terminati.
  95
  96
  97 \subsection{I \textit{process group} e le \textsl{sessioni}}
  98 \label{sec:sess_proc_group}
  99
 100 Come accennato in \secref{sec:sess_job_control_overview} nel job control i
 101 processi vengono raggruppati in \textit{process group} e \textit{sessioni};
 102 per far questo vengono utilizzati due ulteriori identificatori (oltre quelli
 103 visti in \secref{sec:proc_pid}) che il kernel associa a ciascun processo:
 104 l'identificatore del \textit{process group} e l'identificatore della
 105 \textsl{sessione}, che vengono indicati rispettivamente con le sigle
 106 \acr{pgid} e \acr{sid}, e sono mantenuti in variabili di tipo \type{pid\_t}. I
 107 valori di questi identificatori possono essere visualizzati dal comando
 108 \cmd{ps} usando l'opzione \cmd{-j}.
 109
 110 Un \textit{process group} è pertanto definito da tutti i processi che hanno lo
 111 stesso \acr{pgid}; è possibile leggere il valore di questo identificatore con
 112 le funzioni \func{getpgid} e \func{getpgrp},\footnote{\func{getpgrp} è
 113   definita nello standard POSIX.1, mentre \func{getpgid} è richiesta da SVr4.}
 114 i cui prototipi sono:
 115 \begin{functions}
 116   \headdecl{unistd.h}
 117
 118   \funcdecl{pid\_t getpgid(pid\_t pid)}
 119   Legge il \acr{pgid} del processo \param{pid}.
 120
 121   \funcdecl{pid\_t getpgrp(void)}
 122   Legge il \acr{pgid} del processo corrente.
 123
 124   \bodydesc{Le funzioni restituiscono il \acr{pgid} del processo,
 125     \func{getpgrp} ha sempre successo, mentre \func{getpgid} restituisce -1
 126     ponendo \var{errno} a \macro{ESRCH} se il processo selezionato non esiste.}
 127 \end{functions}
 128
 129 La funzione \func{getpgid} permette di specificare il \acr{pid} del processo
 130 di cui si vuole sapere il \acr{pgid}; un valore nullo per \param{pid}
 131 restituisce il \acr{pgid} del processo corrente; \func{getpgrp} è di norma
 132 equivalente a \code{getpgid(0)}.
 133
 134 In maniera analoga l'identificatore della sessione può essere letto dalla
 135 funzione \func{getsid}, che però nelle \acr{glibc}\footnote{la system call è
 136   stata introdotta in Linux a partire dalla versione 1.3.44, il supporto nelle
 137   librerie del C è iniziato dalla versione 5.2.19. La funzione non è prevista
 138   da POSIX.1, che parla solo di processi leader di sessione, e non di
 139   \textit{session id}.} è accessibile solo definendo \macro{\_XOPEN\_SOURCE} e
 140 \macro{\_XOPEN\_SOURCE\_EXTENDED}; il suo prototipo è:
 141 \begin{prototype}{unistd.h}{pid\_t getsid(pid\_t pid)}
 142   Legge l'identificatore di sessione del processo \param{pid}.
 143
 144   \bodydesc{La funzione restituisce l'identificatore (un numero positivo) in
 145   caso di successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà
 146   i valori:
 147     \begin{errlist}
 148     \item[\macro{ESRCH}] Il processo selezionato non esiste.
 149     \item[\macro{EPERM}] In alcune implementazioni viene restituito quando il
 150       processo selezionato non fa parte della stessa sessione del processo
 151       corrente.
 152     \end{errlist}
 153   }
 154 \end{prototype}
 155
 156 Entrambi gli identificatori vengono inizializzati alla creazione di ciascun
 157 processo con lo stesso valore che hanno nel processo padre, per cui un
 158 processo appena creato appartiene sempre allo stesso raggruppamento e alla
 159 stessa sessione del padre. Vedremo poi come sia possibile creare più
 160 \textit{process group} all'interno della stessa sessione, e spostare i
 161 processi dall'uno all'altro, ma sempre all'interno di una stessa sessione.
 162
 163 Ciascun gruppo di processi ha sempre un processo principale, il cosiddetto
 164 \textit{process group leader}, che è identificato dall'avere un \acr{pgid}
 165 uguale al suo \acr{pid}, in genere questo è il primo processo del gruppo, che
 166 si incarica di lanciare tutti gli altri. Un nuovo gruppo si crea con la
 167 funzione \func{setpgrp},\footnote{questa è la definizione di POSIX.1, BSD
 168   definisce una funzione con lo stesso nome, che però è identica a
 169   \func{setpgid}; nelle \acr{glibc} viene sempre usata sempre questa
 170   definizione, a meno di non richiedere esplicitamente la compatibilità
 171   all'indietro con BSD, definendo la macro \macro{\_BSD\_SOURCE}.} il cui
 172 prototipo è:
 173 \begin{prototype}{unistd.h}{int setpgrp(void)}
 174   Modifica il \acr{pgid} al valore del \acr{pid} del processo corrente.
 175
 176   \bodydesc{La funzione restituisce il valore del nuovo \textit{process
 177       group}.}
 178 \end{prototype}
 179
 180 La funzione, assegnando al \acr{pgid} il valore del \acr{pid} processo
 181 corrente, rende questo \textit{process leader} di un nuovo gruppo, tutti i
 182 successivi processi da esso creati apparterranno (a meno di non cambiare di
 183 nuovo il \acr{pgid}) al nuovo gruppo. È possibile invece spostare un processo
 184 da un gruppo ad un altro con la funzione \func{setpgid}, il cui prototipo è:
 185 \begin{prototype}{unistd.h}{int setpgid(pid\_t pid, pid\_t pgid)}
 186   Assegna al \acr{pgid} del processo \param{pid} il valore \param{pgid}.
 187
 188   \bodydesc{La funzione ritorna il valore del nuovo \textit{process group}, e
 189   -1 in caso di errore, nel qual caso \var{errno} assumerà i valori:
 190     \begin{errlist}
 191     \item[\macro{ESRCH}] Il processo selezionato non esiste.
 192     \item[\macro{EPERM}] Il cambiamento non è consentito.
 193     \item[\macro{EINVAL}] Il valore di \param{pgid} è negativo.
 194     \end{errlist}
 195  }
 196 \end{prototype}
 197
 198 La funzione permette di cambiare il \acr{pgid} del processo \param{pid}, ma il
 199 cambiamento può essere effettuato solo se \param{pgid} indica un
 200 \textit{process group} che è nella stessa sessione del processo chiamante.
 201 Inoltre la funzione può essere usata soltanto sul processo corrente o su uno
 202 dei suoi figli, ed in quest'ultimo caso ha successo soltanto se questo non ha
 203 ancora eseguito una \func{exec}. Specificando un valore nullo per \param{pid}
 204 si indica il processo corrente, mentre specificando un valore nullo per
 205 \param{pgid} si imposta il \textit{process group} al valore del \acr{pid} del
 206 processo selezionato; pertanto \func{setpgrp} è equivalente a \code{setpgid(0,
 207   0)}.
 208
 209 Di norma questa funzione viene usata dalla shell quando si usano delle
 210 pipeline, per mettere nello stesso process group tutti i programmi lanciati su
 211 ogni linea di comando; essa viene chiamata dopo una \func{fork} sia dal
 212 processo padre, per impostare il valore nel figlio, che da quest'ultimo, per
 213 sé stesso, in modo che il cambiamento di \textit{process group} sia immediato
 214 per entrambi; una delle due chiamate sarà ridondante, ma non potendo
 215 determinare quale dei due processi viene eseguito per primo, occorre eseguirle
 216 comunque entrambe per evitare di esporsi ad una race condition.
 217
 218 Si noti come nessuna delle funzioni esaminate finora permetta di spostare un
 219 processo da una sessione ad un altra; infatti l'unico modo di far cambiare
 220 sessione ad un processo è quello di crearne una nuova con l'uso di
 221 \func{setsid}; il suo prototipo è:
 222 \begin{prototype}{unistd.h}{pid\_t setsid(void)}
 223   Crea una nuova sessione sul processo corrente settandone \acr{sid} e
 224   \acr{pgid}.
 225
 226   \bodydesc{La funzione ritorna il valore del nuovo \acr{sid}, e -1 in caso di
 227     errore, il solo errore possibile è \macro{EPERM}, che si ha quando il
 228     \acr{pgid} e \acr{pid} del processo concidono.}
 229 \end{prototype}
 230
 231 La funzione imposta il \acr{pgid} ed il \acr{sid} del processo corrente al
 232 valore del suo \acr{pid}, creando così una nuova sessione ed un nuovo
 233 \textit{process group} di cui esso diventa leader (come per i \textit{process
 234   group} un processo si dice leader di sessione se il suo \acr{sid} è uguale
 235 al suo \acr{pid}).  Infine il processo viene distaccato dal terminale di
 236 controllo.
 237
 238 La funzione ha successo soltanto se il processo non è già leader per un
 239 \textit{process group}, per cui di norma si esegue una \func{fork} e si esce,
 240 per poi chiamare \func{setsid} nel processo figlio, in modo che, avendo questo
 241 lo stesso \acr{pgid} del padre ma un \acr{pid} diverso, non ci siano
 242 possibilità di errore.  Questa funzione viene usata di solito dal processo di
 243 login quando si lancia una nuova shell per un utente.
 244
 245
 246
 247
 248 \subsection{Il terminale di controllo}
 249 \label{sec:sess_ctrl_term}
 250
 251 Come accennato in \secref{sec:sess_job_control_overview} ad ogni sessione di
 252 lavoro è associato un terminale di controllo.
 253
 254
 255
 256 \subsection{Dal login alla shell}
 257 \label{sec:sess_login}
 258
 259 L'organizzazione del sistema del job control è strettamente connessa alle
 260 modalità con cui un utente accede al sistema per dare comandi, collegandosi ad
 261 esso con un terminale, che sia questo realmente tale, come un VT100 collegato
 262 ad una seriale o virtuale, come quelli associati a schermo e tastiera o ad una
 263 connessione di rete. Dato che i concetti base sono gli stessi, e dato che alla
 264 fine le differenze sono\footnote{in generale nel caso di login via rete o di
 265   terminali lanciati dall'interfaccia grafica cambia anche il processo da cui
 266   ha origine l'esecuzione della shell.} nel device cui il kernel associa i
 267 file standard (vedi \secref{sec:file_std_descr}) per l'I/O, tratteremo solo il
 268 caso classico del terminale.
 269
 270 Abbiamo già brevemente illustrato in \secref{sec:intro_kern_and_sys} le
 271 modalità con cui il sistema si avvia, e di come, a partire da \cmd{init},
 272 vengano lanciati tutti gli altri processi. Adesso vedremo in maniera più
 273 dettagliata le modalità con cui il sistema arriva a fornire ad un utente la
 274 shell che gli permette di lanciare i suoi comandi su un terminale.
 275
 276 Nella maggior parte delle distribuzioni di GNU/Linux\footnote{fa eccezione la
 277   distribuzione \textit{Slackware}, come alcune distribuzioni su dischetto, ed
 278   altre distribuzioni dedicate a compiti limitati e specifici.}  viene usata
 279 la procedura di avvio di System V; questa prevede che \cmd{init} legga dal
 280 file di configurazione \file{/etc/inittab} quali programmi devono essere
 281 lanciati, ed in quali modalità, a seconda del cosiddetto \textit{run level},
 282 anch'esso definito nello stesso file.
 283
 284 Tralasciando la descrizione del sistema dei run level, (per il quale si
 285 rimanda alla lettura delle pagine di manuale di \cmd{init} e di
 286 \file{inittab}) quello che comunque viene sempre fatto è di eseguire almeno
 287 una istanza di un programma che permetta l'accesso ad un terminale. Uno schema
 288 di massima della procedura è riportato in \secref{fig:sess_term_login}.
 289
 290 \begin{figure}[htb]
 291   \centering
 292   \includegraphics[width=15cm]{img/tty_login}
 293   \caption{Schema della procedura di login su un terminale.}
 294   \label{fig:sess_term_login}
 295 \end{figure}
 296
 297 Un terminale, che esso sia un terminale effettivo, attaccato ad una seriale o
 298 ad un altro tipo di porta di comunicazione, o una delle console virtuali
 299 associate allo schermo,  viene sempre visto attraverso attraverso un device
 300 driver che ne presenta un'interfaccia comune su un apposito file di
 301 dispositivo. Storicamente i primi terminali erano appunto terminali di
 302 telescriventi (\textit{teletype}), da cui deriva sia il nome dell'interfaccia,
 303 \textit{tty}, che quello dei relativi file di dispositivo, che sono sempre
 304 della forma \texttt{/dev/tty*}.\footnote{questo vale anche per i terminali
 305   associati alle connessioni di rete con \cmd{telnet} o \cmd{ssh}.}
 306
 307 Per controllare i terminali si usa di solito il programma \cmd{getty} (od una
 308 delle sue varianti), che permette di mettersi in ascolto sugli stessi. Alla
 309 radice della catena che porta ad una shell per i comandi perciò c'è sempre
 310 \cmd{init} che esegue prima una \func{fork} e poi una \func{exec} per lanciare
 311 una istanza di questo programma su un terminale, il tutto ripetuto per
 312 ciascuno dei terminali che si hanno a disposizione (o per un certo numero di
 313 essi, nel caso delle console virtuali), secondo quanto indicato
 314 dall'amministratore nel file di configurazione del programma,
 315 \file{/etc/inittab}.
 316
 317 Quando viene lanciato da \cmd{init} il programma parte con i privilegi di
 318 amministratore e con un ambiente vuoto; \cmd{getty} si cura di chiamare
 319 \func{setsid} per creare una nuova sessione ed un nuovo process group, e di
 320 aprire il terminale in lettura sullo standard input ed in scrittura sullo
 321 standard output e sullo standard error, e di effettuare, qualora servano,
 322 ulteriori settaggi,\footnote{ad esempio, come qualcuno si sarà accorto
 323   scrivendo un nome di login in maiuscolo, può effettuare la conversione
 324   automatica dell'input in minuscolo, ponendosi in una modalità speciale che
 325   non distingue fra i due tipi di caratteri (a beneficio di alcuni vecchi
 326   terminali che non supportavano le minuscole).} ed infine il programma
 327 stamperà un messaggio di benvenuto per poi porsi in attesa dell'immissione del
 328 nome di un utente.
 329
 330 Una volta che si sia immesso il nome di login \cmd{getty} esegue direttamente
 331 il programma \cmd{login} con una \func{exevle}, passando come argomento la
 332 suddetta stringa ed un ambiente opportunamente costruito che contenga quanto
 333 necessario (ad esempio di solito viene opportunamente inizializzata la
 334 variabile di ambiente \texttt{TERM}) ad identificare il terminale su cui si
 335 sta operando, a beneficio dei programmi che verranno lanciati in seguito.
 336
 337 A sua volta \cmd{login}, che mantiene i privilegi di amministratore, usa il
 338 nome dell'utente per effettuare una ricerca nel database degli
 339 utenti,\footnote{in genere viene chiamata \func{getpwnam}, che abbiamo visto
 340   in \secref{sec:sys_user_group}, per leggere la password e gli altri dati dal
 341   database degli utenti.} e richiede una password. Se l'utente non esiste o se
 342 la password non corrisponde\footnote{il confronto non viene effettuato con un
 343   valore in chiaro; quanto immesso da terminale viene invece a sua volta
 344   criptato, ed è il risultato che viene confrontato con il valore che viene
 345   mantenuto nel database degli utenti.} la richiesta viene ripetuta un certo
 346 numero di volte dopo di che \cmd{login} esce ed \cmd{init} provvede a
 347 rilanciare un'altra istanza di \func{getty}.
 348
 349 Se invece la password corrisponde a questo punto \cmd{login} esegue
 350 \func{chdir} per settare la \textit{home directory} dell'utente, cambia i
 351 diritti di accesso al terminale (con \func{chown} e \func{chmod}) per
 352 assegnarne la titolarità all'utente ed al suo gruppo principale, assegnandogli
 353 al contempo i diritti di lettura e scrittura. Inoltre il programma provvede
 354 a costruire gli opportuni valori per le variabili di ambiente, come
 355 \texttt{HOME}, \texttt{SHELL}, ecc. Infine attraverso l'uso di \func{setuid},
 356 \func{setpid} e \func{initgroups} verrà cambiata l'identità del proprietario
 357 del processo, infatti, come spiegato in \secref{sec:proc_setuid}, avendo
 358 invocato tali funzioni con i privilegi di amministratore, tutti gli userid ed
 359 i groupid (reali, effettivi e salvati) saranno settati a quelli dell'utente.
 360
 361 A questo punto \cmd{login} provvederà (fatte salve eventuali altre azioni
 362 iniziali, come la stampa di messaggi di benvenuto o il controllo della posta)
 363 ad eseguire con un'altra \func{exec} la shell di login, che si troverà con un
 364 ambiente già pronto e con file standard di \secref{sec:file_std_descr}
 365 impostati sul terminale, pronta ad eseguire i comandi fino all'uscita. Dato
 366 che il processo genitore resta sempre \cmd{init} quest'ultimo provvederà,
 367 ricevendo un \macro{SIGCHLD} all'uscita della shell, a rilanciare \cmd{getty}
 368 per ripetere da capo tutto il procedimento.
 369
 370 Una volta arrivati alla
 371
 372
 373
 374
 375 \section{L'I/O su terminale}
 376 \label{sec:sess_terminal_io}
 377
 378 Esamineremo in questa sezione le peculiarità dell'I/O su terminale, tenendo
 379 conto delle
 380
 381
 382 %%% Local Variables:
 383 %%% mode: latex
 384 %%% TeX-master: "gapil"
 385 %%% End: