ipc.tex

   1 %% ipc.tex
   2 %%
   3 %% Copyright (C) 2000-2002 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11 \chapter{La comunicazione fra processi}
  12 \label{cha:IPC}
  13
  14
  15 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
  16 la comunicazione fra processi. In questo capitolo affronteremo solo i
  17 meccanismi più elementari che permettono di mettere in comunicazione processi
  18 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
  19 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
  20
  21 Tralasceremo invece tutte le problematiche relative alla comunicazione
  22 attraverso la rete (e le relative interfacce) che saranno affrontate in
  23 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
  24 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) e CORBA
  25 (\textit{Common Object Request Brocker Architecture}) che in genere sono
  26 implementati con un ulteriore livello sopra i meccanismi elementari.
  27
  28
  29 \section{La comunicazione fra processi tradizionale}
  30 \label{sec:ipc_unix}
  31
  32 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
  33 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
  34 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
  35 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
  36 ne gestiscono l'uso e le varie forme in cui si è evoluto.
  37
  38
  39 \subsection{Le \textit{pipe} standard}
  40 \label{sec:ipc_pipes}
  41
  42 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
  43 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
  44 sostanza di una una coppia di file descriptor\footnote{si tenga presente che
  45   le pipe sono oggetti creati dal kernel e non risiedono su disco.} connessi
  46 fra di loro in modo che se quanto scrive su di uno si può rileggere
  47 dall'altro. Si viene così a costituire un canale di comunicazione tramite i
  48 due file descriptor, nella forma di un \textsl{tubo} (da cui il nome)
  49 attraverso cui fluiscono i dati.
  50
  51 La funzione che permette di creare questa speciale coppia di file descriptor
  52 associati ad una \textit{pipe} è appunto \func{pipe}, ed il suo prototipo è:
  53 \begin{prototype}{unistd.h}
  54 {int pipe(int filedes[2])}
  55
  56 Crea una coppia di file descriptor associati ad una \textit{pipe}.
  57
  58   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
  59     errore, nel qual caso \var{errno} potrà assumere i valori \errval{EMFILE},
  60     \errval{ENFILE} e \errval{EFAULT}.}
  61 \end{prototype}
  62
  63 La funzione restituisce la coppia di file descriptor nel vettore
  64 \param{filedes}; il primo è aperto in lettura ed il secondo in scrittura. Come
  65 accennato concetto di funzionamento di una pipe è semplice: quello che si
  66 scrive nel file descriptor aperto in scrittura viene ripresentato tale e quale
  67 nel file descriptor aperto in lettura. I file descriptor infatti non sono
  68 connessi a nessun file reale, ma ad un buffer nel kernel, la cui dimensione è
  69 specificata dal parametro di sistema \const{PIPE\_BUF}, (vedi
  70 \secref{sec:sys_file_limits}). Lo schema di funzionamento di una pipe è
  71 illustrato in \figref{fig:ipc_pipe_singular}, in cui sono illustrati i due
  72 capi della pipe, associati a ciascun file descriptor, con le frecce che
  73 indicano la direzione del flusso dei dati.
  74
  75 \begin{figure}[htb]
  76   \centering
  77   \includegraphics[height=5cm]{img/pipe}
  78   \caption{Schema della struttura di una pipe.}
  79   \label{fig:ipc_pipe_singular}
  80 \end{figure}
  81
  82 Chiaramente creare una pipe all'interno di un singolo processo non serve a
  83 niente; se però ricordiamo quanto esposto in \secref{sec:file_sharing}
  84 riguardo al comportamento dei file descriptor nei processi figli, è immediato
  85 capire come una pipe possa diventare un meccanismo di intercomunicazione. Un
  86 processo figlio infatti condivide gli stessi file descriptor del padre,
  87 compresi quelli associati ad una pipe (secondo la situazione illustrata in
  88 \figref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
  89 capo della pipe, l'altro può leggere.
  90
  91 \begin{figure}[htb]
  92   \centering
  93   \includegraphics[height=5cm]{img/pipefork}
  94   \caption{Schema dei collegamenti ad una pipe, condivisi fra processo padre e
  95     figlio dopo l'esecuzione \func{fork}.}
  96   \label{fig:ipc_pipe_fork}
  97 \end{figure}
  98
  99 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
 100 comunicazione fra processi attraverso una pipe, utilizzando le proprietà
 101 ordinarie dei file, ma ci mostra anche qual'è il principale\footnote{Stevens
 102   in \cite{APUE} riporta come limite anche il fatto che la comunicazione è
 103   unidirezionale, ma in realtà questo è un limite facilmente superabile usando
 104   una coppia di pipe.} limite nell'uso delle pipe. È necessario infatti che i
 105 processi possano condividere i file descriptor della pipe, e per questo essi
 106 devono comunque essere \textsl{parenti} (dall'inglese \textit{siblings}), cioè
 107 o derivare da uno stesso processo padre in cui è avvenuta la creazione della
 108 pipe, o, più comunemente, essere nella relazione padre/figlio.
 109
 110 A differenza di quanto avviene con i file normali, la lettura da una pipe può
 111 essere bloccante (qualora non siano presenti dati), inoltre se si legge da una
 112 pipe il cui capo in scrittura è stato chiuso, si avrà la ricezione di un EOF
 113 (vale a dire che la funzione \func{read} ritornerà restituendo 0).  Se invece
 114 si esegue una scrittura su una pipe il cui capo in lettura non è aperto il
 115 processo riceverà il segnale \errcode{EPIPE}, e la funzione di scrittura
 116 restituirà un errore di \errcode{EPIPE} (al ritorno del manipolatore, o qualora
 117 il segnale sia ignorato o bloccato).
 118
 119 La dimensione del buffer della pipe (\const{PIPE\_BUF}) ci dà inoltre un'altra
 120 importante informazione riguardo il comportamento delle operazioni di lettura
 121 e scrittura su di una pipe; esse infatti sono atomiche fintanto che la
 122 quantità di dati da scrivere non supera questa dimensione. Qualora ad esempio
 123 si effettui una scrittura di una quantità di dati superiore l'operazione verrà
 124 effettuata in più riprese, consentendo l'intromissione di scritture effettuate
 125 da altri processi.
 126
 127
 128 \subsection{Un esempio dell'uso delle pipe}
 129 \label{sec:ipc_pipe_use}
 130
 131 Per capire meglio il funzionamento delle pipe faremo un esempio di quello che
 132 è il loro uso più comune, analogo a quello effettuato della shell, e che
 133 consiste nell'inviare l'output di un processo (lo standard output) sull'input
 134 di un'altro. Realizzeremo il programma di esempio nella forma di un
 135 \textit{CGI}\footnote{Un CGI (\textit{Common Gateway Interface}) è un
 136   programma che permette la creazione dinamica di un oggetto da inserire
 137   all'interno di una pagina HTML.}  per Apache, che genera una immagine JPEG
 138 di un codice a barre, specificato come parametro di input.
 139
 140 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
 141 delle caratteristiche specifiche, esso infatti non viene lanciato da una
 142 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
 143 solito ha la forma:
 144 \begin{verbatim}
 145     http://www.sito.it/cgi-bin/programma?parametro
 146 \end{verbatim}
 147 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
 148 che ne descrive il mime-type) sullo standard output, in modo che il web-server
 149 possa reinviarlo al browser che ha effettuato la richiesta, che in questo modo
 150 è in grado di visualizzarlo opportunamente.
 151
 152 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
 153 \cmd{gs}, il primo infatti è in grado di generare immagini postscript di
 154 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
 155 serve per poter effettuare la conversione della stessa immagine in formato
 156 JPEG. Usando una pipe potremo inviare l'output del primo sull'input del
 157 secondo, secondo lo schema mostrato in \figref{fig:ipc_pipe_use}, in cui la
 158 direzione del flusso dei dati è data dalle frecce continue.
 159
 160 \begin{figure}[htb]
 161   \centering
 162   \includegraphics[height=5cm]{img/pipeuse}
 163   \caption{Schema dell'uso di una pipe come mezzo di comunicazione fra
 164     due processi attraverso attraverso l'esecuzione una \func{fork} e la
 165     chiusura dei capi non utilizzati.}
 166   \label{fig:ipc_pipe_use}
 167 \end{figure}
 168
 169 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
 170 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
 171 \textit{CGI} deve poter gestire più richieste in concorrenza, e si avrebbe una
 172 evidente race condition in caso di accesso simultaneo a detto
 173 file.\footnote{il problema potrebbe essere superato determinando in anticipo
 174   un nome appropriato per il file temporaneo, che verrebbe utilizzato dai vari
 175   sotto-processi, e cancellato alla fine della loro esecuzione; ma a questo le
 176   cose non sarebbero più tanto semplici.}  L'uso di una pipe invece permette
 177 di risolvere il problema in maniera semplice ed elegante, oltre ad essere
 178 molto più efficiente, dato che non si deve scrivere su disco.
 179
 180 Il programma ci servirà anche come esempio dell'uso delle funzioni di
 181 duplicazione dei file descriptor che abbiamo trattato in
 182 \secref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
 183 funzioni infatti che è possibile dirottare gli stream standard dei processi
 184 (che abbiamo visto in \secref{sec:file_std_descr} e
 185 \secref{sec:file_std_stream}) sulla pipe. In \figref{fig:ipc_barcodepage_code}
 186 abbiamo riportato il corpo del programma, il cui codice completo è disponibile
 187 nel file \file{BarCodePage.c} che si trova nella directory dei sorgenti.
 188
 189
 190 \begin{figure}[!htb]
 191   \footnotesize \centering
 192   \begin{minipage}[c]{15cm}
 193     \begin{lstlisting}{}
 194 int main(int argc, char *argv[], char *envp[])
 195 {
 196     ...
 197     /* create two pipes, pipein and pipeout, to handle communication */
 198     if ( (retval = pipe(pipein)) ) {
 199         WriteMess("input pipe creation error");
 200         exit(0);
 201     }
 202     if ( (retval = pipe(pipeout)) ) {
 203         WriteMess("output pipe creation error");
 204         exit(0);
 205     }
 206     /* First fork: use child to run barcode program */
 207     if ( (pid = fork()) == -1) {          /* on error exit */
 208         WriteMess("child creation error");
 209         exit(0);
 210     }
 211     /* if child */
 212     if (pid == 0) {
 213         close(pipein[1]);                /* close pipe write end  */
 214         dup2(pipein[0], STDIN_FILENO);   /* remap stdin to pipe read end */
 215         close(pipeout[0]);
 216         dup2(pipeout[1], STDOUT_FILENO); /* remap stdout in pipe output */
 217         execlp("barcode", "barcode", size, NULL);
 218     }
 219     close(pipein[0]);                    /* close input side of input pipe */
 220     write(pipein[1], argv[1], strlen(argv[1]));  /* write parameter to pipe */
 221     close(pipein[1]);                    /* closing write end */
 222     waitpid(pid, NULL, 0);               /* wait child completion */
 223     /* Second fork: use child to run ghostscript */
 224     if ( (pid = fork()) == -1) {
 225         WriteMess("child creation error");
 226         exit(0);
 227     }
 228     /* second child, convert PS to JPEG  */
 229     if (pid == 0) {
 230         close(pipeout[1]);              /* close write end */
 231         dup2(pipeout[0], STDIN_FILENO); /* remap read end to stdin */
 232         /* send mime type */
 233         write(STDOUT_FILENO, content, strlen(content));
 234         execlp("gs", "gs", "-q", "-sDEVICE=jpeg", "-sOutputFile=-", "-", NULL);
 235     }
 236     /* still parent */
 237     close(pipeout[1]);
 238     waitpid(pid, NULL, 0);
 239     exit(0);
 240 }
 241     \end{lstlisting}
 242   \end{minipage}
 243   \normalsize
 244   \caption{Sezione principale del codice del \textit{CGI}
 245     \file{BarCodePage.c}.}
 246   \label{fig:ipc_barcodepage_code}
 247 \end{figure}
 248
 249 La prima operazione del programma (\texttt{\small 4--12}) è quella di creare
 250 le due pipe che serviranno per la comunicazione fra i due comandi utilizzati
 251 per produrre il codice a barre; si ha cura di controllare la riuscita della
 252 chiamata, inviando in caso di errore un messaggio invece dell'immagine
 253 richiesta.\footnote{la funzione \func{WriteMess} non è riportata in
 254   \secref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
 255   formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
 256   \textit{mime type}, e formattando il messaggio in HTML, in modo che
 257   quest'ultimo possa essere visualizzato correttamente da un browser.}
 258
 259 Una volta create le pipe, il programma può creare (\texttt{\small 13-17}) il
 260 primo processo figlio, che si incaricherà (\texttt{\small 19--25}) di eseguire
 261 \cmd{barcode}. Quest'ultimo legge dallo standard input una stringa di
 262 caratteri, la converte nell'immagine postscript del codice a barre ad essa
 263 corrispondente, e poi scrive il risultato direttamente sullo standard output.
 264
 265 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
 266 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima pipe, e se
 267 ne collega (\texttt{\small 21}) il capo in lettura allo standard input, usando
 268 \func{dup2}. Si ricordi che invocando \func{dup2} il secondo file, qualora
 269 risulti aperto, viene, come nel caso corrente, chiuso prima di effettuare la
 270 duplicazione. Allo stesso modo, dato che \cmd{barcode} scrive l'immagine
 271 postscript del codice a barre sullo standard output, per poter effettuare una
 272 ulteriore redirezione il capo in lettura della seconda pipe viene chiuso
 273 (\texttt{\small 22}) mentre il capo in scrittura viene collegato allo standard
 274 output (\texttt{\small 23}).
 275
 276 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
 277 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
 278 leggerà dalla prima pipe la stringa da codificare che gli sarà inviata dal
 279 padre, e scriverà l'immagine postscript del codice a barre sulla seconda.
 280
 281 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
 282 (\texttt{\small 26}) il capo inutilizzato della prima pipe (quello in input) e
 283 poi scrive (\texttt{\small 27}) la stringa da convertire sul capo in output,
 284 così che \cmd{barcode} possa riceverla dallo standard input. A questo punto
 285 l'uso della prima pipe da parte del padre è finito ed essa può essere
 286 definitivamente chiusa (\texttt{\small 28}), si attende poi (\texttt{\small
 287   29}) che l'esecuzione di \cmd{barcode} sia completata.
 288
 289 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
 290 postscript del codice a barre sul capo in scrittura della seconda pipe; a
 291 questo punto si può eseguire la seconda conversione, da PS a JPEG, usando il
 292 programma \cmd{gs}. Per questo si crea (\texttt{\small 30--34}) un secondo
 293 processo figlio, che poi (\texttt{\small 35--42}) eseguirà questo programma
 294 leggendo l'immagine postscript creata da \cmd{barcode} dallo standard input,
 295 per convertirla in JPEG.
 296
 297 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
 298 scrittura della seconda pipe, e se ne collega (\texttt{\small 38}) il capo in
 299 lettura allo standard input. Per poter formattare l'output del programma in
 300 maniera utilizzabile da un browser, si provvede anche \texttt{\small 40}) alla
 301 scrittura dell'apposita stringa di identificazione del mime-type in testa allo
 302 standard output. A questo punto si può invocare \texttt{\small 41}) \cmd{gs},
 303 provvedendo gli appositi switch che consentono di leggere il file da
 304 convertire dallo standard input e di inviare la conversione sullo standard
 305 output.
 306
 307 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
 308 capo in scrittura della seconda pipe, e attende la conclusione del figlio
 309 (\texttt{\small 45}); a questo punto può (\texttt{\small 46}) uscire. Si tenga
 310 conto che l'operazione di chiudere il capo in scrittura della seconda pipe è
 311 necessaria, infatti, se non venisse chiusa, \cmd{gs}, che legge il suo
 312 standard input da detta pipe, resterebbe bloccato in attesa di ulteriori dati
 313 in ingresso (l'unico modo che un programma ha per sapere che l'input è
 314 terminato è rilevare che lo standard input è stato chiuso), e la \func{wait}
 315 non ritornerebbe.
 316
 317
 318 \subsection{Le funzioni \func{popen} e \func{pclose}}
 319 \label{sec:ipc_popen}
 320
 321 Come si è visto la modalità più comune di utilizzo di una pipe è quella di
 322 utilizzarla per fare da tramite fra output ed input di due programmi invocati
 323 in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due funzioni
 324 che permettono di sintetizzare queste operazioni. La prima di esse si chiama
 325 \func{popen} ed il suo prototipo è:
 326 \begin{prototype}{stdio.h}
 327 {FILE *popen(const char *command, const char *type)}
 328
 329 Esegue il programma \param{command}, di cui, a seconda di \param{type},
 330 restituisce, lo standard input o lo standard output nella pipe collegata allo
 331 stream restituito come valore di ritorno.
 332
 333 \bodydesc{La funzione restituisce l'indirizzo dello stream associato alla pipe
 334   in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
 335   potrà assumere i valori relativi alle sottostanti invocazioni di \func{pipe}
 336   e \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
 337 \end{prototype}
 338
 339 La funzione crea una pipe, esegue una \func{fork}, ed invoca il programma
 340 \param{command} attraverso la shell (in sostanza esegue \file{/bin/sh} con il
 341 flag \code{-c}); l'argomento \param{type} deve essere una delle due stringhe
 342 \verb|"w"| o \verb|"r"|, per indicare se la pipe sarà collegata allo standard
 343 input o allo standard output del comando invocato.
 344
 345 La funzione restituisce il puntatore allo stream associato alla pipe creata,
 346 che sarà aperto in sola lettura (e quindi associato allo standard output del
 347 programma indicato) in caso si sia indicato \code{"r"}, o in sola scrittura (e
 348 quindi associato allo standard input) in caso di \code{"w"}.
 349
 350 Lo stream restituito da \func{popen} è identico a tutti gli effetti ai file
 351 stream visti in \secref{cha:files_std_interface}, anche se è collegato ad una
 352 pipe e non ad un inode, e viene sempre aperto in modalità
 353 \textit{fully-buffered} (vedi \secref{sec:file_buffering}); l'unica differenza
 354 con gli usuali stream è che dovrà essere chiuso dalla seconda delle due nuove
 355 funzioni, \func{pclose}, il cui prototipo è:
 356 \begin{prototype}{stdio.h}
 357 {int pclose(FILE *stream)}
 358
 359 Chiude il file \param{stream}, restituito da una precedente \func{popen}
 360 attendendo la terminazione del processo ad essa associato.
 361
 362 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
 363   errore; nel quel caso il valore di \var{errno} deriva dalle sottostanti
 364   chiamate.}
 365 \end{prototype}
 366 \noindent che oltre alla chiusura dello stream si incarica anche di attendere
 367 (tramite \func{wait4}) la conclusione del processo creato dalla precedente
 368 \func{popen}.
 369
 370 Per illustrare l'uso di queste due funzioni riprendiamo il problema
 371 precedente: il programma mostrato in \figref{fig:ipc_barcodepage_code} per
 372 quanto funzionante, è (volutamente) codificato in maniera piuttosto complessa,
 373 inoltre nella pratica sconta un problema di \cmd{gs} che non è in
 374 grado\footnote{nella versione GNU Ghostscript 6.53 (2002-02-13).} di
 375 riconoscere correttamente l'encapsulated postscript, per cui deve essere usato
 376 il postscript e tutte le volte viene generata una pagina intera, invece che
 377 una immagine delle dimensioni corrispondenti al codice a barre.
 378
 379 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
 380 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
 381 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
 382 generato da \cmd{barcode} utilizzando lo switch \cmd{-E}).  Utilizzando un PDF
 383 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
 384 originarie del codice a barre e produce un JPEG di dimensioni corrette.
 385
 386 Questo approccio però non funziona, per via di una delle caratteristiche
 387 principali delle pipe. Per poter effettuare la conversione di un PDF infatti è
 388 necessario, per la struttura del formato, potersi spostare (con \func{lseek})
 389 all'interno del file da convertire; se si esegue la conversione con \cmd{gs}
 390 su un file regolare non ci sono problemi, una pipe però è rigidamente
 391 sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre con un errore
 392 di \errcode{ESPIPE}, rendendo impossibile la conversione.  Questo ci dice che
 393 in generale la concatenazione di vari programmi funzionerà soltanto quando
 394 tutti prevedono una lettura sequenziale del loro input.
 395
 396 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
 397 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
 398 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
 399   formato usato spesso come formato intermedio per effettuare conversioni, è
 400   infatti molto facile da manipolare, dato che usa caratteri ASCII per
 401   memorizzare le immagini, anche se per questo è estremamente inefficiente.}
 402 dal quale poi si può ottenere un'immagine di dimensioni corrette attraverso
 403 vari programmi di manipolazione (\cmd{pnmcrop}, \cmd{pnmmargin}) che può
 404 essere infine trasformata in PNG (con \cmd{pnm2png}).
 405
 406 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
 407 inviando l'output di ciascuno all'input del successivo, per poi ottenere il
 408 risultato finale sullo standard output: un caso classico di utilizzazione
 409 delle pipe, in cui l'uso di \func{popen} e \func{pclose} permette di
 410 semplificare notevolmente la stesura del codice.
 411
 412 Nel nostro caso, dato che ciascun processo deve scrivere il suo output sullo
 413 standard input del successivo, occorrerà usare \func{popen} aprendo la pipe in
 414 scrittura. Il codice del nuovo programma è riportato in
 415 \figref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione dei
 416 programmi è l'inverso di quello in cui ci si aspetta che vengano
 417 effettivamente eseguiti. Questo non comporta nessun problema dato che la
 418 lettura su una pipe è bloccante, per cui ciascun processo, per quanto lanciato
 419 per primo, si bloccherà in attesa di ricevere sullo standard input il
 420 risultato dell'elaborazione del precedente, benchè quest'ultimo venga
 421 invocato dopo.
 422
 423 \begin{figure}[!htb]
 424   \footnotesize \centering
 425   \begin{minipage}[c]{15cm}
 426     \begin{lstlisting}{}
 427 int main(int argc, char *argv[], char *envp[])
 428 {
 429     FILE *pipe[4];
 430     FILE *pipein;
 431     char *cmd_string[4]={
 432         "pnmtopng",
 433         "pnmmargin -white 10",
 434         "pnmcrop",
 435         "gs -sDEVICE=ppmraw -sOutputFile=- -sNOPAUSE -q - -c showpage -c quit"
 436     };
 437     char content[]="Content-type: image/png\n\n";
 438     int i;
 439     /* write mime-type to stout */
 440     write(STDOUT_FILENO, content, strlen(content));
 441     /* execute chain of command */
 442     for (i=0; i<4; i++) {
 443         pipe[i] = popen(cmd_string[i], "w");
 444         dup2(fileno(pipe[i]), STDOUT_FILENO);
 445     }
 446     /* create barcode (in PS) */
 447     pipein = popen("barcode", "w");
 448     /* send barcode string to barcode program */
 449     write(fileno(pipein), argv[1], strlen(argv[1]));
 450     /* close all pipes (in reverse order) */
 451     for (i=4; i==0; i--) {
 452         pclose((pipe[i]));
 453     }
 454     exit(0);
 455 }
 456     \end{lstlisting}
 457   \end{minipage}
 458   \normalsize
 459   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
 460   \label{fig:ipc_barcode_code}
 461 \end{figure}
 462
 463 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il mime-type
 464 sullo standard output; a questo punto il processo padre non necessita più di
 465 eseguire ulteriori operazioni sullo standard output e può tranquillamente
 466 provvedere alla redirezione.
 467
 468 Dato che i vari programmi devono essere lanciati in successione, si è
 469 approntato un ciclo (\texttt{\small 15--19}) che esegue le operazioni in
 470 sequenza: prima crea una pipe (\texttt{\small 17}) per la scrittura eseguendo
 471 il programma con \func{popen}, in modo che essa sia collegata allo standard
 472 input, e poi redirige (\texttt{\small 18}) lo standard output su detta pipe.
 473
 474 In questo modo il primo processo ad essere invocato (che è l'ultimo della
 475 catena) scriverà ancora sullo standard output del processo padre, ma i
 476 successivi, a causa di questa redirezione, scriveranno sulla pipe associata
 477 allo standard input del processo invocato nel ciclo precedente.
 478
 479 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
 480 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
 481 (\texttt{\small 23}) la stringa del codice a barre sulla pipe, che è collegata
 482 al suo standard input, infine si può eseguire (\texttt{\small 24--27}) un
 483 ciclo che chiuda, nell'ordine inverso rispetto a quello in cui le si sono
 484 create, tutte le pipe create con \func{pclose}.
 485
 486
 487 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
 488 \label{sec:ipc_named_pipe}
 489
 490 Come accennato in \secref{sec:ipc_pipes} il problema delle \textit{pipe} è che
 491 esse possono essere utilizzate solo da processi con un progenitore comune o
 492 nella relazione padre/figlio; per superare questo problema lo standard POSIX.1
 493 ha definito dei nuovi oggetti, le \textit{fifo}, che hanno le stesse
 494 caratteristiche delle pipe, ma che invece di essere strutture interne del
 495 kernel, visibili solo attraverso un file descriptor, sono accessibili
 496 attraverso un inode che risiede sul filesystem, così che i processi le possono
 497 usare senza dovere per forza essere in una relazione di \textsl{parentela}.
 498
 499 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le pipe,
 500 attraverso un apposito buffer nel kernel, senza transitare dal filesystem;
 501 l'inode allocato sul filesystem serve infatti solo a fornire un punto di
 502 riferimento per i processi, che permetta loro di accedere alla stessa fifo; il
 503 comportamento delle funzioni di lettura e scrittura è identico a quello
 504 illustrato per le pipe in \secref{sec:ipc_pipes}.
 505
 506 Abbiamo già visto in \secref{sec:file_mknod} le funzioni \func{mknod} e
 507 \func{mkfifo} che permettono di creare una fifo; per utilizzarne una un
 508 processo non avrà che da aprire il relativo file speciale o in lettura o
 509 scrittura; nel primo caso sarà collegato al capo di uscita della fifo, e dovrà
 510 leggere, nel secondo al capo di ingresso, e dovrà scrivere.
 511
 512 Il kernel crea una singola pipe per ciascuna fifo che sia stata aperta, che può
 513 essere acceduta contemporaneamente da più processi, sia in lettura che in
 514 scrittura. Dato che per funzionare deve essere aperta in entrambe le
 515 direzioni, per una fifo di norma la funzione \func{open} si blocca se viene
 516 eseguita quando l'altro capo non è aperto.
 517
 518 Le fifo però possono essere anche aperte in modalità \textsl{non-bloccante},
 519 nel qual caso l'apertura del capo in lettura avrà successo solo quando anche
 520 l'altro capo è aperto, mentre l'apertura del capo in scrittura restituirà
 521 l'errore di \errcode{ENXIO} fintanto che non verrà aperto il capo in lettura.
 522
 523 In Linux è possibile aprire le fifo anche in lettura/scrittura,\footnote{lo
 524   standard POSIX lascia indefinito il comportamento in questo caso.}
 525 operazione che avrà sempre successo immediato qualunque sia la modalità di
 526 apertura (bloccante e non bloccante); questo può essere utilizzato per aprire
 527 comunque una fifo in scrittura anche se non ci sono ancora processi il
 528 lettura; è possibile anche usare la fifo all'interno di un solo processo, nel
 529 qual caso però occorre stare molto attenti alla possibili situazioni di
 530 stallo.\footnote{se si cerca di leggere da una fifo che non contiene dati si
 531   avrà un deadlock immediato, dato che il processo si blocca e non potrà
 532   quindi mai eseguire le funzioni di scrittura.}
 533
 534 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
 535 piuttosto frequente l'utilizzo di una fifo come canale di comunicazione nelle
 536 situazioni un processo deve ricevere informazioni da altri. In questo caso è
 537 fondamentale che le operazioni di scrittura siano atomiche; per questo si deve
 538 sempre tenere presente che questo è vero soltanto fintanto che non si supera
 539 il limite delle dimensioni di \const{PIPE\_BUF} (si ricordi quanto detto in
 540 \secref{sec:ipc_pipes}).
 541
 542 A parte il caso precedente, che resta probabilmente il più comune, Stevens
 543 riporta in \cite{APUE} altre due casistiche principali per l'uso delle fifo:
 544 \begin{itemize}
 545 \item Da parte dei comandi di shell, per evitare la creazione di file
 546   temporanei quando si devono inviare i dati di uscita di un processo
 547   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
 548
 549 \item Come canale di comunicazione fra client ed server (il modello
 550   \textit{client-server} è illustrato in \secref{sec:net_cliserv}).
 551 \end{itemize}
 552
 553 Nel primo caso quello che si fa è creare tante fifo, da usare come standard
 554 input, quanti sono i processi a cui i vogliono inviare i dati, questi ultimi
 555 saranno stati posti in esecuzione ridirigendo lo standard input dalle fifo, si
 556 potrà poi eseguire il processo che fornisce l'output replicando quest'ultimo,
 557 con il comando \cmd{tee}, sulle varie fifo.
 558
 559 Il secondo caso è relativamente semplice qualora si debba comunicare con un
 560 processo alla volta (nel qual caso basta usare due fifo, una per leggere ed
 561 una per scrivere), le cose diventano invece molto più complesse quando si
 562 vuole effettuare una comunicazione fra il server ed un numero imprecisato di
 563 client; se il primo infatti può ricevere le richieste attraverso una fifo
 564 ``nota'', per le risposte non si può fare altrettanto, dato che, per la
 565 struttura sequenziale delle fifo, i client dovrebbero sapere, prima di
 566 leggerli, quando i dati inviati sono destinati a loro.
 567
 568 Per risolvere questo problema, si può usare un'architettura come quella
 569 illustrata in \figref{fig:ipc_fifo_server_arch} in cui i client inviano le
 570 richieste al server su una fifo nota mentre le risposte vengono reinviate dal
 571 server a ciascuno di essi su una fifo temporanea creata per l'occasione.
 572
 573 \begin{figure}[htb]
 574   \centering
 575   \includegraphics[height=9cm]{img/fifoserver}
 576   \caption{Schema dell'utilizzo delle fifo nella realizzazione di una
 577   architettura di comunicazione client/server.}
 578   \label{fig:ipc_fifo_server_arch}
 579 \end{figure}
 580
 581 Come esempio di uso questa architettura e dell'uso delle fifo, abbiamo scritto
 582 un server di \textit{fortunes}, che restituisce, alle richieste di un client,
 583 un detto a caso estratto da un insieme di frasi; sia il numero delle frasi
 584 dell'insieme, che i file da cui esse vengono lette all'avvio, sono importabili
 585 da riga di comando. Il corpo principale del server è riportato in
 586 \figref{fig:ipc_fifo_server}, dove si è tralasciata la parte che tratta la
 587 gestione delle opzioni a riga di comando, che effettua il settaggio delle
 588 variabili \var{fortunefilename}, che indica il file da cui leggere le frasi,
 589 ed \var{n}, che indica il numero di frasi tenute in memoria, ad un valore
 590 diverso da quelli preimpostati. Il codice completo è nel file
 591 \file{FortuneServer.c}.
 592
 593 \begin{figure}[!htb]
 594   \footnotesize \centering
 595   \begin{minipage}[c]{15cm}
 596     \begin{lstlisting}{}
 597 char *fifoname = "/tmp/fortune.fifo";
 598 int main(int argc, char *argv[])
 599 {
 600 /* Variables definition */
 601     int i, n = 0;
 602     char *fortunefilename = "/usr/share/games/fortunes/italia";
 603     char **fortune;
 604     char line[80];
 605     int fifo_server, fifo_client;
 606     int nread;
 607     ...
 608     if (n==0) usage();          /* if no pool depth exit printing usage info */
 609     Signal(SIGTERM, HandSIGTERM);            /* set handlers for termination */
 610     Signal(SIGINT, HandSIGTERM);
 611     Signal(SIGQUIT, HandSIGTERM);
 612     i = FortuneParse(fortunefilename, fortune, n);          /* parse phrases */
 613     if (mkfifo(fifoname, 0622)) {  /* create well known fifo if does't exist */
 614         if (errno!=EEXIST) {
 615             perror("Cannot create well known fifo");
 616             exit(1);
 617         }
 618     }
 619     /* open fifo two times to avoid EOF */
 620     fifo_server = open(fifoname, O_RDONLY);
 621     if (fifo_server < 0) {
 622         perror("Cannot open read only well known fifo");
 623         exit(1);
 624     }
 625     if (open(fifoname, O_WRONLY) < 0) {
 626         perror("Cannot open write only well known fifo");
 627         exit(1);
 628     }
 629     /* Main body: loop over requests */
 630     while (1) {
 631         nread = read(fifo_server, line, 79);                 /* read request */
 632         if (nread < 0) {
 633             perror("Read Error");
 634             exit(1);
 635         }
 636         line[nread] = 0;                       /* terminate fifo name string */
 637         n = random() % i;                             /* select random value */
 638         fifo_client = open(line, O_WRONLY);              /* open client fifo */
 639         if (fifo_client < 0) {
 640             perror("Cannot open");
 641             exit(1);
 642         }
 643         nread = write(fifo_client,                           /* write phrase */
 644                       fortune[n], strlen(fortune[n])+1);
 645         close(fifo_client);                             /* close client fifo */
 646     }
 647 }
 648     \end{lstlisting}
 649   \end{minipage}
 650   \normalsize
 651   \caption{Sezione principale del codice del server di \textit{fortunes}
 652     basato sulle fifo.}
 653   \label{fig:ipc_fifo_server}
 654 \end{figure}
 655
 656 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
 657 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
 658 \var{fortune} avviene solo quando questa dimensione viene specificata, la
 659 presenza di un valore nullo provoca l'uscita dal programma attraverso la
 660 routine (non riportata) che ne stampa le modalità d'uso.  Dopo di che installa
 661 (\texttt{\small 13--15}) la funzione che gestisce i segnali di interruzione
 662 (anche questa non è riportata in \figref{fig:ipc_fifo_server}) che si limita a
 663 rimuovere dal filesystem la fifo usata dal server per comunicare.
 664
 665 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
 666 funzione \code{FortuneParse} che legge dal file specificato in
 667 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
 668 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
 669 Anche il codice della funzione non è riportato, in quanto non direttamente
 670 attinente allo scopo dell'esempio.
 671
 672 Il passo successivo (\texttt{\small 17--22}) è quello di creare con
 673 \func{mkfifo} la fifo nota sulla quale il server ascolterà le richieste,
 674 qualora si riscontri un errore il server uscirà (escludendo ovviamente il caso
 675 in cui la funzione \func{mkfifo} fallisce per la precedente esistenza della
 676 fifo).
 677
 678 Una volta che si è certi che la fifo di ascolto esiste si procede
 679 (\texttt{\small 23--32}) alla sua apertura. Questo viene fatto due volte
 680 per evitare di dover gestire all'interno del ciclo principale il caso in cui
 681 il server è in ascolto ma non ci sono client che effettuano richieste.
 682 Si ricordi infatti che quando una fifo è aperta solo dal capo in lettura,
 683 l'esecuzione di \func{read} ritorna con zero byte (si ha cioè una condizione
 684 di end-of-file).
 685
 686 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
 687 client non apre a sua volta la fifo nota in scrittura per effettuare la sua
 688 richiesta. Pertanto all'inizio non ci sono problemi, il client però, una volta
 689 ricevuta la risposta, uscirà, chiudendo tutti i file aperti, compresa la fifo.
 690 A questo punto il server resta (se non ci sono altri client che stanno
 691 effettuando richieste) con la fifo chiusa sul lato in lettura e a questo punto
 692 \func{read} non si bloccherà in attesa di input, ma ritornerà in continuazione
 693 restituendo un end-of-file.\footnote{Si è usata questa tecnica per
 694   compatibilità, Linux infatti supporta l'apertura delle fifo in
 695   lettura/scrittura, per cui si sarebbe potuto effettuare una singola apertura
 696   con \const{O\_RDWR}, la doppia apertura comunque ha il vantaggio che non si
 697   può scrivere per errore sul capo aperto in sola lettura.}
 698
 699 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
 700   24--28}),\footnote{di solito si effettua l'apertura del capo in lettura in
 701   modalità non bloccante, per evitare il rischio di uno stallo (se nessuno
 702   apre la fifo in scrittura il processo non ritornerà mai dalla \func{open})
 703   che nel nostro caso non esiste, mentre è necessario potersi bloccare in
 704   lettura in attesa di una richiesta.} si esegue una seconda apertura in
 705 scrittura (\texttt{\small 29--32}), scartando il relativo file descriptor che
 706 non sarà mai usato, ma lasciando la fifo comunque aperta anche in scrittura,
 707 cosicché le successive possano bloccarsi.
 708
 709 A questo punto si può entrare nel ciclo principale del programma che fornisce
 710 le risposte ai client (\texttt{\small 34--50}), che viene eseguito
 711 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
 712 modo da passare attraverso la routine di chiusura che cancella la fifo).
 713
 714 Il server è progettato per accettare come richieste dai client delle stringhe
 715 che contengono il nome della fifo sulla quale deve essere inviata la risposta.
 716 Per cui prima (\texttt{\small 35--39}) si esegue la lettura dalla stringa di
 717 richiesta dalla fifo nota (che a questo punto si bloccherà tutte le volte che
 718 non ci sono richieste). Dopo di che, una volta terminata la stringa
 719 (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero casuale per
 720 ricavare la frase da inviare, si procederà (\texttt{\small 42--46})
 721 all'apertura della fifo per la risposta, che \texttt{\small 47--48}) poi vi
 722 sarà scritta. Infine (\texttt{\small 49}) si chiude la fifo di risposta che
 723 non serve più.
 724
 725 Il codice del client è invece riportato in \figref{fig:ipc_fifo_client}, anche
 726 in questo caso si è omessa la gestione delle opzioni e la funzione che stampa
 727 a video le informazioni di utilizzo ed esce, riportando solo la sezione
 728 principale del programma e le definizioni delle variabili. Il codice completo
 729 è nel file \file{FortuneClient.c} dei sorgenti allegati.
 730
 731 \begin{figure}[!htb]
 732   \footnotesize \centering
 733   \begin{minipage}[c]{15cm}
 734     \begin{lstlisting}{}
 735 int main(int argc, char *argv[])
 736 {
 737 /* Variables definition */
 738     int n = 0;
 739     char *fortunefilename = "/tmp/fortune.fifo";
 740     char line[80];
 741     int fifo_server, fifo_client;
 742     char fifoname[80];
 743     int nread;
 744     char buffer[PIPE_BUF];
 745     ...
 746     snprintf(fifoname, 80, "/tmp/fortune.%d", getpid());     /* compose name */
 747     if (mkfifo(fifoname, 0622)) {                        /* open client fifo */
 748         if (errno!=EEXIST) {
 749             perror("Cannot create well known fifo");
 750             exit(-1);
 751         }
 752     }
 753     fifo_server = open(fortunefilename, O_WRONLY);       /* open server fifo */
 754     if (fifo_server < 0) {
 755         perror("Cannot open well known fifo");
 756         exit(-1);
 757     }
 758     nread = write(fifo_server, fifoname, strlen(fifoname)+1);  /* write name */
 759     close(fifo_server);                                 /* close server fifo */
 760     fifo_client = open(fifoname, O_RDONLY);              /* open client fifo */
 761     if (fifo_client < 0) {
 762         perror("Cannot open well known fifo");
 763         exit(-1);
 764     }
 765     nread = read(fifo_client, buffer, sizeof(buffer));        /* read answer */
 766     printf("%s", buffer);                                   /* print fortune */
 767     close(fifo_client);                                      /* close client */
 768     close(fifo_server);                                      /* close server */
 769     unlink(fifoname);                                  /* remove client fifo */
 770 }
 771     \end{lstlisting}
 772   \end{minipage}
 773   \normalsize
 774   \caption{Sezione principale del codice del client di \textit{fortunes}
 775     basato sulle fifo.}
 776   \label{fig:ipc_fifo_client}
 777 \end{figure}
 778
 779 La prima istruzione (\texttt{\small 12}) compone il nome della fifo che dovrà
 780 essere utilizzata per ricevere la risposta dal server.  Si usa il \acr{pid}
 781 del processo per essere sicuri di avere un nome univoco; dopo di che
 782 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
 783 in caso di errore (a meno che il file non sia già presente sul filesystem).
 784
 785 A questo punto il client può effettuare l'interrogazione del server, per
 786 questo prima si apre la fifo nota (\texttt{\small 19--23}), e poi ci si scrive
 787 (\texttt{\small 24}) la stringa composta in precedenza, che contiene il nome
 788 della fifo da utilizzare per la risposta. Infine si richiude la fifo del
 789 server che a questo punto non serve più (\texttt{\small 25}).
 790
 791 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
 792 si apre (\texttt{\small 26--30}) la fifo appena creata, da cui si deve
 793 riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
 794 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
 795 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
 796 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
 797 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
 798 fifo e si cancella (\texttt{\small 34}) il relativo file.
 799 Si noti come la fifo per la risposta sia stata aperta solo dopo aver inviato
 800 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
 801 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
 802 scrittura e l'apertura si sarebbe bloccata indefinitamente.
 803
 804 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
 805 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
 806   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
 807   per il server sapere se un client è andato in crash, con la possibilità di
 808   far restare le fifo temporanee sul filesystem, di come sia necessario
 809   intercettare \const{SIGPIPE} dato che un client può terminare dopo aver
 810   fatto una richiesta, ma prima che la risposta sia inviata (cosa che nel
 811   nostro esempio non è stata fatta).}; in generale infatti l'interfaccia delle
 812 fifo non è adatta a risolvere questo tipo di problemi, che possono essere
 813 affrontati in maniera più semplice ed efficace o usando i
 814 \textit{socket}\index{socket} (che tratteremo in dettaglio a partire da
 815 \capref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione diversi,
 816 come quelli che esamineremo in seguito.
 817
 818
 819
 820 \subsection{La funzione \func{socketpair}}
 821 \label{sec:ipc_socketpair}
 822
 823 Un meccanismo di comunicazione molto simile alle pipe, ma che non presenta il
 824 problema della unidirezionalità del flusso dei dati, è quello dei cosiddetti
 825 \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo l'argomento
 826 dei \textit{socket} in \capref{cha:socket_intro},\footnote{si tratta comunque
 827   di oggetti di comunicazione che, come le pipe, sono utilizzati attraverso
 828   dei file descriptor.} nell'ambito dell'interfaccia generale che essi
 829 forniscono per la programmazione di rete; e vedremo anche
 830 (in~\secref{sec:sock_sa_local}) come si possono definire dei file speciali (di
 831 tipo \textit{socket}, analoghi a quello associati alle fifo) cui si accede
 832 però attraverso quella medesima interfaccia; vale però la pena esaminare qui
 833 una modalità di uso dei socket locali\footnote{la funzione \func{socketpair} è
 834   stata introdotta in BSD4.4, ma è supportata in genere da qualunque sistema
 835   che fornisca l'interfaccia dei socket.} che li rende sostanzialmente
 836 identici ad una pipe bidirezionale.
 837
 838 La funzione \func{socketpair} infatti consente di creare una coppia di file
 839 descriptor connessi fra di loro (tramite un socket, appunto), senza dover
 840 ricorrere ad un file speciale sul filesystem, i descrittori sono del tutto
 841 analoghi a quelli che si avrebbero con una chiamata a \func{pipe}, con la sola
 842 differenza è che in questo caso il flusso dei dati può essere effettuato in
 843 entrambe le direzioni. Il prototipo della funzione è:
 844 \begin{functions}
 845   \headdecl{sys/types.h}
 846   \headdecl{sys/socket.h}
 847
 848   \funcdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
 849
 850   Crea una coppia di socket connessi fra loro.
 851
 852   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
 853     errore, nel qual caso \var{errno} assumerà uno dei valori:
 854   \begin{errlist}
 855   \item[\errcode{EAFNOSUPPORT}] I socket locali non sono supportati.
 856   \item[\errcode{EPROTONOSUPPORT}] Il protocollo specificato non è supportato.
 857   \item[\errcode{EOPNOTSUPP}] Il protocollo specificato non supporta la
 858   creazione di coppie di socket.
 859   \end{errlist}
 860   ed inoltre \errval{EMFILE},  \errval{EFAULT}.
 861 }
 862 \end{functions}
 863
 864 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
 865 loro: quello che si scrive su uno di essi sarà ripresentato in input
 866 sull'altro e viceversa. I parametri \param{domain}, \param{type} e
 867 \param{protocol} derivano dall'interfaccia dei socket (che è quella che
 868 fornisce il substrato per connettere i due descrittori), ma in questo caso i
 869 soli valori validi che possono essere specificati sono rispettivamente
 870 \const{AF\_UNIX}, \const{SOCK\_STREAM} e \var{0}.
 871
 872 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
 873 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei socket
 874 locali in generale) permette di trasmettere attraverso le linea non solo dei
 875 dati, ma anche dei file descriptor: si può cioè passare da un processo ad un
 876 altro un file descriptor, con una sorta di duplicazione dello stesso non
 877 all'interno di uno stesso processo, ma fra processi distinti (torneremo su
 878 questa funzionalità in \secref{sec:xxx_fd_passing}).
 879
 880
 881 \section{La comunicazione fra processi di System V}
 882 \label{sec:ipc_sysv}
 883
 884 Benché le pipe e le fifo siano ancora ampiamente usate, esse scontano il
 885 limite fondamentale che il meccanismo di comunicazione che forniscono è
 886 rigidamente sequenziale: una situazione in cui un processo scrive qualcosa che
 887 molti altri devono poter leggere non può essere implementata con una pipe.
 888
 889 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
 890 oggetti per la comunicazione fra processi ed una nuova interfaccia di
 891 programmazione, che fossero in grado di garantire una maggiore flessibilità.
 892 In questa sezione esamineremo come Linux supporta quello che viene chiamato il
 893 \textsl{Sistema di comunicazione inter-processo} di System V, cui da qui in
 894 avanti faremo riferimento come \textit{SysV IPC} (dove IPC è la sigla di
 895 \textit{Inter-Process Comunication}).
 896
 897
 898
 899 \subsection{Considerazioni generali}
 900 \label{sec:ipc_sysv_generic}
 901
 902 La principale caratteristica del \textit{SysV IPC} è quella di essere basato
 903 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
 904 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
 905 non vengono cancellati dal sistema una volta che non sono più in uso.
 906
 907 Questo comporta due problemi: il primo è che, al contrario di quanto avviene
 908 per pipe e fifo, la memoria allocata per questi oggetti non viene rilasciata
 909 automaticamente quando non c'è più nessuno che li utilizzi, ed essi devono
 910 essere cancellati esplicitamente, se non si vuole che restino attivi fino al
 911 riavvio del sistema. Il secondo problema è che, dato che non c'è, come per i
 912 file, un contatore del numero di riferimenti che ne indichi l'essere in uso,
 913 essi possono essere cancellati anche se ci sono dei processi che li stanno
 914 utilizzando, con tutte le conseguenze (negative) del caso.
 915
 916 Un'ulteriore caratteristica negativa è che gli oggetti usati nel \textit{SysV
 917   IPC} vengono creati direttamente dal kernel, e sono accessibili solo
 918 specificando il relativo \textsl{identificatore}. Questo è un numero
 919 progressivo (un po' come il \acr{pid} dei processi) che il kernel assegna a
 920 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
 921 torneremo in \secref{sec:ipc_sysv_id_use}). L'identificatore viene restituito
 922 dalle funzioni che creano l'oggetto, ed è quindi locale al processo che le ha
 923 eseguite. Dato che l'identificatore viene assegnato dinamicamente dal kernel
 924 non è possibile prevedere quale sarà, né utilizzare un qualche valore statico,
 925 si pone perciò il problema di come processi diversi possono accedere allo
 926 stesso oggetto.
 927
 928 Per risolvere il problema nella struttura \var{ipc\_perm} che il kernel
 929 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
 930 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
 931 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
 932 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
 933   si sposta il problema dell'accesso dalla classificazione in base
 934   all'identificatore alla classificazione in base alla chiave, una delle tante
 935   complicazioni inutili presenti nel \textit{SysV IPC}.} Oltre la chiave, la
 936 struttura, la cui definizione è riportata in \figref{fig:ipc_ipc_perm},
 937 mantiene varie proprietà ed informazioni associate all'oggetto.
 938
 939 \begin{figure}[!htb]
 940   \footnotesize \centering
 941   \begin{minipage}[c]{15cm}
 942     \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm ]{}
 943 struct ipc_perm
 944 {
 945     key_t key;                        /* Key.  */
 946     uid_t uid;                        /* Owner's user ID.  */
 947     gid_t gid;                        /* Owner's group ID.  */
 948     uid_t cuid;                       /* Creator's user ID.  */
 949     gid_t cgid;                       /* Creator's group ID.  */
 950     unsigned short int mode;          /* Read/write permission.  */
 951     unsigned short int seq;           /* Sequence number.  */
 952 };
 953     \end{lstlisting}
 954   \end{minipage}
 955   \normalsize
 956   \caption{La struttura \var{ipc\_perm}, come definita in \file{sys/ipc.h}.}
 957   \label{fig:ipc_ipc_perm}
 958 \end{figure}
 959
 960 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
 961 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
 962 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
 963 sono \textsl{parenti} la soluzione è relativamente semplice, in tal caso
 964 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
 965 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
 966 disponibile in tutti i figli, e potrà essere passato come parametro attraverso
 967 una \func{exec}.
 968
 969 Però quando i processi non sono \textsl{parenti} (come capita tutte le volte
 970 che si ha a che fare con un sistema client-server) tutto questo non è
 971 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
 972 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
 973 alternativa più efficace è quella che i programmi usino un valore comune per
 974 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
 975 sempre il rischio che questa chiave possa essere stata già utilizzata da
 976 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
 977 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione,
 978 \func{ftok}, che permette di ottenere una chiave specificando il nome di un
 979 file ed un numero di versione; il suo prototipo è:
 980 \begin{functions}
 981   \headdecl{sys/types.h}
 982   \headdecl{sys/ipc.h}
 983
 984   \funcdecl{key\_t ftok(const char *pathname, int proj\_id)}
 985
 986   Restituisce una chiave per identificare un oggetto del \textit{SysV IPC}.
 987
 988   \bodydesc{La funzione restituisce la chiave in caso di successo e -1
 989     altrimenti, nel qual caso \var{errno} sarà uno dei possibili codici di
 990     errore di \func{stat}.}
 991 \end{functions}
 992
 993 La funzione determina un valore della chiave sulla base di \param{pathname},
 994 che deve specificare il pathname di un file effettivamente esistente e di un
 995 numero di progetto \param{proj\_id)}, che di norma viene specificato come
 996 carattere, dato che ne vengono utilizzati solo gli 8 bit meno
 997 significativi.\footnote{nelle libc4 e libc5, come avviene in SunOS,
 998   l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, le \acr{glibc}
 999   usano il prototipo specificato da XPG4, ma vengono lo stesso utilizzati gli
1000   8 bit meno significativi.}
1001
1002 Il problema è che anche così non c'è la sicurezza che il valore della chiave
1003 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
1004 con i 16 bit meno significativi dell'inode del file \param{pathname} (che
1005 vengono ottenuti attraverso \func{stat}, da cui derivano i possibili errori),
1006 e gli 8 bit meno significativi del numero del dispositivo su cui è il file.
1007 Diventa perciò relativamente facile ottenere delle collisioni, specie se i
1008 file sono su dispositivi con lo stesso \textit{minor number}, come
1009 \file{/dev/hda1} e \file{/dev/sda1}.
1010
1011 In genere quello che si fa è utilizzare un file comune usato dai programmi che
1012 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
1013 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
1014 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
1015 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
1016 bene in fase di creazione, le cose possono complicarsi per i programmi che
1017 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
1018 attributi di \var{ipc\_perm}, non esiste una modalità semplice per essere
1019 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
1020 creato da chi ci si aspetta.
1021
1022 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
1023 contatore di riferimenti per la cancellazione automatica, il principale
1024 problema del \textit{SysV IPC}. Non esiste infatti una modalità chiara per
1025 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
1026 file, e tutta l'interfaccia è inutilmente complessa.  Per questo ne è stata
1027 effettuata una revisione completa nello standard POSIX.1b, che tratteremo in
1028 \secref{sec:ipc_posix}.
1029
1030
1031 \subsection{Il controllo di accesso}
1032 \label{sec:ipc_sysv_access_control}
1033
1034 Oltre alle chiavi, abbiamo visto che ad ogni oggetto sono associate in
1035 \var{ipc\_perm} ulteriori informazioni, come gli identificatori del creatore
1036 (nei campi \var{cuid} e \var{cgid}) e del proprietario (nei campi \var{uid} e
1037 \var{gid}) dello stesso, e un insieme di permessi (nel campo \var{mode}). In
1038 questo modo è possibile definire un controllo di accesso sugli oggetti di IPC,
1039 simile a quello che si ha per i file (vedi \secref{sec:file_perm_overview}).
1040
1041 Benché questo controllo di accesso sia molto simile a quello dei file, restano
1042 delle importanti differenze. La prima è che il permesso di esecuzione non
1043 esiste (e se specificato viene ignorato), per cui si può parlare solo di
1044 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
1045 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
1046 ed hanno lo stesso significato di quelli riportati in
1047 \secref{tab:file_mode_flags}\footnote{se però si vogliono usare le costanti
1048   simboliche ivi definite occorrerà includere il file \file{sys/stat.h},
1049   alcuni sistemi definiscono le costanti \const{MSG\_R} (\texttt{0400}) e
1050   \const{MSG\_W} (\texttt{0200}) per indicare i permessi base di lettura e
1051   scrittura per il proprietario, da utilizzare, con gli opportuni shift, pure
1052   per il gruppo e gli altri, in Linux, visto la loro scarsa utilità, queste
1053   costanti non sono definite.} e come per i file definiscono gli accessi per
1054 il proprietario, il suo gruppo e tutti gli altri.
1055
1056 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
1057 \var{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono settati
1058 rispettivamente al valore dell'userid e del groupid effettivo del processo che
1059 ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
1060 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
1061
1062 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
1063 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
1064 specificano tutte un argomento \param{flag}, in tal caso quando viene
1065 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
1066 permessi, questi vengono controllati e l'identificatore viene restituito solo
1067 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
1068 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
1069 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
1070 nullo, nel qual caso l'identificatore sarà restituito comunque.
1071
1072 Il secondo livello di controllo è quello delle varie funzioni che accedono
1073 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
1074 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
1075 \begin{itemize}
1076 \item se il processo ha i privilegi di amministratore l'accesso è sempre
1077   consentito.
1078 \item se l'userid effettivo del processo corrisponde o al valore del campo
1079   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
1080   in \var{mode} è appropriato\footnote{per appropriato si intende che è
1081     settato il permesso di scrittura per le operazioni di scrittura e quello
1082     di lettura per le operazioni di lettura.} l'accesso è consentito.
1083 \item se il groupid effettivo del processo corrisponde o al
1084   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
1085   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
1086 \item se il permesso per gli altri è appropriato l'accesso è consentito.
1087 \end{itemize}
1088 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
1089 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
1090 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
1091 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
1092 il valore di \var{umask} (si ricordi quanto esposto in
1093 \secref{sec:file_umask}) non ha alcun significato.
1094
1095
1096 \subsection{Gli identificatori ed il loro utilizzo}
1097 \label{sec:ipc_sysv_id_use}
1098
1099 L'unico campo di \var{ipc\_perm} del quale non abbiamo ancora parlato è
1100 \var{seq}, che in \figref{fig:ipc_ipc_perm} è qualificato con un criptico
1101 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
1102 strettamente attinente alle modalità con cui il kernel assegna gli
1103 identificatori degli oggetti del sistema di IPC.
1104
1105 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
1106 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
1107 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
1108 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
1109 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
1110 dimensioni (inferiori al numero massimo di oggetti disponibili).
1111
1112 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1113 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1114 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1115 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1116 relativo identificatore viene immediatamente assegnato a quelle di un altro
1117 server partito subito dopo, con la possibilità che i client del primo non
1118 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1119 con gli oggetti del secondo, con conseguenze imprevedibili.
1120
1121 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1122 \var{req} per provvedere un meccanismo che porti gli identificatori ad
1123 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1124 un identificatore può venire riutilizzato.
1125
1126 Il sistema dispone sempre di un numero fisso di oggetti di IPC,\footnote{fino
1127   al kernel 2.2.x questi valori, definiti dalle costanti \const{MSGMNI},
1128   \const{SEMMNI} e \const{SHMMNI}, potevano essere cambiati (come tutti gli
1129   altri limiti relativi al \textit{SysV IPC}) solo con una ricompilazione del
1130   kernel, andando a modificarne la definizione nei relativi header file.  A
1131   partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1132   scrivendo sui file \file{shmmni}, \file{msgmni} e \file{sem} di
1133   \file{/proc/sys/kernel} o con l'uso di \texttt{syscntl}.} e per ciascuno di
1134 essi viene mantenuto in \var{seq} un numero di sequenza progressivo che viene
1135 incrementato di uno ogni volta che l'oggetto viene cancellato. Quando
1136 l'oggetto viene creato usando uno spazio che era già stato utilizzato in
1137 precedenza per restituire l'identificatore al numero di oggetti presenti viene
1138 sommato il valore di \var{seq} moltiplicato per il numero massimo di oggetti
1139 di quel tipo,\footnote{questo vale fino ai kernel della serie 2.2.x, dalla
1140   serie 2.4.x viene usato lo stesso fattore per tutti gli oggetti, esso è dato
1141   dalla costante \const{IPCMNI}, definita in \file{include/linux/ipc.h}, che
1142   indica il limite massimo per il numero di tutti oggetti di IPC, ed il cui
1143   valore è 32768.}  si evita così il riutilizzo degli stessi numeri, e si fa
1144 sì che l'identificatore assuma tutti i valori possibili.
1145
1146 \begin{figure}[!htb]
1147   \footnotesize \centering
1148   \begin{minipage}[c]{15cm}
1149     \begin{lstlisting}{}
1150 int main(int argc, char *argv[])
1151 {
1152     ...
1153     switch (type) {
1154     case 'q':   /* Message Queue */
1155         debug("Message Queue Try\n");
1156         for (i=0; i<n; i++) {
1157             id = msgget(IPC_PRIVATE, IPC_CREAT|0666);
1158             printf("Identifier Value %d \n", id);
1159             msgctl(id, IPC_RMID, NULL);
1160         }
1161         break;
1162     case 's':   /* Semaphore */
1163         debug("Semaphore\n");
1164         for (i=0; i<n; i++) {
1165             id = semget(IPC_PRIVATE, 1, IPC_CREAT|0666);
1166             printf("Identifier Value %d \n", id);
1167             semctl(id, 0, IPC_RMID);
1168         }
1169         break;
1170     case 'm':   /* Shared Memory */
1171         debug("Shared Memory\n");
1172         for (i=0; i<n; i++) {
1173             id = shmget(IPC_PRIVATE, 1000, IPC_CREAT|0666);
1174             printf("Identifier Value %d \n", id);
1175             shmctl(id, IPC_RMID, NULL);
1176         }
1177         break;
1178     default:    /* should not reached */
1179         return -1;
1180     }
1181     return 0;
1182 }
1183     \end{lstlisting}
1184   \end{minipage}
1185   \normalsize
1186   \caption{Sezione principale del programma di test per l'assegnazione degli
1187     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1188   \label{fig:ipc_sysv_idtest}
1189 \end{figure}
1190
1191 In \figref{fig:ipc_sysv_idtest} è riportato il codice di un semplice programma
1192 di test che si limita a creare un oggetto (specificato a riga di comando),
1193 stamparne il numero di identificatore e cancellarlo per un numero specificato
1194 di volte. Al solito non si è riportato il codice della gestione delle opzioni
1195 a riga di comando, che permette di specificare quante volte effettuare il
1196 ciclo \var{n}, e su quale tipo di oggetto eseguirlo.
1197
1198 La figura non riporta il codice di selezione delle opzioni, che permette di
1199 inizializzare i valori delle variabili \var{type} al tipo di oggetto voluto, e
1200 \var{n} al numero di volte che si vuole effettuare il ciclo di creazione,
1201 stampa, cancellazione. I valori di default sono per l'uso delle code di
1202 messaggi e un ciclo di 5 volte. Se si lancia il comando si otterrà qualcosa
1203 del tipo:
1204 \begin{verbatim}
1205 piccardi@gont sources]$ ./ipctestid
1206 Identifier Value 0
1207 Identifier Value 32768
1208 Identifier Value 65536
1209 Identifier Value 98304
1210 Identifier Value 131072
1211 \end{verbatim}%$
1212 il che ci mostra che abbiamo un kernel della serie 2.4.x nel quale non avevamo
1213 ancora usato nessuna coda di messaggi. Se ripetiamo il comando otterremo
1214 ancora:
1215 \begin{verbatim}
1216 [piccardi@gont sources]$ ./ipctestid
1217 Identifier Value 163840
1218 Identifier Value 196608
1219 Identifier Value 229376
1220 Identifier Value 262144
1221 Identifier Value 294912
1222 \end{verbatim}%$
1223 che ci mostra come il valore di \var{seq} sia in effetti una quantità
1224 mantenuta staticamente all'interno del sistema.
1225
1226
1227 \subsection{Code di messaggi}
1228 \label{sec:ipc_sysv_mq}
1229
1230 Il primo oggetto introdotto dal \textit{SysV IPC} è quello delle code di
1231 messaggi.  Le code di messaggi sono oggetti analoghi alle pipe o alle fifo,
1232 anche se la loro struttura è diversa. La funzione che permette di ottenerne
1233 una è \func{msgget} ed il suo prototipo è:
1234 \begin{functions}
1235   \headdecl{sys/types.h}
1236   \headdecl{sys/ipc.h}
1237   \headdecl{sys/msg.h}
1238
1239   \funcdecl{int msgget(key\_t key, int flag)}
1240
1241   Restituisce l'identificatore di una coda di messaggi.
1242
1243   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1244     in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1245   \begin{errlist}
1246   \item[\errcode{EACCES}] Il processo chiamante non ha i privilegi per accedere
1247   alla coda richiesta.
1248   \item[\errcode{EEXIST}] Si è richiesta la creazione di una coda che già
1249   esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}.
1250   \item[\errcode{EIDRM}] La coda richiesta è marcata per essere cancellata.
1251   \item[\errcode{ENOENT}] Si è cercato di ottenere l'identificatore di una coda
1252     di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1253     non era specificato.
1254   \item[\errcode{ENOSPC}] Si è cercato di creare una coda di messaggi quando è
1255     stato superato il limite massimo di code (\const{MSGMNI}).
1256   \end{errlist}
1257   ed inoltre \errval{ENOMEM}.
1258 }
1259 \end{functions}
1260
1261 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1262 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1263 nuova. L'argomento \param{key} specifica la chiave che è associata
1264 all'oggetto, eccetto il caso in cui si specifichi il valore
1265 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1266 associata alcuna chiave, il processo (ed i suoi eventuali figli) potranno
1267 farvi riferimento solo attraverso l'identificatore.
1268
1269 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE}\footnote{in
1270   Linux questo significa un valore diverso da zero.} l'effetto della funzione
1271 dipende dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1272 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1273 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1274 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1275 validi.
1276
1277 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1278 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1279 corrispondente al valore \const{IPC\_CREAT}. In questo caso i nove bit meno
1280 significativi di \param{flag} saranno usati come permessi per il nuovo
1281 oggetto, secondo quanto illustrato in \secref{sec:ipc_sysv_access_control}.
1282 Se si imposta anche il bit corrispondente a \const{IPC\_EXCL} la funzione avrà
1283 successo solo se l'oggetto non esiste già, fallendo con un errore di
1284 \errcode{EEXIST} altrimenti.
1285
1286 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1287 processi di accedere alla coda (se hanno privilegi sufficienti) una volta che
1288 questi possano indovinare o ricavare (ad esempio per tentativi)
1289 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1290 IPC infatti non esiste una maniera che  garantisca l'accesso esclusivo ad una
1291 coda di messaggi.  Usare \const{IPC\_PRIVATE} o const{IPC\_CREAT} e
1292 \const{IPC\_EXCL} per \param{flag} comporta solo la creazione di una nuova
1293 coda.
1294
1295 \begin{table}[htb]
1296   \footnotesize
1297   \centering
1298   \begin{tabular}[c]{|c|r|l|l|}
1299     \hline
1300     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
1301     & \textbf{Significato} \\
1302     \hline
1303     \hline
1304     \const{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1305                                           messaggi. \\
1306     \const{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1307                                           messaggio.\\
1308     \const{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di
1309                                           una coda.\\
1310     \hline
1311   \end{tabular}
1312   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1313   \label{tab:ipc_msg_limits}
1314 \end{table}
1315
1316 Le code di messaggi sono caratterizzate da tre limiti fondamentali, definiti
1317 negli header e corrispondenti alle prime tre costanti riportate in
1318 \tabref{tab:ipc_msg_limits}, come accennato però in Linux è possibile
1319 modificare questi limiti attraverso l'uso di \func{syscntl} o scrivendo nei
1320 file \file{msgmax}, \file{msgmnb} e \file{msgmni} di \file{/proc/sys/kernel/}.
1321
1322
1323 \begin{figure}[htb]
1324   \centering \includegraphics[width=15cm]{img/mqstruct}
1325   \caption{Schema della struttura di una coda messaggi.}
1326   \label{fig:ipc_mq_schema}
1327 \end{figure}
1328
1329
1330 Una coda di messaggi è costituita da una \textit{linked list};\footnote{una
1331   \textit{linked list} è una tipica struttura di dati, organizzati in una
1332   lista in cui ciascun elemento contiene un puntatore al successivo. In questo
1333   modo la struttura è veloce nell'estrazione ed immissione dei dati dalle
1334   estremità dalla lista (basta aggiungere un elemento in testa o in coda ed
1335   aggiornare un puntatore), e relativamente veloce da attraversare in ordine
1336   sequenziale (seguendo i puntatori), è invece relativamente lenta
1337   nell'accesso casuale e nella ricerca.}  i nuovi messaggi vengono inseriti in
1338 coda alla lista e vengono letti dalla cima, in \figref{fig:ipc_mq_schema} si è
1339 riportato lo schema con cui queste strutture vengono mantenute dal
1340 kernel.\footnote{lo schema illustrato in \figref{fig:ipc_mq_schema} è in
1341   realtà una semplificazione di quello usato effettivamente fino ai kernel
1342   della serie 2.2.x, nei kernel della serie 2.4.x la gestione delle code di
1343   messaggi è stata modificata ed è effettuata in maniera diversa; abbiamo
1344   mantenuto lo schema precedente in quanto illustra comunque in maniera più
1345   che adeguata i principi di funzionamento delle code di messaggi.}
1346
1347 \begin{figure}[!htb]
1348   \footnotesize \centering
1349   \begin{minipage}[c]{15cm}
1350     \begin{lstlisting}[labelstep=0]{}
1351 struct msqid_ds {
1352     struct ipc_perm msg_perm;     /* structure for operation permission */
1353     time_t msg_stime;             /* time of last msgsnd command */
1354     time_t msg_rtime;             /* time of last msgrcv command */
1355     time_t msg_ctime;             /* time of last change */
1356     msgqnum_t msg_qnum;           /* number of messages currently on queue */
1357     msglen_t msg_qbytes;          /* max number of bytes allowed on queue */
1358     pid_t msg_lspid;              /* pid of last msgsnd() */
1359     pid_t msg_lrpid;              /* pid of last msgrcv() */
1360     struct msg *msg_first;        /* first message on queue, unused  */
1361     struct msg *msg_last;         /* last message in queue, unused */
1362     unsigned long int msg_cbytes; /* current number of bytes on queue */
1363 };
1364     \end{lstlisting}
1365   \end{minipage}
1366   \normalsize
1367   \caption{La struttura \var{msgid\_ds}, associata a ciascuna coda di
1368     messaggi.}
1369   \label{fig:ipc_msgid_ds}
1370 \end{figure}
1371
1372 A ciascuna coda è associata una struttura \var{msgid\_ds}, la cui definizione,
1373 è riportata in \secref{fig:ipc_msgid_ds}. In questa struttura il kernel
1374 mantiene le principali informazioni riguardo lo stato corrente della
1375 coda.\footnote{come accennato questo vale fino ai kernel della serie 2.2.x,
1376   essa viene usata nei kernel della serie 2.4.x solo per compatibilità in
1377   quanto è quella restituita dalle funzioni dell'interfaccia.  Si noti come ci
1378   sia una differenza con i campi mostrati nello schema di
1379   \figref{fig:ipc_mq_schema} che sono presi dalla definizione di
1380   \file{linux/msg.h}, e fanno riferimento alla definizione della omonima
1381   struttura usata nel kernel.} In \figref{fig:ipc_msgid_ds} sono elencati i
1382 campi significativi definiti in \file{sys/msg.h}, a cui si sono aggiunti gli
1383 ultimi tre campi che sono previsti dalla implementazione originale di System
1384 V, ma non dallo standard Unix98.
1385
1386 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1387 inizializzata, in particolare il campo \var{msg\_perm} viene inizializzato
1388 come illustrato in \secref{sec:ipc_sysv_access_control}, per quanto riguarda
1389 gli altri campi invece:
1390 \begin{itemize}
1391 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1392   sulla coda, viene inizializzato a 0.
1393 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1394   rispettivamente il \acr{pid} dell'ultimo processo che ha inviato o ricevuto
1395   un messaggio sulla coda, sono inizializzati a 0.
1396 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1397   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1398   messaggio sulla coda, sono inizializzati a 0.
1399 \item il campo \var{msg\_ctime}, che esprime il tempo di creazione della coda,
1400   viene inizializzato al tempo corrente.
1401 \item il campo \var{msg\_qbytes} che esprime la dimensione massima del
1402   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1403   del sistema (\const{MSGMNB}).
1404 \item i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1405   primo e ultimo messaggio sono inizializzati a \val{NULL} e
1406   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1407   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1408   e non devono essere utilizzati da programmi in user space).
1409 \end{itemize}
1410
1411 Una volta creata una coda di messaggi le operazioni di controllo vengono
1412 effettuate con la funzione \func{msgctl}, che (come le analoghe \func{semctl}
1413 e \func{shmctl}) fa le veci di quello che \func{ioctl} è per i file; il suo
1414 prototipo è:
1415 \begin{functions}
1416   \headdecl{sys/types.h}
1417   \headdecl{sys/ipc.h}
1418   \headdecl{sys/msg.h}
1419
1420   \funcdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1421
1422   Esegue l'operazione specificata da \param{cmd} sulla coda \param{msqid}.
1423
1424   \bodydesc{La funzione restituisce 0 in caso di successo o -1 in caso di
1425     errore, nel qual caso \var{errno} assumerà uno dei valori:
1426   \begin{errlist}
1427   \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma processo
1428     chiamante non ha i privilegi di lettura sulla coda.
1429   \item[\errcode{EIDRM}] La coda richiesta è stata cancellata.
1430   \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1431     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1432     \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1433     amministratore.
1434   \end{errlist}
1435   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1436 }
1437 \end{functions}
1438
1439 La funzione permette di accedere ai valori della struttura \var{msqid\_ds},
1440 mantenuta all'indirizzo \param{buf}, per la coda specificata
1441 dall'identificatore \param{msqid}. Il comportamento della funzione dipende dal
1442 valore dell'argomento \param{cmd}, che specifica il tipo di azione da
1443 eseguire; i valori possibili sono:
1444 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1445 \item[\const{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1446   struttura indicata da \param{buf}. Occorre avere il permesso di lettura
1447   sulla coda.
1448 \item[\const{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1449   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1450   riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1451   funzioni di di lettura o di scrittura sulla coda saranno svegliati ricevendo
1452   il medesimo errore. Questo comando può essere eseguito solo da un processo
1453   con userid effettivo corrispondente al creatore o al proprietario della
1454   coda, o all'amministratore.
1455 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1456   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1457   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1458   struttura \var{msqid\_ds} puntata da \param{buf}.  Per modificare i valori
1459   di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid} occorre
1460   essere il proprietario o il creatore della coda, oppure l'amministratore; lo
1461   stesso vale per \var{msg\_qbytes}, ma l'amministratore ha la facoltà di
1462   incrementarne il valore a limiti superiori a \const{MSGMNB}.
1463 \end{basedescript}
1464
1465
1466 Una volta che si abbia a disposizione l'identificatore, per inviare un
1467 messaggio su una coda si utilizza la funzione \func{msgsnd}; il suo prototipo
1468 è:
1469 \begin{functions}
1470   \headdecl{sys/types.h}
1471   \headdecl{sys/ipc.h}
1472   \headdecl{sys/msg.h}
1473
1474   \funcdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int
1475     msgflg)}
1476
1477   Invia un messaggio sulla coda \param{msqid}.
1478
1479   \bodydesc{La funzione restituisce 0, e -1 in caso di errore, nel qual caso
1480     \var{errno} assumerà uno dei valori:
1481   \begin{errlist}
1482   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1483   \item[\errcode{EIDRM}] La coda è stata cancellata.
1484   \item[\errcode{EAGAIN}] Il messaggio non può essere inviato perché si è
1485   superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1486   sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1487   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
1488   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido, o un
1489     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1490     maggiore di \const{MSGMAX}.
1491   \end{errlist}
1492   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}.
1493 }
1494 \end{functions}
1495
1496 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1497 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1498 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1499 puntatore ad una struttura \var{msgbuf} analoga a quella riportata in
1500 \figref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1501 messaggio.  La dimensione massima per il testo di un messaggio non può
1502 comunque superare il limite \const{MSGMAX}.
1503
1504 La struttura di \figref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1505 la definizione contenuta in \file{sys/msg.h} usa esplicitamente per il secondo
1506 campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini pratici.
1507 La sola cosa che conta è che la struttura abbia come primo membro un campo
1508 \var{mtype} come nell'esempio; esso infatti serve ad identificare il tipo di
1509 messaggio e deve essere sempre specificato come intero positivo di tipo
1510 \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1511 dimensione, e serve a contenere il testo del messaggio.
1512
1513 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1514 ridefinire una struttura simile a quella di \figref{fig:ipc_msbuf}, adattando
1515 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1516 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1517 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1518 indica il tipo.
1519
1520 Si tenga presente che la lunghezza che deve essere indicata in questo
1521 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1522 cioè \var{message} è una propria struttura che si passa alla funzione,
1523 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1524 consideriamo il caso dell'esempio in \figref{fig:ipc_msbuf}, \param{msgsz}
1525 dovrà essere pari a \const{LENGTH}).
1526
1527 \begin{figure}[!htb]
1528   \footnotesize \centering
1529   \begin{minipage}[c]{15cm}
1530     \begin{lstlisting}[labelstep=0]{}
1531     struct msgbuf {
1532          long mtype;          /* message type, must be > 0 */
1533          char mtext[LENGTH];  /* message data */
1534     };
1535     \end{lstlisting}
1536   \end{minipage}
1537   \normalsize
1538   \caption{Schema della struttura \var{msgbuf}, da utilizzare come argomento
1539     per inviare/ricevere messaggi.}
1540   \label{fig:ipc_msbuf}
1541 \end{figure}
1542
1543 Per capire meglio il funzionamento della funzione riprendiamo in
1544 considerazione la struttura della coda illustrata in
1545 \figref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1546 sarà aggiunto in fondo alla lista inserendo una nuova struttura \var{msg}, il
1547 puntatore \var{msg\_last} di \var{msqid\_ds} verrà aggiornato, come pure il
1548 puntatore al messaggio successivo per quello che era il precedente ultimo
1549 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1550 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1551 all'indirizzo specificato da \var{msg\_spot}.
1552
1553 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1554 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1555 ritorna immediatamente a meno che si sia ecceduto il valore di
1556 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1557 caso si blocca mandando il processo in stato di \textit{sleep}.  Se si
1558 specifica per \param{flag} il valore \const{IPC\_NOWAIT} la funzione opera in
1559 modalità non bloccante, ed in questi casi ritorna immediatamente con un errore
1560 di \errcode{EAGAIN}.
1561
1562 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1563 che non si liberano risorse sufficienti per poter inserire nella coda il
1564 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare, con
1565 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1566 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1567 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1568
1569 Una volta completato con successo l'invio del messaggio sulla coda, la
1570 funzione aggiorna i dati mantenuti in \var{msqid\_ds}, in particolare vengono
1571 modificati:
1572 \begin{itemize*}
1573 \item Il valore di \var{msg\_lspid}, che viene impostato al \acr{pid} del
1574   processo chiamante.
1575 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1576 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1577 \end{itemize*}
1578
1579 La funzione che viene utilizzata per estrarre un messaggio da una coda è
1580 \func{msgrcv}; il suo prototipo è:
1581 \begin{functions}
1582   \headdecl{sys/types.h}
1583   \headdecl{sys/ipc.h}
1584   \headdecl{sys/msg.h}
1585
1586   \funcdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1587     long msgtyp, int msgflg)}
1588
1589   Legge un messaggio dalla coda \param{msqid}.
1590
1591   \bodydesc{La funzione restituisce il numero di byte letti in caso di
1592     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà uno
1593     dei valori:
1594   \begin{errlist}
1595   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1596   \item[\errcode{EIDRM}] La coda è stata cancellata.
1597   \item[\errcode{E2BIG}] Il testo del messaggio è più lungo di \param{msgsz} e
1598     non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1599   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale mentre
1600     era in attesa di ricevere un messaggio.
1601   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido o un
1602     valore di \param{msgsz} negativo.
1603   \end{errlist}
1604   ed inoltre \errval{EFAULT}.
1605 }
1606 \end{functions}
1607
1608 La funzione legge un messaggio dalla coda specificata, scrivendolo sulla
1609 struttura puntata da \param{msgp}, che dovrà avere un formato analogo a quello
1610 di \figref{fig:ipc_msbuf}.  Una volta estratto, il messaggio sarà rimosso dalla
1611 coda.  L'argomento \param{msgsz} indica la lunghezza massima del testo del
1612 messaggio (equivalente al valore del parametro \const{LENGTH} nell'esempio di
1613 \figref{fig:ipc_msbuf}).
1614
1615 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1616 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1617 \const{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1618 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1619 un errore di \errcode{E2BIG}.
1620
1621 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1622 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1623 una scansione della struttura mostrata in \figref{fig:ipc_mq_schema},
1624 restituendo il primo messaggio incontrato che corrisponde ai criteri
1625 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1626 coda, è quello meno recente); in particolare:
1627 \begin{itemize*}
1628 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1629   quello fra i presenti che è stato inserito inserito per primo.
1630 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1631   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1632   \param{msgtyp}.
1633 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1634   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1635   inferiore al valore assoluto di \param{msgtyp}.
1636 \end{itemize*}
1637
1638 Il valore di \param{msgflg} permette di controllare il comportamento della
1639 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1640 valori.  Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1641 valori: \const{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1642 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1643 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1644 ci sono messaggi sulla coda.
1645
1646 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1647 disponibili per la lettura, è di bloccare il processo in stato di
1648 \textit{sleep}. Nel caso però si sia specificato \const{IPC\_NOWAIT} la
1649 funzione ritorna immediatamente con un errore \errcode{ENOMSG}. Altrimenti la
1650 funzione ritorna normalmente non appena viene inserito un messaggio del tipo
1651 desiderato, oppure ritorna con errore qualora la coda sia rimossa (con
1652 \var{errno} impostata a \errcode{EIDRM}) o se il processo viene interrotto da
1653 un segnale (con \var{errno} impostata a \errcode{EINTR}).
1654
1655 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1656 funzione aggiorna i dati mantenuti in \var{msqid\_ds}, in particolare vengono
1657 modificati:
1658 \begin{itemize*}
1659 \item Il valore di \var{msg\_lrpid}, che viene impostato al \acr{pid} del
1660   processo chiamante.
1661 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1662 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1663 \end{itemize*}
1664
1665 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1666 SysV IPC; essendo questi permanenti restano nel sistema occupando risorse
1667 anche quando un processo è terminato, al contrario delle pipe per le quali
1668 tutte le risorse occupate vengono rilasciate quanto l'ultimo processo che le
1669 utilizzava termina. Questo comporta che in caso di errori si può saturare il
1670 sistema, e che devono comunque essere esplicitamente previste delle funzioni
1671 di rimozione in caso di interruzioni o uscite dal programma (come vedremo in
1672 \figref{fig:ipc_mq_fortune_server}).
1673
1674 L'altro problema è non facendo uso di file descriptor le tecniche di
1675 \textit{I/O multiplexing} descritte in \secref{sec:file_multiplexing} non
1676 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1677 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1678 una di queste strutture alla volta; ad esempio non si può scrivere un server
1679 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1680 di \textit{polling}\index{polling} che esegua un ciclo di attesa su ciascuna
1681 di esse.
1682
1683 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1684 server di \textit{fortunes} usando queste al posto delle fifo. In questo caso
1685 useremo una sola coda di messaggi, usando il tipo di messaggio per comunicare
1686 in maniera indipendente con client diversi.
1687
1688 \begin{figure}[!bht]
1689   \footnotesize \centering
1690   \begin{minipage}[c]{15cm}
1691     \begin{lstlisting}{}
1692 int msgid;                                       /* Message queue identifier */
1693 int main(int argc, char *argv[])
1694 {
1695 /* Variables definition */
1696     int i, n = 0;
1697     char **fortune;                       /* array of fortune message string */
1698     char *fortunefilename;                              /* fortune file name */
1699     struct msgbuf_read {      /* message struct to read request from clients */
1700         long mtype;                               /* message type, must be 1 */
1701         long pid;             /* message data, must be the pid of the client */
1702     } msg_read;
1703     struct msgbuf_write {       /* message struct to write result to clients */
1704         long mtype;            /* message type, will be the pid of the client*/
1705         char mtext[MSGMAX];             /* message data, will be the fortune */
1706     } msg_write;
1707     key_t key;                                          /* Message queue key */
1708     int size;                                                /* message size */
1709     ...
1710     Signal(SIGTERM, HandSIGTERM);            /* set handlers for termination */
1711     Signal(SIGINT, HandSIGTERM);
1712     Signal(SIGQUIT, HandSIGTERM);
1713     if (n==0) usage();          /* if no pool depth exit printing usage info */
1714     i = FortuneParse(fortunefilename, fortune, n);          /* parse phrases */
1715     /* Create the queue */
1716     key = ftok("./MQFortuneServer.c", 1);
1717     msgid = msgget(key, IPC_CREAT|0666);
1718     if (msgid < 0) {
1719         perror("Cannot create message queue");
1720         exit(1);
1721     }
1722     /* Main body: loop over requests */
1723     while (1) {
1724         msgrcv(msgid, &msg_read, sizeof(int), 1, MSG_NOERROR);
1725         n = random() % i;                             /* select random value */
1726         strncpy(msg_write.mtext, fortune[n], MSGMAX);
1727         size = min(strlen(fortune[n])+1, MSGMAX);
1728         msg_write.mtype=msg_read.pid;             /* use request pid as type */
1729         msgsnd(msgid, &msg_write, size, 0);
1730     }
1731 }
1732 /*
1733  * Signal Handler to manage termination
1734  */
1735 void HandSIGTERM(int signo) {
1736     msgctl(msgid, IPC_RMID, NULL);                   /* remove message queue */
1737     exit(0);
1738 }
1739     \end{lstlisting}
1740   \end{minipage}
1741   \normalsize
1742   \caption{Sezione principale del codice del server di \textit{fortunes}
1743     basato sulle \textit{message queue}.}
1744   \label{fig:ipc_mq_fortune_server}
1745 \end{figure}
1746
1747 In \figref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1748 principali del codice del nuovo server (il codice completo è nel file
1749 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1750 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1751 per permettere una comunicazione indipendente fra il server ed i vari client,
1752 usando il \acr{pid} di questi ultimi come identificativo. Questo è possibile
1753 in quanto, al contrario di una fifo, la lettura di una coda di messaggi può
1754 non essere sequenziale, proprio grazie alla classificazione dei messaggi sulla
1755 base del loro tipo.
1756
1757 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1758 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1759 definisce due strutture appositamente per la comunicazione; con
1760 \var{msgbuf\_read} (\texttt{\small 8--11}) vengono passate le richieste mentre
1761 con \var{msgbuf\_write} (\texttt{\small 12--15}) vengono restituite le frasi.
1762
1763 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1764 in \var{n} il numero di frasi da leggere specificato a linea di comando ed in
1765 \var{fortunefilename} il file da cui leggerle; dopo aver installato
1766 (\texttt{\small 19--21}) dei manipolatori per gestire l'uscita dal server,
1767 viene prima controllato (\texttt{\small 22}) il numero di frasi richieste
1768 abbia senso (cioè sia maggiore di zero), le quali poi (\texttt{\small 23})
1769 vengono lette nel vettore in memoria con la stessa funzione
1770 \code{FortuneParse()} usata anche per il server basato sulle fifo.
1771
1772 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1773 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1774 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1775 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1776 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1777 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1778 programma (\texttt{\small 27--29}) in caso di errore.
1779
1780 Finita la fase di inizializzazione il server esegue in permanenza il ciclo
1781 principale (\texttt{\small 32--41}). Questo inizia (\texttt{\small 33}) con il
1782 porsi in attesa di un messaggio di richiesta da parte di un client; si noti
1783 infatti come \func{msgrcv} richieda un messaggio con \var{mtype} uguale a 1:
1784 questo è il valore usato per le richieste dato che corrisponde al \acr{pid} di
1785 \cmd{init}, che non può essere un client. L'uso del flag \const{MSG\_NOERROR}
1786 è solo per sicurezza, dato che i messaggi di richiesta sono di dimensione
1787 fissa (e contengono solo il \acr{pid} del client).
1788
1789 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1790 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1791 di richiesta da parte di un client, in tal caso il ciclo prosegue
1792 (\texttt{\small 34}) selezionando una frase a caso, copiandola (\texttt{\small
1793   35}) nella struttura \var{msgbuf\_write} usata per la risposta e
1794 calcolandone (\texttt{\small 36}) la dimensione.
1795
1796 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1797 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 37})
1798 al valore del \acr{pid} del client ricevuto nel messaggio di richiesta.
1799 L'ultimo passo del ciclo (\texttt{\small 38}) è inviare sulla coda il
1800 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1801 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1802
1803 Si noti che il programma può terminare solo grazie ad una interruzione da
1804 parte di un segnale; in tal caso verrà eseguito il manipolatore
1805 \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1806 (\texttt{\small 44}) ed ad uscire (\texttt{\small 45}).
1807
1808 \begin{figure}[!bht]
1809   \footnotesize \centering
1810   \begin{minipage}[c]{15cm}
1811     \begin{lstlisting}{}
1812 int main(int argc, char *argv[])
1813 {
1814     ...
1815     key = ftok("./MQFortuneServer.c", 1);
1816     msgid = msgget(key, 0);
1817     if (msgid < 0) {
1818         perror("Cannot find message queue");
1819         exit(1);
1820     }
1821     /* Main body: do request and write result */
1822     msg_read.mtype = 1;                      /* type for request is always 1 */
1823     msg_read.pid = getpid();                   /* use pid for communications */
1824     size = sizeof(msg_read.pid);
1825     msgsnd(msgid, &msg_read, size, 0);               /* send request message */
1826     msgrcv(msgid, &msg_write, MSGMAX, msg_read.pid, MSG_NOERROR);
1827     printf("%s", msg_write.mtext);
1828 }
1829     \end{lstlisting}
1830   \end{minipage}
1831   \normalsize
1832   \caption{Sezione principale del codice del client di \textit{fortunes}
1833     basato sulle \textit{message queue}.}
1834   \label{fig:ipc_mq_fortune_client}
1835 \end{figure}
1836
1837 In \figref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice del
1838 programma client.  Al solito il codice completo è con i sorgenti allegati, nel
1839 file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti relative
1840 alla gestione delle opzioni, ed in questo caso, anche la dichiarazione delle
1841 variabili, che, per la parte relative alle strutture usate per la
1842 comunicazione tramite le code, sono le stesse viste in
1843 \figref{fig:ipc_mq_fortune_server}.
1844
1845 Il client in questo caso è molto semplice; la prima parte del programma
1846 (\texttt{\small 4--9}) si occupa di accedere alla coda di messaggi, ed è
1847 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1848 non viene chiamata con il flag di creazione in quanto la coda deve essere
1849 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1850 il programma termina immediatamente.
1851
1852 Una volta acquisito l'identificatore della coda il client compone il
1853 messaggio di richiesta (\texttt{\small 12--13}) in \var{msg\_read}, usando 1
1854 per il tipo ed inserendo il proprio \acr{pid} come dato da passare al server.
1855 Calcolata (\texttt{\small 14}) la dimensione, provvede (\texttt{\small 15}) ad
1856 immettere la richiesta sulla coda.
1857
1858 A questo punto non resta che (\texttt{\small 16}) rileggere dalla coda la
1859 risposta del server richiedendo a \func{msgrcv} di selezionare i messaggi di
1860 tipo corrispondente al valore del \acr{pid} inviato nella richiesta. L'ultimo
1861 passo (\texttt{\small 17}) prima di uscire è quello di stampare a video il
1862 messaggio ricevuto.
1863
1864 Benché funzionante questa architettura risente dello stesso inconveniente
1865 visto anche nel caso del precedente server basato sulle fifo; se il client
1866 viene interrotto dopo l'invio del messaggio di richiesta e prima della lettura
1867 della risposta, quest'ultima resta nella coda (così come per le fifo si aveva
1868 il problema delle fifo che restavano nel filesystem). In questo caso però il
1869 problemi sono maggiori, sia perché è molto più facile esaurire la memoria
1870 dedicata ad una coda di messaggi che gli inode di un filesystem, sia perché,
1871 con il riutilizzo dei \acr{pid} da parte dei processi, un client eseguito in
1872 un momento successivo potrebbe ricevere un messaggio non indirizzato a
1873 lui.
1874
1875
1876
1877 \subsection{Semafori}
1878 \label{sec:ipc_sysv_sem}
1879
1880 I semafori non sono meccanismi di intercomunicazione diretta come quelli
1881 (pipe, fifo e code di messaggi) visti finora, e non consentono di scambiare
1882 dati fra processi, ma servono piuttosto come meccanismi di sincronizzazione o
1883 di protezione per le \textsl{sezioni critiche}\index{sezioni critiche} del
1884 codice (si ricordi quanto detto in \secref{sec:proc_race_cond}).
1885
1886 Un semaforo è uno speciale contatore, mantenuto nel kernel, che permette, a
1887 seconda del suo valore, di consentire o meno la prosecuzione dell'esecuzione
1888 di un programma. In questo modo l'accesso ad una risorsa condivisa da più
1889 processi può essere controllato, associando ad essa un semaforo che consente
1890 di assicurare che non più di un processo alla volta possa usarla.
1891
1892 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1893 assolutamente generico, così come del tutto generali sono modalità con cui lo
1894 si utilizza. Un processo che deve accedere ad una risorsa eseguirà un
1895 controllo del semaforo: se questo è positivo il suo valore sarà decrementato,
1896 indicando che si è consumato una unità della risorsa, ed il processo potrà
1897 proseguire nell'utilizzo di quest'ultima, provvedendo a rilasciarla, una volta
1898 completate le operazioni volute, reincrementando il semaforo.
1899
1900 Se al momento del controllo il valore del semaforo è nullo, siamo invece in
1901 una situazione in cui la risorsa non è disponibile, ed il processo si
1902 bloccherà in stato di \textit{sleep} fin quando chi la sta utilizzando non la
1903 rilascerà, incrementando il valore del semaforo. Non appena il semaforo torna
1904 positivo, indicando che la risorsa è disponibile, il processo sarà svegliato,
1905 e si potrà operare come nel caso precedente (decremento del semaforo, accesso
1906 alla risorsa, incremento del semaforo).
1907
1908 Per poter implementare questo tipo di logica le operazioni di controllo e
1909 decremento del contatore associato al semaforo devono essere atomiche,
1910 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1911 demandata al kernel. La forma più semplice di semaforo è quella del
1912 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1913 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1914 della risorsa; in generale però si possono usare semafori con valori interi,
1915 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1916 ancora disponibili.
1917
1918 Il sistema di comunicazione interprocesso di \textit{SysV IPC} prevede anche i
1919 semafori, ma gli oggetti utilizzati non sono semafori singoli, ma gruppi di
1920 semafori detti \textsl{insiemi} (o \textit{semaphore set}); la funzione che
1921 permette di creare o ottenere l'identificatore di un insieme di semafori è
1922 \func{semget}, ed il suo prototipo è:
1923 \begin{functions}
1924   \headdecl{sys/types.h}
1925   \headdecl{sys/ipc.h}
1926   \headdecl{sys/sem.h}
1927
1928   \funcdecl{int semget(key\_t key, int nsems, int flag)}
1929
1930   Restituisce l'identificatore di un insieme di semafori.
1931
1932   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1933     in caso di errore, nel qual caso \var{errno} assumerà i valori:
1934     \begin{errlist}
1935     \item[\errcode{ENOSPC}] Si è cercato di creare una insieme di semafori
1936       quando è stato superato o il limite per il numero totale di semafori
1937       (\const{SEMMNS}) o quello per il numero totale degli insiemi
1938       (\const{SEMMNI}) nel sistema.
1939     \item[\errcode{EINVAL}] L'argomento \param{nsems} è minore di zero o
1940       maggiore del limite sul numero di semafori per ciascun insieme
1941       (\const{SEMMSL}), o se l'insieme già esiste, maggiore del numero di
1942       semafori che contiene.
1943     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
1944       contenere le strutture per un nuovo insieme di semafori.
1945     \end{errlist}
1946     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
1947     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
1948 \end{functions}
1949
1950 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1951 restituisce l'identificatore di un insieme di semafori, in particolare è
1952 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1953 ripeteremo quanto detto al proposito in \secref{sec:ipc_sysv_mq}. L'argomento
1954 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1955 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1956 richiesta dell'identificatore di un insieme già esistente.
1957
1958 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1959 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1960 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1961 complicazione inutile, il problema è che i semafori del \textit{SysV IPC}
1962 soffrono di altri due, ben più gravi, difetti.
1963
1964 Il primo difetto è che non esiste una funzione che permetta di creare ed
1965 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1966 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1967 perde così ogni possibilità di eseguire l'operazione atomicamente.
1968
1969 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1970 \textit{SysV IPC} di essere risorse globali di sistema, che non vengono
1971 cancellate quando nessuno le usa più; ci si così a trova a dover affrontare
1972 esplicitamente il caso in cui un processo termina per un qualche errore,
1973 lasciando un semaforo occupato, che resterà tale fino al successivo riavvio
1974 del sistema. Come vedremo esistono delle modalità per evitare tutto ciò, ma
1975 diventa necessario indicare esplicitamente che si vuole il ripristino del
1976 semaforo all'uscita del processo.
1977
1978
1979 \begin{figure}[!htb]
1980   \footnotesize \centering
1981   \begin{minipage}[c]{15cm}
1982     \begin{lstlisting}[labelstep=0]{}
1983 struct semid_ds
1984 {
1985     struct ipc_perm sem_perm;           /* operation permission struct */
1986     time_t sem_otime;                   /* last semop() time */
1987     time_t sem_ctime;                   /* last time changed by semctl() */
1988     unsigned long int sem_nsems;        /* number of semaphores in set */
1989 };
1990     \end{lstlisting}
1991   \end{minipage}
1992   \normalsize
1993   \caption{La struttura \var{semid\_ds}, associata a ciascun insieme di
1994     semafori.}
1995   \label{fig:ipc_semid_ds}
1996 \end{figure}
1997
1998 A ciascun insieme di semafori è associata una struttura \var{semid\_ds},
1999 riportata in \figref{fig:ipc_semid_ds}.\footnote{non si sono riportati i campi
2000   ad uso interno del kernel, che vedremo in \figref{fig:ipc_sem_schema}, che
2001   dipendono dall'implementazione.} Come nel caso delle code di messaggi quando
2002 si crea un nuovo insieme di semafori con \func{semget} questa struttura viene
2003 inizializzata, in particolare il campo \var{sem\_perm} viene inizializzato
2004 come illustrato in \secref{sec:ipc_sysv_access_control} (si ricordi che in
2005 questo caso il permesso di scrittura è in realtà permesso di alterare il
2006 semaforo), per quanto riguarda gli altri campi invece:
2007 \begin{itemize*}
2008 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
2009   nell'insieme, viene inizializzato al valore di \param{nsems}.
2010 \item il campo \var{sem\_ctime}, che esprime il tempo di creazione
2011   dell'insieme, viene inizializzato al tempo corrente.
2012 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
2013   effettuata, viene inizializzato a zero.
2014 \end{itemize*}
2015
2016
2017 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
2018 \var{sem} che ne contiene i dati essenziali, la sua definizione\footnote{si è
2019   riportata la definizione originaria del kernel 1.0, che contiene la prima
2020   realizzazione del \textit{SysV IPC} in Linux. In realtà questa struttura
2021   ormai è ridotta ai soli due primi membri, e gli altri vengono calcolati
2022   dinamicamente. La si è utilizzata a scopo di esempio, perché indica tutti i
2023   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
2024   citati dalle pagine di manuale.} è riportata in \figref{fig:ipc_sem}. Questa
2025 struttura, non è accessibile in user space, ma i valori in essa specificati
2026 possono essere letti in maniera indiretta, attraverso l'uso delle funzioni di
2027 controllo.
2028
2029 \begin{figure}[!htb]
2030   \footnotesize \centering
2031   \begin{minipage}[c]{15cm}
2032     \begin{lstlisting}[labelstep=0]{}
2033 struct sem {
2034   short   sempid;         /* pid of last operation */
2035   ushort  semval;         /* current value */
2036   ushort  semncnt;        /* num procs awaiting increase in semval */
2037   ushort  semzcnt;        /* num procs awaiting semval = 0 */
2038 };
2039     \end{lstlisting}
2040   \end{minipage}
2041   \normalsize
2042   \caption{La struttura \var{sem}, che contiene i dati di un singolo semaforo.}
2043   \label{fig:ipc_sem}
2044 \end{figure}
2045
2046 I dati mantenuti nella struttura, ed elencati in \figref{fig:ipc_sem},
2047 indicano rispettivamente:
2048 \begin{description*}
2049 \item[\var{semval}] il valore numerico del semaforo.
2050 \item[\var{sempid}] il \acr{pid} dell'ultimo processo che ha eseguito una
2051   operazione sul semaforo.
2052 \item[\var{semncnt}] il numero di processi in attesa che esso venga
2053   incrementato.
2054 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
2055 \end{description*}
2056
2057 \begin{table}[htb]
2058   \footnotesize
2059   \centering
2060   \begin{tabular}[c]{|c|r|p{8cm}|}
2061     \hline
2062     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
2063     \hline
2064     \hline
2065     \const{SEMMNI}&          128 & Numero massimo di insiemi di semafori. \\
2066     \const{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
2067     \const{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
2068                                    nel sistema .\\
2069     \const{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
2070     \const{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
2071                                    \func{semop}. \\
2072     \const{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
2073     \const{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
2074     \const{SEMAEM}&\const{SEMVMX}& valore massimo per l'aggiustamento
2075                                    all'uscita. \\
2076     \hline
2077   \end{tabular}
2078   \caption{Valori delle costanti associate ai limiti degli insiemi di
2079     semafori, definite in \file{linux/sem.h}.}
2080   \label{tab:ipc_sem_limits}
2081 \end{table}
2082
2083 Come per le code di messaggi anche per gli insiemi di semafori esistono una
2084 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
2085 sono riportate in \tabref{tab:ipc_sem_limits}. Alcuni di questi limiti sono al
2086 solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
2087 direttamente nel file \file{/proc/sys/kernel/sem}.
2088
2089 La funzione che permette di effettuare le varie operazioni di controllo sui
2090 semafori (fra le quali, come accennato, è impropriamente compresa anche la
2091 loro inizializzazione) è \func{semctl}; il suo prototipo è:
2092 \begin{functions}
2093   \headdecl{sys/types.h}
2094   \headdecl{sys/ipc.h}
2095   \headdecl{sys/sem.h}
2096
2097   \funcdecl{int semctl(int semid, int semnum, int cmd)}
2098   \funcdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
2099
2100   Esegue le operazioni di controllo su un semaforo o un insieme di semafori.
2101
2102   \bodydesc{La funzione restituisce in caso di successo un valore positivo
2103     quanto usata con tre argomenti ed un valore nullo quando usata con
2104     quattro. In caso di errore restituisce -1, ed \var{errno} assumerà uno dei
2105     valori:
2106     \begin{errlist}
2107     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
2108       l'operazione richiesta.
2109     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
2110     \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
2111       ma il processo non ha privilegi sufficienti ad eseguire l'operazione.
2112     \item[\errcode{ERANGE}] Si è richiesto \const{SETALL} \const{SETVAL} ma il
2113       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
2114       di \const{SEMVMX}.
2115   \end{errlist}
2116   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2117 }
2118 \end{functions}
2119
2120 La funzione può avere tre o quattro parametri, a seconda dell'operazione
2121 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
2122 \param{semid} o sul singolo semaforo di un insieme, specificato da
2123 \param{semnum}.
2124
2125 \begin{figure}[!htb]
2126   \footnotesize \centering
2127   \begin{minipage}[c]{15cm}
2128     \begin{lstlisting}[labelstep=0]{}
2129 union semun {
2130       int val;                  /* value for SETVAL */
2131       struct semid_ds *buf;     /* buffer for IPC_STAT, IPC_SET */
2132       unsigned short *array;    /* array for GETALL, SETALL */
2133                                 /* Linux specific part: */
2134       struct seminfo *__buf;    /* buffer for IPC_INFO */
2135 };
2136     \end{lstlisting}
2137   \end{minipage}
2138   \normalsize
2139   \caption{La definizione dei possibili valori di una \var{union semun}, usata
2140     come quarto argomento della funzione \func{semctl}.}
2141   \label{fig:ipc_semun}
2142 \end{figure}
2143
2144 Qualora la funzione operi con quattro argomenti \param{arg} è
2145 un argomento generico, che conterrà un dato diverso a seconda dell'azione
2146 richiesta; per unificare l'argomento esso deve essere passato come una
2147 \var{union semun}, la cui definizione, con i possibili valori che può
2148 assumere, è riportata in \figref{fig:ipc_semun}.
2149
2150 Come già accennato sia il comportamento della funzione che il numero di
2151 parametri con cui deve essere invocata, dipendono dal valore dell'argomento
2152 \param{cmd}, che specifica l'azione da intraprendere; i valori validi (che
2153 cioè non causano un errore di \errcode{EINVAL}) per questo argomento sono i
2154 seguenti:
2155 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2156 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiando il
2157   contenuto della relativa struttura \var{semid\_ds} all'indirizzo specificato
2158   con \var{arg.buf}. Occorre avere il permesso di lettura. L'argomento
2159   \param{semnum} viene ignorato.
2160 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
2161   dati, con effetto immediato. Tutti i processi che erano stato di
2162   \textit{sleep} vengono svegliati, ritornando con un errore di
2163   \errcode{EIDRM}.  L'userid effettivo del processo deve corrispondere o al
2164   creatore o al proprietario dell'insieme, o all'amministratore. L'argomento
2165   \param{semnum} viene ignorato.
2166 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2167   dell'insieme. I valori devono essere passati in una struttura
2168   \var{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto i
2169   campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
2170   significativi di \var{sem\_perm.mode}. L'userid effettivo del processo deve
2171   corrispondere o al creatore o al proprietario dell'insieme, o
2172   all'amministratore.  L'argomento \param{semnum} viene ignorato.
2173 \item[\const{GETALL}] Restituisce il valore corrente di ciascun semaforo
2174   dell'insieme (corrispondente al campo \var{semval} di \var{sem}) nel vettore
2175   indicato da \param{arg.array}. Occorre avere il permesso di lettura.
2176   L'argomento \param{semnum} viene ignorato.
2177 \item[\const{GETNCNT}] Restituisce come valore di ritorno della funzione il
2178   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
2179   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
2180   \var{sem}); va invocata con tre argomenti.  Occorre avere il permesso di
2181   lettura.
2182 \item[\const{GETPID}] Restituisce come valore di ritorno della funzione il
2183   \acr{pid} dell'ultimo processo che ha compiuto una operazione sul semaforo
2184   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
2185   \var{sempid} di \var{sem}); va invocata con tre argomenti.  Occorre avere il
2186   permesso di lettura.
2187 \item[\const{GETVAL}] Restituisce come valore di ritorno della funzione il il
2188   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
2189   (corrispondente al campo \var{semval} di \var{sem}); va invocata con tre
2190   argomenti.  Occorre avere il permesso di lettura.
2191 \item[\const{GETZCNT}] Restituisce come valore di ritorno della funzione il
2192   numero di processi in attesa che il valore del semaforo \param{semnum}
2193   dell'insieme \param{semid} diventi nullo (corrispondente al campo
2194   \var{semncnt} di \var{sem}); va invocata con tre argomenti.  Occorre avere
2195   il permesso di lettura.
2196 \item[\const{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
2197   aggiornando il campo \var{sem\_ctime} di \var{semid\_ds}. I valori devono
2198   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
2199   privilegi di scrittura sul semaforo.  L'argomento \param{semnum} viene
2200   ignorato.
2201 \item[\const{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
2202   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
2203   \var{semid\_ds}.  Si devono avere i privilegi di scrittura sul semaforo.
2204 \end{basedescript}
2205
2206 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2207 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2208 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2209 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2210 tutti i semafori il cui valore viene modificato.
2211
2212 \begin{table}[htb]
2213   \footnotesize
2214   \centering
2215   \begin{tabular}[c]{|c|l|}
2216     \hline
2217     \textbf{Operazione}  & \textbf{Valore restituito} \\
2218     \hline
2219     \hline
2220     \const{GETNCNT}& valore di \var{semncnt}.\\
2221     \const{GETPID} & valore di \var{sempid}.\\
2222     \const{GETVAL} & valore di \var{semval}.\\
2223     \const{GETZCNT}& valore di \var{semzcnt}.\\
2224     \hline
2225   \end{tabular}
2226   \caption{Valori di ritorno della funzione \func{semctl}.}
2227   \label{tab:ipc_semctl_returns}
2228 \end{table}
2229
2230 Il valore di ritorno della funzione in caso di successo dipende
2231 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2232 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2233 \tabref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2234 corrispondente al campo della struttura \var{sem} indicato nella seconda
2235 colonna della tabella.
2236
2237 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2238 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2239 vengono effettuate con la funzione \func{semop}, il cui prototipo è:
2240 \begin{functions}
2241   \headdecl{sys/types.h}
2242   \headdecl{sys/ipc.h}
2243   \headdecl{sys/sem.h}
2244
2245   \funcdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2246
2247   Esegue le operazioni ordinarie su un semaforo o un insieme di semafori.
2248
2249   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2250     errore, nel qual caso \var{errno} assumerà uno dei valori:
2251     \begin{errlist}
2252     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
2253       l'operazione richiesta.
2254     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
2255     \item[\errcode{ENOMEM}] Si è richiesto un \const{SEM\_UNDO} ma il sistema
2256       non ha le risorse per allocare la struttura di ripristino.
2257     \item[\errcode{EAGAIN}] Un'operazione comporterebbe il blocco del processo,
2258       ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2259     \item[\errcode{EINTR}] La funzione, bloccata in attesa dell'esecuzione
2260       dell'operazione, viene interrotta da un segnale.
2261     \item[\errcode{E2BIG}] L'argomento \param{nsops} è maggiore del numero
2262       massimo di operazioni \const{SEMOPM}.
2263     \item[\errcode{ERANGE}] Per alcune operazioni il valore risultante del
2264       semaforo viene a superare il limite massimo \const{SEMVMX}.
2265   \end{errlist}
2266   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2267 }
2268 \end{functions}
2269
2270 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2271 un insieme. La funzione richiede come primo argomento l'identificatore
2272 \param{semid} dell'insieme su cui si vuole operare. Il numero di operazioni da
2273 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2274 contenuto viene passato con un puntatore ad un vettore di strutture
2275 \var{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2276 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante.
2277
2278 \begin{figure}[!htb]
2279   \footnotesize \centering
2280   \begin{minipage}[c]{15cm}
2281     \begin{lstlisting}[labelstep=0]{}
2282 struct sembuf
2283 {
2284   unsigned short int sem_num;   /* semaphore number */
2285   short int sem_op;             /* semaphore operation */
2286   short int sem_flg;            /* operation flag */
2287 };
2288     \end{lstlisting}
2289   \end{minipage}
2290   \normalsize
2291   \caption{La struttura \var{sembuf}, usata per le operazioni sui
2292     semafori.}
2293   \label{fig:ipc_sembuf}
2294 \end{figure}
2295
2296 Il contenuto di ciascuna operazione deve essere specificato attraverso una
2297 opportuna struttura \var{sembuf} (la cui definizione è riportata in
2298 \figref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2299 allocare in un opportuno vettore. La struttura permette di indicare il
2300 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2301 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2302 riferimento l'operazione; si ricordi che i semafori sono numerati come in un
2303 vettore, per cui il primo semaforo corrisponde ad un valore nullo di
2304 \var{sem\_num}.
2305
2306 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2307 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2308 \const{SEM\_UNDO}.  Impostando \const{IPC\_NOWAIT} si fa si che, invece di
2309 bloccarsi (in tutti quei casi in cui l'esecuzione di una operazione richiede
2310 che il processo vada in stato di \textit{sleep}), \func{semop} ritorni
2311 immediatamente con un errore di \errcode{EAGAIN}.  Impostando \const{SEM\_UNDO}
2312 si richiede invece che l'operazione venga registrata in modo che il valore del
2313 semaforo possa essere ripristinato all'uscita del processo.
2314
2315 Infine \var{sem\_op} è il campo che controlla l'operazione che viene eseguita
2316 e determina il comportamento della chiamata a \func{semop}; tre sono i casi
2317 possibili:
2318 \begin{basedescript}{\desclabelwidth{2.0cm}}
2319 \item[\var{sem\_op}$>0$] In questo caso il valore di \var{sem\_op} viene
2320   aggiunto al valore corrente di \var{semval}. La funzione ritorna
2321   immediatamente (con un errore di \errcode{ERANGE} qualora si sia superato il
2322   limite \const{SEMVMX}) ed il processo non viene bloccato in nessun caso.
2323   Specificando \const{SEM\_UNDO} si aggiorna il contatore per il ripristino
2324   del valore del semaforo. Al processo chiamante è richiesto il privilegio di
2325   alterazione (scrittura) sull'insieme di semafori.
2326
2327 \item[\var{sem\_op}$=0$] Nel caso \var{semval} sia zero l'esecuzione procede
2328   immediatamente. Se \var{semval} è diverso da zero il comportamento è
2329   controllato da \var{sem\_flg}, se è stato impostato \const{IPC\_NOWAIT} la
2330   funzione ritorna con un errore di \errcode{EAGAIN}, altrimenti viene
2331   incrementato \var{semzcnt} di uno ed il processo resta in stato di
2332   \textit{sleep} fintanto che non si ha una delle condizioni seguenti:
2333   \begin{itemize*}
2334   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2335     decrementato di uno.
2336   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2337     un errore di \errcode{EIDRM}.
2338   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2339     viene decrementato di uno e \func{semop} ritorna un errore di
2340     \errcode{EINTR}.
2341   \end{itemize*}
2342   Al processo chiamante è richiesto il privilegio di lettura dell'insieme dei
2343   semafori.
2344
2345 \item[\var{sem\_op}$<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2346   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2347   positiva o nulla) i valori vengono sommati e la funzione ritorna
2348   immediatamente; qualora si sia impostato \const{SEM\_UNDO} viene anche
2349   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2350   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2351   negativo) se si è impostato \const{IPC\_NOWAIT} la funzione ritorna con un
2352   errore di \errcode{EAGAIN}, altrimenti viene incrementato di uno
2353   \var{semncnt} ed il processo resta in stato di \textit{sleep} fintanto che
2354   non si ha una delle condizioni seguenti:
2355   \begin{itemize*}
2356   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2357     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2358     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2359     impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2360     ripristino del valore del semaforo.
2361   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2362     ritorna un errore di \errcode{EIDRM}.
2363   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2364     viene decrementato di uno e \func{semop} ritorna un errore di
2365     \errcode{EINTR}.
2366   \end{itemize*}
2367   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2368   sull'insieme di semafori.
2369 \end{basedescript}
2370
2371 In caso di successo della funzione viene aggiornato di \var{sempid} per ogni
2372 semaforo modificato al valore del \acr{pid} del processo chiamante; inoltre
2373 vengono pure aggiornati al tempo corrente i campi \var{sem\_otime} e
2374 \var{sem\_ctime}.
2375
2376 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2377 semafori possono restare occupati, abbiamo visto come \func{semop} permetta di
2378 attivare un meccanismo di ripristino attraverso l'uso del flag
2379 \const{SEM\_UNDO}. Il meccanismo è implementato tramite una apposita struttura
2380 \var{sem\_undo}, associata ad ogni processo per ciascun semaforo che esso ha
2381 modificato; all'uscita i semafori modificati vengono ripristinati, e le
2382 strutture disallocate.  Per mantenere coerente il comportamento queste
2383 strutture non vengono ereditate attraverso una \func{fork} (altrimenti si
2384 avrebbe un doppio ripristino), mentre passano inalterate nell'esecuzione di
2385 una \func{exec} (altrimenti non si avrebbe ripristino).
2386
2387 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2388 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2389 in maniera semplificata nello schema di \figref{fig:ipc_sem_schema}.  Si è
2390 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2391 semplice (ed illustrata in dettaglio in \cite{tlk}); nel kernel 2.4.x la
2392 struttura del \textit{SysV IPC} è stata modificata, ma le definizioni relative
2393 a queste strutture restano per compatibilità.\footnote{in particolare con le
2394   vecchie versioni delle librerie del C, come le libc5.}
2395
2396 \begin{figure}[htb]
2397   \centering \includegraphics[width=15cm]{img/semtruct}
2398   \caption{Schema della struttura di un insieme di semafori.}
2399   \label{fig:ipc_sem_schema}
2400 \end{figure}
2401
2402 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2403 \var{semid\_ds} ed il relativo vettore di strutture \var{sem}. Quando si
2404 richiede una operazione viene anzitutto verificato che tutte le operazioni
2405 possono avere successo; se una di esse comporta il blocco del processo il
2406 kernel crea una struttura \var{sem\_queue} che viene aggiunta in fondo alla
2407 coda di attesa associata a ciascun insieme di semafori\footnote{che viene
2408   referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last}
2409   di \var{semid\_ds}.}. Nella struttura viene memorizzato il riferimento alle
2410 operazioni richieste (nel campo \var{sops}, che è un puntatore ad una
2411 struttura \var{sembuf}) e al processo corrente (nel campo \var{sleeper}) poi
2412 quest'ultimo viene messo stato di attesa e viene invocato lo
2413 scheduler\index{scheduler} per passare all'esecuzione di un altro processo.
2414
2415 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2416 immediatamente, dopo di che il kernel esegue una scansione della coda di
2417 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2418 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2419 struttura \var{sem\_queue} viene rimossa e lo stato del processo associato
2420 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2421 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2422 svuotata la coda.
2423
2424 Per gestire il meccanismo del ripristino tutte le volte che per un'operazione
2425 si è specificato il flag \const{SEM\_UNDO} viene mantenuta per ciascun insieme
2426 di semafori una apposita struttura \var{sem\_undo} che contiene (nel vettore
2427 puntato dal campo \var{semadj}) un valore di aggiustamento per ogni semaforo
2428 cui viene sommato l'opposto del valore usato per l'operazione.
2429
2430 Queste strutture sono mantenute in due liste,\footnote{rispettivamente
2431   attraverso i due campi \var{id\_next} e \var{proc\_next}.} una associata
2432 all'insieme di cui fa parte il semaforo, che viene usata per invalidare le
2433 strutture se questo viene cancellato o per azzerarle se si è eseguita una
2434 operazione con \func{semctl}; l'altra associata al processo che ha eseguito
2435 l'operazione;\footnote{attraverso il campo \var{semundo} di
2436   \var{task\_struct}, come mostrato in \ref{fig:ipc_sem_schema}.} quando un
2437 processo termina, la lista ad esso associata viene scandita e le operazioni
2438 applicate al semaforo.
2439
2440 Siccome un processo può accumulare delle richieste di ripristino per semafori
2441 differenti chiamate attraverso diverse chiamate a \func{semop}, si pone il
2442 problema di come eseguire il ripristino dei semafori all'uscita del processo,
2443 ed in particolare se questo può essere fatto atomicamente. Il punto è cosa
2444 succede quando una delle operazioni previste per il ripristino non può essere
2445 eseguita immediatamente perché ad esempio il semaforo è occupato; in tal caso
2446 infatti, se si pone il processo in stato di \textit{sleep} aspettando la
2447 disponibilità del semaforo (come faceva l'implementazione originaria) si perde
2448 l'atomicità dell'operazione. La scelta fatta dal kernel è pertanto quella di
2449 effettuare subito le operazioni che non prevedono un blocco del processo e di
2450 ignorare silenziosamente le altre; questo però comporta il fatto che il
2451 ripristino non è comunque garantito in tutte le occasioni.
2452
2453 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2454 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2455 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2456 riportato in \figref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2457 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2458 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2459 nullo per segnalarne l'indisponibilità.
2460
2461 \begin{figure}[!bht]
2462   \footnotesize \centering
2463   \begin{minipage}[c]{15cm}
2464     \begin{lstlisting}{}
2465 /*
2466  * Function MutexCreate: create a mutex/semaphore
2467  */
2468 int MutexCreate(key_t ipc_key)
2469 {
2470     const union semun semunion={1};             /* semaphore union structure */
2471     int sem_id, ret;
2472     sem_id = semget(ipc_key, 1, IPC_CREAT|0666);         /* get semaphore ID */
2473     if (sem_id == -1) {                              /* if error return code */
2474         return sem_id;
2475     }
2476     ret = semctl(sem_id, 0, SETVAL, semunion);             /* init semaphore */
2477     if (ret == -1) {
2478         return ret;
2479     }
2480     return sem_id;
2481 }
2482 /*
2483  * Function MutexFind: get the semaphore/mutex Id given the IPC key value
2484  */
2485 int MutexFind(key_t ipc_key)
2486 {
2487     return semget(ipc_key,1,0);
2488 }
2489 /*
2490  * Function MutexRead: read the current value of the mutex/semaphore
2491  */
2492 int MutexRead(int sem_id)
2493 {
2494     return semctl(sem_id, 0, GETVAL);
2495 }
2496 /*
2497  * Define sembuf structures to lock and unlock the semaphore
2498  */
2499 struct sembuf sem_lock={                                /* to lock semaphore */
2500     0,                                   /* semaphore number (only one so 0) */
2501     -1,                                    /* operation (-1 to use resource) */
2502     SEM_UNDO};                                /* flag (set for undo at exit) */
2503 struct sembuf sem_ulock={                             /* to unlock semaphore */
2504     0,                                   /* semaphore number (only one so 0) */
2505     1,                                  /* operation (1 to release resource) */
2506     SEM_UNDO};                                      /* flag (in this case 0) */
2507 /*
2508  * Function MutexLock: to lock a mutex/semaphore
2509  */
2510 int MutexLock(int sem_id)
2511 {
2512     return semop(sem_id, &sem_lock, 1);
2513 }
2514 /*
2515  * Function MutexUnlock: to unlock a mutex/semaphore
2516  */
2517 int MutexUnlock(int sem_id)
2518 {
2519     return semop(sem_id, &sem_ulock, 1);
2520 }
2521     \end{lstlisting}
2522   \end{minipage}
2523   \normalsize
2524   \caption{Il codice delle funzioni che permettono di creare o recuperare
2525     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2526   \label{fig:ipc_mutex_create}
2527 \end{figure}
2528
2529 La prima funzione (\texttt{\small 1--17}) è \func{MutexCreate} che data una
2530 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2531 l'identificatore. Il primo passo (\texttt{\small 8}) è chiamare \func{semget}
2532 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2533 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2534 (\texttt{\small 9--11}) si ritorna subito il risultato di \func{semget},
2535 altrimenti (\texttt{\small 12}) si inizializza il semaforo chiamando
2536 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2537 \var{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 6}) ad 1
2538 per significare che risorsa è libera. In caso di errore (\texttt{\small
2539   13--16}) si restituisce il valore di ritorno di \func{semctl}, altrimenti si
2540 ritorna l'identificatore del semaforo.
2541
2542 La seconda funzione (\texttt{\small 18--24}) è \func{MutexFind}, che data una
2543 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2544 comprensione del suo funzionamento è immediata in quanto è solo un
2545 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2546   \textsl{involucro} alla chiamata di un altra, usata in genere per
2547   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2548   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2549   stesse funzionalità.} di \func{semget} per cercare l'identificatore
2550 associato alla chiave, restituendo direttamente il valore di ritorno della
2551 funzione.
2552
2553 La terza funzione (\texttt{\small 25--31}) è \func{MutexRead} che, dato
2554 l'identificatore, restituisce il valore del mutex. Anche in questo caso la
2555 funzione è un \textit{wrapper} per la chiamata di \func{semctl}, questa volta
2556 con il comando \const{GETVAL}, che permette di restituire il valore del
2557 semaforo.
2558
2559 La quarta e la quinta funzione (\texttt{\small 43--56}) sono \func{MutexLock},
2560 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2561 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2562 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2563 (\texttt{\small 32--42}). Si noti come per queste ultime si sia fatto uso
2564 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2565 caso di terminazione imprevista del processo.%%  Si noti infine come, essendo
2566 %% tutte le funzioni riportate in \figref{fig:ipc_mutex_create} estremamente
2567 %% semplici, se si sono definite tutte come \ctyp{inline}.\footnote{la direttiva
2568 %%   \func{inline} viene usata per dire al compilatore di non trattare la
2569 %%   funzione cui essa fa riferimento come una funzione, ma di inserire il codice
2570 %%   direttamente nel testo del programma.  Anche se i compilatori più moderni
2571 %%   sono in grado di effettuare da soli queste manipolazioni (impostando le
2572 %%   opportune ottimizzazioni) questa è una tecnica usata per migliorare le
2573 %%   prestazioni per le funzioni piccole ed usate di frequente, in tal caso
2574 %%   infatti le istruzioni per creare un nuovo frame nello stack per chiamare la
2575 %%   funzione costituirebbero una parte rilevante del codice, appesantendo
2576 %%   inutilmente il programma. Originariamente questa era fatto utilizzando delle
2577 %%   macro, ma queste hanno tutta una serie di problemi di sintassi nel passaggio
2578 %%   degli argomenti (si veda ad esempio \cite{PratC} che in questo modo possono
2579 %%   essere evitati.}
2580
2581
2582 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2583 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2584 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2585 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2586 incrementato di uno, sbloccandolo qualora fosse bloccato.  Si noti che occorre
2587 eseguire sempre prima \func{MutexLock} e poi \func{MutexUnlock}, perché se per
2588 un qualche errore si esegue più volte quest'ultima il valore del semaforo
2589 crescerebbe oltre 1, e \func{MutexLock} non avrebbe più l'effetto aspettato
2590 (bloccare la risorsa quando questa è considerata libera). Si tenga presente
2591 che usare \func{MutexRead} per controllare il valore dei mutex prima di
2592 proseguire non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2593 Vedremo in \secref{sec:ipc_posix_sem} come è possibile ottenere un'interfaccia
2594 analoga senza questo problemi usando il file locking.
2595
2596
2597
2598 \subsection{Memoria condivisa}
2599 \label{sec:ipc_sysv_shm}
2600
2601 Il terzo oggetto introdotto dal \textit{SysV IPC} è quello dei segmenti di
2602 memoria condivisa. La funzione che permette di ottenerne uno è \func{shmget},
2603 ed il suo prototipo è:
2604 \begin{functions}
2605   \headdecl{sys/types.h}
2606   \headdecl{sys/ipc.h}
2607   \headdecl{sys/shm.h}
2608
2609   \funcdecl{int shmget(key\_t key, int size, int flag)}
2610
2611   Restituisce l'identificatore di una memoria condivisa.
2612
2613   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
2614     in caso di errore, nel qual caso \var{errno} assumerà i valori:
2615     \begin{errlist}
2616     \item[\errcode{ENOSPC}] Si è superato il limite (\const{SHMMNI}) sul numero
2617       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2618       cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2619       la memoria ad essi riservata.
2620     \item[\errcode{EINVAL}] Si è richiesta una dimensione per un nuovo segmento
2621       maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2622       già esiste \param{size} è maggiore delle sue dimensioni.
2623     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
2624       contenere le strutture per un nuovo segmento di memoria condivisa.
2625     \end{errlist}
2626     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2627     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2628 \end{functions}
2629
2630 La funzione, come \func{semget}, è del tutto analoga a \func{msgget}, ed
2631 identico è l'uso degli argomenti \param{key} e \param{flag} per cui non
2632 ripeteremo quanto detto al proposito in \secref{sec:ipc_sysv_mq}. L'argomento
2633 \param{size} specifica invece la dimensione, in byte, del segmento, che viene
2634 comunque arrotondata al multiplo superiore di \const{PAGE\_SIZE}.
2635
2636 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2637 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2638 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2639 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2640 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2641 dati in memoria.
2642
2643 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2644 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2645 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2646 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2647 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2648 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2649 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2650 altro processo. Per questo in genere la memoria condivisa viene sempre
2651 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2652 norma, significa insieme a dei semafori.
2653
2654 \begin{figure}[!htb]
2655   \footnotesize \centering
2656   \begin{minipage}[c]{15cm}
2657     \begin{lstlisting}[labelstep=0]{}
2658 struct shmid_ds {
2659      struct    ipc_perm shm_perm;  /* operation perms */
2660      int  shm_segsz;               /* size of segment (bytes) */
2661      time_t    shm_atime;          /* last attach time */
2662      time_t    shm_dtime;          /* last detach time */
2663      time_t    shm_ctime;          /* last change time */
2664      unsigned short shm_cpid;      /* pid of creator */
2665      unsigned short shm_lpid;      /* pid of last operator */
2666      short     shm_nattch;         /* no. of current attaches */
2667 };
2668     \end{lstlisting}
2669   \end{minipage}
2670   \normalsize
2671   \caption{La struttura \var{shmid\_ds}, associata a ciascun segmento di
2672     memoria condivisa.}
2673   \label{fig:ipc_shmid_ds}
2674 \end{figure}
2675
2676 A ciascun segmento di memoria condivisa è associata una struttura
2677 \var{shmid\_ds}, riportata in \figref{fig:ipc_shmid_ds}.  Come nel caso delle
2678 code di messaggi quando si crea un nuovo segmento di memoria condivisa con
2679 \func{shmget} questa struttura viene inizializzata, in particolare il campo
2680 \var{shm\_perm} viene inizializzato come illustrato in
2681 \secref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2682 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2683 invece:
2684 \begin{itemize*}
2685 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2686   inizializzato al valore di \param{size}.
2687 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2688   segmento, viene inizializzato al tempo corrente.
2689 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2690   rispettivamente il tempo dell'ultima volta che il segmento è stato
2691   agganciato o sganciato da un processo, vengono inizializzati a zero.
2692 \item il campo \var{shm\_lpid}, che esprime il \acr{pid} del processo che ha
2693   eseguito l'ultima operazione, viene inizializzato a zero.
2694 \item il campo \var{shm\_cpid}, che esprime il \acr{pid} del processo che ha
2695   creato il segmento, viene inizializzato al \acr{pid} del processo chiamante.
2696 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2697   al segmento viene inizializzato a zero.
2698 \end{itemize*}
2699
2700 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2701 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2702 di questi limiti sono al solito accessibili e modificabili attraverso
2703 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2704 \file{/proc/sys/kernel/}. In \tabref{tab:ipc_shm_limits} si sono riportate le
2705 costanti simboliche associate a ciascuno di essi, il loro significato, i
2706 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2707 che permettono di cambiarne il valore.
2708
2709
2710 \begin{table}[htb]
2711   \footnotesize
2712   \centering
2713   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2714     \hline
2715     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2716     & \textbf{Significato} \\
2717     \hline
2718     \hline
2719     \const{SHMALL}& 0x200000&\file{shmall}& Numero massimo di pagine che
2720                                        possono essere usate per i segmenti di
2721                                        memoria condivisa. \\
2722     \const{SHMMAX}&0x2000000&\file{shmmax}& Dimensione massima di un segmento
2723                                             di memoria condivisa.\\
2724     \const{SHMMNI}&     4096&\file{msgmni}& Numero massimo di segmenti di
2725                                             memoria condivisa presenti nel
2726                                             kernel.\\
2727     \const{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2728                                             memoria condivisa. \\
2729     \const{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2730                                             minime di un segmento (deve essere
2731                                             allineato alle dimensioni di una
2732                                             pagina di memoria). \\
2733     \const{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2734                                             memoria condivisa
2735                                             per ciascun processo.\\
2736
2737
2738     \hline
2739   \end{tabular}
2740   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2741     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2742     valore preimpostato presente nel sistema.}
2743   \label{tab:ipc_shm_limits}
2744 \end{table}
2745
2746 Al solito la funzione che permette di effettuare le operazioni di controllo su
2747 un segmento di memoria condivisa è \func{shmctl}; il suo prototipo è:
2748 \begin{functions}
2749   \headdecl{sys/ipc.h}
2750   \headdecl{sys/shm.h}
2751
2752   \funcdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2753
2754   Esegue le operazioni di controllo su un segmento di memoria condivisa.
2755
2756   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2757     errore, nel qual caso \var{errno} assumerà i valori:
2758     \begin{errlist}
2759     \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma i permessi non
2760       consentono l'accesso in lettura al segmento.
2761     \item[\errcode{EINVAL}] O \param{shmid} o \param{cmd} hanno valori non
2762       validi.
2763     \item[\errcode{EIDRM}] L'argomento \param{shmid} fa riferimento ad un
2764       segmento che è stato cancellato.
2765     \item[\errcode{EPERM}] Si è specificato un comando con \const{IPC\_SET} o
2766       \const{IPC\_RMID} senza i permessi necessari.
2767     \item[\errcode{EOVERFLOW}] L'argomento \param{shmid} fa riferimento ad un
2768       segmento che è stato cancellato.
2769     \end{errlist}
2770   ed inoltre \errval{EFAULT}.}
2771 \end{functions}
2772
2773 Il comportamento della funzione dipende dal valore del comando passato
2774 attraverso l'argomento \param{cmd}, i valori possibili sono i seguenti:
2775 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2776 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2777   condivisa nella struttura \var{shmid\_ds} puntata da \param{buf}. Occorre
2778   avere il permesso di lettura sulla coda.
2779 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2780   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2781   processo ad esso agganciato si sarà staccato. Questo comando può essere
2782   eseguito solo da un processo con userid effettivo corrispondente o al
2783   creatore della coda, o al proprietario della coda, o all'amministratore.
2784 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2785   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2786   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2787   il creatore della coda, oppure l'amministratore. Compiuta l'operazione
2788   aggiorna anche il valore del campo \var{shm\_ctime}.
2789 \item[\const{SHM\_LOCK}] Abilita il \textit{memory locking}\index{memory
2790     locking}\footnote{impedisce cioè che la memoria usata per il segmento
2791     venga salvata su disco dal meccanismo della memoria virtuale; si ricordi
2792     quanto trattato in \secref{sec:proc_mem_lock}.} sul segmento di memoria
2793   condivisa. Solo l'amministratore può utilizzare questo comando.
2794 \item[\const{SHM\_UNLOCK}] Disabilita il \textit{memory locking} sul segmento
2795   di memoria condivisa. Solo l'amministratore può utilizzare questo comando.
2796 \end{basedescript}
2797 i primi tre comandi sono gli stessi già visti anche per le code ed i semafori,
2798 gli ultimi due sono delle estensioni previste da Linux.
2799
2800 Per utilizzare i segmenti di memoria condivisa l'interfaccia prevede due
2801 funzioni, la prima è \func{shmat}, che serve ad agganciare un segmento al
2802 processo chiamante, in modo che quest'ultimo possa vederlo nel suo spazio di
2803 indirizzi; il suo prototipo è:
2804 \begin{functions}
2805   \headdecl{sys/types.h}
2806   \headdecl{sys/shm.h}
2807
2808   \funcdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2809   Aggancia al processo un segmento di memoria condivisa.
2810
2811   \bodydesc{La funzione restituisce l'indirizzo del segmento in caso di
2812     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà i
2813     valori:
2814     \begin{errlist}
2815     \item[\errcode{EACCES}] Il processo non ha i privilegi per accedere al
2816       segmento nella modalità richiesta.
2817     \item[\errcode{EINVAL}] Si è specificato un identificatore invalido per
2818       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2819       per \param{shmaddr}.
2820     \end{errlist}
2821     ed inoltre \errval{ENOMEM}.}
2822 \end{functions}
2823
2824 La funzione inserisce un segmento di memoria condivisa all'interno dello
2825 spazio di indirizzi del processo, in modo che questo possa accedervi
2826 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2827 \figref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2828 ricordi quanto illustrato al proposito in \secref{sec:proc_mem_layout}). In
2829 particolare l'indirizzo finale del segmento dati (quello impostato da
2830 \func{brk}, vedi \secref{sec:proc_mem_sbrk}) non viene influenzato. Si tenga
2831 presente infine che la funzione ha successo anche se il segmento è stato
2832 marcato per la cancellazione.
2833
2834 \begin{figure}[htb]
2835   \centering
2836   \includegraphics[height=10cm]{img/sh_memory_layout}
2837   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2838     agganciato un segmento di memoria condivisa.}
2839   \label{fig:ipc_shmem_layout}
2840 \end{figure}
2841
2842 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{Lo standard
2843   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2844   come il valore di ritorno della funzione. In Linux è stato così con le
2845   \acr{libc4} e le \acr{libc5}, con il passaggio alle \acr{glibc} il tipo di
2846   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2847   ritorno un \ctyp{void *}.} deve essere associato il segmento, se il valore
2848 specificato è \val{NULL} è il sistema a scegliere opportunamente un'area di
2849 memoria libera (questo è il modo più portabile e sicuro di usare la funzione).
2850 Altrimenti il kernel aggancia il segmento all'indirizzo specificato da
2851 \param{shmaddr}; questo però può avvenire solo se l'indirizzo coincide con il
2852 limite di una pagina, cioè se è un multiplo esatto del parametro di sistema
2853 \const{SHMLBA}, che in Linux è sempre uguale \const{PAGE\_SIZE}.
2854
2855 Si tenga presente però che quando si usa \val{NULL} come valore di
2856 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2857 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2858 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2859 riferiti all'indirizzo di partenza del segmento).
2860
2861 L'argomento \param{shmflg} permette di cambiare il comportamento della
2862 funzione; esso va specificato come maschera binaria, i bit utilizzati sono
2863 solo due e sono identificati dalle costanti \const{SHM\_RND} e
2864 \const{SHM\_RDONLY}, che vanno combinate con un OR aritmetico.  Specificando
2865 \const{SHM\_RND} si evita che \func{shmat} ritorni un errore quando
2866 \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi usare
2867 un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2868 agganciato, ma al più vicino multiplo di \const{SHMLBA} (il nome della
2869 costante sta infatti per \textit{rounded}, e serve per specificare un
2870 indirizzo come arrotondamento, in Linux è equivalente a \const{PAGE\_SIZE}).
2871
2872 L'uso di \const{SHM\_RDONLY} permette di agganciare il segmento in sola
2873 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2874 caso un tentativo di scrivere sul segmento comporterà una violazione di
2875 accesso con l'emissione di un segnale di \const{SIGSEGV}. Il comportamento
2876 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2877 lettura e scrittura (ed il processo deve aver questi permessi in
2878 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2879 sola scrittura.
2880
2881 In caso di successo la funzione aggiorna anche i seguenti campi di
2882 \var{shmid\_ds}:
2883 \begin{itemize*}
2884 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2885   impostato al tempo corrente.
2886 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2887   segmento viene impostato a quello del processo corrente.
2888 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2889   aumentato di uno.
2890 \end{itemize*}
2891
2892 Come accennato in \secref{sec:proc_fork} un segmento di memoria condivisa
2893 agganciato ad un processo viene ereditato da un figlio attraverso una
2894 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2895 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2896 eseguito un diverso programma con uno spazio di indirizzi completamente
2897 diverso, tutti i segmenti agganciati al processo originario vengono
2898 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2899 attraverso una \func{exit}.
2900
2901 Una volta che un segmento di memoria condivisa non serve più, si può
2902 sganciarlo esplicitamente dal processo usando l'altra funzione
2903 dell'interfaccia, \func{shmdt}, il cui prototipo è:
2904 \begin{functions}
2905   \headdecl{sys/types.h}
2906   \headdecl{sys/shm.h}
2907
2908   \funcdecl{int shmdt(const void *shmaddr)}
2909   Sgancia dal processo un segmento di memoria condivisa.
2910
2911   \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
2912     errore, la funzione fallisce solo quando non c'è un segmento agganciato
2913     all'indirizzo \func{shmaddr}, con \var{errno} che assume il valore
2914     \errval{EINVAL}.}
2915 \end{functions}
2916
2917 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2918 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2919 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2920 agganciato al processo.
2921
2922 In caso di successo la funzione aggiorna anche i seguenti campi di
2923 \var{shmid\_ds}:
2924 \begin{itemize*}
2925 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2926   impostato al tempo corrente.
2927 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2928   segmento viene impostato a quello del processo corrente.
2929 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2930   decrementato di uno.
2931 \end{itemize*}
2932 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2933 viene tolta dallo spazio di indirizzi del processo.
2934
2935
2936 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
2937 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
2938 %% condivisa; uno schema semplificato della struttura è illustrato in
2939 %% \figref{fig:ipc_shm_struct}.
2940
2941 %% \begin{figure}[htb]
2942 %%   \centering
2943 %%   \includegraphics[width=10cm]{img/shmstruct}
2944 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
2945 %%     Linux.}
2946 %%   \label{fig:ipc_shm_struct}
2947 %% \end{figure}
2948
2949
2950
2951
2952 \section{Tecniche alternative}
2953 \label{sec:ipc_alternatives}
2954
2955 Come abbiamo detto in \secref{sec:ipc_sysv_generic}, e ripreso nella
2956 descrizione dei signoli oggetti che ne fan parte, il \textit{SysV IPC}
2957 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
2958   capitolo 14.}  Stevens ne eeffettua una accurata analisi (alcuni dei
2959 concetti sono già stati accennati in precedenza) ed elenca alcune possibili
2960 tecniche alternative, che vogliamo riprendere in questa sezione.
2961
2962
2963 \subsection{Alternative alle code di messaggi}
2964 \label{sec:ipc_mq_alternative}
2965
2966 Le code di messaggi sono probabilmente il meno usato degli oggetti del
2967 \textit{SysV IPC}; esse infatti nacquero principalmente come meccanismo di
2968 comunicazione bidirezionale quando ancora le pipe erano unidirezionali; con la
2969 disponibilità di \func{socketpair} (vedi \secref{sec:ipc_socketpair}) si può
2970 ottenere lo stesso risultato senza incorrere nelle complicazioni introdotte
2971 dal \textit{SysV IPC}.
2972
2973 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
2974 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
2975 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
2976 sono impossibili da ottenere con le pipe e i socket di \func{socketpair}.  A
2977 queste esigenze però si può comunque ovviare in maniera diversa con un uso
2978 combinato della memoria condivisa e dei meccanismi di sincronizzazione, per
2979 cui alla fine l'uso delle code di messaggi classiche è poco diffuso.
2980
2981
2982
2983 \subsection{I \textsl{file di lock}}
2984 \label{sec:ipc_file_lock}
2985
2986 Come illustrato in \secref{sec:ipc_sysv_sem} i semafori del \textit{SysV IPC}
2987 presentano una interfaccia inutilmente complessa e con alcuni difetti
2988 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
2989 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
2990 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
2991 necessità di un contatore come i semafori, si possono utilizzare metodi
2992 alternativi.
2993
2994 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
2995 dei \textsl{file di lock}\index{file di lock} (per i quali esiste anche una
2996 opportuna directory, \file{/var/lock}, nel filesystem standard). Per questo si
2997 usa la caratteristica della funzione \func{open} (illustrata in
2998 \secref{sec:file_open}) che prevede\footnote{questo è quanto dettato dallo
2999   standard POSIX.1, ciò non toglie che in alcune implementazioni questa
3000   tecnica possa non funzionare; in particolare per Linux, nel caso di NFS, si
3001   è comunque soggetti alla possibilità di una race condition.} che essa
3002 ritorni un errore quando usata con i flag di \const{O\_CREAT} e
3003 \const{O\_EXCL}. In tal modo la creazione di un \textsl{file di lock} può
3004 essere eseguita atomicamente, il processo che crea il file con successo si può
3005 considerare come titolare del lock (e della risorsa ad esso associata) mentre
3006 il rilascio si può eseguire con una chiamata ad \func{unlink}.
3007
3008 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3009 \func{LockFile} ed \func{UnlockFile} riportate in \figref{fig:ipc_file_lock}
3010 (sono contenute in \file{LockFile.c}, un'altro dei sorgenti allegati alla
3011 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3012   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3013 (\texttt{\small 4--10}) si limita ad aprire il file di lock (\texttt{\small
3014   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11--17}) lo
3015 cancella con \func{unlink}.
3016
3017 \begin{figure}[!htb]
3018   \footnotesize \centering
3019   \begin{minipage}[c]{15cm}
3020     \begin{lstlisting}{}
3021 #include <sys/types.h>
3022 #include <sys/stat.h>
3023 #include <unistd.h>                               /* unix standard functions */
3024 /*
3025  * Function LockFile:
3026  */
3027 int LockFile(const char* path_name)
3028 {
3029     return open(path_name, O_EXCL|O_CREAT);
3030 }
3031 /*
3032  * Function UnlockFile:
3033  */
3034 int UnlockFile(const char* path_name)
3035 {
3036     return unlink(path_name);
3037 }
3038
3039     \end{lstlisting}
3040   \end{minipage}
3041   \normalsize
3042   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3043     permettono di creare e rimuovere un \textsl{file di lock}.}
3044   \label{fig:ipc_file_lock}
3045 \end{figure}
3046
3047 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3048 \secref{sec:file_open}, questo comportamento di \func{open} può non funzionare
3049 (la funzione viene eseguita, ma non è garantita l'atomicità dell'operazione)
3050 se il filesystem su cui si va ad operare è su NFS; in tal caso si può adottare
3051 una tecnica alternativa che prevede l'uso della \func{link} per creare come
3052 file di lock un hard link ad un file esistente; se il link esiste già e la
3053 funzione fallisce, significa che la risorsa è bloccata e potrà essere
3054 sbloccata solo con un \func{unlink}, altrimenti il link è creato ed il lock
3055 acquisito; il controllo e l'eventuale acquisizione sono atomici; la soluzione
3056 funziona anche su NFS, ma ha un'altro difetto è che è quello di poterla usare
3057 solo se si opera all'interno di uno stesso filesystem.
3058
3059 Un generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3060 problemi, che non lo rendono una alternativa praticabile per la
3061 sincronizzazione: anzitutto anche in questo caso, in caso di terminazione
3062 imprevista del processo, si lascia allocata la risorsa (il file di lock) e
3063 questa deve essere sempre cancellata esplicitamente.  Inoltre il controllo
3064 della disponibilità può essere eseguito solo con una tecnica di
3065 \textit{polling}\index{polling}, ed è quindi molto inefficiente.
3066
3067 La tecnica dei file di lock non di meno ha una sua utilità, e può essere usata
3068 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3069 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3070 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3071 più programmi: qualora si trovi un file di lock il programma che cerca di
3072 accedere alla seriale si limita a segnalare che la risorsa non è disponibile.
3073
3074 \subsection{La sincronizzazione con il \textit{file locking}}
3075 \label{sec:ipc_lock_file}
3076
3077 Dato che i file di lock presentano gli inconvenienti illustrati in precedenza,
3078 la tecnica alternativa più comune è quella di fare ricorso al \textit{file
3079   locking} (trattato in \secref{sec:file_locking}) usando \func{fcntl} su un
3080 file creato per l'occasione per ottenere un write lock. In questo modo potremo
3081 usare il lock come un \textit{mutex}: per bloccare la risorsa basterà
3082 acquisire il lock, per sbloccarla basterà rilasciare il lock; una richiesta
3083 fatta con un write lock metterà automaticamente il processo in stato di
3084 attesa, senza necessità di ricorrere al \textit{polling}\index{polling} per
3085 determinare la disponibilità della risorsa, e al rilascio della stessa da
3086 parte del processo che la occupava si otterrà il nuovo lock atomicamente.
3087
3088 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3089 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3090 chiusura dei relativi file) e non ci si deve preoccupare di niente, inoltre
3091 non consuma risorse permanentemente allocate nel sistema, lo svantaggio è che
3092 dovendo fare ricorso a delle operazioni sul filesystem esso è in genere
3093 leggermente più lento.
3094
3095 \begin{figure}[!htb]
3096   \footnotesize \centering
3097   \begin{minipage}[c]{15cm}
3098     \begin{lstlisting}{}
3099 /*
3100  * Function LockMutex: lock a file (creating it if not existent).
3101  */
3102 int LockMutex(const char *path_name)
3103 {
3104     int fd, res;
3105     struct flock lock;                                /* file lock structure */
3106     /* first open the file (creating it if not existent) */
3107     if ( (fd = open(path_name, O_EXCL|O_CREAT)) < 0) {    /* first open file */
3108         return fd;
3109     }
3110     /* set flock structure */
3111     lock.l_type = F_WRLCK;                        /* set type: read or write */
3112     lock.l_whence = SEEK_SET;        /* start from the beginning of the file */
3113     lock.l_start = 0;                  /* set the start of the locked region */
3114     lock.l_len = 0;                   /* set the length of the locked region */
3115     /* do locking */
3116     if ( (res = fcntl(fd, F_SETLKW, &lock)) < 0 ) {
3117         return res;
3118     }
3119     return 0;
3120 }
3121 /*
3122  * Function UnLockMutex: unlock a file.
3123  */
3124 int UnlockMutex(const char *path_name)
3125 {
3126     int fd, res;
3127     struct flock lock;                                /* file lock structure */
3128     /* first open the file */
3129     if ( (fd = open(path_name, O_RDWR)) < 0) {            /* first open file */
3130         return fd;
3131     }
3132     /* set flock structure */
3133     lock.l_type = F_UNLCK;                               /* set type: unlock */
3134     lock.l_whence = SEEK_SET;        /* start from the beginning of the file */
3135     lock.l_start = 0;                  /* set the start of the locked region */
3136     lock.l_len = 0;                   /* set the length of the locked region */
3137     /* do locking */
3138     if ( (res = fcntl(fd, F_SETLK, &lock)) < 0 ) {
3139         return res;
3140     }
3141     return 0;
3142 }
3143     \end{lstlisting}
3144   \end{minipage}
3145   \normalsize
3146   \caption{Il codice delle funzioni che permettono di creare un
3147     \textit{mutex} utilizzando il file locking.}
3148   \label{fig:ipc_flock_mutex}
3149 \end{figure}
3150
3151 Il codice per implementare un mutex utilizzando il file locking è riportato in
3152 \figref{fig:ipc_flock_mutex}; a differenza del precedente caso in cui si sono
3153 usati i semafori le funzioni questa volta sono sufficienti due funzioni,
3154 \func{LockMutex} e \func{UnlockMutex}, usate rispettivamente per acquisire e
3155 rilasciare il mutex.
3156
3157 La prima funzione (\texttt{\small 1--22}) serve per acquisire il mutex.
3158 Anzitutto si apre (\texttt{\small 9--11}), creandolo se non esiste, il file
3159 specificato dall'argomento \param{pathname}. In caso di errore si ritorna
3160 immediatamente, altrimenti si prosegue impostando (\texttt{\small 12--16}) la
3161 struttura \var{lock} in modo da poter acquisire un write lock sul file. Infine
3162 si richiede (\texttt{\small 17--20}) il file lock (restituendo il codice di
3163 ritorno di \func{fcntl} caso di errore). Se il file è libero il lock è
3164 acquisito e la funzione ritorna immediatamente; altrimenti \func{fcntl} si
3165 bloccherà (si noti che la si è chiamata con \func{F\_SETLKW}) fino al rilascio
3166 del lock.
3167
3168 La seconda funzione (\texttt{\small 23--44}) serve a rilasciare il mutex. Di
3169 nuovo si apre (\texttt{\small 30--33}) il file specificato dall'argomento
3170 \param{pathname} (che stavolta deve esistere), ritornando immediatamente in
3171 caso di errore. Poi si passa ad inizializzare (\texttt{\small 34--38}) la
3172 struttura \var{lock} per il rilascio del lock, che viene effettuato
3173 (\texttt{\small 39--42}) subito dopo.
3174
3175  \subsection{Il \textit{memory mapping} anonimo}
3176 \label{sec:ipc_mmap_anonymous}
3177
3178 Abbiamo già visto che quando i processi sono \textsl{correlati}\footnote{se
3179   cioè hanno almeno un progenitore comune.} l'uso delle pipe può costituire
3180 una valida alternativa alle code di messaggi; nella stessa situazione si può
3181 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3182 \textit{memory mapping} anonimo.
3183
3184 Abbiamo visto in \secref{sec:file_memory_map} che è possibile mappare il
3185 contenuto di un file nella memoria di un processo, e che, quando viene usato
3186 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3187 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3188 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3189 inefficiente, in quanto occorre passare attraverso il disco. Però abbiamo
3190 visto anche che se si esegue la mappatura con il flag \const{MAP\_ANONYMOUS}
3191 la regione mappata non viene associata a nessun file, anche se quanto scritto
3192 rimane in memoria e può essere riletto; allora, dato che un processo figlio
3193 mantiene nel suo spazio degli indirizzi anche le regioni mappate, esso sarà
3194 anche in grado di accedere a quanto in esse è contenuto.
3195
3196 In questo modo diventa possibile creare una memoria condivisa fra processi
3197 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3198 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3199   funzionalità simile a questa viene implementata mappando il file speciale
3200   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3201   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3202   restano in memoria e possono essere riletti secondo le stesse modalità usate
3203   nele \textit{memory mapping} anonimo.} Un esempio di utilizzo di questa
3204 tecnica è mostrato in
3205
3206
3207
3208 \section{La comunicazione fra processi di POSIX}
3209 \label{sec:ipc_posix}
3210
3211 Per superare i numerosi problemi del \textit{SysV IPC}, evidenziati per i suoi
3212 aspetti generali in coda a \secref{sec:ipc_sysv_generic} e per i singoli
3213 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3214 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3215 una interfaccia completamente nuova, che tratteremo in questa sezione.
3216
3217
3218
3219 \subsection{Considerazioni generali}
3220 \label{sec:ipc_posix_generic}
3221
3222 Il Linux non tutti gli oggetti del POSIX IPC sono supportati nel kernel
3223 ufficiale; solo la memoria condivisa è presente, ma solo a partire dal kernel
3224 2.4.x, per gli altri oggetti esistono patch e librerie non ufficiali.
3225 Nonostante questo è importante esaminare questa interfaccia per la sua netta
3226 superiorità nei confronti di quella del \textit{SysV IPC}.
3227
3228
3229 \subsection{Code di messaggi}
3230 \label{sec:ipc_posix_mq}
3231
3232 Le code di messaggi non sono supportate a livello del kernel, esse però
3233 possono essere implementate, usando la memoria condivisa ed i mutex, con
3234 funzioni di libreria. In generale esse sono comunque poco usate, i socket, nei
3235 casi in cui sono sufficienti, sono più comodi, e negli altri casi la
3236 comunicazione può essere gestita direttamente con la stessa metodologia usata
3237 per implementare le code di messaggi. Per questo ci limiteremo ad una
3238 descrizione essenziale.
3239
3240
3241
3242 \subsection{Semafori}
3243 \label{sec:ipc_posix_sem}
3244
3245 Dei semafori POSIX esistono sostanzialmente due implementazioni; una è fatta a
3246 livello di libreria ed è fornita dalla libreria dei thread; questa però li
3247 implementa solo a livello di thread e non di processi. Esiste una
3248
3249
3250 \subsection{Memoria condivisa}
3251 \label{sec:ipc_posix_shm}
3252
3253 La memoria condivisa è l'unico degli oggetti di IPC POSIX già presente nel
3254 kernel ufficiale.
3255
3256
3257 %%% Local Variables:
3258 %%% mode: latex
3259 %%% TeX-master: "gapil"
3260 %%% End: