ipc.tex

   1 %% ipc.tex
   2 %%
   3 %% Copyright (C) 2000-2002 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11 \chapter{La comunicazione fra processi}
  12 \label{cha:IPC}
  13
  14
  15 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
  16 la comunicazione fra processi. In questo capitolo affronteremo solo i
  17 meccanismi più elementari che permettono di mettere in comunicazione processi
  18 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
  19 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
  20
  21 Tralasceremo invece tutte le problematiche relative alla comunicazione
  22 attraverso la rete (e le relative interfacce) che saranno affrontate in
  23 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
  24 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) e CORBA
  25 (\textit{Common Object Request Brocker Architecture}) che in genere sono
  26 implementati con un ulteriore livello sopra i meccanismi elementari.
  27
  28
  29 \section{La comunicazione fra processi tradizionale}
  30 \label{sec:ipc_unix}
  31
  32 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
  33 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
  34 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
  35 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
  36 ne gestiscono l'uso e le varie forme in cui si è evoluto.
  37
  38
  39 \subsection{Le \textit{pipe} standard}
  40 \label{sec:ipc_pipes}
  41
  42 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
  43 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
  44 sostanza di una una coppia di file descriptor\footnote{si tenga presente che
  45   le pipe sono oggetti creati dal kernel e non risiedono su disco.} connessi
  46 fra di loro in modo che se quanto scrive su di uno si può rileggere
  47 dall'altro. Si viene così a costituire un canale di comunicazione tramite i
  48 due file descriptor, nella forma di un \textsl{tubo} (da cui il nome)
  49 attraverso cui fluiscono i dati.
  50
  51 La funzione che permette di creare questa speciale coppia di file descriptor
  52 associati ad una \textit{pipe} è appunto \func{pipe}, ed il suo prototipo è:
  53 \begin{prototype}{unistd.h}
  54 {int pipe(int filedes[2])}
  55
  56 Crea una coppia di file descriptor associati ad una \textit{pipe}.
  57
  58   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
  59     errore, nel qual caso \var{errno} potrà assumere i valori \macro{EMFILE},
  60     \macro{ENFILE} e \macro{EFAULT}.}
  61 \end{prototype}
  62
  63 La funzione restituisce la coppia di file descriptor nel vettore
  64 \param{filedes}; il primo è aperto in lettura ed il secondo in scrittura. Come
  65 accennato concetto di funzionamento di una pipe è semplice: quello che si
  66 scrive nel file descriptor aperto in scrittura viene ripresentato tale e quale
  67 nel file descriptor aperto in lettura. I file descriptor infatti non sono
  68 connessi a nessun file reale, ma ad un buffer nel kernel, la cui dimensione è
  69 specificata dal parametro di sistema \macro{PIPE\_BUF}, (vedi
  70 \secref{sec:sys_file_limits}). Lo schema di funzionamento di una pipe è
  71 illustrato in \figref{fig:ipc_pipe_singular}, in cui sono illustrati i due
  72 capi della pipe, associati a ciascun file descriptor, con le frecce che
  73 indicano la direzione del flusso dei dati.
  74
  75 \begin{figure}[htb]
  76   \centering
  77   \includegraphics[height=5cm]{img/pipe}
  78   \caption{Schema della struttura di una pipe.}
  79   \label{fig:ipc_pipe_singular}
  80 \end{figure}
  81
  82 Chiaramente creare una pipe all'interno di un singolo processo non serve a
  83 niente; se però ricordiamo quanto esposto in \secref{sec:file_sharing}
  84 riguardo al comportamento dei file descriptor nei processi figli, è immediato
  85 capire come una pipe possa diventare un meccanismo di intercomunicazione. Un
  86 processo figlio infatti condivide gli stessi file descriptor del padre,
  87 compresi quelli associati ad una pipe (secondo la situazione illustrata in
  88 \figref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
  89 capo della pipe, l'altro può leggere.
  90
  91 \begin{figure}[htb]
  92   \centering
  93   \includegraphics[height=5cm]{img/pipefork}
  94   \caption{Schema dei collegamenti ad una pipe, condivisi fra processo padre e
  95     figlio dopo l'esecuzione \func{fork}.}
  96   \label{fig:ipc_pipe_fork}
  97 \end{figure}
  98
  99 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
 100 comunicazione fra processi attraverso una pipe, utilizzando le proprietà
 101 ordinarie dei file, ma ci mostra anche qual'è il principale\footnote{Stevens
 102   in \cite{APUE} riporta come limite anche il fatto che la comunicazione è
 103   unidirezionale, ma in realtà questo è un limite facilmente superabile usando
 104   una coppia di pipe.} limite nell'uso delle pipe. È necessario infatti che i
 105 processi possano condividere i file descriptor della pipe, e per questo essi
 106 devono comunque essere \textsl{parenti} (dall'inglese \textit{siblings}), cioè
 107 o derivare da uno stesso processo padre in cui è avvenuta la creazione della
 108 pipe, o, più comunemente, essere nella relazione padre/figlio.
 109
 110 A differenza di quanto avviene con i file normali, la lettura da una pipe può
 111 essere bloccante (qualora non siano presenti dati), inoltre se si legge da una
 112 pipe il cui capo in scrittura è stato chiuso, si avrà la ricezione di un EOF
 113 (vale a dire che la funzione \func{read} ritornerà restituendo 0).  Se invece
 114 si esegue una scrittura su una pipe il cui capo in lettura non è aperto il
 115 processo riceverà il segnale \macro{EPIPE}, e la funzione di scrittura
 116 restituirà un errore di \macro{EPIPE} (al ritorno del manipolatore, o qualora
 117 il segnale sia ignorato o bloccato).
 118
 119 La dimensione del buffer della pipe (\macro{PIPE\_BUF}) ci dà inoltre un'altra
 120 importante informazione riguardo il comportamento delle operazioni di lettura
 121 e scrittura su di una pipe; esse infatti sono atomiche fintanto che la
 122 quantità di dati da scrivere non supera questa dimensione. Qualora ad esempio
 123 si effettui una scrittura di una quantità di dati superiore l'operazione verrà
 124 effettuata in più riprese, consentendo l'intromissione di scritture effettuate
 125 da altri processi.
 126
 127
 128 \subsection{Un esempio dell'uso delle pipe}
 129 \label{sec:ipc_pipe_use}
 130
 131 Per capire meglio il funzionamento delle pipe faremo un esempio di quello che
 132 è il loro uso più comune, analogo a quello effettuato della shell, e che
 133 consiste nell'inviare l'output di un processo (lo standard output) sull'input
 134 di un'altro. Realizzeremo il programma di esempio nella forma di un
 135 \textit{CGI}\footnote{Un CGI (\textit{Common Gateway Interface}) è un
 136   programma che permette la creazione dinamica di un oggetto da inserire
 137   all'interno di una pagina HTML.}  per Apache, che genera una immagine JPEG
 138 di un codice a barre, specificato come parametro di input.
 139
 140 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
 141 delle caratteristiche specifiche, esso infatti non viene lanciato da una
 142 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
 143 solito ha la forma:
 144 \begin{verbatim}
 145     http://www.sito.it/cgi-bin/programma?parametro
 146 \end{verbatim}
 147 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
 148 che ne descrive il mime-type) sullo standard output, in modo che il web-server
 149 possa reinviarlo al browser che ha effettuato la richiesta, che in questo modo
 150 è in grado di visualizzarlo opportunamente.
 151
 152 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
 153 \cmd{gs}, il primo infatti è in grado di generare immagini postscript di
 154 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
 155 serve per poter effettuare la conversione della stessa immagine in formato
 156 JPEG. Usando una pipe potremo inviare l'output del primo sull'input del
 157 secondo, secondo lo schema mostrato in \figref{fig:ipc_pipe_use}, in cui la
 158 direzione del flusso dei dati è data dalle frecce continue.
 159
 160 \begin{figure}[htb]
 161   \centering
 162   \includegraphics[height=5cm]{img/pipeuse}
 163   \caption{Schema dell'uso di una pipe come mezzo di comunicazione fra
 164     due processi attraverso attraverso l'esecuzione una \func{fork} e la
 165     chiusura dei capi non utilizzati.}
 166   \label{fig:ipc_pipe_use}
 167 \end{figure}
 168
 169 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
 170 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
 171 \textit{CGI} deve poter gestire più richieste in concorrenza, e si avrebbe una
 172 evidente race condition in caso di accesso simultaneo a detto
 173 file.\footnote{il problema potrebbe essere superato determinando in anticipo
 174   un nome appropriato per il file temporaneo, che verrebbe utilizzato dai vari
 175   sotto-processi, e cancellato alla fine della loro esecuzione; ma a questo le
 176   cose non sarebbero più tanto semplici.}  L'uso di una pipe invece permette
 177 di risolvere il problema in maniera semplice ed elegante, oltre ad essere
 178 molto più efficiente, dato che non si deve scrivere su disco.
 179
 180 Il programma ci servirà anche come esempio dell'uso delle funzioni di
 181 duplicazione dei file descriptor che abbiamo trattato in
 182 \secref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
 183 funzioni infatti che è possibile dirottare gli stream standard dei processi
 184 (che abbiamo visto in \secref{sec:file_std_descr} e
 185 \secref{sec:file_std_stream}) sulla pipe. In \figref{fig:ipc_barcodepage_code}
 186 abbiamo riportato il corpo del programma, il cui codice completo è disponibile
 187 nel file \file{BarCodePage.c} che si trova nella directory dei sorgenti.
 188
 189
 190 \begin{figure}[!htb]
 191   \footnotesize \centering
 192   \begin{minipage}[c]{15cm}
 193     \begin{lstlisting}{}
 194 int main(int argc, char *argv[], char *envp[])
 195 {
 196     ...
 197     /* create two pipes, pipein and pipeout, to handle communication */
 198     if ( (retval = pipe(pipein)) ) {
 199         WriteMess("input pipe creation error");
 200         exit(0);
 201     }
 202     if ( (retval = pipe(pipeout)) ) {
 203         WriteMess("output pipe creation error");
 204         exit(0);
 205     }
 206     /* First fork: use child to run barcode program */
 207     if ( (pid = fork()) == -1) {          /* on error exit */
 208         WriteMess("child creation error");
 209         exit(0);
 210     }
 211     /* if child */
 212     if (pid == 0) {
 213         close(pipein[1]);                /* close pipe write end  */
 214         dup2(pipein[0], STDIN_FILENO);   /* remap stdin to pipe read end */
 215         close(pipeout[0]);
 216         dup2(pipeout[1], STDOUT_FILENO); /* remap stdout in pipe output */
 217         execlp("barcode", "barcode", size, NULL);
 218     }
 219     close(pipein[0]);                    /* close input side of input pipe */
 220     write(pipein[1], argv[1], strlen(argv[1]));  /* write parameter to pipe */
 221     close(pipein[1]);                    /* closing write end */
 222     waitpid(pid, NULL, 0);               /* wait child completion */
 223     /* Second fork: use child to run ghostscript */
 224     if ( (pid = fork()) == -1) {
 225         WriteMess("child creation error");
 226         exit(0);
 227     }
 228     /* second child, convert PS to JPEG  */
 229     if (pid == 0) {
 230         close(pipeout[1]);              /* close write end */
 231         dup2(pipeout[0], STDIN_FILENO); /* remap read end to stdin */
 232         /* send mime type */
 233         write(STDOUT_FILENO, content, strlen(content));
 234         execlp("gs", "gs", "-q", "-sDEVICE=jpeg", "-sOutputFile=-", "-", NULL);
 235     }
 236     /* still parent */
 237     close(pipeout[1]);
 238     waitpid(pid, NULL, 0);
 239     exit(0);
 240 }
 241     \end{lstlisting}
 242   \end{minipage}
 243   \normalsize
 244   \caption{Sezione principale del codice del \textit{CGI}
 245     \file{BarCodePage.c}.}
 246   \label{fig:ipc_barcodepage_code}
 247 \end{figure}
 248
 249 La prima operazione del programma (\texttt{\small 4--12}) è quella di creare
 250 le due pipe che serviranno per la comunicazione fra i due comandi utilizzati
 251 per produrre il codice a barre; si ha cura di controllare la riuscita della
 252 chiamata, inviando in caso di errore un messaggio invece dell'immagine
 253 richiesta.\footnote{la funzione \func{WriteMess} non è riportata in
 254   \secref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
 255   formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
 256   \textit{mime type}, e formattando il messaggio in HTML, in modo che
 257   quest'ultimo possa essere visualizzato correttamente da un browser.}
 258
 259 Una volta create le pipe, il programma può creare (\texttt{\small 13-17}) il
 260 primo processo figlio, che si incaricherà (\texttt{\small 19--25}) di eseguire
 261 \cmd{barcode}. Quest'ultimo legge dallo standard input una stringa di
 262 caratteri, la converte nell'immagine postscript del codice a barre ad essa
 263 corrispondente, e poi scrive il risultato direttamente sullo standard output.
 264
 265 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
 266 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima pipe, e se
 267 ne collega (\texttt{\small 21}) il capo in lettura allo standard input, usando
 268 \func{dup2}. Si ricordi che invocando \func{dup2} il secondo file, qualora
 269 risulti aperto, viene, come nel caso corrente, chiuso prima di effettuare la
 270 duplicazione. Allo stesso modo, dato che \cmd{barcode} scrive l'immagine
 271 postscript del codice a barre sullo standard output, per poter effettuare una
 272 ulteriore redirezione il capo in lettura della seconda pipe viene chiuso
 273 (\texttt{\small 22}) mentre il capo in scrittura viene collegato allo standard
 274 output (\texttt{\small 23}).
 275
 276 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
 277 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
 278 leggerà dalla prima pipe la stringa da codificare che gli sarà inviata dal
 279 padre, e scriverà l'immagine postscript del codice a barre sulla seconda.
 280
 281 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
 282 (\texttt{\small 26}) il capo inutilizzato della prima pipe (quello in input) e
 283 poi scrive (\texttt{\small 27}) la stringa da convertire sul capo in output,
 284 così che \cmd{barcode} possa riceverla dallo standard input. A questo punto
 285 l'uso della prima pipe da parte del padre è finito ed essa può essere
 286 definitivamente chiusa (\texttt{\small 28}), si attende poi (\texttt{\small
 287   29}) che l'esecuzione di \cmd{barcode} sia completata.
 288
 289 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
 290 postscript del codice a barre sul capo in scrittura della seconda pipe; a
 291 questo punto si può eseguire la seconda conversione, da PS a JPEG, usando il
 292 programma \cmd{gs}. Per questo si crea (\texttt{\small 30--34}) un secondo
 293 processo figlio, che poi (\texttt{\small 35--42}) eseguirà questo programma
 294 leggendo l'immagine postscript creata da \cmd{barcode} dallo standard input,
 295 per convertirla in JPEG.
 296
 297 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
 298 scrittura della seconda pipe, e se ne collega (\texttt{\small 38}) il capo in
 299 lettura allo standard input. Per poter formattare l'output del programma in
 300 maniera utilizzabile da un browser, si provvede anche \texttt{\small 40}) alla
 301 scrittura dell'apposita stringa di identificazione del mime-type in testa allo
 302 standard output. A questo punto si può invocare \texttt{\small 41}) \cmd{gs},
 303 provvedendo gli appositi switch che consentono di leggere il file da
 304 convertire dallo standard input e di inviare la conversione sullo standard
 305 output.
 306
 307 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
 308 capo in scrittura della seconda pipe, e attende la conclusione del figlio
 309 (\texttt{\small 45}); a questo punto può (\texttt{\small 46}) uscire. Si tenga
 310 conto che l'operazione di chiudere il capo in scrittura della seconda pipe è
 311 necessaria, infatti, se non venisse chiusa, \cmd{gs}, che legge il suo
 312 standard input da detta pipe, resterebbe bloccato in attesa di ulteriori dati
 313 in ingresso (l'unico modo che un programma ha per sapere che l'input è
 314 terminato è rilevare che lo standard input è stato chiuso), e la \func{wait}
 315 non ritornerebbe.
 316
 317
 318 \subsection{Le funzioni \func{popen} e \func{pclose}}
 319 \label{sec:ipc_popen}
 320
 321 Come si è visto la modalità più comune di utilizzo di una pipe è quella di
 322 utilizzarla per fare da tramite fra output ed input di due programmi invocati
 323 in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due funzioni
 324 che permettono di sintetizzare queste operazioni. La prima di esse si chiama
 325 \func{popen} ed il suo prototipo è:
 326 \begin{prototype}{stdio.h}
 327 {FILE *popen(const char *command, const char *type)}
 328
 329 Esegue il programma \param{command}, di cui, a seconda di \param{type},
 330 restituisce, lo standard input o lo standard output nella pipe collegata allo
 331 stream restituito come valore di ritorno.
 332
 333 \bodydesc{La funzione restituisce l'indirizzo dello stream associato alla pipe
 334   in caso di successo e \macro{NULL} per un errore, nel qual caso \var{errno}
 335   potrà assumere i valori relativi alle sottostanti invocazioni di \func{pipe}
 336   e \func{fork} o \macro{EINVAL} se \param{type} non è valido.}
 337 \end{prototype}
 338
 339 La funzione crea una pipe, esegue una \func{fork}, ed invoca il programma
 340 \param{command} attraverso la shell (in sostanza esegue \file{/bin/sh} con il
 341 flag \code{-c}); l'argomento \param{type} deve essere una delle due stringhe
 342 \verb|"w"| o \verb|"r"|, per indicare se la pipe sarà collegata allo standard
 343 input o allo standard output del comando invocato.
 344
 345 La funzione restituisce il puntatore allo stream associato alla pipe creata,
 346 che sarà aperto in sola lettura (e quindi associato allo standard output del
 347 programma indicato) in caso si sia indicato \code{"r"}, o in sola scrittura (e
 348 quindi associato allo standard input) in caso di \code{"w"}.
 349
 350 Lo stream restituito da \func{popen} è identico a tutti gli effetti ai file
 351 stream visti in \secref{cha:files_std_interface}, anche se è collegato ad una
 352 pipe e non ad un inode, e viene sempre aperto in modalità
 353 \textit{fully-buffered} (vedi \secref{sec:file_buffering}); l'unica differenza
 354 con gli usuali stream è che dovrà essere chiuso dalla seconda delle due nuove
 355 funzioni, \func{pclose}, il cui prototipo è:
 356 \begin{prototype}{stdio.h}
 357 {int pclose(FILE *stream)}
 358
 359 Chiude il file \param{stream}, restituito da una precedente \func{popen}
 360 attendendo la terminazione del processo ad essa associato.
 361
 362 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
 363   errore; nel quel caso il valore di \func{errno} deriva dalle sottostanti
 364   chiamate.}
 365 \end{prototype}
 366 \noindent che oltre alla chiusura dello stream si incarica anche di attendere
 367 (tramite \func{wait4}) la conclusione del processo creato dalla precedente
 368 \func{popen}.
 369
 370 Per illustrare l'uso di queste due funzioni riprendiamo il problema
 371 precedente: il programma mostrato in \figref{fig:ipc_barcodepage_code} per
 372 quanto funzionante, è (volutamente) codificato in maniera piuttosto complessa,
 373 inoltre nella pratica sconta un problema di \cmd{gs} che non è in
 374 grado\footnote{nella versione GNU Ghostscript 6.53 (2002-02-13).} di
 375 riconoscere correttamente l'encapsulated postscript, per cui deve essere usato
 376 il postscript e tutte le volte viene generata una pagina intera, invece che
 377 una immagine delle dimensioni corrispondenti al codice a barre.
 378
 379 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
 380 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
 381 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
 382 generato da \cmd{barcode} utilizzando lo switch \cmd{-E}).  Utilizzando un PDF
 383 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
 384 originarie del codice a barre e produce un JPEG di dimensioni corrette.
 385
 386 Questo approccio però non funziona, per via di una delle caratteristiche
 387 principali delle pipe. Per poter effettuare la conversione di un PDF infatti è
 388 necessario, per la struttura del formato, potersi spostare (con \func{lseek})
 389 all'interno del file da convertire; se si esegue la conversione con \cmd{gs} su
 390 un file regolare non ci sono problemi, una pipe però è rigidamente
 391 sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre con un errore
 392 di \macro{ESPIPE}, rendendo impossibile la conversione.  Questo ci dice che in
 393 generale la concatenazione di vari programmi funzionerà soltanto quando tutti
 394 prevedono una lettura sequenziale del loro input.
 395
 396 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
 397 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
 398 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
 399   formato usato spesso come formato intermedio per effettuare conversioni, è
 400   infatti molto facile da manipolare, dato che usa caratteri ASCII per
 401   memorizzare le immagini, anche se per questo è estremamente inefficiente.}
 402 dal quale poi si può ottenere un'immagine di dimensioni corrette attraverso
 403 vari programmi di manipolazione (\cmd{pnmcrop}, \cmd{pnmmargin}) che può
 404 essere infine trasformata in PNG (con \cmd{pnm2png}).
 405
 406 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
 407 inviando l'output di ciascuno all'input del successivo, per poi ottenere il
 408 risultato finale sullo standard output: un caso classico di utilizzazione
 409 delle pipe, in cui l'uso di \func{popen} e \func{pclose} permette di
 410 semplificare notevolmente la stesura del codice.
 411
 412 Nel nostro caso, dato che ciascun processo deve scrivere il suo output sullo
 413 standard input del successivo, occorrerà usare \func{popen} aprendo la pipe in
 414 scrittura. Il codice del nuovo programma è riportato in
 415 \figref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione dei
 416 programmi è l'inverso di quello in cui ci si aspetta che vengano
 417 effettivamente eseguiti. Questo non comporta nessun problema dato che la
 418 lettura su una pipe è bloccante, per cui ciascun processo, per quanto lanciato
 419 per primo, si bloccherà in attesa di ricevere sullo standard input il
 420 risultato dell'elaborazione del precedente, benchè quest'ultimo venga
 421 invocato dopo.
 422
 423 \begin{figure}[!htb]
 424   \footnotesize \centering
 425   \begin{minipage}[c]{15cm}
 426     \begin{lstlisting}{}
 427 int main(int argc, char *argv[], char *envp[])
 428 {
 429     FILE *pipe[4];
 430     FILE *pipein;
 431     char *cmd_string[4]={
 432         "pnmtopng",
 433         "pnmmargin -white 10",
 434         "pnmcrop",
 435         "gs -sDEVICE=ppmraw -sOutputFile=- -sNOPAUSE -q - -c showpage -c quit"
 436     };
 437     char content[]="Content-type: image/png\n\n";
 438     int i;
 439     /* write mime-type to stout */
 440     write(STDOUT_FILENO, content, strlen(content));
 441     /* execute chain of command */
 442     for (i=0; i<4; i++) {
 443         pipe[i] = popen(cmd_string[i], "w");
 444         dup2(fileno(pipe[i]), STDOUT_FILENO);
 445     }
 446     /* create barcode (in PS) */
 447     pipein = popen("barcode", "w");
 448     /* send barcode string to barcode program */
 449     write(fileno(pipein), argv[1], strlen(argv[1]));
 450     /* close all pipes (in reverse order) */
 451     for (i=4; i==0; i--) {
 452         pclose((pipe[i]));
 453     }
 454     exit(0);
 455 }
 456     \end{lstlisting}
 457   \end{minipage}
 458   \normalsize
 459   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
 460   \label{fig:ipc_barcode_code}
 461 \end{figure}
 462
 463 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il mime-type
 464 sullo standard output; a questo punto il processo padre non necessita più di
 465 eseguire ulteriori operazioni sullo standard output e può tranquillamente
 466 provvedere alla redirezione.
 467
 468 Dato che i vari programmi devono essere lanciati in successione, si è
 469 approntato un ciclo (\texttt{\small 15--19}) che esegue le operazioni in
 470 sequenza: prima crea una pipe (\texttt{\small 17}) per la scrittura eseguendo
 471 il programma con \func{popen}, in modo che essa sia collegata allo standard
 472 input, e poi redirige (\texttt{\small 18}) lo standard output su detta pipe.
 473
 474 In questo modo il primo processo ad essere invocato (che è l'ultimo della
 475 catena) scriverà ancora sullo standard output del processo padre, ma i
 476 successivi, a causa di questa redirezione, scriveranno sulla pipe associata
 477 allo standard input del processo invocato nel ciclo precedente.
 478
 479 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
 480 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
 481 (\texttt{\small 23}) la stringa del codice a barre sulla pipe, che è collegata
 482 al suo standard input, infine si può eseguire (\texttt{\small 24--27}) un
 483 ciclo che chiuda, nell'ordine inverso rispetto a quello in cui le si sono
 484 create, tutte le pipe create con \func{pclose}.
 485
 486
 487 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
 488 \label{sec:ipc_named_pipe}
 489
 490 Come accennato in \secref{sec:ipc_pipes} il problema delle \textit{pipe} è che
 491 esse possono essere utilizzate solo da processi con un progenitore comune o
 492 nella relazione padre/figlio; per superare questo problema lo standard POSIX.1
 493 ha definito dei nuovi oggetti, le \textit{fifo}, che hanno le stesse
 494 caratteristiche delle pipe, ma che invece di essere strutture interne del
 495 kernel, visibili solo attraverso un file descriptor, sono accessibili
 496 attraverso un inode che risiede sul filesystem, così che i processi le possono
 497 usare senza dovere per forza essere in una relazione di \textsl{parentela}.
 498
 499 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le pipe,
 500 attraverso un apposito buffer nel kernel, senza transitare dal filesystem;
 501 l'inode allocato sul filesystem serve infatti solo a fornire un punto di
 502 riferimento per i processi, che permetta loro di accedere alla stessa fifo; il
 503 comportamento delle funzioni di lettura e scrittura è identico a quello
 504 illustrato per le pipe in \secref{sec:ipc_pipes}.
 505
 506 Abbiamo già visto in \secref{sec:file_mknod} le funzioni \func{mknod} e
 507 \func{mkfifo} che permettono di creare una fifo; per utilizzarne una un
 508 processo non avrà che da aprire il relativo file speciale o in lettura o
 509 scrittura; nel primo caso sarà collegato al capo di uscita della fifo, e dovrà
 510 leggere, nel secondo al capo di ingresso, e dovrà scrivere.
 511
 512 Il kernel crea una singola pipe per ciascuna fifo che sia stata aperta, che può
 513 essere acceduta contemporaneamente da più processi, sia in lettura che in
 514 scrittura. Dato che per funzionare deve essere aperta in entrambe le
 515 direzioni, per una fifo di norma la funzione \func{open} si blocca se viene
 516 eseguita quando l'altro capo non è aperto.
 517
 518 Le fifo però possono essere anche aperte in modalità \textsl{non-bloccante},
 519 nel qual caso l'apertura del capo in lettura avrà successo solo quando anche
 520 l'altro capo è aperto, mentre l'apertura del capo in scrittura restituirà
 521 l'errore di \macro{ENXIO} fintanto che non verrà aperto il capo in lettura.
 522
 523 In Linux è possibile aprire le fifo anche in lettura/scrittura,\footnote{lo
 524   standard POSIX lascia indefinito il comportamento in questo caso.}
 525 operazione che avrà sempre successo immediato qualunque sia la modalità di
 526 apertura (bloccante e non bloccante); questo può essere utilizzato per aprire
 527 comunque una fifo in scrittura anche se non ci sono ancora processi il
 528 lettura; è possibile anche usare la fifo all'interno di un solo processo, nel
 529 qual caso però occorre stare molto attenti alla possibili situazioni di
 530 stallo.\footnote{se si cerca di leggere da una fifo che non contiene dati si
 531   avrà un deadlock immediato, dato che il processo si blocca e non potrà
 532   quindi mai eseguire le funzioni di scrittura.}
 533
 534 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
 535 piuttosto frequente l'utilizzo di una fifo come canale di comunicazione nelle
 536 situazioni un processo deve ricevere informazioni da altri. In questo caso è
 537 fondamentale che le operazioni di scrittura siano atomiche; per questo si deve
 538 sempre tenere presente che questo è vero soltanto fintanto che non si supera
 539 il limite delle dimensioni di \macro{PIPE\_BUF} (si ricordi quanto detto in
 540 \secref{sec:ipc_pipes}).
 541
 542 A parte il caso precedente, che resta probabilmente il più comune, Stevens
 543 riporta in \cite{APUE} altre due casistiche principali per l'uso delle fifo:
 544 \begin{itemize}
 545 \item Da parte dei comandi di shell, per evitare la creazione di file
 546   temporanei quando si devono inviare i dati di uscita di un processo
 547   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
 548
 549 \item Come canale di comunicazione fra client ed server (il modello
 550   \textit{client-server} è illustrato in \secref{sec:net_cliserv}).
 551 \end{itemize}
 552
 553 Nel primo caso quello che si fa è creare tante fifo, da usare come standard
 554 input, quanti sono i processi a cui i vogliono inviare i dati, questi ultimi
 555 saranno stati posti in esecuzione ridirigendo lo standard input dalle fifo, si
 556 potrà poi eseguire il processo che fornisce l'output replicando quest'ultimo,
 557 con il comando \cmd{tee}, sulle varie fifo.
 558
 559 Il secondo caso è relativamente semplice qualora si debba comunicare con un
 560 processo alla volta (nel qual caso basta usare due fifo, una per leggere ed
 561 una per scrivere), le cose diventano invece molto più complesse quando si
 562 vuole effettuare una comunicazione fra il server ed un numero imprecisato di
 563 client; se il primo infatti può ricevere le richieste attraverso una fifo
 564 ``nota'', per le risposte non si può fare altrettanto, dato che, per la
 565 struttura sequenziale delle fifo, i client dovrebbero sapere, prima di
 566 leggerli, quando i dati inviati sono destinati a loro.
 567
 568 Per risolvere questo problema, si può usare un'architettura come quella
 569 illustrata in \figref{fig:ipc_fifo_server_arch} in cui i client inviano le
 570 richieste al server su una fifo nota mentre le risposte vengono reinviate dal
 571 server a ciascuno di essi su una fifo temporanea creata per l'occasione.
 572
 573 \begin{figure}[htb]
 574   \centering
 575   \includegraphics[height=9cm]{img/fifoserver}
 576   \caption{Schema dell'utilizzo delle fifo nella realizzazione di una
 577   architettura di comunicazione client/server.}
 578   \label{fig:ipc_fifo_server_arch}
 579 \end{figure}
 580
 581 Come esempio di uso questa architettura e dell'uso delle fifo, abbiamo scritto
 582 un server di \textit{fortunes}, che restituisce, alle richieste di un client,
 583 un detto a caso estratto da un insieme di frasi; sia il numero delle frasi
 584 dell'insieme, che i file da cui esse vengono lette all'avvio, sono importabili
 585 da riga di comando. Il corpo principale del server è riportato in
 586 \figref{fig:ipc_fifo_server}, dove si è tralasciata la parte che tratta la
 587 gestione delle opzioni a riga di comando, che effettua il settaggio delle
 588 variabili \var{fortunefilename}, che indica il file da cui leggere le frasi,
 589 ed \var{n}, che indica il numero di frasi tenute in memoria, ad un valore
 590 diverso da quelli preimpostati. Il codice completo è nel file
 591 \file{FortuneServer.c}.
 592
 593 \begin{figure}[!htb]
 594   \footnotesize \centering
 595   \begin{minipage}[c]{15cm}
 596     \begin{lstlisting}{}
 597 char *fifoname = "/tmp/fortune.fifo";
 598 int main(int argc, char *argv[])
 599 {
 600 /* Variables definition */
 601     int i, n = 0;
 602     char *fortunefilename = "/usr/share/games/fortunes/italia";
 603     char **fortune;
 604     char line[80];
 605     int fifo_server, fifo_client;
 606     int nread;
 607     ...
 608     if (n==0) usage();          /* if no pool depth exit printing usage info */
 609     Signal(SIGTERM, HandSIGTERM);            /* set handlers for termination */
 610     Signal(SIGINT, HandSIGTERM);
 611     Signal(SIGQUIT, HandSIGTERM);
 612     i = FortuneParse(fortunefilename, fortune, n);          /* parse phrases */
 613     if (mkfifo(fifoname, 0622)) {  /* create well known fifo if does't exist */
 614         if (errno!=EEXIST) {
 615             perror("Cannot create well known fifo");
 616             exit(1);
 617         }
 618     }
 619     /* open fifo two times to avoid EOF */
 620     fifo_server = open(fifoname, O_RDONLY);
 621     if (fifo_server < 0) {
 622         perror("Cannot open read only well known fifo");
 623         exit(1);
 624     }
 625     if (open(fifoname, O_WRONLY) < 0) {
 626         perror("Cannot open write only well known fifo");
 627         exit(1);
 628     }
 629     /* Main body: loop over requests */
 630     while (1) {
 631         nread = read(fifo_server, line, 79);                 /* read request */
 632         if (nread < 0) {
 633             perror("Read Error");
 634             exit(1);
 635         }
 636         line[nread] = 0;                       /* terminate fifo name string */
 637         n = random() % i;                             /* select random value */
 638         fifo_client = open(line, O_WRONLY);              /* open client fifo */
 639         if (fifo_client < 0) {
 640             perror("Cannot open");
 641             exit(1);
 642         }
 643         nread = write(fifo_client,                           /* write phrase */
 644                       fortune[n], strlen(fortune[n])+1);
 645         close(fifo_client);                             /* close client fifo */
 646     }
 647 }
 648     \end{lstlisting}
 649   \end{minipage}
 650   \normalsize
 651   \caption{Sezione principale del codice del server di \textit{fortunes}
 652     basato sulle fifo.}
 653   \label{fig:ipc_fifo_server}
 654 \end{figure}
 655
 656 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
 657 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
 658 \var{fortune} avviene solo quando questa dimensione viene specificata, la
 659 presenza di un valore nullo provoca l'uscita dal programma attraverso la
 660 routine (non riportata) che ne stampa le modalità d'uso.  Dopo di che installa
 661 (\texttt{\small 13--15}) la funzione che gestisce i segnali di interruzione
 662 (anche questa non è riportata in \figref{fig:ipc_fifo_server}) che si limita a
 663 rimuovere dal filesystem la fifo usata dal server per comunicare.
 664
 665 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
 666 funzione \code{FortuneParse} che legge dal file specificato in
 667 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
 668 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
 669 Anche il codice della funzione non è riportato, in quanto non direttamente
 670 attinente allo scopo dell'esempio.
 671
 672 Il passo successivo (\texttt{\small 17--22}) è quello di creare con
 673 \func{mkfifo} la fifo nota sulla quale il server ascolterà le richieste,
 674 qualora si riscontri un errore il server uscirà (escludendo ovviamente il caso
 675 in cui la funzione \func{mkfifo} fallisce per la precedente esistenza della
 676 fifo).
 677
 678 Una volta che si è certi che la fifo di ascolto esiste si procede
 679 (\texttt{\small 23--32}) alla sua apertura. Questo viene fatto due volte
 680 per evitare di dover gestire all'interno del ciclo principale il caso in cui
 681 il server è in ascolto ma non ci sono client che effettuano richieste.
 682 Si ricordi infatti che quando una fifo è aperta solo dal capo in lettura,
 683 l'esecuzione di \func{read} ritorna con zero byte (si ha cioè una condizione
 684 di end-of-file).
 685
 686 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
 687 client non apre a sua volta la fifo nota in scrittura per effettuare la sua
 688 richiesta. Pertanto all'inizio non ci sono problemi, il client però, una volta
 689 ricevuta la risposta, uscirà, chiudendo tutti i file aperti, compresa la fifo.
 690 A questo punto il server resta (se non ci sono altri client che stanno
 691 effettuando richieste) con la fifo chiusa sul lato in lettura e a questo punto
 692 \func{read} non si bloccherà in attesa di input, ma ritornerà in continuazione
 693 restituendo un end-of-file.\footnote{Si è usata questa tecnica per
 694   compatibilità, Linux infatti supporta l'apertura delle fifo in
 695   lettura/scrittura, per cui si sarebbe potuto effettuare una singola apertura
 696   con \macro{O\_RDWR}, la doppia apertura comunque ha il vantaggio che non si
 697   può scrivere per errore sul capo aperto in sola lettura.}
 698
 699 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
 700   24--28}),\footnote{di solito si effettua l'apertura del capo in lettura in
 701   modalità non bloccante, per evitare il rischio di uno stallo (se nessuno
 702   apre la fifo in scrittura il processo non ritornerà mai dalla \func{open})
 703   che nel nostro caso non esiste, mentre è necessario potersi bloccare in
 704   lettura in attesa di una richiesta.} si esegue una seconda apertura in
 705 scrittura (\texttt{\small 29--32}), scartando il relativo file descriptor che
 706 non sarà mai usato, ma lasciando la fifo comunque aperta anche in scrittura,
 707 cosicché le successive possano bloccarsi.
 708
 709 A questo punto si può entrare nel ciclo principale del programma che fornisce
 710 le risposte ai client (\texttt{\small 34--50}), che viene eseguito
 711 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
 712 modo da passare attraverso la routine di chiusura che cancella la fifo).
 713
 714 Il server è progettato per accettare come richieste dai client delle stringhe
 715 che contengono il nome della fifo sulla quale deve essere inviata la risposta.
 716 Per cui prima (\texttt{\small 35--39}) si esegue la lettura dalla stringa di
 717 richiesta dalla fifo nota (che a questo punto si bloccherà tutte le volte che
 718 non ci sono richieste). Dopo di che, una volta terminata la stringa
 719 (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero casuale per
 720 ricavare la frase da inviare, si procederà (\texttt{\small 42--46})
 721 all'apertura della fifo per la risposta, che \texttt{\small 47--48}) poi vi
 722 sarà scritta. Infine (\texttt{\small 49}) si chiude la fifo di risposta che
 723 non serve più.
 724
 725 Il codice del client è invece riportato in \figref{fig:ipc_fifo_client}, anche
 726 in questo caso si è omessa la gestione delle opzioni e la funzione che stampa
 727 a video le informazioni di utilizzo ed esce, riportando solo la sezione
 728 principale del programma e le definizioni delle variabili. Il codice completo
 729 è nel file \file{FortuneClient.c} dei sorgenti allegati.
 730
 731 \begin{figure}[!htb]
 732   \footnotesize \centering
 733   \begin{minipage}[c]{15cm}
 734     \begin{lstlisting}{}
 735 int main(int argc, char *argv[])
 736 {
 737 /* Variables definition */
 738     int n = 0;
 739     char *fortunefilename = "/tmp/fortune.fifo";
 740     char line[80];
 741     int fifo_server, fifo_client;
 742     char fifoname[80];
 743     int nread;
 744     char buffer[PIPE_BUF];
 745     ...
 746     snprintf(fifoname, 80, "/tmp/fortune.%d", getpid());     /* compose name */
 747     if (mkfifo(fifoname, 0622)) {                        /* open client fifo */
 748         if (errno!=EEXIST) {
 749             perror("Cannot create well known fifo");
 750             exit(-1);
 751         }
 752     }
 753     fifo_server = open(fortunefilename, O_WRONLY);       /* open server fifo */
 754     if (fifo_server < 0) {
 755         perror("Cannot open well known fifo");
 756         exit(-1);
 757     }
 758     nread = write(fifo_server, fifoname, strlen(fifoname)+1);  /* write name */
 759     close(fifo_server);                                 /* close server fifo */
 760     fifo_client = open(fifoname, O_RDONLY);              /* open client fifo */
 761     if (fifo_client < 0) {
 762         perror("Cannot open well known fifo");
 763         exit(-1);
 764     }
 765     nread = read(fifo_client, buffer, sizeof(buffer));        /* read answer */
 766     printf("%s", buffer);                                   /* print fortune */
 767     close(fifo_client);                                      /* close client */
 768     close(fifo_server);                                      /* close server */
 769     unlink(fifoname);                                  /* remove client fifo */
 770 }
 771     \end{lstlisting}
 772   \end{minipage}
 773   \normalsize
 774   \caption{Sezione principale del codice del client di \textit{fortunes}
 775     basato sulle fifo.}
 776   \label{fig:ipc_fifo_client}
 777 \end{figure}
 778
 779 La prima istruzione (\texttt{\small 12}) compone il nome della fifo che dovrà
 780 essere utilizzata per ricevere la risposta dal server.  Si usa il \acr{pid}
 781 del processo per essere sicuri di avere un nome univoco; dopo di che
 782 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
 783 in caso di errore (a meno che il file non sia già presente sul filesystem).
 784
 785 A questo punto il client può effettuare l'interrogazione del server, per
 786 questo prima si apre la fifo nota (\texttt{\small 19--23}), e poi ci si scrive
 787 (\texttt{\small 24}) la stringa composta in precedenza, che contiene il nome
 788 della fifo da utilizzare per la risposta. Infine si richiude la fifo del
 789 server che a questo punto non serve più (\texttt{\small 25}).
 790
 791 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
 792 si apre (\texttt{\small 26--30}) la fifo appena creata, da cui si deve
 793 riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
 794 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
 795 dal server siano sempre di dimensioni inferiori a \macro{PIPE\_BUF},
 796 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
 797 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
 798 fifo e si cancella (\texttt{\small 34}) il relativo file.
 799 Si noti come la fifo per la risposta sia stata aperta solo dopo aver inviato
 800 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
 801 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
 802 scrittura e l'apertura si sarebbe bloccata indefinitamente.
 803
 804 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
 805 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
 806   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
 807   per il server sapere se un client è andato in crash, con la possibilità di
 808   far restare le fifo temporanee sul filesystem, di come sia necessario
 809   intercettare \macro{SIGPIPE} dato che un client può terminare dopo aver
 810   fatto una richiesta, ma prima che la risposta sia inviata (cosa che nel
 811   nostro esempio non è stata fatta).}; in generale infatti l'interfaccia delle
 812 fifo non è adatta a risolvere questo tipo di problemi, che possono essere
 813 affrontati in maniera più semplice ed efficace o usando i
 814 \textit{socket}\index{socket} (che tratteremo in dettaglio a partire da
 815 \capref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione diversi,
 816 come quelli che esamineremo in seguito.
 817
 818
 819
 820 \subsection{La funzione \func{socketpair}}
 821 \label{sec:ipc_socketpair}
 822
 823 Un meccanismo di comunicazione molto simile alle pipe, ma che non presenta il
 824 problema della unidirezionalità del flusso dei dati, è quello dei cosiddetti
 825 \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo l'argomento
 826 dei \textit{socket} in \capref{cha:socket_intro},\footnote{si tratta comunque
 827   di oggetti di comunicazione che, come le pipe, sono utilizzati attraverso
 828   dei file descriptor.} nell'ambito dell'interfaccia generale che essi
 829 forniscono per la programmazione di rete; e vedremo anche
 830 (in~\secref{sec:sock_sa_local}) come si possono definire dei file speciali (di
 831 tipo \textit{socket}, analoghi a quello associati alle fifo) cui si accede
 832 però attraverso quella medesima interfaccia; vale però la pena esaminare qui
 833 una modalità di uso dei socket locali\footnote{la funzione \func{socketpair} è
 834   stata introdotta in BSD4.4, ma è supportata in genere da qualunque sistema
 835   che fornisca l'interfaccia dei socket.} che li rende sostanzialmente
 836 identici ad una pipe bidirezionale.
 837
 838 La funzione \func{socketpair} infatti consente di creare una coppia di file
 839 descriptor connessi fra di loro (tramite un socket, appunto), senza dover
 840 ricorrere ad un file speciale sul filesystem, i descrittori sono del tutto
 841 analoghi a quelli che si avrebbero con una chiamata a \func{pipe}, con la sola
 842 differenza è che in questo caso il flusso dei dati può essere effettuato in
 843 entrambe le direzioni. Il prototipo della funzione è:
 844 \begin{functions}
 845   \headdecl{sys/types.h}
 846   \headdecl{sys/socket.h}
 847
 848   \funcdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
 849
 850   Crea una coppia di socket connessi fra loro.
 851
 852   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
 853     errore, nel qual caso \var{errno} assumerà uno dei valori:
 854   \begin{errlist}
 855   \item[\macro{EAFNOSUPPORT}] I socket locali non sono supportati.
 856   \item[\macro{EPROTONOSUPPORT}] Il protocollo specificato non è supportato.
 857   \item[\macro{EOPNOTSUPP}] Il protocollo specificato non supporta la
 858   creazione di coppie di socket.
 859   \end{errlist}
 860   ed inoltre \macro{EMFILE},  \macro{EFAULT}.
 861 }
 862 \end{functions}
 863
 864 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
 865 loro: quello che si scrive su uno di essi sarà ripresentato in input
 866 sull'altro e viceversa. I parametri \param{domain}, \param{type} e
 867 \param{protocol} derivano dall'interfaccia dei socket (che è quella che
 868 fornisce il substrato per connettere i due descrittori), ma in questo caso i
 869 soli valori validi che possono essere specificati sono rispettivamente
 870 \macro{AF\_UNIX}, \macro{SOCK\_STREAM} e \macro{0}.
 871
 872 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
 873 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei socket
 874 locali in generale) permette di trasmettere attraverso le linea non solo dei
 875 dati, ma anche dei file descriptor: si può cioè passare da un processo ad un
 876 altro un file descriptor, con una sorta di duplicazione dello stesso non
 877 all'interno di uno stesso processo, ma fra processi distinti (torneremo su
 878 questa funzionalità in \secref{sec:xxx_fd_passing}).
 879
 880
 881 \section{La comunicazione fra processi di System V}
 882 \label{sec:ipc_sysv}
 883
 884 Benché le pipe e le fifo siano ancora ampiamente usate, esse scontano il
 885 limite fondamentale che il meccanismo di comunicazione che forniscono è
 886 rigidamente sequenziale: una situazione in cui un processo scrive qualcosa che
 887 molti altri devono poter leggere non può essere implementata con una pipe.
 888
 889 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
 890 oggetti per la comunicazione fra processi ed una nuova interfaccia di
 891 programmazione, che fossero in grado di garantire una maggiore flessibilità.
 892 In questa sezione esamineremo come Linux supporta quello che viene chiamato il
 893 \textsl{Sistema di comunicazione inter-processo} di System V, cui da qui in
 894 avanti faremo riferimento come \textit{SysV IPC} (dove IPC è la sigla di
 895 \textit{Inter-Process Comunication}).
 896
 897
 898
 899 \subsection{Considerazioni generali}
 900 \label{sec:ipc_sysv_generic}
 901
 902 La principale caratteristica del \textit{SysV IPC} è quella di essere basato
 903 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
 904 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
 905 non vengono cancellati dal sistema una volta che non sono più in uso.
 906
 907 Questo comporta due problemi: il primo è che, al contrario di quanto avviene
 908 per pipe e fifo, la memoria allocata per questi oggetti non viene rilasciata
 909 automaticamente quando non c'è più nessuno che li utilizzi, ed essi devono
 910 essere cancellati esplicitamente, se non si vuole che restino attivi fino al
 911 riavvio del sistema. Il secondo problema è che, dato che non c'è, come per i
 912 file, un contatore del numero di riferimenti che ne indichi l'essere in uso,
 913 essi possono essere cancellati anche se ci sono dei processi che li stanno
 914 utilizzando, con tutte le conseguenze (negative) del caso.
 915
 916 Un'ulteriore caratteristica negativa è che gli oggetti usati nel \textit{SysV
 917   IPC} vengono creati direttamente dal kernel, e sono accessibili solo
 918 specificando il relativo \textsl{identificatore}. Questo è un numero
 919 progressivo (un po' come il \acr{pid} dei processi) che il kernel assegna a
 920 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
 921 torneremo in \secref{sec:ipc_sysv_id_use}). L'identificatore viene restituito
 922 dalle funzioni che creano l'oggetto, ed è quindi locale al processo che le ha
 923 eseguite. Dato che l'identificatore viene assegnato dinamicamente dal kernel
 924 non è possibile prevedere quale sarà, né utilizzare un qualche valore statico,
 925 si pone perciò il problema di come processi diversi possono accedere allo
 926 stesso oggetto.
 927
 928 Per risolvere il problema nella struttura \var{ipc\_perm} che il kernel
 929 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
 930 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
 931 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
 932 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
 933   si sposta il problema dell'accesso dalla classificazione in base
 934   all'identificatore alla classificazione in base alla chiave, una delle tante
 935   complicazioni inutili presenti nel \textit{SysV IPC}.} Oltre la chiave, la
 936 struttura, la cui definizione è riportata in \figref{fig:ipc_ipc_perm},
 937 mantiene varie proprietà ed informazioni associate all'oggetto.
 938
 939 \begin{figure}[!htb]
 940   \footnotesize \centering
 941   \begin{minipage}[c]{15cm}
 942     \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm ]{}
 943 struct ipc_perm
 944 {
 945     key_t key;                        /* Key.  */
 946     uid_t uid;                        /* Owner's user ID.  */
 947     gid_t gid;                        /* Owner's group ID.  */
 948     uid_t cuid;                       /* Creator's user ID.  */
 949     gid_t cgid;                       /* Creator's group ID.  */
 950     unsigned short int mode;          /* Read/write permission.  */
 951     unsigned short int seq;           /* Sequence number.  */
 952 };
 953     \end{lstlisting}
 954   \end{minipage}
 955   \normalsize
 956   \caption{La struttura \var{ipc\_perm}, come definita in \file{sys/ipc.h}.}
 957   \label{fig:ipc_ipc_perm}
 958 \end{figure}
 959
 960 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
 961 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
 962 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
 963 sono \textsl{parenti} la soluzione è relativamente semplice, in tal caso
 964 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
 965 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
 966 disponibile in tutti i figli, e potrà essere passato come parametro attraverso
 967 una \func{exec}.
 968
 969 Però quando i processi non sono \textsl{parenti} (come capita tutte le volte
 970 che si ha a che fare con un sistema client-server) tutto questo non è
 971 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
 972 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
 973 alternativa più efficace è quella che i programmi usino un valore comune per
 974 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
 975 sempre il rischio che questa chiave possa essere stata già utilizzata da
 976 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
 977 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione,
 978 \func{ftok}, che permette di ottenere una chiave specificando il nome di un
 979 file ed un numero di versione; il suo prototipo è:
 980 \begin{functions}
 981   \headdecl{sys/types.h}
 982   \headdecl{sys/ipc.h}
 983
 984   \funcdecl{key\_t ftok(const char *pathname, int proj\_id)}
 985
 986   Restituisce una chiave per identificare un oggetto del \textit{SysV IPC}.
 987
 988   \bodydesc{La funzione restituisce la chiave in caso di successo e -1
 989     altrimenti, nel qual caso \var{errno} sarà uno dei possibili codici di
 990     errore di \func{stat}.}
 991 \end{functions}
 992
 993 La funzione determina un valore della chiave sulla base di \param{pathname},
 994 che deve specificare il pathname di un file effettivamente esistente e di un
 995 numero di progetto \param{proj\_id)}, che di norma viene specificato come
 996 carattere, dato che ne vengono utilizzati solo gli 8 bit meno
 997 significativi.\footnote{nelle libc4 e libc5, come avviene in SunOS,
 998   l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, le \acr{glibc}
 999   usano il prototipo specificato da XPG4, ma vengono lo stesso utilizzati gli
1000   8 bit meno significativi.}
1001
1002 Il problema è che anche così non c'è la sicurezza che il valore della chiave
1003 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
1004 con i 16 bit meno significativi dell'inode del file \param{pathname} (che
1005 vengono ottenuti attraverso \func{stat}, da cui derivano i possibili errori),
1006 e gli 8 bit meno significativi del numero del dispositivo su cui è il file.
1007 Diventa perciò relativamente facile ottenere delle collisioni, specie se i
1008 file sono su dispositivi con lo stesso \textit{minor number}, come
1009 \file{/dev/hda1} e \file{/dev/sda1}.
1010
1011 In genere quello che si fa è utilizzare un file comune usato dai programmi che
1012 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
1013 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
1014 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
1015 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
1016 bene in fase di creazione, le cose possono complicarsi per i programmi che
1017 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
1018 attributi di \var{ipc\_perm}, non esiste una modalità semplice per essere
1019 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
1020 creato da chi ci si aspetta.
1021
1022 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
1023 contatore di riferimenti per la cancellazione automatica, il principale
1024 problema del \textit{SysV IPC}. Non esiste infatti una modalità chiara per
1025 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
1026 file, e tutta l'interfaccia è inutilmente complessa.  Per questo ne è stata
1027 effettuata una revisione completa nello standard POSIX.1b, che tratteremo in
1028 \secref{sec:ipc_posix}.
1029
1030
1031 \subsection{Il controllo di accesso}
1032 \label{sec:ipc_sysv_access_control}
1033
1034 Oltre alle chiavi, abbiamo visto che ad ogni oggetto sono associate in
1035 \var{ipc\_perm} ulteriori informazioni, come gli identificatori del creatore
1036 (nei campi \var{cuid} e \var{cgid}) e del proprietario (nei campi \var{uid} e
1037 \var{gid}) dello stesso, e un insieme di permessi (nel campo \var{mode}). In
1038 questo modo è possibile definire un controllo di accesso sugli oggetti di IPC,
1039 simile a quello che si ha per i file (vedi \secref{sec:file_perm_overview}).
1040
1041 Benché questo controllo di accesso sia molto simile a quello dei file, restano
1042 delle importanti differenze. La prima è che il permesso di esecuzione non
1043 esiste (e se specificato viene ignorato), per cui si può parlare solo di
1044 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
1045 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
1046 ed hanno lo stesso significato di quelli riportati in
1047 \secref{tab:file_mode_flags}\footnote{se però si vogliono usare le costanti
1048   simboliche ivi definite occorrerà includere il file \file{sys/stat.h},
1049   alcuni sistemi definiscono le costanti \macro{MSG\_R} (\texttt{0400}) e
1050   \macro{MSG\_W} (\texttt{0200}) per indicare i permessi base di lettura e
1051   scrittura per il proprietario, da utilizzare, con gli opportuni shift, pure
1052   per il gruppo e gli altri, in Linux, visto la loro scarsa utilità, queste
1053   costanti non sono definite.} e come per i file definiscono gli accessi per
1054 il proprietario, il suo gruppo e tutti gli altri.
1055
1056 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
1057 \var{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono settati
1058 rispettivamente al valore dell'userid e del groupid effettivo del processo che
1059 ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
1060 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
1061
1062 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
1063 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
1064 specificano tutte un argomento \param{flag}, in tal caso quando viene
1065 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
1066 permessi, questi vengono controllati e l'identificatore viene restituito solo
1067 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
1068 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
1069 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
1070 nullo, nel qual caso l'identificatore sarà restituito comunque.
1071
1072 Il secondo livello di controllo è quello delle varie funzioni che accedono
1073 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
1074 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
1075 \begin{itemize}
1076 \item se il processo ha i privilegi di amministratore l'accesso è sempre
1077   consentito.
1078 \item se l'userid effettivo del processo corrisponde o al valore del campo
1079   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
1080   in \var{mode} è appropriato\footnote{per appropriato si intende che è
1081     settato il permesso di scrittura per le operazioni di scrittura e quello
1082     di lettura per le operazioni di lettura.} l'accesso è consentito.
1083 \item se il groupid effettivo del processo corrisponde o al
1084   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
1085   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
1086 \item se il permesso per gli altri è appropriato l'accesso è consentito.
1087 \end{itemize}
1088 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
1089 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
1090 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
1091 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
1092 il valore di \var{umask} (si ricordi quanto esposto in
1093 \secref{sec:file_umask}) non ha alcun significato.
1094
1095
1096 \subsection{Gli identificatori ed il loro utilizzo}
1097 \label{sec:ipc_sysv_id_use}
1098
1099 L'unico campo di \var{ipc\_perm} del quale non abbiamo ancora parlato è
1100 \var{seq}, che in \figref{fig:ipc_ipc_perm} è qualificato con un criptico
1101 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
1102 strettamente attinente alle modalità con cui il kernel assegna gli
1103 identificatori degli oggetti del sistema di IPC.
1104
1105 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
1106 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
1107 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
1108 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
1109 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
1110 dimensioni (inferiori al numero massimo di oggetti disponibili).
1111
1112 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1113 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1114 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1115 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1116 relativo identificatore viene immediatamente assegnato a quelle di un altro
1117 server partito subito dopo, con la possibilità che i client del primo non
1118 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1119 con gli oggetti del secondo, con conseguenze imprevedibili.
1120
1121 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1122 \var{req} per provvedere un meccanismo che porti gli identificatori ad
1123 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1124 un identificatore può venire riutilizzato.
1125
1126 Il sistema dispone sempre di un numero fisso di oggetti di IPC,\footnote{fino
1127   al kernel 2.2.x questi valori, definiti dalle costanti \macro{MSGMNI},
1128   \macro{SEMMNI} e \macro{SHMMNI}, potevano essere cambiati (come tutti gli
1129   altri limiti relativi al \textit{SysV IPC}) solo con una ricompilazione del
1130   kernel, andando a modificarne la definizione nei relativi header file.  A
1131   partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1132   scrivendo sui file \file{shmmni}, \file{msgmni} e \file{sem} di
1133   \file{/proc/sys/kernel} o con l'uso di \texttt{syscntl}.} e per ciascuno di
1134 essi viene mantenuto in \var{seq} un numero di sequenza progressivo che viene
1135 incrementato di uno ogni volta che l'oggetto viene cancellato. Quando
1136 l'oggetto viene creato usando uno spazio che era già stato utilizzato in
1137 precedenza per restituire l'identificatore al numero di oggetti presenti viene
1138 sommato il valore di \var{seq} moltiplicato per il numero massimo di oggetti
1139 di quel tipo,\footnote{questo vale fino ai kernel della serie 2.2.x, dalla
1140   serie 2.4.x viene usato lo stesso fattore per tutti gli oggetti, esso è dato
1141   dalla costante \macro{IPCMNI}, definita in \file{include/linux/ipc.h}, che
1142   indica il limite massimo per il numero di tutti oggetti di IPC, ed il cui
1143   valore è 32768.}  si evita così il riutilizzo degli stessi numeri, e si fa
1144 sì che l'identificatore assuma tutti i valori possibili.
1145
1146 \begin{figure}[!htb]
1147   \footnotesize \centering
1148   \begin{minipage}[c]{15cm}
1149     \begin{lstlisting}{}
1150 int main(int argc, char *argv[])
1151 {
1152     ...
1153     switch (type) {
1154     case 'q':   /* Message Queue */
1155         debug("Message Queue Try\n");
1156         for (i=0; i<n; i++) {
1157             id = msgget(IPC_PRIVATE, IPC_CREAT|0666);
1158             printf("Identifier Value %d \n", id);
1159             msgctl(id, IPC_RMID, NULL);
1160         }
1161         break;
1162     case 's':   /* Semaphore */
1163         debug("Semaphore\n");
1164         for (i=0; i<n; i++) {
1165             id = semget(IPC_PRIVATE, 1, IPC_CREAT|0666);
1166             printf("Identifier Value %d \n", id);
1167             semctl(id, 0, IPC_RMID);
1168         }
1169         break;
1170     case 'm':   /* Shared Memory */
1171         debug("Shared Memory\n");
1172         for (i=0; i<n; i++) {
1173             id = shmget(IPC_PRIVATE, 1000, IPC_CREAT|0666);
1174             printf("Identifier Value %d \n", id);
1175             shmctl(id, IPC_RMID, NULL);
1176         }
1177         break;
1178     default:    /* should not reached */
1179         return -1;
1180     }
1181     return 0;
1182 }
1183     \end{lstlisting}
1184   \end{minipage}
1185   \normalsize
1186   \caption{Sezione principale del programma di test per l'assegnazione degli
1187     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1188   \label{fig:ipc_sysv_idtest}
1189 \end{figure}
1190
1191 In \figref{fig:ipc_sysv_idtest} è riportato il codice di un semplice programma
1192 di test che si limita a creare un oggetto (specificato a riga di comando),
1193 stamparne il numero di identificatore e cancellarlo per un numero specificato
1194 di volte. Al solito non si è riportato il codice della gestione delle opzioni
1195 a riga di comando, che permette di specificare quante volte effettuare il
1196 ciclo \var{n}, e su quale tipo di oggetto eseguirlo.
1197
1198 La figura non riporta il codice di selezione delle opzioni, che permette di
1199 inizializzare i valori delle variabili \var{type} al tipo di oggetto voluto, e
1200 \var{n} al numero di volte che si vuole effettuare il ciclo di creazione,
1201 stampa, cancellazione. I valori di default sono per l'uso delle code di
1202 messaggi e un ciclo di 5 volte. Se si lancia il comando si otterrà qualcosa
1203 del tipo:
1204 \begin{verbatim}
1205 piccardi@gont sources]$ ./ipctestid
1206 Identifier Value 0
1207 Identifier Value 32768
1208 Identifier Value 65536
1209 Identifier Value 98304
1210 Identifier Value 131072
1211 \end{verbatim}%$
1212 il che ci mostra che abbiamo un kernel della serie 2.4.x nel quale non avevamo
1213 ancora usato nessuna coda di messaggi. Se ripetiamo il comando otterremo
1214 ancora:
1215 \begin{verbatim}
1216 [piccardi@gont sources]$ ./ipctestid
1217 Identifier Value 163840
1218 Identifier Value 196608
1219 Identifier Value 229376
1220 Identifier Value 262144
1221 Identifier Value 294912
1222 \end{verbatim}%$
1223 che ci mostra come il valore di \var{seq} sia in effetti una quantità
1224 mantenuta staticamente all'interno del sistema.
1225
1226
1227 \subsection{Code di messaggi}
1228 \label{sec:ipc_sysv_mq}
1229
1230 Il primo oggetto introdotto dal \textit{SysV IPC} è quello delle code di
1231 messaggi.  Le code di messaggi sono oggetti analoghi alle pipe o alle fifo,
1232 anche se la loro struttura è diversa. La funzione che permette di ottenerne
1233 una è \func{msgget} ed il suo prototipo è:
1234 \begin{functions}
1235   \headdecl{sys/types.h}
1236   \headdecl{sys/ipc.h}
1237   \headdecl{sys/msg.h}
1238
1239   \funcdecl{int msgget(key\_t key, int flag)}
1240
1241   Restituisce l'identificatore di una coda di messaggi.
1242
1243   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1244     in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1245   \begin{errlist}
1246   \item[\macro{EACCES}] Il processo chiamante non ha i privilegi per accedere
1247   alla coda richiesta.
1248   \item[\macro{EEXIST}] Si è richiesta la creazione di una coda che già
1249   esiste, ma erano specificati sia \macro{IPC\_CREAT} che \macro{IPC\_EXCL}.
1250   \item[\macro{EIDRM}] La coda richiesta è marcata per essere cancellata.
1251   \item[\macro{ENOENT}] Si è cercato di ottenere l'identificatore di una coda
1252     di messaggi specificando una chiave che non esiste e \macro{IPC\_CREAT}
1253     non era specificato.
1254   \item[\macro{ENOSPC}] Si è cercato di creare una coda di messaggi quando è
1255     stato superato il limite massimo di code (\macro{MSGMNI}).
1256   \end{errlist}
1257   ed inoltre \macro{ENOMEM}.
1258 }
1259 \end{functions}
1260
1261 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1262 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1263 nuova. L'argomento \param{key} specifica la chiave che è associata
1264 all'oggetto, eccetto il caso in cui si specifichi il valore
1265 \macro{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1266 associata alcuna chiave, il processo (ed i suoi eventuali figli) potranno
1267 farvi riferimento solo attraverso l'identificatore.
1268
1269 Se invece si specifica un valore diverso da \macro{IPC\_PRIVATE}\footnote{in
1270   Linux questo significa un valore diverso da zero.} l'effetto della funzione
1271 dipende dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1272 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1273 se trova una corrispondenza, o fallendo con un errore di \macro{ENOENT} se non
1274 esiste o di \macro{EACCESS} se si sono specificati dei permessi non validi.
1275
1276 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1277 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1278 corrispondente al valore \macro{IPC\_CREAT}. In questo caso i nove bit meno
1279 significativi di \param{flag} saranno usati come permessi per il nuovo
1280 oggetto, secondo quanto illustrato in \secref{sec:ipc_sysv_access_control}.
1281 Se si imposta anche il bit corrispondente a \macro{IPC\_EXCL} la funzione avrà
1282 successo solo se l'oggetto non esiste già, fallendo con un errore di
1283 \macro{EEXIST} altrimenti.
1284
1285 Si tenga conto che l'uso di \macro{IPC\_PRIVATE} non impedisce ad altri
1286 processi di accedere alla coda (se hanno privilegi sufficienti) una volta che
1287 questi possano indovinare o ricavare (ad esempio per tentativi)
1288 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1289 IPC infatti non esiste una maniera che  garantisca l'accesso esclusivo ad una
1290 coda di messaggi.  Usare \macro{IPC\_PRIVATE} o macro{IPC\_CREAT} e
1291 \macro{IPC\_EXCL} per \param{flag} comporta solo la creazione di una nuova
1292 coda.
1293
1294 \begin{table}[htb]
1295   \footnotesize
1296   \centering
1297   \begin{tabular}[c]{|c|r|l|l|}
1298     \hline
1299     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
1300     & \textbf{Significato} \\
1301     \hline
1302     \hline
1303     \macro{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1304                                           messaggi. \\
1305     \macro{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1306                                           messaggio.\\
1307     \macro{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di
1308                                           una coda.\\
1309     \hline
1310   \end{tabular}
1311   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1312   \label{tab:ipc_msg_limits}
1313 \end{table}
1314
1315 Le code di messaggi sono caratterizzate da tre limiti fondamentali, definiti
1316 negli header e corrispondenti alle prime tre costanti riportate in
1317 \tabref{tab:ipc_msg_limits}, come accennato però in Linux è possibile
1318 modificare questi limiti attraverso l'uso di \func{syscntl} o scrivendo nei
1319 file \file{msgmax}, \file{msgmnb} e \file{msgmni} di \file{/proc/sys/kernel/}.
1320
1321
1322 \begin{figure}[htb]
1323   \centering \includegraphics[width=15cm]{img/mqstruct}
1324   \caption{Schema della struttura di una coda messaggi.}
1325   \label{fig:ipc_mq_schema}
1326 \end{figure}
1327
1328
1329 Una coda di messaggi è costituita da una \textit{linked list};\footnote{una
1330   \textit{linked list} è una tipica struttura di dati, organizzati in una
1331   lista in cui ciascun elemento contiene un puntatore al successivo. In questo
1332   modo la struttura è veloce nell'estrazione ed immissione dei dati dalle
1333   estremità dalla lista (basta aggiungere un elemento in testa o in coda ed
1334   aggiornare un puntatore), e relativamente veloce da attraversare in ordine
1335   sequenziale (seguendo i puntatori), è invece relativamente lenta
1336   nell'accesso casuale e nella ricerca.}  i nuovi messaggi vengono inseriti in
1337 coda alla lista e vengono letti dalla cima, in \figref{fig:ipc_mq_schema} si è
1338 riportato lo schema con cui queste strutture vengono mantenute dal
1339 kernel.\footnote{lo schema illustrato in \figref{fig:ipc_mq_schema} è in
1340   realtà una semplificazione di quello usato effettivamente fino ai kernel
1341   della serie 2.2.x, nei kernel della serie 2.4.x la gestione delle code di
1342   messaggi è stata modificata ed è effettuata in maniera diversa; abbiamo
1343   mantenuto lo schema precedente in quanto illustra comunque in maniera più
1344   che adeguata i principi di funzionamento delle code di messaggi.}
1345
1346 \begin{figure}[!htb]
1347   \footnotesize \centering
1348   \begin{minipage}[c]{15cm}
1349     \begin{lstlisting}[labelstep=0]{}
1350 struct msqid_ds {
1351     struct ipc_perm msg_perm;     /* structure for operation permission */
1352     time_t msg_stime;             /* time of last msgsnd command */
1353     time_t msg_rtime;             /* time of last msgrcv command */
1354     time_t msg_ctime;             /* time of last change */
1355     msgqnum_t msg_qnum;           /* number of messages currently on queue */
1356     msglen_t msg_qbytes;          /* max number of bytes allowed on queue */
1357     pid_t msg_lspid;              /* pid of last msgsnd() */
1358     pid_t msg_lrpid;              /* pid of last msgrcv() */
1359     struct msg *msg_first;        /* first message on queue, unused  */
1360     struct msg *msg_last;         /* last message in queue, unused */
1361     unsigned long int msg_cbytes; /* current number of bytes on queue */
1362 };
1363     \end{lstlisting}
1364   \end{minipage}
1365   \normalsize
1366   \caption{La struttura \var{msgid\_ds}, associata a ciascuna coda di
1367     messaggi.}
1368   \label{fig:ipc_msgid_ds}
1369 \end{figure}
1370
1371 A ciascuna coda è associata una struttura \var{msgid\_ds}, la cui definizione,
1372 è riportata in \secref{fig:ipc_msgid_ds}. In questa struttura il kernel
1373 mantiene le principali informazioni riguardo lo stato corrente della
1374 coda.\footnote{come accennato questo vale fino ai kernel della serie 2.2.x,
1375   essa viene usata nei kernel della serie 2.4.x solo per compatibilità in
1376   quanto è quella restituita dalle funzioni dell'interfaccia.  Si noti come ci
1377   sia una differenza con i campi mostrati nello schema di
1378   \figref{fig:ipc_mq_schema} che sono presi dalla definizione di
1379   \file{linux/msg.h}, e fanno riferimento alla definizione della omonima
1380   struttura usata nel kernel.} In \figref{fig:ipc_msgid_ds} sono elencati i
1381 campi significativi definiti in \file{sys/msg.h}, a cui si sono aggiunti gli
1382 ultimi tre campi che sono previsti dalla implementazione originale di System
1383 V, ma non dallo standard Unix98.
1384
1385 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1386 inizializzata, in particolare il campo \var{msg\_perm} viene inizializzato
1387 come illustrato in \secref{sec:ipc_sysv_access_control}, per quanto riguarda
1388 gli altri campi invece:
1389 \begin{itemize}
1390 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1391   sulla coda, viene inizializzato a 0.
1392 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1393   rispettivamente il \acr{pid} dell'ultimo processo che ha inviato o ricevuto
1394   un messaggio sulla coda, sono inizializzati a 0.
1395 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1396   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1397   messaggio sulla coda, sono inizializzati a 0.
1398 \item il campo \var{msg\_ctime}, che esprime il tempo di creazione della coda,
1399   viene inizializzato al tempo corrente.
1400 \item il campo \var{msg\_qbytes} che esprime la dimensione massima del
1401   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1402   del sistema (\macro{MSGMNB}).
1403 \item i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1404   primo e ultimo messaggio sono inizializzati a \macro{NULL} e
1405   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1406   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1407   e non devono essere utilizzati da programmi in user space).
1408 \end{itemize}
1409
1410 Una volta creata una coda di messaggi le operazioni di controllo vengono
1411 effettuate con la funzione \func{msgctl}, che (come le analoghe \func{semctl}
1412 e \func{shmctl}) fa le veci di quello che \func{ioctl} è per i file; il suo
1413 prototipo è:
1414 \begin{functions}
1415   \headdecl{sys/types.h}
1416   \headdecl{sys/ipc.h}
1417   \headdecl{sys/msg.h}
1418
1419   \funcdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1420
1421   Esegue l'operazione specificata da \param{cmd} sulla coda \param{msqid}.
1422
1423   \bodydesc{La funzione restituisce 0 in caso di successo o -1 in caso di
1424     errore, nel qual caso \var{errno} assumerà uno dei valori:
1425   \begin{errlist}
1426   \item[\macro{EACCES}] Si è richiesto \macro{IPC\_STAT} ma processo chiamante
1427     non ha i privilegi di lettura sulla coda.
1428   \item[\macro{EIDRM}] La coda richiesta è stata cancellata.
1429   \item[\macro{EPERM}] Si è richiesto \macro{IPC\_SET} o \macro{IPC\_RMID} ma
1430     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1431     \var{msg\_qbytes} oltre il limite \macro{MSGMNB} senza essere
1432     amministratore.
1433   \end{errlist}
1434   ed inoltre \macro{EFAULT} ed \macro{EINVAL}.
1435 }
1436 \end{functions}
1437
1438 La funzione permette di accedere ai valori della struttura \var{msqid\_ds},
1439 mantenuta all'indirizzo \param{buf}, per la coda specificata
1440 dall'identificatore \param{msqid}. Il comportamento della funzione dipende dal
1441 valore dell'argomento \param{cmd}, che specifica il tipo di azione da
1442 eseguire; i valori possibili sono:
1443 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1444 \item[\macro{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1445   struttura indicata da \param{buf}. Occorre avere il permesso di lettura
1446   sulla coda.
1447 \item[\macro{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1448   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1449   riceveranno un errore di \macro{EIDRM}, e tutti processi in attesa su
1450   funzioni di di lettura o di scrittura sulla coda saranno svegliati ricevendo
1451   il medesimo errore. Questo comando può essere eseguito solo da un processo
1452   con userid effettivo corrispondente al creatore o al proprietario della
1453   coda, o all'amministratore.
1454 \item[\macro{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1455   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1456   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1457   struttura \var{msqid\_ds} puntata da \param{buf}.  Per modificare i valori
1458   di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid} occorre
1459   essere il proprietario o il creatore della coda, oppure l'amministratore; lo
1460   stesso vale per \var{msg\_qbytes}, ma l'amministratore ha la facoltà di
1461   incrementarne il valore a limiti superiori a \macro{MSGMNB}.
1462 \end{basedescript}
1463
1464
1465 Una volta che si abbia a disposizione l'identificatore, per inviare un
1466 messaggio su una coda si utilizza la funzione \func{msgsnd}; il suo prototipo
1467 è:
1468 \begin{functions}
1469   \headdecl{sys/types.h}
1470   \headdecl{sys/ipc.h}
1471   \headdecl{sys/msg.h}
1472
1473   \funcdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int
1474     msgflg)}
1475
1476   Invia un messaggio sulla coda \param{msqid}.
1477
1478   \bodydesc{La funzione restituisce 0, e -1 in caso di errore, nel qual caso
1479     \var{errno} assumerà uno dei valori:
1480   \begin{errlist}
1481   \item[\macro{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1482   \item[\macro{EIDRM}] La coda è stata cancellata.
1483   \item[\macro{EAGAIN}] Il messaggio non può essere inviato perché si è
1484   superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1485   sulla coda, e si è richiesto \macro{IPC\_NOWAIT} in \param{flag}.
1486   \item[\macro{EINTR}] La funzione è stata interrotta da un segnale.
1487   \item[\macro{EINVAL}] Si è specificato un \param{msgid} invalido, o un
1488     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1489     maggiore di \macro{MSGMAX}.
1490   \end{errlist}
1491   ed inoltre \macro{EFAULT} ed \macro{ENOMEM}.
1492 }
1493 \end{functions}
1494
1495 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1496 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1497 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1498 puntatore ad una struttura \var{msgbuf} analoga a quella riportata in
1499 \figref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1500 messaggio.  La dimensione massima per il testo di un messaggio non può
1501 comunque superare il limite \macro{MSGMAX}.
1502
1503 La struttura di \figref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1504 la definizione contenuta in \file{sys/msg.h} usa esplicitamente per il secondo
1505 campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini pratici.
1506 La sola cosa che conta è che la struttura abbia come primo membro un campo
1507 \var{mtype} come nell'esempio; esso infatti serve ad identificare il tipo di
1508 messaggio e deve essere sempre specificato come intero positivo di tipo
1509 \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1510 dimensione, e serve a contenere il testo del messaggio.
1511
1512 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1513 ridefinire una struttura simile a quella di \figref{fig:ipc_msbuf}, adattando
1514 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1515 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1516 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1517 indica il tipo.
1518
1519 Si tenga presente che la lunghezza che deve essere indicata in questo
1520 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1521 cioè \var{message} è una propria struttura che si passa alla funzione,
1522 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1523 consideriamo il caso dell'esempio in \figref{fig:ipc_msbuf}, \param{msgsz}
1524 dovrà essere pari a \macro{LENGTH}).
1525
1526 \begin{figure}[!htb]
1527   \footnotesize \centering
1528   \begin{minipage}[c]{15cm}
1529     \begin{lstlisting}[labelstep=0]{}
1530     struct msgbuf {
1531          long mtype;          /* message type, must be > 0 */
1532          char mtext[LENGTH];  /* message data */
1533     };
1534     \end{lstlisting}
1535   \end{minipage}
1536   \normalsize
1537   \caption{Schema della struttura \var{msgbuf}, da utilizzare come argomento
1538     per inviare/ricevere messaggi.}
1539   \label{fig:ipc_msbuf}
1540 \end{figure}
1541
1542 Per capire meglio il funzionamento della funzione riprendiamo in
1543 considerazione la struttura della coda illustrata in
1544 \figref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1545 sarà aggiunto in fondo alla lista inserendo una nuova struttura \var{msg}, il
1546 puntatore \var{msg\_last} di \var{msqid\_ds} verrà aggiornato, come pure il
1547 puntatore al messaggio successivo per quello che era il precedente ultimo
1548 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1549 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1550 all'indirizzo specificato da \var{msg\_spot}.
1551
1552 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1553 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1554 ritorna immediatamente a meno che si sia ecceduto il valore di
1555 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1556 caso si blocca mandando il processo in stato di \textit{sleep}.  Se si
1557 specifica per \param{flag} il valore \macro{IPC\_NOWAIT} la funzione opera in
1558 modalità non bloccante, ed in questi casi ritorna immediatamente con un errore
1559 di \macro{EAGAIN}.
1560
1561 Se non si specifica \macro{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1562 che non si liberano risorse sufficienti per poter inserire nella coda il
1563 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare, con
1564 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1565 (nel qual caso si ha un errore di \macro{EIDRM}) o quando la funzione viene
1566 interrotta da un segnale (nel qual caso si ha un errore di \macro{EINTR}).
1567
1568 Una volta completato con successo l'invio del messaggio sulla coda, la
1569 funzione aggiorna i dati mantenuti in \var{msqid\_ds}, in particolare vengono
1570 modificati:
1571 \begin{itemize*}
1572 \item Il valore di \var{msg\_lspid}, che viene impostato al \acr{pid} del
1573   processo chiamante.
1574 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1575 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1576 \end{itemize*}
1577
1578 La funzione che viene utilizzata per estrarre un messaggio da una coda è
1579 \func{msgrcv}; il suo prototipo è:
1580 \begin{functions}
1581   \headdecl{sys/types.h}
1582   \headdecl{sys/ipc.h}
1583   \headdecl{sys/msg.h}
1584
1585   \funcdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1586     long msgtyp, int msgflg)}
1587
1588   Legge un messaggio dalla coda \param{msqid}.
1589
1590   \bodydesc{La funzione restituisce il numero di byte letti in caso di
1591     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà uno
1592     dei valori:
1593   \begin{errlist}
1594   \item[\macro{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1595   \item[\macro{EIDRM}] La coda è stata cancellata.
1596   \item[\macro{E2BIG}] Il testo del messaggio è più lungo di \param{msgsz} e
1597   non si è specificato \macro{MSG\_NOERROR} in \param{msgflg}.
1598   \item[\macro{EINTR}] La funzione è stata interrotta da un segnale mentre era
1599   in attesa di ricevere un messaggio.
1600   \item[\macro{EINVAL}] Si è specificato un \param{msgid} invalido o un valore
1601     di \param{msgsz} negativo.
1602   \end{errlist}
1603   ed inoltre \macro{EFAULT}.
1604 }
1605 \end{functions}
1606
1607 La funzione legge un messaggio dalla coda specificata, scrivendolo sulla
1608 struttura puntata da \param{msgp}, che dovrà avere un formato analogo a quello
1609 di \figref{fig:ipc_msbuf}.  Una volta estratto, il messaggio sarà rimosso dalla
1610 coda.  L'argomento \param{msgsz} indica la lunghezza massima del testo del
1611 messaggio (equivalente al valore del parametro \macro{LENGTH} nell'esempio di
1612 \figref{fig:ipc_msbuf}).
1613
1614 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1615 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1616 \macro{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1617 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1618 un errore di \macro{E2BIG}.
1619
1620 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1621 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1622 una scansione della struttura mostrata in \figref{fig:ipc_mq_schema},
1623 restituendo il primo messaggio incontrato che corrisponde ai criteri
1624 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1625 coda, è quello meno recente); in particolare:
1626 \begin{itemize*}
1627 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1628   quello fra i presenti che è stato inserito inserito per primo.
1629 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1630   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1631   \param{msgtyp}.
1632 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1633   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1634   inferiore al valore assoluto di \param{msgtyp}.
1635 \end{itemize*}
1636
1637 Il valore di \param{msgflg} permette di controllare il comportamento della
1638 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1639 valori.  Oltre al precedente \macro{MSG\_NOERROR}, sono possibili altri due
1640 valori: \macro{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1641 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1642 \macro{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1643 ci sono messaggi sulla coda.
1644
1645 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1646 disponibili per la lettura, è di bloccare il processo in stato di
1647 \textit{sleep}. Nel caso però si sia specificato \macro{IPC\_NOWAIT} la
1648 funzione ritorna immediatamente con un errore \macro{ENOMSG}. Altrimenti la
1649 funzione ritorna normalmente non appena viene inserito un messaggio del tipo
1650 desiderato, oppure ritorna con errore qualora la coda sia rimossa (con
1651 \var{errno} impostata a \macro{EIDRM}) o se il processo viene interrotto da un
1652 segnale (con \var{errno} impostata a \macro{EINTR}).
1653
1654 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1655 funzione aggiorna i dati mantenuti in \var{msqid\_ds}, in particolare vengono
1656 modificati:
1657 \begin{itemize*}
1658 \item Il valore di \var{msg\_lrpid}, che viene impostato al \acr{pid} del
1659   processo chiamante.
1660 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1661 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1662 \end{itemize*}
1663
1664 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1665 SysV IPC; essendo questi permanenti restano nel sistema occupando risorse
1666 anche quando un processo è terminato, al contrario delle pipe per le quali
1667 tutte le risorse occupate vengono rilasciate quanto l'ultimo processo che le
1668 utilizzava termina. Questo comporta che in caso di errori si può saturare il
1669 sistema, e che devono comunque essere esplicitamente previste delle funzioni
1670 di rimozione in caso di interruzioni o uscite dal programma (come vedremo in
1671 \figref{fig:ipc_mq_fortune_server}).
1672
1673 L'altro problema è non facendo uso di file descriptor le tecniche di
1674 \textit{I/O multiplexing} descritte in \secref{sec:file_multiplexing} non
1675 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1676 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1677 una di queste strutture alla volta; ad esempio non si può scrivere un server
1678 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1679 di \textit{polling}\index{polling} che esegua un ciclo di attesa su ciascuna
1680 di esse.
1681
1682 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1683 server di \textit{fortunes} usando queste al posto delle fifo. In questo caso
1684 useremo una sola coda di messaggi, usando il tipo di messaggio per comunicare
1685 in maniera indipendente con client diversi.
1686
1687 \begin{figure}[!bht]
1688   \footnotesize \centering
1689   \begin{minipage}[c]{15cm}
1690     \begin{lstlisting}{}
1691 int msgid;                                       /* Message queue identifier */
1692 int main(int argc, char *argv[])
1693 {
1694 /* Variables definition */
1695     int i, n = 0;
1696     char **fortune;                       /* array of fortune message string */
1697     char *fortunefilename;                              /* fortune file name */
1698     struct msgbuf_read {      /* message struct to read request from clients */
1699         long mtype;                               /* message type, must be 1 */
1700         long pid;             /* message data, must be the pid of the client */
1701     } msg_read;
1702     struct msgbuf_write {       /* message struct to write result to clients */
1703         long mtype;            /* message type, will be the pid of the client*/
1704         char mtext[MSGMAX];             /* message data, will be the fortune */
1705     } msg_write;
1706     key_t key;                                          /* Message queue key */
1707     int size;                                                /* message size */
1708     ...
1709     Signal(SIGTERM, HandSIGTERM);            /* set handlers for termination */
1710     Signal(SIGINT, HandSIGTERM);
1711     Signal(SIGQUIT, HandSIGTERM);
1712     if (n==0) usage();          /* if no pool depth exit printing usage info */
1713     i = FortuneParse(fortunefilename, fortune, n);          /* parse phrases */
1714     /* Create the queue */
1715     key = ftok("./MQFortuneServer.c", 1);
1716     msgid = msgget(key, IPC_CREAT|0666);
1717     if (msgid < 0) {
1718         perror("Cannot create message queue");
1719         exit(1);
1720     }
1721     /* Main body: loop over requests */
1722     while (1) {
1723         msgrcv(msgid, &msg_read, sizeof(int), 1, MSG_NOERROR);
1724         n = random() % i;                             /* select random value */
1725         strncpy(msg_write.mtext, fortune[n], MSGMAX);
1726         size = min(strlen(fortune[n])+1, MSGMAX);
1727         msg_write.mtype=msg_read.pid;             /* use request pid as type */
1728         msgsnd(msgid, &msg_write, size, 0);
1729     }
1730 }
1731 /*
1732  * Signal Handler to manage termination
1733  */
1734 void HandSIGTERM(int signo) {
1735     msgctl(msgid, IPC_RMID, NULL);                   /* remove message queue */
1736     exit(0);
1737 }
1738     \end{lstlisting}
1739   \end{minipage}
1740   \normalsize
1741   \caption{Sezione principale del codice del server di \textit{fortunes}
1742     basato sulle \textit{message queue}.}
1743   \label{fig:ipc_mq_fortune_server}
1744 \end{figure}
1745
1746 In \figref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1747 principali del codice del nuovo server (il codice completo è nel file
1748 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1749 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1750 per permettere una comunicazione indipendente fra il server ed i vari client,
1751 usando il \acr{pid} di questi ultimi come identificativo. Questo è possibile
1752 in quanto, al contrario di una fifo, la lettura di una coda di messaggi può
1753 non essere sequenziale, proprio grazie alla classificazione dei messaggi sulla
1754 base del loro tipo.
1755
1756 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1757 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1758 definisce due strutture appositamente per la comunicazione; con
1759 \var{msgbuf\_read} (\texttt{\small 8--11}) vengono passate le richieste mentre
1760 con \var{msgbuf\_write} (\texttt{\small 12--15}) vengono restituite le frasi.
1761
1762 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1763 in \var{n} il numero di frasi da leggere specificato a linea di comando ed in
1764 \var{fortunefilename} il file da cui leggerle; dopo aver installato
1765 (\texttt{\small 19--21}) dei manipolatori per gestire l'uscita dal server,
1766 viene prima controllato (\texttt{\small 22}) il numero di frasi richieste
1767 abbia senso (cioè sia maggiore di zero), le quali poi (\texttt{\small 23})
1768 vengono lette nel vettore in memoria con la stessa funzione
1769 \code{FortuneParse()} usata anche per il server basato sulle fifo.
1770
1771 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1772 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1773 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1774 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1775 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1776 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1777 programma (\texttt{\small 27--29}) in caso di errore.
1778
1779 Finita la fase di inizializzazione il server esegue in permanenza il ciclo
1780 principale (\texttt{\small 32--41}). Questo inizia (\texttt{\small 33}) con il
1781 porsi in attesa di un messaggio di richiesta da parte di un client; si noti
1782 infatti come \func{msgrcv} richieda un messaggio con \var{mtype} uguale a 1:
1783 questo è il valore usato per le richieste dato che corrisponde al \acr{pid} di
1784 \cmd{init}, che non può essere un client. L'uso del flag \macro{MSG\_NOERROR}
1785 è solo per sicurezza, dato che i messaggi di richiesta sono di dimensione
1786 fissa (e contengono solo il \acr{pid} del client).
1787
1788 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1789 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1790 di richiesta da parte di un client, in tal caso il ciclo prosegue
1791 (\texttt{\small 34}) selezionando una frase a caso, copiandola (\texttt{\small
1792   35}) nella struttura \var{msgbuf\_write} usata per la risposta e
1793 calcolandone (\texttt{\small 36}) la dimensione.
1794
1795 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1796 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 37})
1797 al valore del \acr{pid} del client ricevuto nel messaggio di richiesta.
1798 L'ultimo passo del ciclo (\texttt{\small 38}) è inviare sulla coda il
1799 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1800 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1801
1802 Si noti che il programma può terminare solo grazie ad una interruzione da
1803 parte di un segnale; in tal caso verrà eseguito il manipolatore
1804 \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1805 (\texttt{\small 44}) ed ad uscire (\texttt{\small 45}).
1806
1807 \begin{figure}[!bht]
1808   \footnotesize \centering
1809   \begin{minipage}[c]{15cm}
1810     \begin{lstlisting}{}
1811 int main(int argc, char *argv[])
1812 {
1813     ...
1814     key = ftok("./MQFortuneServer.c", 1);
1815     msgid = msgget(key, 0);
1816     if (msgid < 0) {
1817         perror("Cannot find message queue");
1818         exit(1);
1819     }
1820     /* Main body: do request and write result */
1821     msg_read.mtype = 1;                      /* type for request is always 1 */
1822     msg_read.pid = getpid();                   /* use pid for communications */
1823     size = sizeof(msg_read.pid);
1824     msgsnd(msgid, &msg_read, size, 0);               /* send request message */
1825     msgrcv(msgid, &msg_write, MSGMAX, msg_read.pid, MSG_NOERROR);
1826     printf("%s", msg_write.mtext);
1827 }
1828     \end{lstlisting}
1829   \end{minipage}
1830   \normalsize
1831   \caption{Sezione principale del codice del client di \textit{fortunes}
1832     basato sulle \textit{message queue}.}
1833   \label{fig:ipc_mq_fortune_client}
1834 \end{figure}
1835
1836 In \figref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice del
1837 programma client.  Al solito il codice completo è con i sorgenti allegati, nel
1838 file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti relative
1839 alla gestione delle opzioni, ed in questo caso, anche la dichiarazione delle
1840 variabili, che, per la parte relative alle strutture usate per la
1841 comunicazione tramite le code, sono le stesse viste in
1842 \figref{fig:ipc_mq_fortune_server}.
1843
1844 Il client in questo caso è molto semplice; la prima parte del programma
1845 (\texttt{\small 4--9}) si occupa di accedere alla coda di messaggi, ed è
1846 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1847 non viene chiamata con il flag di creazione in quanto la coda deve essere
1848 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1849 il programma termina immediatamente.
1850
1851 Una volta acquisito l'identificatore della coda il client compone il
1852 messaggio di richiesta (\texttt{\small 12--13}) in \var{msg\_read}, usando 1
1853 per il tipo ed inserendo il proprio \acr{pid} come dato da passare al server.
1854 Calcolata (\texttt{\small 14}) la dimensione, provvede (\texttt{\small 15}) ad
1855 immettere la richiesta sulla coda.
1856
1857 A questo punto non resta che (\texttt{\small 16}) rileggere dalla coda la
1858 risposta del server richiedendo a \func{msgrcv} di selezionare i messaggi di
1859 tipo corrispondente al valore del \acr{pid} inviato nella richiesta. L'ultimo
1860 passo (\texttt{\small 17}) prima di uscire è quello di stampare a video il
1861 messaggio ricevuto.
1862
1863 Benché funzionante questa architettura risente dello stesso inconveniente
1864 visto anche nel caso del precedente server basato sulle fifo; se il client
1865 viene interrotto dopo l'invio del messaggio di richiesta e prima della lettura
1866 della risposta, quest'ultima resta nella coda (così come per le fifo si aveva
1867 il problema delle fifo che restavano nel filesystem). In questo caso però il
1868 problemi sono maggiori, sia perché è molto più facile esaurire la memoria
1869 dedicata ad una coda di messaggi che gli inode di un filesystem, sia perché,
1870 con il riutilizzo dei \acr{pid} da parte dei processi, un client eseguito in
1871 un momento successivo potrebbe ricevere un messaggio non indirizzato a
1872 lui.
1873
1874
1875
1876 \subsection{Semafori}
1877 \label{sec:ipc_sysv_sem}
1878
1879 I semafori non sono meccanismi di intercomunicazione diretta come quelli
1880 (pipe, fifo e code di messaggi) visti finora, e non consentono di scambiare
1881 dati fra processi, ma servono piuttosto come meccanismi di sincronizzazione o
1882 di protezione per le \textsl{sezioni critiche}\index{sezioni critiche} del
1883 codice (si ricordi quanto detto in \secref{sec:proc_race_cond}).
1884
1885 Un semaforo è uno speciale contatore, mantenuto nel kernel, che permette, a
1886 seconda del suo valore, di consentire o meno la prosecuzione dell'esecuzione
1887 di un programma. In questo modo l'accesso ad una risorsa condivisa da più
1888 processi può essere controllato, associando ad essa un semaforo che consente
1889 di assicurare che non più di un processo alla volta possa usarla.
1890
1891 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1892 assolutamente generico, così come del tutto generali sono modalità con cui lo
1893 si utilizza. Un processo che deve accedere ad una risorsa eseguirà un
1894 controllo del semaforo: se questo è positivo il suo valore sarà decrementato,
1895 indicando che si è consumato una unità della risorsa, ed il processo potrà
1896 proseguire nell'utilizzo di quest'ultima, provvedendo a rilasciarla, una volta
1897 completate le operazioni volute, reincrementando il semaforo.
1898
1899 Se al momento del controllo il valore del semaforo è nullo, siamo invece in
1900 una situazione in cui la risorsa non è disponibile, ed il processo si
1901 bloccherà in stato di \textit{sleep} fin quando chi la sta utilizzando non la
1902 rilascerà, incrementando il valore del semaforo. Non appena il semaforo torna
1903 positivo, indicando che la risorsa è disponibile, il processo sarà svegliato,
1904 e si potrà operare come nel caso precedente (decremento del semaforo, accesso
1905 alla risorsa, incremento del semaforo).
1906
1907 Per poter implementare questo tipo di logica le operazioni di controllo e
1908 decremento del contatore associato al semaforo devono essere atomiche,
1909 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1910 demandata al kernel. La forma più semplice di semaforo è quella del
1911 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1912 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1913 della risorsa; in generale però si possono usare semafori con valori interi,
1914 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1915 ancora disponibili.
1916
1917 Il sistema di comunicazione interprocesso di \textit{SysV IPC} prevede anche i
1918 semafori, ma gli oggetti utilizzati non sono semafori singoli, ma gruppi di
1919 semafori detti \textsl{insiemi} (o \textit{semaphore set}); la funzione che
1920 permette di creare o ottenere l'identificatore di un insieme di semafori è
1921 \func{semget}, ed il suo prototipo è:
1922 \begin{functions}
1923   \headdecl{sys/types.h}
1924   \headdecl{sys/ipc.h}
1925   \headdecl{sys/sem.h}
1926
1927   \funcdecl{int semget(key\_t key, int nsems, int flag)}
1928
1929   Restituisce l'identificatore di un insieme di semafori.
1930
1931   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1932     in caso di errore, nel qual caso \var{errno} assumerà i valori:
1933     \begin{errlist}
1934     \item[\macro{ENOSPC}] Si è cercato di creare una insieme di semafori
1935       quando è stato superato o il limite per il numero totale di semafori
1936       (\macro{SEMMNS}) o quello per il numero totale degli insiemi
1937       (\macro{SEMMNI}) nel sistema.
1938     \item[\macro{EINVAL}] L'argomento \param{nsems} è minore di zero o
1939       maggiore del limite sul numero di semafori per ciascun insieme
1940       (\macro{SEMMSL}), o se l'insieme già esiste, maggiore del numero di
1941       semafori che contiene.
1942     \item[\macro{ENOMEM}] Il sistema non ha abbastanza memoria per poter
1943       contenere le strutture per un nuovo insieme di semafori.
1944     \end{errlist}
1945     ed inoltre \macro{EACCES}, \macro{ENOENT}, \macro{EEXIST}, \macro{EIDRM},
1946     con lo stesso significato che hanno per \func{msgget}.}
1947 \end{functions}
1948
1949 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1950 restituisce l'identificatore di un insieme di semafori, in particolare è
1951 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1952 ripeteremo quanto detto al proposito in \secref{sec:ipc_sysv_mq}. L'argomento
1953 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1954 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1955 richiesta dell'identificatore di un insieme già esistente.
1956
1957 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1958 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1959 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1960 complicazione inutile, il problema è che i semafori del \textit{SysV IPC}
1961 soffrono di altri due, ben più gravi, difetti.
1962
1963 Il primo difetto è che non esiste una funzione che permetta di creare ed
1964 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1965 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1966 perde così ogni possibilità di eseguire l'operazione atomicamente.
1967
1968 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1969 \textit{SysV IPC} di essere risorse globali di sistema, che non vengono
1970 cancellate quando nessuno le usa più; ci si così a trova a dover affrontare
1971 esplicitamente il caso in cui un processo termina per un qualche errore,
1972 lasciando un semaforo occupato, che resterà tale fino al successivo riavvio
1973 del sistema. Come vedremo esistono delle modalità per evitare tutto ciò, ma
1974 diventa necessario indicare esplicitamente che si vuole il ripristino del
1975 semaforo all'uscita del processo.
1976
1977
1978 \begin{figure}[!htb]
1979   \footnotesize \centering
1980   \begin{minipage}[c]{15cm}
1981     \begin{lstlisting}[labelstep=0]{}
1982 struct semid_ds
1983 {
1984     struct ipc_perm sem_perm;           /* operation permission struct */
1985     time_t sem_otime;                   /* last semop() time */
1986     time_t sem_ctime;                   /* last time changed by semctl() */
1987     unsigned long int sem_nsems;        /* number of semaphores in set */
1988 };
1989     \end{lstlisting}
1990   \end{minipage}
1991   \normalsize
1992   \caption{La struttura \var{semid\_ds}, associata a ciascun insieme di
1993     semafori.}
1994   \label{fig:ipc_semid_ds}
1995 \end{figure}
1996
1997 A ciascun insieme di semafori è associata una struttura \var{semid\_ds},
1998 riportata in \figref{fig:ipc_semid_ds}.\footnote{non si sono riportati i campi
1999   ad uso interno del kernel, che vedremo in \figref{fig:ipc_sem_schema}, che
2000   dipendono dall'implementazione.} Come nel caso delle code di messaggi quando
2001 si crea un nuovo insieme di semafori con \func{semget} questa struttura viene
2002 inizializzata, in particolare il campo \var{sem\_perm} viene inizializzato
2003 come illustrato in \secref{sec:ipc_sysv_access_control} (si ricordi che in
2004 questo caso il permesso di scrittura è in realtà permesso di alterare il
2005 semaforo), per quanto riguarda gli altri campi invece:
2006 \begin{itemize*}
2007 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
2008   nell'insieme, viene inizializzato al valore di \param{nsems}.
2009 \item il campo \var{sem\_ctime}, che esprime il tempo di creazione
2010   dell'insieme, viene inizializzato al tempo corrente.
2011 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
2012   effettuata, viene inizializzato a zero.
2013 \end{itemize*}
2014
2015
2016 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
2017 \var{sem} che ne contiene i dati essenziali, la sua definizione\footnote{si è
2018   riportata la definizione originaria del kernel 1.0, che contiene la prima
2019   realizzazione del \textit{SysV IPC} in Linux. In realtà questa struttura
2020   ormai è ridotta ai soli due primi membri, e gli altri vengono calcolati
2021   dinamicamente. La si è utilizzata a scopo di esempio, perché indica tutti i
2022   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
2023   citati dalle pagine di manuale.} è riportata in \figref{fig:ipc_sem}. Questa
2024 struttura, non è accessibile in user space, ma i valori in essa specificati
2025 possono essere letti in maniera indiretta, attraverso l'uso delle funzioni di
2026 controllo.
2027
2028 \begin{figure}[!htb]
2029   \footnotesize \centering
2030   \begin{minipage}[c]{15cm}
2031     \begin{lstlisting}[labelstep=0]{}
2032 struct sem {
2033   short   sempid;         /* pid of last operation */
2034   ushort  semval;         /* current value */
2035   ushort  semncnt;        /* num procs awaiting increase in semval */
2036   ushort  semzcnt;        /* num procs awaiting semval = 0 */
2037 };
2038     \end{lstlisting}
2039   \end{minipage}
2040   \normalsize
2041   \caption{La struttura \var{sem}, che contiene i dati di un singolo semaforo.}
2042   \label{fig:ipc_sem}
2043 \end{figure}
2044
2045 I dati mantenuti nella struttura, ed elencati in \figref{fig:ipc_sem},
2046 indicano rispettivamente:
2047 \begin{description*}
2048 \item[\var{semval}] il valore numerico del semaforo.
2049 \item[\var{sempid}] il \acr{pid} dell'ultimo processo che ha eseguito una
2050   operazione sul semaforo.
2051 \item[\var{semncnt}] il numero di processi in attesa che esso venga
2052   incrementato.
2053 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
2054 \end{description*}
2055
2056 \begin{table}[htb]
2057   \footnotesize
2058   \centering
2059   \begin{tabular}[c]{|c|r|p{8cm}|}
2060     \hline
2061     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
2062     \hline
2063     \hline
2064     \macro{SEMMNI}&          128 & Numero massimo di insiemi di semafori. \\
2065     \macro{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
2066     \macro{SEMMNS}&\macro{SEMMNI}*\macro{SEMMSL}& Numero massimo di semafori
2067                                    nel sistema .\\
2068     \macro{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
2069     \macro{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
2070                                    \func{semop}. \\
2071     \macro{SEMMNU}&\macro{SEMMNS}& Massimo numero di strutture di ripristino.\\
2072     \macro{SEMUME}&\macro{SEMOPM}& Massimo numero di voci di ripristino.\\
2073     \macro{SEMAEM}&\macro{SEMVMX}& valore massimo per l'aggiustamento
2074                                    all'uscita. \\
2075     \hline
2076   \end{tabular}
2077   \caption{Valori delle costanti associate ai limiti degli insiemi di
2078     semafori, definite in \file{linux/sem.h}.}
2079   \label{tab:ipc_sem_limits}
2080 \end{table}
2081
2082 Come per le code di messaggi anche per gli insiemi di semafori esistono una
2083 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
2084 sono riportate in \tabref{tab:ipc_sem_limits}. Alcuni di questi limiti sono al
2085 solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
2086 direttamente nel file \file{/proc/sys/kernel/sem}.
2087
2088 La funzione che permette di effettuare le varie operazioni di controllo sui
2089 semafori (fra le quali, come accennato, è impropriamente compresa anche la
2090 loro inizializzazione) è \func{semctl}; il suo prototipo è:
2091 \begin{functions}
2092   \headdecl{sys/types.h}
2093   \headdecl{sys/ipc.h}
2094   \headdecl{sys/sem.h}
2095
2096   \funcdecl{int semctl(int semid, int semnum, int cmd)}
2097   \funcdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
2098
2099   Esegue le operazioni di controllo su un semaforo o un insieme di semafori.
2100
2101   \bodydesc{La funzione restituisce in caso di successo un valore positivo
2102     quanto usata con tre argomenti ed un valore nullo quando usata con
2103     quattro. In caso di errore restituisce -1, ed \var{errno} assumerà uno dei
2104     valori:
2105     \begin{errlist}
2106     \item[\macro{EACCES}] Il processo non ha i privilegi per eseguire
2107       l'operazione richiesta.
2108     \item[\macro{EIDRM}] L'insieme di semafori è stato cancellato.
2109     \item[\macro{EPERM}] Si è richiesto \macro{IPC\_SET} o \macro{IPC\_RMID} ma
2110       il processo non ha  privilegi sufficienti ad eseguire l'operazione.
2111     \item[\macro{ERANGE}] Si è richiesto \macro{SETALL} \macro{SETVAL} ma il
2112       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
2113       di \macro{SEMVMX}.
2114   \end{errlist}
2115   ed inoltre \macro{EFAULT} ed \macro{EINVAL}.
2116 }
2117 \end{functions}
2118
2119 La funzione può avere tre o quattro parametri, a seconda dell'operazione
2120 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
2121 \param{semid} o sul singolo semaforo di un insieme, specificato da
2122 \param{semnum}.
2123
2124 \begin{figure}[!htb]
2125   \footnotesize \centering
2126   \begin{minipage}[c]{15cm}
2127     \begin{lstlisting}[labelstep=0]{}
2128 union semun {
2129       int val;                  /* value for SETVAL */
2130       struct semid_ds *buf;     /* buffer for IPC_STAT, IPC_SET */
2131       unsigned short *array;    /* array for GETALL, SETALL */
2132                                 /* Linux specific part: */
2133       struct seminfo *__buf;    /* buffer for IPC_INFO */
2134 };
2135     \end{lstlisting}
2136   \end{minipage}
2137   \normalsize
2138   \caption{La definizione dei possibili valori di una \var{union semun}, usata
2139     come quarto argomento della funzione \func{semctl}.}
2140   \label{fig:ipc_semun}
2141 \end{figure}
2142
2143 Qualora la funzione operi con quattro argomenti \param{arg} è
2144 un argomento generico, che conterrà un dato diverso a seconda dell'azione
2145 richiesta; per unificare l'argomento esso deve essere passato come una
2146 \var{union semun}, la cui definizione, con i possibili valori che può
2147 assumere, è riportata in \figref{fig:ipc_semun}.
2148
2149 Come già accennato sia il comportamento della funzione che il numero di
2150 parametri con cui deve essere invocata, dipendono dal valore dell'argomento
2151 \param{cmd}, che specifica l'azione da intraprendere; i valori validi (che
2152 cioè non causano un errore di \macro{EINVAL}) per questo argomento sono i
2153 seguenti:
2154 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2155 \item[\macro{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiando il
2156   contenuto della relativa struttura \var{semid\_ds} all'indirizzo specificato
2157   con \var{arg.buf}. Occorre avere il permesso di lettura. L'argomento
2158   \param{semnum} viene ignorato.
2159 \item[\macro{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
2160   dati, con effetto immediato. Tutti i processi che erano stato di
2161   \textit{sleep} vengono svegliati, ritornando con un errore di \macro{EIDRM}.
2162   L'userid effettivo del processo deve corrispondere o al creatore o al
2163   proprietario dell'insieme, o all'amministratore. L'argomento \param{semnum}
2164   viene ignorato.
2165 \item[\macro{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2166   dell'insieme. I valori devono essere passati in una struttura
2167   \var{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto i
2168   campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
2169   significativi di \var{sem\_perm.mode}. L'userid effettivo del processo deve
2170   corrispondere o al creatore o al proprietario dell'insieme, o
2171   all'amministratore.  L'argomento \param{semnum} viene ignorato.
2172 \item[\macro{GETALL}] Restituisce il valore corrente di ciascun semaforo
2173   dell'insieme (corrispondente al campo \var{semval} di \var{sem}) nel vettore
2174   indicato da \param{arg.array}. Occorre avere il permesso di lettura.
2175   L'argomento \param{semnum} viene ignorato.
2176 \item[\macro{GETNCNT}] Restituisce come valore di ritorno della funzione il
2177   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
2178   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
2179   \var{sem}); va invocata con tre argomenti.  Occorre avere il permesso di
2180   lettura.
2181 \item[\macro{GETPID}] Restituisce come valore di ritorno della funzione il
2182   \acr{pid} dell'ultimo processo che ha compiuto una operazione sul semaforo
2183   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
2184   \var{sempid} di \var{sem}); va invocata con tre argomenti.  Occorre avere il
2185   permesso di lettura.
2186 \item[\macro{GETVAL}] Restituisce come valore di ritorno della funzione il il
2187   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
2188   (corrispondente al campo \var{semval} di \var{sem}); va invocata con tre
2189   argomenti.  Occorre avere il permesso di lettura.
2190 \item[\macro{GETZCNT}] Restituisce come valore di ritorno della funzione il
2191   numero di processi in attesa che il valore del semaforo \param{semnum}
2192   dell'insieme \param{semid} diventi nullo (corrispondente al campo
2193   \var{semncnt} di \var{sem}); va invocata con tre argomenti.  Occorre avere
2194   il permesso di lettura.
2195 \item[\macro{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
2196   aggiornando il campo \var{sem\_ctime} di \var{semid\_ds}. I valori devono
2197   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
2198   privilegi di scrittura sul semaforo.  L'argomento \param{semnum} viene
2199   ignorato.
2200 \item[\macro{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
2201   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
2202   \var{semid\_ds}.  Si devono avere i privilegi di scrittura sul semaforo.
2203 \end{basedescript}
2204
2205 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2206 l'insieme con \macro{SETALL}, che per un solo semaforo con \macro{SETVAL}), i
2207 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2208 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2209 tutti i semafori il cui valore viene modificato.
2210
2211 \begin{table}[htb]
2212   \footnotesize
2213   \centering
2214   \begin{tabular}[c]{|c|l|}
2215     \hline
2216     \textbf{Operazione}  & \textbf{Valore restituito} \\
2217     \hline
2218     \hline
2219     \macro{GETNCNT}& valore di \var{semncnt}.\\
2220     \macro{GETPID} & valore di \var{sempid}.\\
2221     \macro{GETVAL} & valore di \var{semval}.\\
2222     \macro{GETZCNT}& valore di \var{semzcnt}.\\
2223     \hline
2224   \end{tabular}
2225   \caption{Valori di ritorno della funzione \func{semctl}.}
2226   \label{tab:ipc_semctl_returns}
2227 \end{table}
2228
2229 Il valore di ritorno della funzione in caso di successo dipende
2230 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2231 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2232 \tabref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2233 corrispondente al campo della struttura \var{sem} indicato nella seconda
2234 colonna della tabella.
2235
2236 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2237 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2238 vengono effettuate con la funzione \func{semop}, il cui prototipo è:
2239 \begin{functions}
2240   \headdecl{sys/types.h}
2241   \headdecl{sys/ipc.h}
2242   \headdecl{sys/sem.h}
2243
2244   \funcdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2245
2246   Esegue le operazioni ordinarie su un semaforo o un insieme di semafori.
2247
2248   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2249     errore, nel qual caso \var{errno} assumerà uno dei valori:
2250     \begin{errlist}
2251     \item[\macro{EACCES}] Il processo non ha i privilegi per eseguire
2252       l'operazione richiesta.
2253     \item[\macro{EIDRM}] L'insieme di semafori è stato cancellato.
2254     \item[\macro{ENOMEM}] Si è richiesto un \macro{SEM\_UNDO} ma il sistema
2255       non ha le risorse per allocare la struttura di ripristino.
2256     \item[\macro{EAGAIN}] Un'operazione comporterebbe il blocco del processo,
2257       ma si è specificato \macro{IPC\_NOWAIT} in \var{sem\_flg}.
2258     \item[\macro{EINTR}] La funzione, bloccata in attesa dell'esecuzione
2259       dell'operazione, viene interrotta da un segnale.
2260     \item[\macro{E2BIG}] L'argomento \param{nsops} è maggiore del numero
2261       massimo di operazioni \macro{SEMOPM}.
2262     \item[\macro{ERANGE}] Per alcune operazioni il valore risultante del
2263       semaforo viene a superare il limite massimo \macro{SEMVMX}.
2264   \end{errlist}
2265   ed inoltre \macro{EFAULT} ed \macro{EINVAL}.
2266 }
2267 \end{functions}
2268
2269 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2270 un insieme. La funzione richiede come primo argomento l'identificatore
2271 \param{semid} dell'insieme su cui si vuole operare. Il numero di operazioni da
2272 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2273 contenuto viene passato con un puntatore ad un vettore di strutture
2274 \var{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2275 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante.
2276
2277 \begin{figure}[!htb]
2278   \footnotesize \centering
2279   \begin{minipage}[c]{15cm}
2280     \begin{lstlisting}[labelstep=0]{}
2281 struct sembuf
2282 {
2283   unsigned short int sem_num;   /* semaphore number */
2284   short int sem_op;             /* semaphore operation */
2285   short int sem_flg;            /* operation flag */
2286 };
2287     \end{lstlisting}
2288   \end{minipage}
2289   \normalsize
2290   \caption{La struttura \var{sembuf}, usata per le operazioni sui
2291     semafori.}
2292   \label{fig:ipc_sembuf}
2293 \end{figure}
2294
2295 Il contenuto di ciascuna operazione deve essere specificato attraverso una
2296 opportuna struttura \var{sembuf} (la cui definizione è riportata in
2297 \figref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2298 allocare in un opportuno vettore. La struttura permette di indicare il
2299 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2300 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2301 riferimento l'operazione; si ricordi che i semafori sono numerati come in un
2302 vettore, per cui il primo semaforo corrisponde ad un valore nullo di
2303 \var{sem\_num}.
2304
2305 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2306 quale possono essere impostati i due valori \macro{IPC\_NOWAIT} e
2307 \macro{SEM\_UNDO}.  Impostando \macro{IPC\_NOWAIT} si fa si che, invece di
2308 bloccarsi (in tutti quei casi in cui l'esecuzione di una operazione richiede
2309 che il processo vada in stato di \textit{sleep}), \func{semop} ritorni
2310 immediatamente con un errore di \macro{EAGAIN}.  Impostando \macro{SEM\_UNDO}
2311 si richiede invece che l'operazione venga registrata in modo che il valore del
2312 semaforo possa essere ripristinato all'uscita del processo.
2313
2314 Infine \var{sem\_op} è il campo che controlla l'operazione che viene eseguita
2315 e determina il comportamento della chiamata a \func{semop}; tre sono i casi
2316 possibili:
2317 \begin{basedescript}{\desclabelwidth{2.0cm}}
2318 \item[\var{sem\_op}$>0$] In questo caso il valore di \var{sem\_op} viene
2319   aggiunto al valore corrente di \var{semval}. La funzione ritorna
2320   immediatamente (con un errore di \macro{ERANGE} qualora si sia superato il
2321   limite \macro{SEMVMX}) ed il processo non viene bloccato in nessun caso.
2322   Specificando \macro{SEM\_UNDO} si aggiorna il contatore per il ripristino
2323   del valore del semaforo. Al processo chiamante è richiesto il privilegio di
2324   alterazione (scrittura) sull'insieme di semafori.
2325
2326 \item[\var{sem\_op}$=0$] Nel caso \var{semval} sia zero l'esecuzione procede
2327   immediatamente. Se \var{semval} è diverso da zero il comportamento è
2328   controllato da \var{sem\_flg}, se è stato impostato \macro{IPC\_NOWAIT} la
2329   funzione ritorna con un errore di \macro{EAGAIN}, altrimenti viene
2330   incrementato \var{semzcnt} di uno ed il processo resta in stato di
2331   \textit{sleep} fintanto che non si ha una delle condizioni seguenti:
2332   \begin{itemize*}
2333   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2334     decrementato di uno.
2335   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2336     un errore di \macro{EIDRM}.
2337   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2338     viene decrementato di uno e \func{semop} ritorna un errore di
2339     \macro{EINTR}.
2340   \end{itemize*}
2341   Al processo chiamante è richiesto il privilegio di lettura dell'insieme dei
2342   semafori.
2343
2344 \item[\var{sem\_op}$<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2345   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2346   positiva o nulla) i valori vengono sommati e la funzione ritorna
2347   immediatamente; qualora si sia impostato \macro{SEM\_UNDO} viene anche
2348   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2349   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2350   negativo) se si è impostato \macro{IPC\_NOWAIT} la funzione ritorna con un
2351   errore di \macro{EAGAIN}, altrimenti viene incrementato di uno \var{semncnt}
2352   ed il processo resta in stato di \textit{sleep} fintanto che non si ha una
2353   delle condizioni seguenti:
2354   \begin{itemize*}
2355   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2356     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2357     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2358     impostato \macro{SEM\_UNDO} viene aggiornato il contatore per il
2359     ripristino del valore del semaforo.
2360   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2361     un errore di \macro{EIDRM}.
2362   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2363     viene decrementato di uno e \func{semop} ritorna un errore di
2364     \macro{EINTR}.
2365   \end{itemize*}
2366   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2367   sull'insieme di semafori.
2368 \end{basedescript}
2369
2370 In caso di successo della funzione viene aggiornato di \var{sempid} per ogni
2371 semaforo modificato al valore del \acr{pid} del processo chiamante; inoltre
2372 vengono pure aggiornati al tempo corrente i campi \var{sem\_otime} e
2373 \var{sem\_ctime}.
2374
2375 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2376 semafori possono restare occupati, abbiamo visto come \func{semop} permetta di
2377 attivare un meccanismo di ripristino attraverso l'uso del flag
2378 \macro{SEM\_UNDO}. Il meccanismo è implementato tramite una apposita struttura
2379 \var{sem\_undo}, associata ad ogni processo per ciascun semaforo che esso ha
2380 modificato; all'uscita i semafori modificati vengono ripristinati, e le
2381 strutture disallocate.  Per mantenere coerente il comportamento queste
2382 strutture non vengono ereditate attraverso una \func{fork} (altrimenti si
2383 avrebbe un doppio ripristino), mentre passano inalterate nell'esecuzione di
2384 una \func{exec} (altrimenti non si avrebbe ripristino).
2385
2386 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2387 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2388 in maniera semplificata nello schema di \figref{fig:ipc_sem_schema}.  Si è
2389 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2390 semplice (ed illustrata in dettaglio in \cite{tlk}); nel kernel 2.4.x la
2391 struttura del \textit{SysV IPC} è stata modificata, ma le definizioni relative
2392 a queste strutture restano per compatibilità.\footnote{in particolare con le
2393   vecchie versioni delle librerie del C, come le libc5.}
2394
2395 \begin{figure}[htb]
2396   \centering \includegraphics[width=15cm]{img/semtruct}
2397   \caption{Schema della struttura di un insieme di semafori.}
2398   \label{fig:ipc_sem_schema}
2399 \end{figure}
2400
2401 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2402 \var{semid\_ds} ed il relativo vettore di strutture \var{sem}. Quando si
2403 richiede una operazione viene anzitutto verificato che tutte le operazioni
2404 possono avere successo; se una di esse comporta il blocco del processo il
2405 kernel crea una struttura \var{sem\_queue} che viene aggiunta in fondo alla
2406 coda di attesa associata a ciascun insieme di semafori\footnote{che viene
2407   referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last}
2408   di \var{semid\_ds}.}. Nella struttura viene memorizzato il riferimento alle
2409 operazioni richieste (nel campo \var{sops}, che è un puntatore ad una
2410 struttura \var{sembuf}) e al processo corrente (nel campo \var{sleeper}) poi
2411 quest'ultimo viene messo stato di attesa e viene invocato lo
2412 scheduler\index{scheduler} per passare all'esecuzione di un altro processo.
2413
2414 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2415 immediatamente, dopo di che il kernel esegue una scansione della coda di
2416 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2417 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2418 struttura \var{sem\_queue} viene rimossa e lo stato del processo associato
2419 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2420 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2421 svuotata la coda.
2422
2423 Per gestire il meccanismo del ripristino tutte le volte che per un'operazione
2424 si è specificato il flag \macro{SEM\_UNDO} viene mantenuta per ciascun insieme
2425 di semafori una apposita struttura \var{sem\_undo} che contiene (nel vettore
2426 puntato dal campo \var{semadj}) un valore di aggiustamento per ogni semaforo
2427 cui viene sommato l'opposto del valore usato per l'operazione.
2428
2429 Queste strutture sono mantenute in due liste,\footnote{rispettivamente
2430   attraverso i due campi \var{id\_next} e \var{proc\_next}.} una associata
2431 all'insieme di cui fa parte il semaforo, che viene usata per invalidare le
2432 strutture se questo viene cancellato o per azzerarle se si è eseguita una
2433 operazione con \func{semctl}; l'altra associata al processo che ha eseguito
2434 l'operazione;\footnote{attraverso il campo \var{semundo} di
2435   \var{task\_struct}, come mostrato in \ref{fig:ipc_sem_schema}.} quando un
2436 processo termina, la lista ad esso associata viene scandita e le operazioni
2437 applicate al semaforo.
2438
2439 Siccome un processo può accumulare delle richieste di ripristino per semafori
2440 differenti chiamate attraverso diverse chiamate a \func{semop}, si pone il
2441 problema di come eseguire il ripristino dei semafori all'uscita del processo,
2442 ed in particolare se questo può essere fatto atomicamente. Il punto è cosa
2443 succede quando una delle operazioni previste per il ripristino non può essere
2444 eseguita immediatamente perché ad esempio il semaforo è occupato; in tal caso
2445 infatti, se si pone il processo in stato di \textit{sleep} aspettando la
2446 disponibilità del semaforo (come faceva l'implementazione originaria) si perde
2447 l'atomicità dell'operazione. La scelta fatta dal kernel è pertanto quella di
2448 effettuare subito le operazioni che non prevedono un blocco del processo e di
2449 ignorare silenziosamente le altre; questo però comporta il fatto che il
2450 ripristino non è comunque garantito in tutte le occasioni.
2451
2452 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2453 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2454 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2455 riportato in \figref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2456 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2457 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2458 nullo per segnalarne l'indisponibilità.
2459
2460 \begin{figure}[!bht]
2461   \footnotesize \centering
2462   \begin{minipage}[c]{15cm}
2463     \begin{lstlisting}{}
2464 /*
2465  * Function MutexCreate: create a mutex/semaphore
2466  */
2467 int MutexCreate(key_t ipc_key)
2468 {
2469     const union semun semunion={1};             /* semaphore union structure */
2470     int sem_id, ret;
2471     sem_id = semget(ipc_key, 1, IPC_CREAT|0666);         /* get semaphore ID */
2472     if (sem_id == -1) {                              /* if error return code */
2473         return sem_id;
2474     }
2475     ret = semctl(sem_id, 0, SETVAL, semunion);             /* init semaphore */
2476     if (ret == -1) {
2477         return ret;
2478     }
2479     return sem_id;
2480 }
2481 /*
2482  * Function MutexFind: get the semaphore/mutex Id given the IPC key value
2483  */
2484 int MutexFind(key_t ipc_key)
2485 {
2486     return semget(ipc_key,1,0);
2487 }
2488 /*
2489  * Function MutexRead: read the current value of the mutex/semaphore
2490  */
2491 int MutexRead(int sem_id)
2492 {
2493     return semctl(sem_id, 0, GETVAL);
2494 }
2495 /*
2496  * Define sembuf structures to lock and unlock the semaphore
2497  */
2498 struct sembuf sem_lock={                                /* to lock semaphore */
2499     0,                                   /* semaphore number (only one so 0) */
2500     -1,                                    /* operation (-1 to use resource) */
2501     SEM_UNDO};                                /* flag (set for undo at exit) */
2502 struct sembuf sem_ulock={                             /* to unlock semaphore */
2503     0,                                   /* semaphore number (only one so 0) */
2504     1,                                  /* operation (1 to release resource) */
2505     SEM_UNDO};                                      /* flag (in this case 0) */
2506 /*
2507  * Function MutexLock: to lock a mutex/semaphore
2508  */
2509 int MutexLock(int sem_id)
2510 {
2511     return semop(sem_id, &sem_lock, 1);
2512 }
2513 /*
2514  * Function MutexUnlock: to unlock a mutex/semaphore
2515  */
2516 int MutexUnlock(int sem_id)
2517 {
2518     return semop(sem_id, &sem_ulock, 1);
2519 }
2520     \end{lstlisting}
2521   \end{minipage}
2522   \normalsize
2523   \caption{Il codice delle funzioni che permettono di creare o recuperare
2524     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2525   \label{fig:ipc_mutex_create}
2526 \end{figure}
2527
2528 La prima funzione (\texttt{\small 1--17}) è \func{MutexCreate} che data una
2529 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2530 l'identificatore. Il primo passo (\texttt{\small 8}) è chiamare \func{semget}
2531 con \macro{IPC\_CREATE} per creare il semaforo qualora non esista,
2532 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2533 (\texttt{\small 9--11}) si ritorna subito il risultato di \func{semget},
2534 altrimenti (\texttt{\small 12}) si inizializza il semaforo chiamando
2535 \func{semctl} con il comando \macro{SETVAL}, utilizzando l'unione
2536 \var{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 6}) ad 1
2537 per significare che risorsa è libera. In caso di errore (\texttt{\small
2538   13--16}) si restituisce il valore di ritorno di \func{semctl}, altrimenti si
2539 ritorna l'identificatore del semaforo.
2540
2541 La seconda funzione (\texttt{\small 18--24}) è \func{MutexFind}, che data una
2542 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2543 comprensione del suo funzionamento è immediata in quanto è solo un
2544 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2545   \textsl{involucro} alla chiamata di un altra, usata in genere per
2546   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2547   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2548   stesse funzionalità.} di \func{semget} per cercare l'identificatore
2549 associato alla chiave, restituendo direttamente il valore di ritorno della
2550 funzione.
2551
2552 La terza funzione (\texttt{\small 25--31}) è \func{MutexRead} che, dato
2553 l'identificatore, restituisce il valore del mutex. Anche in questo caso la
2554 funzione è un \textit{wrapper} per la chiamata di \func{semctl}, questa volta
2555 con il comando \macro{GETVAL}, che permette di restituire il valore del
2556 semaforo.
2557
2558 La quarta e la quinta funzione (\texttt{\small 43--56}) sono \func{MutexLock},
2559 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2560 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2561 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2562 (\texttt{\small 32--42}). Si noti come per queste ultime si sia fatto uso
2563 dell'opzione \macro{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2564 caso di terminazione imprevista del processo.%%  Si noti infine come, essendo
2565 %% tutte le funzioni riportate in \figref{fig:ipc_mutex_create} estremamente
2566 %% semplici, se si sono definite tutte come \ctyp{inline}.\footnote{la direttiva
2567 %%   \func{inline} viene usata per dire al compilatore di non trattare la
2568 %%   funzione cui essa fa riferimento come una funzione, ma di inserire il codice
2569 %%   direttamente nel testo del programma.  Anche se i compilatori più moderni
2570 %%   sono in grado di effettuare da soli queste manipolazioni (impostando le
2571 %%   opportune ottimizzazioni) questa è una tecnica usata per migliorare le
2572 %%   prestazioni per le funzioni piccole ed usate di frequente, in tal caso
2573 %%   infatti le istruzioni per creare un nuovo frame nello stack per chiamare la
2574 %%   funzione costituirebbero una parte rilevante del codice, appesantendo
2575 %%   inutilmente il programma. Originariamente questa era fatto utilizzando delle
2576 %%   macro, ma queste hanno tutta una serie di problemi di sintassi nel passaggio
2577 %%   degli argomenti (si veda ad esempio \cite{PratC} che in questo modo possono
2578 %%   essere evitati.}
2579
2580
2581 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2582 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2583 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2584 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2585 incrementato di uno, sbloccandolo qualora fosse bloccato.  Si noti che occorre
2586 eseguire sempre prima \func{MutexLock} e poi \func{MutexUnlock}, perché se per
2587 un qualche errore si esegue più volte quest'ultima il valore del semaforo
2588 crescerebbe oltre 1, e \func{MutexLock} non avrebbe più l'effetto aspettato
2589 (bloccare la risorsa quando questa è considerata libera). Si tenga presente
2590 che usare \func{MutexRead} per controllare il valore dei mutex prima di
2591 proseguire non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2592 Vedremo in \secref{sec:ipc_posix_sem} come è possibile ottenere un'interfaccia
2593 analoga senza questo problemi usando il file locking.
2594
2595
2596
2597 \subsection{Memoria condivisa}
2598 \label{sec:ipc_sysv_shm}
2599
2600 Il terzo oggetto introdotto dal \textit{SysV IPC} è quello dei segmenti di
2601 memoria condivisa. La funzione che permette di ottenerne uno è \func{shmget},
2602 ed il suo prototipo è:
2603 \begin{functions}
2604   \headdecl{sys/types.h}
2605   \headdecl{sys/ipc.h}
2606   \headdecl{sys/shm.h}
2607
2608   \funcdecl{int shmget(key\_t key, int size, int flag)}
2609
2610   Restituisce l'identificatore di una memoria condivisa.
2611
2612   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
2613     in caso di errore, nel qual caso \var{errno} assumerà i valori:
2614     \begin{errlist}
2615     \item[\macro{ENOSPC}] Si è superato il limite (\macro{SHMMNI}) sul numero
2616       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2617       cui dimensioni fanno superare il limite di sistema (\macro{SHMALL}) per
2618       la memoria ad essi riservata.
2619     \item[\macro{EINVAL}] Si è richiesta una dimensione per un nuovo segmento
2620       maggiore di \macro{SHMMAX} o minore di \macro{SHMMIN}, o se il segmento
2621       già esiste \param{size} è maggiore delle sue dimensioni.
2622     \item[\macro{ENOMEM}] Il sistema non ha abbastanza memoria per poter
2623       contenere le strutture per un nuovo segmento di memoria condivisa.
2624     \end{errlist}
2625     ed inoltre \macro{EACCES}, \macro{ENOENT}, \macro{EEXIST}, \macro{EIDRM},
2626     con lo stesso significato che hanno per \func{msgget}.}
2627 \end{functions}
2628
2629 La funzione, come \func{semget}, è del tutto analoga a \func{msgget}, ed
2630 identico è l'uso degli argomenti \param{key} e \param{flag} per cui non
2631 ripeteremo quanto detto al proposito in \secref{sec:ipc_sysv_mq}. L'argomento
2632 \param{size} specifica invece la dimensione, in byte, del segmento, che viene
2633 comunque arrotondata al multiplo superiore di \macro{PAGE\_SIZE}.
2634
2635 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2636 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2637 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2638 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2639 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2640 dati in memoria.
2641
2642 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2643 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2644 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2645 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2646 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2647 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2648 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2649 altro processo. Per questo in genere la memoria condivisa viene sempre
2650 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2651 norma, significa insieme a dei semafori.
2652
2653 \begin{figure}[!htb]
2654   \footnotesize \centering
2655   \begin{minipage}[c]{15cm}
2656     \begin{lstlisting}[labelstep=0]{}
2657 struct shmid_ds {
2658      struct    ipc_perm shm_perm;  /* operation perms */
2659      int  shm_segsz;               /* size of segment (bytes) */
2660      time_t    shm_atime;          /* last attach time */
2661      time_t    shm_dtime;          /* last detach time */
2662      time_t    shm_ctime;          /* last change time */
2663      unsigned short shm_cpid;      /* pid of creator */
2664      unsigned short shm_lpid;      /* pid of last operator */
2665      short     shm_nattch;         /* no. of current attaches */
2666 };
2667     \end{lstlisting}
2668   \end{minipage}
2669   \normalsize
2670   \caption{La struttura \var{shmid\_ds}, associata a ciascun segmento di
2671     memoria condivisa.}
2672   \label{fig:ipc_shmid_ds}
2673 \end{figure}
2674
2675 A ciascun segmento di memoria condivisa è associata una struttura
2676 \var{shmid\_ds}, riportata in \figref{fig:ipc_shmid_ds}.  Come nel caso delle
2677 code di messaggi quando si crea un nuovo segmento di memoria condivisa con
2678 \func{shmget} questa struttura viene inizializzata, in particolare il campo
2679 \var{shm\_perm} viene inizializzato come illustrato in
2680 \secref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2681 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2682 invece:
2683 \begin{itemize*}
2684 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2685   inizializzato al valore di \param{size}.
2686 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2687   segmento, viene inizializzato al tempo corrente.
2688 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2689   rispettivamente il tempo dell'ultima volta che il segmento è stato
2690   agganciato o sganciato da un processo, vengono inizializzati a zero.
2691 \item il campo \var{shm\_lpid}, che esprime il \acr{pid} del processo che ha
2692   eseguito l'ultima operazione, viene inizializzato a zero.
2693 \item il campo \var{shm\_cpid}, che esprime il \acr{pid} del processo che ha
2694   creato il segmento, viene inizializzato al \acr{pid} del processo chiamante.
2695 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2696   al segmento viene inizializzato a zero.
2697 \end{itemize*}
2698
2699 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2700 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2701 di questi limiti sono al solito accessibili e modificabili attraverso
2702 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2703 \file{/proc/sys/kernel/}. In \tabref{tab:ipc_shm_limits} si sono riportate le
2704 costanti simboliche associate a ciascuno di essi, il loro significato, i
2705 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2706 che permettono di cambiarne il valore.
2707
2708
2709 \begin{table}[htb]
2710   \footnotesize
2711   \centering
2712   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2713     \hline
2714     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2715     & \textbf{Significato} \\
2716     \hline
2717     \hline
2718     \macro{SHMALL}& 0x200000&\file{shmall}& Numero massimo di pagine che
2719                                        possono essere usate per i segmenti di
2720                                        memoria condivisa. \\
2721     \macro{SHMMAX}&0x2000000&\file{shmmax}& Dimensione massima di un segmento
2722                                             di memoria condivisa.\\
2723     \macro{SHMMNI}&     4096&\file{msgmni}& Numero massimo di segmenti di
2724                                             memoria condivisa presenti nel
2725                                             kernel.\\
2726     \macro{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2727                                             memoria condivisa. \\
2728     \macro{SHMLBA}&\macro{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2729                                             minime di un segmento (deve essere
2730                                             allineato alle dimensioni di una
2731                                             pagina di memoria). \\
2732     \macro{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2733                                             memoria condivisa
2734                                             per ciascun processo.\\
2735
2736
2737     \hline
2738   \end{tabular}
2739   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2740     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2741     valore preimpostato presente nel sistema.}
2742   \label{tab:ipc_shm_limits}
2743 \end{table}
2744
2745 Al solito la funzione che permette di effettuare le operazioni di controllo su
2746 un segmento di memoria condivisa è \func{shmctl}; il suo prototipo è:
2747 \begin{functions}
2748   \headdecl{sys/ipc.h}
2749   \headdecl{sys/shm.h}
2750
2751   \funcdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2752
2753   Esegue le operazioni di controllo su un segmento di memoria condivisa.
2754
2755   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2756     errore, nel qual caso \var{errno} assumerà i valori:
2757     \begin{errlist}
2758     \item[\macro{EACCES}] Si è richiesto \macro{IPC\_STAT} ma i permessi non
2759       consentono l'accesso in lettura al segmento.
2760     \item[\macro{EINVAL}] O \param{shmid} o \param{cmd} hanno valori non
2761       validi.
2762     \item[\macro{EIDRM}] L'argomento \param{shmid} fa riferimento ad un
2763       segmento che è stato cancellato.
2764     \item[\macro{EPERM}] Si è specificato un comando con \macro{IPC\_SET} o
2765       \macro{IPC\_RMID} senza i permessi necessari.
2766     \item[\macro{EOVERFLOW}] L'argomento \param{shmid} fa riferimento ad un
2767       segmento che è stato cancellato.
2768     \end{errlist}
2769   ed inoltre \macro{EFAULT}.}
2770 \end{functions}
2771
2772 Il comportamento della funzione dipende dal valore del comando passato
2773 attraverso l'argomento \param{cmd}, i valori possibili sono i seguenti:
2774 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2775 \item[\macro{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2776   condivisa nella struttura \var{shmid\_ds} puntata da \param{buf}. Occorre
2777   avere il permesso di lettura sulla coda.
2778 \item[\macro{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2779   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2780   processo ad esso agganciato si sarà staccato. Questo comando può essere
2781   eseguito solo da un processo con userid effettivo corrispondente o al
2782   creatore della coda, o al proprietario della coda, o all'amministratore.
2783 \item[\macro{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2784   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2785   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2786   il creatore della coda, oppure l'amministratore. Compiuta l'operazione
2787   aggiorna anche il valore del campo \var{shm\_ctime}.
2788 \item[\macro{SHM\_LOCK}] Abilita il \textit{memory locking}\index{memory
2789     locking}\footnote{impedisce cioè che la memoria usata per il segmento
2790     venga salvata su disco dal meccanismo della memoria virtuale; si ricordi
2791     quanto trattato in \secref{sec:proc_mem_lock}.} sul segmento di memoria
2792   condivisa. Solo l'amministratore può utilizzare questo comando.
2793 \item[\macro{SHM\_UNLOCK}] Disabilita il \textit{memory locking} sul segmento
2794   di memoria condivisa. Solo l'amministratore può utilizzare questo comando.
2795 \end{basedescript}
2796 i primi tre comandi sono gli stessi già visti anche per le code ed i semafori,
2797 gli ultimi due sono delle estensioni previste da Linux.
2798
2799 Per utilizzare i segmenti di memoria condivisa l'interfaccia prevede due
2800 funzioni, la prima è \func{shmat}, che serve ad agganciare un segmento al
2801 processo chiamante, in modo che quest'ultimo possa vederlo nel suo spazio di
2802 indirizzi; il suo prototipo è:
2803 \begin{functions}
2804   \headdecl{sys/types.h}
2805   \headdecl{sys/shm.h}
2806
2807   \funcdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2808   Aggancia al processo un segmento di memoria condivisa.
2809
2810   \bodydesc{La funzione restituisce l'indirizzo del segmento in caso di
2811     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà i
2812     valori:
2813     \begin{errlist}
2814     \item[\macro{EACCES}] Il processo non ha i privilegi per accedere al
2815       segmento nella modalità richiesta.
2816     \item[\macro{EINVAL}] Si è specificato un identificatore invalido per
2817       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2818       per \param{shmaddr}.
2819     \end{errlist}
2820     ed inoltre \macro{ENOMEM}.}
2821 \end{functions}
2822
2823 La funzione inserisce un segmento di memoria condivisa all'interno dello
2824 spazio di indirizzi del processo, in modo che questo possa accedervi
2825 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2826 \figref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2827 ricordi quanto illustrato al proposito in \secref{sec:proc_mem_layout}). In
2828 particolare l'indirizzo finale del segmento dati (quello impostato da
2829 \func{brk}, vedi \secref{sec:proc_mem_sbrk}) non viene influenzato. Si tenga
2830 presente infine che la funzione ha successo anche se il segmento è stato
2831 marcato per la cancellazione.
2832
2833 \begin{figure}[htb]
2834   \centering
2835   \includegraphics[height=10cm]{img/sh_memory_layout}
2836   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2837     agganciato un segmento di memoria condivisa.}
2838   \label{fig:ipc_shmem_layout}
2839 \end{figure}
2840
2841 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{Lo standard
2842   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2843   come il valore di ritorno della funzione. In Linux è stato così con le
2844   \acr{libc4} e le \acr{libc5}, con il passaggio alle \acr{glibc} il tipo di
2845   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2846   ritorno un \ctyp{void *}.} deve essere associato il segmento, se il valore
2847 specificato è \macro{NULL} è il sistema a scegliere opportunamente un'area di
2848 memoria libera (questo è il modo più portabile e sicuro di usare la funzione).
2849 Altrimenti il kernel aggancia il segmento all'indirizzo specificato da
2850 \param{shmaddr}; questo però può avvenire solo se l'indirizzo coincide con il
2851 limite di una pagina, cioè se è un multiplo esatto del parametro di sistema
2852 \macro{SHMLBA}, che in Linux è sempre uguale \macro{PAGE\_SIZE}.
2853
2854 Si tenga presente però che quando si usa \macro{NULL} come valore di
2855 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2856 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2857 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2858 riferiti all'indirizzo di partenza del segmento).
2859
2860 L'argomento \param{shmflg} permette di cambiare il comportamento della
2861 funzione; esso va specificato come maschera binaria, i bit utilizzati sono
2862 solo due e sono identificati dalle costanti \macro{SHM\_RND} e
2863 \macro{SHM\_RDONLY}, che vanno combinate con un OR aritmetico.  Specificando
2864 \macro{SHM\_RND} si evita che \func{shmat} ritorni un errore quando
2865 \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi usare
2866 un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2867 agganciato, ma al più vicino multiplo di \macro{SHMLBA} (il nome della
2868 costante sta infatti per \textit{rounded}, e serve per specificare un
2869 indirizzo come arrotondamento, in Linux è equivalente a \macro{PAGE\_SIZE}).
2870
2871 L'uso di \macro{SHM\_RDONLY} permette di agganciare il segmento in sola
2872 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2873 caso un tentativo di scrivere sul segmento comporterà una violazione di
2874 accesso con l'emissione di un segnale di \macro{SIGSEGV}. Il comportamento
2875 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2876 lettura e scrittura (ed il processo deve aver questi permessi in
2877 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2878 sola scrittura.
2879
2880 In caso di successo la funzione aggiorna anche i seguenti campi di
2881 \var{shmid\_ds}:
2882 \begin{itemize*}
2883 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2884   impostato al tempo corrente.
2885 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2886   segmento viene impostato a quello del processo corrente.
2887 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2888   aumentato di uno.
2889 \end{itemize*}
2890
2891 Come accennato in \secref{sec:proc_fork} un segmento di memoria condivisa
2892 agganciato ad un processo viene ereditato da un figlio attraverso una
2893 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2894 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2895 eseguito un diverso programma con uno spazio di indirizzi completamente
2896 diverso, tutti i segmenti agganciati al processo originario vengono
2897 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2898 attraverso una \func{exit}.
2899
2900 Una volta che un segmento di memoria condivisa non serve più, si può
2901 sganciarlo esplicitamente dal processo usando l'altra funzione
2902 dell'interfaccia, \func{shmdt}, il cui prototipo è:
2903 \begin{functions}
2904   \headdecl{sys/types.h}
2905   \headdecl{sys/shm.h}
2906
2907   \funcdecl{int shmdt(const void *shmaddr)}
2908   Sgancia dal processo un segmento di memoria condivisa.
2909
2910   \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
2911     errore, la funzione fallisce solo quando non c'è un segmento agganciato
2912     all'indirizzo \func{shmaddr}, con \var{errno} che assume il valore
2913     \macro{EINVAL}.}
2914 \end{functions}
2915
2916 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2917 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2918 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2919 agganciato al processo.
2920
2921 In caso di successo la funzione aggiorna anche i seguenti campi di
2922 \var{shmid\_ds}:
2923 \begin{itemize*}
2924 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2925   impostato al tempo corrente.
2926 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2927   segmento viene impostato a quello del processo corrente.
2928 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2929   decrementato di uno.
2930 \end{itemize*}
2931 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2932 viene tolta dallo spazio di indirizzi del processo.
2933
2934
2935 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
2936 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
2937 %% condivisa; uno schema semplificato della struttura è illustrato in
2938 %% \figref{fig:ipc_shm_struct}.
2939
2940 %% \begin{figure}[htb]
2941 %%   \centering
2942 %%   \includegraphics[width=10cm]{img/shmstruct}
2943 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
2944 %%     Linux.}
2945 %%   \label{fig:ipc_shm_struct}
2946 %% \end{figure}
2947
2948
2949
2950
2951 \section{Tecniche alternative}
2952 \label{sec:ipc_alternatives}
2953
2954 Come abbiamo detto in \secref{sec:ipc_sysv_generic}, e ripreso nella
2955 descrizione dei signoli oggetti che ne fan parte, il \textit{SysV IPC}
2956 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
2957   capitolo 14.}  Stevens ne eeffettua una accurata analisi (alcuni dei
2958 concetti sono già stati accennati in precedenza) ed elenca alcune possibili
2959 tecniche alternative, che vogliamo riprendere in questa sezione.
2960
2961
2962 \subsection{Alternative alle code di messaggi}
2963 \label{sec:ipc_mq_alternative}
2964
2965 Le code di messaggi sono probabilmente il meno usato degli oggetti del
2966 \textit{SysV IPC}; esse infatti nacquero principalmente come meccanismo di
2967 comunicazione bidirezionale quando ancora le pipe erano unidirezionali; con la
2968 disponibilità di \func{socketpair} (vedi \secref{sec:ipc_socketpair}) si può
2969 ottenere lo stesso risultato senza incorrere nelle complicazioni introdotte
2970 dal \textit{SysV IPC}.
2971
2972 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
2973 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
2974 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
2975 sono impossibili da ottenere con le pipe e i socket di \func{socketpair}.  A
2976 queste esigenze però si può comunque ovviare in maniera diversa con un uso
2977 combinato della memoria condivisa e dei meccanismi di sincronizzazione, per
2978 cui alla fine l'uso delle code di messaggi classiche è poco diffuso.
2979
2980
2981
2982 \subsection{I \textsl{file di lock}}
2983 \label{sec:ipc_file_lock}
2984
2985 Come illustrato in \secref{sec:ipc_sysv_sem} i semafori del \textit{SysV IPC}
2986 presentano una interfaccia inutilmente complessa e con alcuni difetti
2987 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
2988 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
2989 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
2990 necessità di un contatore come i semafori, si possono utilizzare metodi
2991 alternativi.
2992
2993 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
2994 dei \textsl{file di lock}\index{file di lock} (per i quali esiste anche una
2995 opportuna directory, \file{/var/lock}, nel filesystem standard). Per questo si
2996 usa la caratteristica della funzione \func{open} (illustrata in
2997 \secref{sec:file_open}) che prevede\footnote{questo è quanto dettato dallo
2998   standard POSIX.1, ciò non toglie che in alcune implementazioni questa
2999   tecnica possa non funzionare; in particolare per Linux, nel caso di NFS, si
3000   è comunque soggetti alla possibilità di una race condition.} che essa
3001 ritorni un errore quando usata con i flag di \macro{O\_CREAT} e
3002 \macro{O\_EXCL}. In tal modo la creazione di un \textsl{file di lock} può
3003 essere eseguita atomicamente, il processo che crea il file con successo si può
3004 considerare come titolare del lock (e della risorsa ad esso associata) mentre
3005 il rilascio si può eseguire con una chiamata ad \func{unlink}.
3006
3007 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3008 \func{LockFile} ed \func{UnlockFile} riportate in \figref{fig:ipc_file_lock}
3009 (sono contenute in \file{LockFile.c}, un'altro dei sorgenti allegati alla
3010 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3011   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3012 (\texttt{\small 4--10}) si limita ad aprire il file di lock (\texttt{\small
3013   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11--17}) lo
3014 cancella con \func{unlink}.
3015
3016 \begin{figure}[!htb]
3017   \footnotesize \centering
3018   \begin{minipage}[c]{15cm}
3019     \begin{lstlisting}{}
3020 #include <sys/types.h>
3021 #include <sys/stat.h>
3022 #include <unistd.h>                               /* unix standard functions */
3023 /*
3024  * Function LockFile:
3025  */
3026 int LockFile(const char* path_name)
3027 {
3028     return open(path_name, O_EXCL|O_CREAT);
3029 }
3030 /*
3031  * Function UnlockFile:
3032  */
3033 int UnlockFile(const char* path_name)
3034 {
3035     return unlink(path_name);
3036 }
3037
3038     \end{lstlisting}
3039   \end{minipage}
3040   \normalsize
3041   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3042     permettono di creare e rimuovere un \textsl{file di lock}.}
3043   \label{fig:ipc_file_lock}
3044 \end{figure}
3045
3046 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3047 \secref{sec:file_open}, questo comportamento di \func{open} può non funzionare
3048 (la funzione viene eseguita, ma non è garantita l'atomicità dell'operazione)
3049 se il filesystem su cui si va ad operare è su NFS; in tal caso si può adottare
3050 una tecnica alternativa che prevede l'uso della \func{link} per creare come
3051 file di lock un hard link ad un file esistente; se il link esiste già e la
3052 funzione fallisce, significa che la risorsa è bloccata e potrà essere
3053 sbloccata solo con un \func{unlink}, altrimenti il link è creato ed il lock
3054 acquisito; il controllo e l'eventuale acquisizione sono atomici; la soluzione
3055 funziona anche su NFS, ma ha un'altro difetto è che è quello di poterla usare
3056 solo se si opera all'interno di uno stesso filesystem.
3057
3058 Un generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3059 problemi, che non lo rendono una alternativa praticabile per la
3060 sincronizzazione: anzitutto anche in questo caso, in caso di terminazione
3061 imprevista del processo, si lascia allocata la risorsa (il file di lock) e
3062 questa deve essere sempre cancellata esplicitamente.  Inoltre il controllo
3063 della disponibilità può essere eseguito solo con una tecnica di
3064 \textit{polling}\index{polling}, ed è quindi molto inefficiente.
3065
3066 La tecnica dei file di lock non di meno ha una sua utilità, e può essere usata
3067 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3068 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3069 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3070 più programmi: qualora si trovi un file di lock il programma che cerca di
3071 accedere alla seriale si limita a segnalare che la risorsa non è disponibile.
3072
3073 \subsection{La sincronizzazione con il \textit{file locking}}
3074 \label{sec:ipc_lock_file}
3075
3076 Dato che i file di lock presentano gli inconvenienti illustrati in precedenza,
3077 la tecnica alternativa più comune è quella di fare ricorso al \textit{file
3078   locking} (trattato in \secref{sec:file_locking}) usando \func{fcntl} su un
3079 file creato per l'occasione per ottenere un write lock. In questo modo potremo
3080 usare il lock come un \textit{mutex}: per bloccare la risorsa basterà
3081 acquisire il lock, per sbloccarla basterà rilasciare il lock; una richiesta
3082 fatta con un write lock metterà automaticamente il processo in stato di
3083 attesa, senza necessità di ricorrere al \textit{polling}\index{polling} per
3084 determinare la disponibilità della risorsa, e al rilascio della stessa da
3085 parte del processo che la occupava si otterrà il nuovo lock atomicamente.
3086
3087 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3088 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3089 chiusura dei relativi file) e non ci si deve preoccupare di niente, inoltre
3090 non consuma risorse permanentemente allocate nel sistema, lo svantaggio è che
3091 dovendo fare ricorso a delle operazioni sul filesystem esso è in genere
3092 leggermente più lento.
3093
3094 \begin{figure}[!htb]
3095   \footnotesize \centering
3096   \begin{minipage}[c]{15cm}
3097     \begin{lstlisting}{}
3098 /*
3099  * Function LockMutex: lock a file (creating it if not existent).
3100  */
3101 int LockMutex(const char *path_name)
3102 {
3103     int fd, res;
3104     struct flock lock;                                /* file lock structure */
3105     /* first open the file (creating it if not existent) */
3106     if ( (fd = open(path_name, O_EXCL|O_CREAT)) < 0) {    /* first open file */
3107         return fd;
3108     }
3109     /* set flock structure */
3110     lock.l_type = F_WRLCK;                        /* set type: read or write */
3111     lock.l_whence = SEEK_SET;        /* start from the beginning of the file */
3112     lock.l_start = 0;                  /* set the start of the locked region */
3113     lock.l_len = 0;                   /* set the length of the locked region */
3114     /* do locking */
3115     if ( (res = fcntl(fd, F_SETLKW, &lock)) < 0 ) {
3116         return res;
3117     }
3118     return 0;
3119 }
3120 /*
3121  * Function UnLockMutex: unlock a file.
3122  */
3123 int UnlockMutex(const char *path_name)
3124 {
3125     int fd, res;
3126     struct flock lock;                                /* file lock structure */
3127     /* first open the file */
3128     if ( (fd = open(path_name, O_RDWR)) < 0) {            /* first open file */
3129         return fd;
3130     }
3131     /* set flock structure */
3132     lock.l_type = F_UNLCK;                               /* set type: unlock */
3133     lock.l_whence = SEEK_SET;        /* start from the beginning of the file */
3134     lock.l_start = 0;                  /* set the start of the locked region */
3135     lock.l_len = 0;                   /* set the length of the locked region */
3136     /* do locking */
3137     if ( (res = fcntl(fd, F_SETLK, &lock)) < 0 ) {
3138         return res;
3139     }
3140     return 0;
3141 }
3142     \end{lstlisting}
3143   \end{minipage}
3144   \normalsize
3145   \caption{Il codice delle funzioni che permettono di creare un
3146     \textit{mutex} utilizzando il file locking.}
3147   \label{fig:ipc_flock_mutex}
3148 \end{figure}
3149
3150 Il codice per implementare un mutex utilizzando il file locking è riportato in
3151 \figref{fig:ipc_flock_mutex}; a differenza del precedente caso in cui si sono
3152 usati i semafori le funzioni questa volta sono sufficienti due funzioni,
3153 \func{LockMutex} e \func{UnlockMutex}, usate rispettivamente per acquisire e
3154 rilasciare il mutex.
3155
3156 La prima funzione (\texttt{\small 1--22}) serve per acquisire il mutex.
3157 Anzitutto si apre (\texttt{\small 9--11}), creandolo se non esiste, il file
3158 specificato dall'argomento \param{pathname}. In caso di errore si ritorna
3159 immediatamente, altrimenti si prosegue impostando (\texttt{\small 12--16}) la
3160 struttura \var{lock} in modo da poter acquisire un write lock sul file. Infine
3161 si richiede (\texttt{\small 17--20}) il file lock (restituendo il codice di
3162 ritorno di \func{fcntl} caso di errore). Se il file è libero il lock è
3163 acquisito e la funzione ritorna immediatamente; altrimenti \func{fcntl} si
3164 bloccherà (si noti che la si è chiamata con \func{F\_SETLKW}) fino al rilascio
3165 del lock.
3166
3167 La seconda funzione (\texttt{\small 23--44}) serve a rilasciare il mutex. Di
3168 nuovo si apre (\texttt{\small 30--33}) il file specificato dall'argomento
3169 \param{pathname} (che stavolta deve esistere), ritornando immediatamente in
3170 caso di errore. Poi si passa ad inizializzare (\texttt{\small 34--38}) la
3171 struttura \var{lock} per il rilascio del lock, che viene effettuato
3172 (\texttt{\small 39--42}) subito dopo.
3173
3174  \subsection{Il \textit{memory mapping} anonimo}
3175 \label{sec:ipc_mmap_anonymous}
3176
3177 Abbiamo già visto che quando i processi sono \textsl{correlati}\footnote{se
3178   cioè hanno almeno un progenitore comune.} l'uso delle pipe può costituire
3179 una valida alternativa alle code di messaggi; nella stessa situazione si può
3180 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3181 \textit{memory mapping} anonimo.
3182
3183 Abbiamo visto in \secref{sec:file_memory_map} che è possibile mappare il
3184 contenuto di un file nella memoria di un processo, e che, quando viene usato
3185 il flag \macro{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3186 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3187 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3188 inefficiente, in quanto occorre passare attraverso il disco. Però abbiamo
3189 visto anche che se si esegue la mappatura con il flag \macro{MAP\_ANONYMOUS}
3190 la regione mappata non viene associata a nessun file, anche se quanto scritto
3191 rimane in memoria e può essere riletto; allora, dato che un processo figlio
3192 mantiene nel suo spazio degli indirizzi anche le regioni mappate, esso sarà
3193 anche in grado di accedere a quanto in esse è contenuto.
3194
3195 In questo modo diventa possibile creare una memoria condivisa fra processi
3196 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3197 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3198   funzionalità simile a questa viene implementata mappando il file speciale
3199   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3200   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3201   restano in memoria e possono essere riletti secondo le stesse modalità usate
3202   nele \textit{memory mapping} anonimo.} Un esempio di utilizzo di questa
3203 tecnica è mostrato in
3204
3205
3206
3207 \section{La comunicazione fra processi di POSIX}
3208 \label{sec:ipc_posix}
3209
3210 Per superare i numerosi problemi del \textit{SysV IPC}, evidenziati per i suoi
3211 aspetti generali in coda a \secref{sec:ipc_sysv_generic} e per i singoli
3212 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3213 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3214 una interfaccia completamente nuova, che tratteremo in questa sezione.
3215
3216
3217
3218 \subsection{Considerazioni generali}
3219 \label{sec:ipc_posix_generic}
3220
3221 Il Linux non tutti gli oggetti del POSIX IPC sono supportati nel kernel
3222 ufficiale; solo la memoria condivisa è presente, ma solo a partire dal kernel
3223 2.4.x, per gli altri oggetti esistono patch e librerie non ufficiali.
3224 Nonostante questo è importante esaminare questa interfaccia per la sua netta
3225 superiorità nei confronti di quella del \textit{SysV IPC}.
3226
3227
3228 \subsection{Code di messaggi}
3229 \label{sec:ipc_posix_mq}
3230
3231 Le code di messaggi non sono supportate a livello del kernel, esse però
3232 possono essere implementate, usando la memoria condivisa ed i mutex, con
3233 funzioni di libreria. In generale esse sono comunque poco usate, i socket, nei
3234 casi in cui sono sufficienti, sono più comodi, e negli altri casi la
3235 comunicazione può essere gestita direttamente con la stessa metodologia usata
3236 per implementare le code di messaggi. Per questo ci limiteremo ad una
3237 descrizione essenziale.
3238
3239
3240
3241 \subsection{Semafori}
3242 \label{sec:ipc_posix_sem}
3243
3244 Dei semafori POSIX esistono sostanzialmente due implementazioni; una è fatta a
3245 livello di libreria ed è fornita dalla libreria dei thread; questa però li
3246 implementa solo a livello di thread e non di processi. Esiste una
3247
3248
3249 \subsection{Memoria condivisa}
3250 \label{sec:ipc_posix_shm}
3251
3252 La memoria condivisa è l'unico degli oggetti di IPC POSIX già presente nel
3253 kernel ufficiale.
3254
3255
3256 %%% Local Variables:
3257 %%% mode: latex
3258 %%% TeX-master: "gapil"
3259 %%% End: