a3846faf6ff3bba8f19f8ce20a903bf6ef4373f2
[gapil.git] / ipc.tex
1 %% ipc.tex
2 %%
3 %% Copyright (C) 2000-2002 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11 \chapter{La comunicazione fra processi}
12 \label{cha:IPC}
13
14
15 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
16 la comunicazione fra processi. In questo capitolo affronteremo solo i
17 meccanismi più elementari che permettono di mettere in comunicazione processi
18 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
19 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
20
21 Tralasceremo invece tutte le problematiche relative alla comunicazione
22 attraverso la rete (e le relative interfacce) che saranno affrontate in
23 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
24 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) e CORBA
25 (\textit{Common Object Request Brocker Architecture}) che in genere sono
26 implementati con un ulteriore livello sopra i meccanismi elementari.
27
28
29 \section{La comunicazione fra processi tradizionale}
30 \label{sec:ipc_unix}
31
32 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
33 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
34 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
35 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
36 ne gestiscono l'uso e le varie forme in cui si è evoluto.
37
38
39 \subsection{Le \textit{pipe} standard}
40 \label{sec:ipc_pipes}
41
42 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
43 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
44 sostanza di una una coppia di file descriptor\footnote{si tenga presente che
45   le pipe sono oggetti creati dal kernel e non risiedono su disco.} connessi
46 fra di loro in modo che se quanto scrive su di uno si può rileggere
47 dall'altro. Si viene così a costituire un canale di comunicazione tramite i
48 due file descriptor, nella forma di un \textsl{tubo} (da cui il nome)
49 attraverso cui fluiscono i dati.
50
51 La funzione che permette di creare questa speciale coppia di file descriptor
52 associati ad una \textit{pipe} è appunto \func{pipe}, ed il suo prototipo è:
53 \begin{prototype}{unistd.h}
54 {int pipe(int filedes[2])} 
55   
56 Crea una coppia di file descriptor associati ad una \textit{pipe}.
57   
58   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
59     errore, nel qual caso \var{errno} potrà assumere i valori \errval{EMFILE},
60     \errval{ENFILE} e \errval{EFAULT}.}
61 \end{prototype}
62
63 La funzione restituisce la coppia di file descriptor nel vettore
64 \param{filedes}; il primo è aperto in lettura ed il secondo in scrittura. Come
65 accennato concetto di funzionamento di una pipe è semplice: quello che si
66 scrive nel file descriptor aperto in scrittura viene ripresentato tale e quale
67 nel file descriptor aperto in lettura. I file descriptor infatti non sono
68 connessi a nessun file reale, ma ad un buffer nel kernel, la cui dimensione è
69 specificata dal parametro di sistema \const{PIPE\_BUF}, (vedi
70 \secref{sec:sys_file_limits}). Lo schema di funzionamento di una pipe è
71 illustrato in \figref{fig:ipc_pipe_singular}, in cui sono illustrati i due
72 capi della pipe, associati a ciascun file descriptor, con le frecce che
73 indicano la direzione del flusso dei dati.
74
75 \begin{figure}[htb]
76   \centering
77   \includegraphics[height=5cm]{img/pipe}
78   \caption{Schema della struttura di una pipe.}
79   \label{fig:ipc_pipe_singular}
80 \end{figure}
81
82 Chiaramente creare una pipe all'interno di un singolo processo non serve a
83 niente; se però ricordiamo quanto esposto in \secref{sec:file_sharing}
84 riguardo al comportamento dei file descriptor nei processi figli, è immediato
85 capire come una pipe possa diventare un meccanismo di intercomunicazione. Un
86 processo figlio infatti condivide gli stessi file descriptor del padre,
87 compresi quelli associati ad una pipe (secondo la situazione illustrata in
88 \figref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
89 capo della pipe, l'altro può leggere.
90
91 \begin{figure}[htb]
92   \centering
93   \includegraphics[height=5cm]{img/pipefork}
94   \caption{Schema dei collegamenti ad una pipe, condivisi fra processo padre e
95     figlio dopo l'esecuzione \func{fork}.}
96   \label{fig:ipc_pipe_fork}
97 \end{figure}
98
99 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
100 comunicazione fra processi attraverso una pipe, utilizzando le proprietà
101 ordinarie dei file, ma ci mostra anche qual'è il principale\footnote{Stevens
102   in \cite{APUE} riporta come limite anche il fatto che la comunicazione è
103   unidirezionale, ma in realtà questo è un limite facilmente superabile usando
104   una coppia di pipe.} limite nell'uso delle pipe. È necessario infatti che i
105 processi possano condividere i file descriptor della pipe, e per questo essi
106 devono comunque essere \textsl{parenti} (dall'inglese \textit{siblings}), cioè
107 o derivare da uno stesso processo padre in cui è avvenuta la creazione della
108 pipe, o, più comunemente, essere nella relazione padre/figlio.
109
110 A differenza di quanto avviene con i file normali, la lettura da una pipe può
111 essere bloccante (qualora non siano presenti dati), inoltre se si legge da una
112 pipe il cui capo in scrittura è stato chiuso, si avrà la ricezione di un EOF
113 (vale a dire che la funzione \func{read} ritornerà restituendo 0).  Se invece
114 si esegue una scrittura su una pipe il cui capo in lettura non è aperto il
115 processo riceverà il segnale \errcode{EPIPE}, e la funzione di scrittura
116 restituirà un errore di \errcode{EPIPE} (al ritorno del manipolatore, o qualora
117 il segnale sia ignorato o bloccato).
118
119 La dimensione del buffer della pipe (\const{PIPE\_BUF}) ci dà inoltre un'altra
120 importante informazione riguardo il comportamento delle operazioni di lettura
121 e scrittura su di una pipe; esse infatti sono atomiche fintanto che la
122 quantità di dati da scrivere non supera questa dimensione. Qualora ad esempio
123 si effettui una scrittura di una quantità di dati superiore l'operazione verrà
124 effettuata in più riprese, consentendo l'intromissione di scritture effettuate
125 da altri processi.
126
127
128 \subsection{Un esempio dell'uso delle pipe}
129 \label{sec:ipc_pipe_use}
130
131 Per capire meglio il funzionamento delle pipe faremo un esempio di quello che
132 è il loro uso più comune, analogo a quello effettuato della shell, e che
133 consiste nell'inviare l'output di un processo (lo standard output) sull'input
134 di un'altro. Realizzeremo il programma di esempio nella forma di un
135 \textit{CGI}\footnote{Un CGI (\textit{Common Gateway Interface}) è un
136   programma che permette la creazione dinamica di un oggetto da inserire
137   all'interno di una pagina HTML.}  per Apache, che genera una immagine JPEG
138 di un codice a barre, specificato come parametro di input.
139
140 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
141 delle caratteristiche specifiche, esso infatti non viene lanciato da una
142 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
143 solito ha la forma:
144 \begin{verbatim}
145     http://www.sito.it/cgi-bin/programma?parametro
146 \end{verbatim}
147 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
148 che ne descrive il mime-type) sullo standard output, in modo che il web-server
149 possa reinviarlo al browser che ha effettuato la richiesta, che in questo modo
150 è in grado di visualizzarlo opportunamente.
151
152 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
153 \cmd{gs}, il primo infatti è in grado di generare immagini postscript di
154 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
155 serve per poter effettuare la conversione della stessa immagine in formato
156 JPEG. Usando una pipe potremo inviare l'output del primo sull'input del
157 secondo, secondo lo schema mostrato in \figref{fig:ipc_pipe_use}, in cui la
158 direzione del flusso dei dati è data dalle frecce continue.
159
160 \begin{figure}[htb]
161   \centering
162   \includegraphics[height=5cm]{img/pipeuse}
163   \caption{Schema dell'uso di una pipe come mezzo di comunicazione fra
164     due processi attraverso attraverso l'esecuzione una \func{fork} e la
165     chiusura dei capi non utilizzati.}
166   \label{fig:ipc_pipe_use}
167 \end{figure}
168
169 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
170 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
171 \textit{CGI} deve poter gestire più richieste in concorrenza, e si avrebbe una
172 evidente race condition\index{race condition} in caso di accesso simultaneo a
173 detto file.\footnote{il problema potrebbe essere superato determinando in
174   anticipo un nome appropriato per il file temporaneo, che verrebbe utilizzato
175   dai vari sotto-processi, e cancellato alla fine della loro esecuzione; ma a
176   questo le cose non sarebbero più tanto semplici.}  L'uso di una pipe invece
177 permette di risolvere il problema in maniera semplice ed elegante, oltre ad
178 essere molto più efficiente, dato che non si deve scrivere su disco.
179
180 Il programma ci servirà anche come esempio dell'uso delle funzioni di
181 duplicazione dei file descriptor che abbiamo trattato in
182 \secref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
183 funzioni infatti che è possibile dirottare gli stream standard dei processi
184 (che abbiamo visto in \secref{sec:file_std_descr} e
185 \secref{sec:file_std_stream}) sulla pipe. In \figref{fig:ipc_barcodepage_code}
186 abbiamo riportato il corpo del programma, il cui codice completo è disponibile
187 nel file \file{BarCodePage.c} che si trova nella directory dei sorgenti.
188
189
190 \begin{figure}[!htb]
191   \footnotesize \centering
192   \begin{minipage}[c]{15cm}
193     \begin{lstlisting}{}
194 int main(int argc, char *argv[], char *envp[])
195 {
196     ...
197     /* create two pipes, pipein and pipeout, to handle communication */
198     if ( (retval = pipe(pipein)) ) {
199         WriteMess("input pipe creation error");
200         exit(0);        
201     }
202     if ( (retval = pipe(pipeout)) ) {
203         WriteMess("output pipe creation error");
204         exit(0);        
205     }    
206     /* First fork: use child to run barcode program */
207     if ( (pid = fork()) == -1) {          /* on error exit */
208         WriteMess("child creation error");
209         exit(0);        
210     }
211     /* if child */
212     if (pid == 0) {
213         close(pipein[1]);                /* close pipe write end  */
214         dup2(pipein[0], STDIN_FILENO);   /* remap stdin to pipe read end */
215         close(pipeout[0]);
216         dup2(pipeout[1], STDOUT_FILENO); /* remap stdout in pipe output */
217         execlp("barcode", "barcode", size, NULL);
218     } 
219     close(pipein[0]);                    /* close input side of input pipe */
220     write(pipein[1], argv[1], strlen(argv[1]));  /* write parameter to pipe */
221     close(pipein[1]);                    /* closing write end */
222     waitpid(pid, NULL, 0);               /* wait child completion */
223     /* Second fork: use child to run ghostscript */
224     if ( (pid = fork()) == -1) {
225         WriteMess("child creation error");
226         exit(0);
227     }
228     /* second child, convert PS to JPEG  */
229     if (pid == 0) {                     
230         close(pipeout[1]);              /* close write end */
231         dup2(pipeout[0], STDIN_FILENO); /* remap read end to stdin */
232         /* send mime type */
233         write(STDOUT_FILENO, content, strlen(content));
234         execlp("gs", "gs", "-q", "-sDEVICE=jpeg", "-sOutputFile=-", "-", NULL);
235     }
236     /* still parent */
237     close(pipeout[1]); 
238     waitpid(pid, NULL, 0);
239     exit(0);
240 }
241     \end{lstlisting}
242   \end{minipage} 
243   \normalsize 
244   \caption{Sezione principale del codice del \textit{CGI} 
245     \file{BarCodePage.c}.}
246   \label{fig:ipc_barcodepage_code}
247 \end{figure}
248
249 La prima operazione del programma (\texttt{\small 4--12}) è quella di creare
250 le due pipe che serviranno per la comunicazione fra i due comandi utilizzati
251 per produrre il codice a barre; si ha cura di controllare la riuscita della
252 chiamata, inviando in caso di errore un messaggio invece dell'immagine
253 richiesta.\footnote{la funzione \func{WriteMess} non è riportata in
254   \secref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
255   formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
256   \textit{mime type}, e formattando il messaggio in HTML, in modo che
257   quest'ultimo possa essere visualizzato correttamente da un browser.}
258
259 Una volta create le pipe, il programma può creare (\texttt{\small 13-17}) il
260 primo processo figlio, che si incaricherà (\texttt{\small 19--25}) di eseguire
261 \cmd{barcode}. Quest'ultimo legge dallo standard input una stringa di
262 caratteri, la converte nell'immagine postscript del codice a barre ad essa
263 corrispondente, e poi scrive il risultato direttamente sullo standard output.
264
265 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
266 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima pipe, e se
267 ne collega (\texttt{\small 21}) il capo in lettura allo standard input, usando
268 \func{dup2}. Si ricordi che invocando \func{dup2} il secondo file, qualora
269 risulti aperto, viene, come nel caso corrente, chiuso prima di effettuare la
270 duplicazione. Allo stesso modo, dato che \cmd{barcode} scrive l'immagine
271 postscript del codice a barre sullo standard output, per poter effettuare una
272 ulteriore redirezione il capo in lettura della seconda pipe viene chiuso
273 (\texttt{\small 22}) mentre il capo in scrittura viene collegato allo standard
274 output (\texttt{\small 23}).
275
276 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
277 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
278 leggerà dalla prima pipe la stringa da codificare che gli sarà inviata dal
279 padre, e scriverà l'immagine postscript del codice a barre sulla seconda.
280
281 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
282 (\texttt{\small 26}) il capo inutilizzato della prima pipe (quello in input) e
283 poi scrive (\texttt{\small 27}) la stringa da convertire sul capo in output,
284 così che \cmd{barcode} possa riceverla dallo standard input. A questo punto
285 l'uso della prima pipe da parte del padre è finito ed essa può essere
286 definitivamente chiusa (\texttt{\small 28}), si attende poi (\texttt{\small
287   29}) che l'esecuzione di \cmd{barcode} sia completata.
288
289 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
290 postscript del codice a barre sul capo in scrittura della seconda pipe; a
291 questo punto si può eseguire la seconda conversione, da PS a JPEG, usando il
292 programma \cmd{gs}. Per questo si crea (\texttt{\small 30--34}) un secondo
293 processo figlio, che poi (\texttt{\small 35--42}) eseguirà questo programma
294 leggendo l'immagine postscript creata da \cmd{barcode} dallo standard input,
295 per convertirla in JPEG.
296
297 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
298 scrittura della seconda pipe, e se ne collega (\texttt{\small 38}) il capo in
299 lettura allo standard input. Per poter formattare l'output del programma in
300 maniera utilizzabile da un browser, si provvede anche \texttt{\small 40}) alla
301 scrittura dell'apposita stringa di identificazione del mime-type in testa allo
302 standard output. A questo punto si può invocare \texttt{\small 41}) \cmd{gs},
303 provvedendo gli appositi switch che consentono di leggere il file da
304 convertire dallo standard input e di inviare la conversione sullo standard
305 output.
306
307 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
308 capo in scrittura della seconda pipe, e attende la conclusione del figlio
309 (\texttt{\small 45}); a questo punto può (\texttt{\small 46}) uscire. Si tenga
310 conto che l'operazione di chiudere il capo in scrittura della seconda pipe è
311 necessaria, infatti, se non venisse chiusa, \cmd{gs}, che legge il suo
312 standard input da detta pipe, resterebbe bloccato in attesa di ulteriori dati
313 in ingresso (l'unico modo che un programma ha per sapere che l'input è
314 terminato è rilevare che lo standard input è stato chiuso), e la \func{wait}
315 non ritornerebbe.
316
317
318 \subsection{Le funzioni \func{popen} e \func{pclose}}
319 \label{sec:ipc_popen}
320
321 Come si è visto la modalità più comune di utilizzo di una pipe è quella di
322 utilizzarla per fare da tramite fra output ed input di due programmi invocati
323 in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due funzioni
324 che permettono di sintetizzare queste operazioni. La prima di esse si chiama
325 \func{popen} ed il suo prototipo è:
326 \begin{prototype}{stdio.h}
327 {FILE *popen(const char *command, const char *type)}
328
329 Esegue il programma \param{command}, di cui, a seconda di \param{type},
330 restituisce, lo standard input o lo standard output nella pipe collegata allo
331 stream restituito come valore di ritorno.
332   
333 \bodydesc{La funzione restituisce l'indirizzo dello stream associato alla pipe
334   in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
335   potrà assumere i valori relativi alle sottostanti invocazioni di \func{pipe}
336   e \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
337 \end{prototype}
338
339 La funzione crea una pipe, esegue una \func{fork}, ed invoca il programma
340 \param{command} attraverso la shell (in sostanza esegue \file{/bin/sh} con il
341 flag \code{-c}); l'argomento \param{type} deve essere una delle due stringhe
342 \verb|"w"| o \verb|"r"|, per indicare se la pipe sarà collegata allo standard
343 input o allo standard output del comando invocato.
344
345 La funzione restituisce il puntatore allo stream associato alla pipe creata,
346 che sarà aperto in sola lettura (e quindi associato allo standard output del
347 programma indicato) in caso si sia indicato \code{"r"}, o in sola scrittura (e
348 quindi associato allo standard input) in caso di \code{"w"}.
349
350 Lo stream restituito da \func{popen} è identico a tutti gli effetti ai file
351 stream visti in \capref{cha:files_std_interface}, anche se è collegato ad una
352 pipe e non ad un inode\index{inode}, e viene sempre aperto in modalità
353 \textit{fully-buffered} (vedi \secref{sec:file_buffering}); l'unica differenza
354 con gli usuali stream è che dovrà essere chiuso dalla seconda delle due nuove
355 funzioni, \func{pclose}, il cui prototipo è:
356 \begin{prototype}{stdio.h}
357 {int pclose(FILE *stream)}
358
359 Chiude il file \param{stream}, restituito da una precedente \func{popen}
360 attendendo la terminazione del processo ad essa associato.
361   
362 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
363   errore; nel quel caso il valore di \var{errno} deriva dalle sottostanti
364   chiamate.}
365 \end{prototype}
366 \noindent che oltre alla chiusura dello stream si incarica anche di attendere
367 (tramite \func{wait4}) la conclusione del processo creato dalla precedente
368 \func{popen}.
369
370 Per illustrare l'uso di queste due funzioni riprendiamo il problema
371 precedente: il programma mostrato in \figref{fig:ipc_barcodepage_code} per
372 quanto funzionante, è (volutamente) codificato in maniera piuttosto complessa,
373 inoltre nella pratica sconta un problema di \cmd{gs} che non è in
374 grado\footnote{nella versione GNU Ghostscript 6.53 (2002-02-13).} di
375 riconoscere correttamente l'encapsulated postscript, per cui deve essere usato
376 il postscript e tutte le volte viene generata una pagina intera, invece che
377 una immagine delle dimensioni corrispondenti al codice a barre.
378
379 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
380 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
381 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
382 generato da \cmd{barcode} utilizzando lo switch \cmd{-E}).  Utilizzando un PDF
383 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
384 originarie del codice a barre e produce un JPEG di dimensioni corrette.
385
386 Questo approccio però non funziona, per via di una delle caratteristiche
387 principali delle pipe. Per poter effettuare la conversione di un PDF infatti è
388 necessario, per la struttura del formato, potersi spostare (con \func{lseek})
389 all'interno del file da convertire; se si esegue la conversione con \cmd{gs}
390 su un file regolare non ci sono problemi, una pipe però è rigidamente
391 sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre con un errore
392 di \errcode{ESPIPE}, rendendo impossibile la conversione.  Questo ci dice che
393 in generale la concatenazione di vari programmi funzionerà soltanto quando
394 tutti prevedono una lettura sequenziale del loro input.
395
396 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
397 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
398 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
399   formato usato spesso come formato intermedio per effettuare conversioni, è
400   infatti molto facile da manipolare, dato che usa caratteri ASCII per
401   memorizzare le immagini, anche se per questo è estremamente inefficiente.}
402 dal quale poi si può ottenere un'immagine di dimensioni corrette attraverso
403 vari programmi di manipolazione (\cmd{pnmcrop}, \cmd{pnmmargin}) che può
404 essere infine trasformata in PNG (con \cmd{pnm2png}).
405
406 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
407 inviando l'output di ciascuno all'input del successivo, per poi ottenere il
408 risultato finale sullo standard output: un caso classico di utilizzazione
409 delle pipe, in cui l'uso di \func{popen} e \func{pclose} permette di
410 semplificare notevolmente la stesura del codice.
411
412 Nel nostro caso, dato che ciascun processo deve scrivere il suo output sullo
413 standard input del successivo, occorrerà usare \func{popen} aprendo la pipe in
414 scrittura. Il codice del nuovo programma è riportato in
415 \figref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione dei
416 programmi è l'inverso di quello in cui ci si aspetta che vengano
417 effettivamente eseguiti. Questo non comporta nessun problema dato che la
418 lettura su una pipe è bloccante, per cui ciascun processo, per quanto lanciato
419 per primo, si bloccherà in attesa di ricevere sullo standard input il
420 risultato dell'elaborazione del precedente, benchè quest'ultimo venga
421 invocato dopo.
422
423 \begin{figure}[!htb]
424   \footnotesize \centering
425   \begin{minipage}[c]{15cm}
426     \begin{lstlisting}{}
427 int main(int argc, char *argv[], char *envp[])
428 {
429     FILE *pipe[4];
430     FILE *pipein;
431     char *cmd_string[4]={
432         "pnmtopng",
433         "pnmmargin -white 10",
434         "pnmcrop",
435         "gs -sDEVICE=ppmraw -sOutputFile=- -sNOPAUSE -q - -c showpage -c quit"
436     };  
437     char content[]="Content-type: image/png\n\n";
438     int i;
439     /* write mime-type to stout */ 
440     write(STDOUT_FILENO, content, strlen(content));
441     /* execute chain of command */
442     for (i=0; i<4; i++) {
443         pipe[i] = popen(cmd_string[i], "w");
444         dup2(fileno(pipe[i]), STDOUT_FILENO); 
445     }
446     /* create barcode (in PS) */
447     pipein = popen("barcode", "w");
448     /* send barcode string to barcode program */
449     write(fileno(pipein), argv[1], strlen(argv[1]));
450     /* close all pipes (in reverse order) */
451     for (i=4; i==0; i--) {
452         pclose((pipe[i]));
453     }
454     exit(0);
455 }
456     \end{lstlisting}
457   \end{minipage} 
458   \normalsize 
459   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
460   \label{fig:ipc_barcode_code}
461 \end{figure}
462
463 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il mime-type
464 sullo standard output; a questo punto il processo padre non necessita più di
465 eseguire ulteriori operazioni sullo standard output e può tranquillamente
466 provvedere alla redirezione.
467
468 Dato che i vari programmi devono essere lanciati in successione, si è
469 approntato un ciclo (\texttt{\small 15--19}) che esegue le operazioni in
470 sequenza: prima crea una pipe (\texttt{\small 17}) per la scrittura eseguendo
471 il programma con \func{popen}, in modo che essa sia collegata allo standard
472 input, e poi redirige (\texttt{\small 18}) lo standard output su detta pipe.
473
474 In questo modo il primo processo ad essere invocato (che è l'ultimo della
475 catena) scriverà ancora sullo standard output del processo padre, ma i
476 successivi, a causa di questa redirezione, scriveranno sulla pipe associata
477 allo standard input del processo invocato nel ciclo precedente.
478
479 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
480 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
481 (\texttt{\small 23}) la stringa del codice a barre sulla pipe, che è collegata
482 al suo standard input, infine si può eseguire (\texttt{\small 24--27}) un
483 ciclo che chiuda, nell'ordine inverso rispetto a quello in cui le si sono
484 create, tutte le pipe create con \func{pclose}.
485
486
487 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
488 \label{sec:ipc_named_pipe}
489
490 Come accennato in \secref{sec:ipc_pipes} il problema delle \textit{pipe} è che
491 esse possono essere utilizzate solo da processi con un progenitore comune o
492 nella relazione padre/figlio; per superare questo problema lo standard POSIX.1
493 ha definito dei nuovi oggetti, le \textit{fifo}, che hanno le stesse
494 caratteristiche delle pipe, ma che invece di essere strutture interne del
495 kernel, visibili solo attraverso un file descriptor, sono accessibili
496 attraverso un inode\index{inode} che risiede sul filesystem, così che i
497 processi le possono usare senza dovere per forza essere in una relazione di
498 \textsl{parentela}.
499
500 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le pipe,
501 attraverso un apposito buffer nel kernel, senza transitare dal filesystem;
502 l'inode\index{inode} allocato sul filesystem serve infatti solo a fornire un
503 punto di riferimento per i processi, che permetta loro di accedere alla stessa
504 fifo; il comportamento delle funzioni di lettura e scrittura è identico a
505 quello illustrato per le pipe in \secref{sec:ipc_pipes}.
506
507 Abbiamo già visto in \secref{sec:file_mknod} le funzioni \func{mknod} e
508 \func{mkfifo} che permettono di creare una fifo; per utilizzarne una un
509 processo non avrà che da aprire il relativo file speciale o in lettura o
510 scrittura; nel primo caso sarà collegato al capo di uscita della fifo, e dovrà
511 leggere, nel secondo al capo di ingresso, e dovrà scrivere.
512
513 Il kernel crea una singola pipe per ciascuna fifo che sia stata aperta, che può
514 essere acceduta contemporaneamente da più processi, sia in lettura che in
515 scrittura. Dato che per funzionare deve essere aperta in entrambe le
516 direzioni, per una fifo di norma la funzione \func{open} si blocca se viene
517 eseguita quando l'altro capo non è aperto.
518
519 Le fifo però possono essere anche aperte in modalità \textsl{non-bloccante},
520 nel qual caso l'apertura del capo in lettura avrà successo solo quando anche
521 l'altro capo è aperto, mentre l'apertura del capo in scrittura restituirà
522 l'errore di \errcode{ENXIO} fintanto che non verrà aperto il capo in lettura.
523
524 In Linux è possibile aprire le fifo anche in lettura/scrittura,\footnote{lo
525   standard POSIX lascia indefinito il comportamento in questo caso.}
526 operazione che avrà sempre successo immediato qualunque sia la modalità di
527 apertura (bloccante e non bloccante); questo può essere utilizzato per aprire
528 comunque una fifo in scrittura anche se non ci sono ancora processi il
529 lettura; è possibile anche usare la fifo all'interno di un solo processo, nel
530 qual caso però occorre stare molto attenti alla possibili situazioni di
531 stallo.\footnote{se si cerca di leggere da una fifo che non contiene dati si
532   avrà un deadlock\index{deadlock} immediato, dato che il processo si blocca e
533   non potrà quindi mai eseguire le funzioni di scrittura.}
534
535 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
536 piuttosto frequente l'utilizzo di una fifo come canale di comunicazione nelle
537 situazioni un processo deve ricevere informazioni da altri. In questo caso è
538 fondamentale che le operazioni di scrittura siano atomiche; per questo si deve
539 sempre tenere presente che questo è vero soltanto fintanto che non si supera
540 il limite delle dimensioni di \const{PIPE\_BUF} (si ricordi quanto detto in
541 \secref{sec:ipc_pipes}).
542
543 A parte il caso precedente, che resta probabilmente il più comune, Stevens
544 riporta in \cite{APUE} altre due casistiche principali per l'uso delle fifo:
545 \begin{itemize}
546 \item Da parte dei comandi di shell, per evitare la creazione di file
547   temporanei quando si devono inviare i dati di uscita di un processo
548   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
549   
550 \item Come canale di comunicazione fra client ed server (il modello
551   \textit{client-server} è illustrato in \secref{sec:net_cliserv}).
552 \end{itemize}
553
554 Nel primo caso quello che si fa è creare tante fifo, da usare come standard
555 input, quanti sono i processi a cui i vogliono inviare i dati, questi ultimi
556 saranno stati posti in esecuzione ridirigendo lo standard input dalle fifo, si
557 potrà poi eseguire il processo che fornisce l'output replicando quest'ultimo,
558 con il comando \cmd{tee}, sulle varie fifo.
559
560 Il secondo caso è relativamente semplice qualora si debba comunicare con un
561 processo alla volta (nel qual caso basta usare due fifo, una per leggere ed
562 una per scrivere), le cose diventano invece molto più complesse quando si
563 vuole effettuare una comunicazione fra il server ed un numero imprecisato di
564 client; se il primo infatti può ricevere le richieste attraverso una fifo
565 ``nota'', per le risposte non si può fare altrettanto, dato che, per la
566 struttura sequenziale delle fifo, i client dovrebbero sapere, prima di
567 leggerli, quando i dati inviati sono destinati a loro.
568
569 Per risolvere questo problema, si può usare un'architettura come quella
570 illustrata in \figref{fig:ipc_fifo_server_arch} in cui i client inviano le
571 richieste al server su una fifo nota mentre le risposte vengono reinviate dal
572 server a ciascuno di essi su una fifo temporanea creata per l'occasione.
573
574 \begin{figure}[htb]
575   \centering
576   \includegraphics[height=9cm]{img/fifoserver}
577   \caption{Schema dell'utilizzo delle fifo nella realizzazione di una
578   architettura di comunicazione client/server.}
579   \label{fig:ipc_fifo_server_arch}
580 \end{figure}
581
582 Come esempio di uso questa architettura e dell'uso delle fifo, abbiamo scritto
583 un server di \textit{fortunes}, che restituisce, alle richieste di un client,
584 un detto a caso estratto da un insieme di frasi; sia il numero delle frasi
585 dell'insieme, che i file da cui esse vengono lette all'avvio, sono importabili
586 da riga di comando. Il corpo principale del server è riportato in
587 \figref{fig:ipc_fifo_server}, dove si è tralasciata la parte che tratta la
588 gestione delle opzioni a riga di comando, che effettua il settaggio delle
589 variabili \var{fortunefilename}, che indica il file da cui leggere le frasi,
590 ed \var{n}, che indica il numero di frasi tenute in memoria, ad un valore
591 diverso da quelli preimpostati. Il codice completo è nel file
592 \file{FortuneServer.c}.
593
594 \begin{figure}[!htb]
595   \footnotesize \centering
596   \begin{minipage}[c]{15cm}
597     \begin{lstlisting}{}
598 char *fifoname = "/tmp/fortune.fifo";
599 int main(int argc, char *argv[])
600 {
601 /* Variables definition */
602     int i, n = 0;
603     char *fortunefilename = "/usr/share/games/fortunes/italia";
604     char **fortune;
605     char line[80];
606     int fifo_server, fifo_client;
607     int nread;
608     ...
609     if (n==0) usage();          /* if no pool depth exit printing usage info */
610     Signal(SIGTERM, HandSIGTERM);            /* set handlers for termination */
611     Signal(SIGINT, HandSIGTERM);
612     Signal(SIGQUIT, HandSIGTERM);
613     i = FortuneParse(fortunefilename, fortune, n);          /* parse phrases */
614     if (mkfifo(fifoname, 0622)) {  /* create well known fifo if does't exist */
615         if (errno!=EEXIST) {
616             perror("Cannot create well known fifo");
617             exit(1);
618         }
619     }
620     /* open fifo two times to avoid EOF */
621     fifo_server = open(fifoname, O_RDONLY);
622     if (fifo_server < 0) {
623         perror("Cannot open read only well known fifo");
624         exit(1);
625     }
626     if (open(fifoname, O_WRONLY) < 0) {                        
627         perror("Cannot open write only well known fifo");
628         exit(1);
629     }
630     /* Main body: loop over requests */
631     while (1) {
632         nread = read(fifo_server, line, 79);                 /* read request */
633         if (nread < 0) {
634             perror("Read Error");
635             exit(1);
636         }
637         line[nread] = 0;                       /* terminate fifo name string */
638         n = random() % i;                             /* select random value */
639         fifo_client = open(line, O_WRONLY);              /* open client fifo */
640         if (fifo_client < 0) {
641             perror("Cannot open");
642             exit(1);
643         }
644         nread = write(fifo_client,                           /* write phrase */
645                       fortune[n], strlen(fortune[n])+1);
646         close(fifo_client);                             /* close client fifo */
647     }
648 }
649     \end{lstlisting}
650   \end{minipage} 
651   \normalsize 
652   \caption{Sezione principale del codice del server di \textit{fortunes}
653     basato sulle fifo.}
654   \label{fig:ipc_fifo_server}
655 \end{figure}
656
657 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
658 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
659 \var{fortune} avviene solo quando questa dimensione viene specificata, la
660 presenza di un valore nullo provoca l'uscita dal programma attraverso la
661 routine (non riportata) che ne stampa le modalità d'uso.  Dopo di che installa
662 (\texttt{\small 13--15}) la funzione che gestisce i segnali di interruzione
663 (anche questa non è riportata in \figref{fig:ipc_fifo_server}) che si limita a
664 rimuovere dal filesystem la fifo usata dal server per comunicare.
665
666 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
667 funzione \code{FortuneParse} che legge dal file specificato in
668 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
669 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
670 Anche il codice della funzione non è riportato, in quanto non direttamente
671 attinente allo scopo dell'esempio.
672
673 Il passo successivo (\texttt{\small 17--22}) è quello di creare con
674 \func{mkfifo} la fifo nota sulla quale il server ascolterà le richieste,
675 qualora si riscontri un errore il server uscirà (escludendo ovviamente il caso
676 in cui la funzione \func{mkfifo} fallisce per la precedente esistenza della
677 fifo).
678
679 Una volta che si è certi che la fifo di ascolto esiste si procede
680 (\texttt{\small 23--32}) alla sua apertura. Questo viene fatto due volte
681 per evitare di dover gestire all'interno del ciclo principale il caso in cui
682 il server è in ascolto ma non ci sono client che effettuano richieste.
683 Si ricordi infatti che quando una fifo è aperta solo dal capo in lettura,
684 l'esecuzione di \func{read} ritorna con zero byte (si ha cioè una condizione
685 di end-of-file).
686
687 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
688 client non apre a sua volta la fifo nota in scrittura per effettuare la sua
689 richiesta. Pertanto all'inizio non ci sono problemi, il client però, una volta
690 ricevuta la risposta, uscirà, chiudendo tutti i file aperti, compresa la fifo.
691 A questo punto il server resta (se non ci sono altri client che stanno
692 effettuando richieste) con la fifo chiusa sul lato in lettura e a questo punto
693 \func{read} non si bloccherà in attesa di input, ma ritornerà in continuazione
694 restituendo un end-of-file.\footnote{Si è usata questa tecnica per
695   compatibilità, Linux infatti supporta l'apertura delle fifo in
696   lettura/scrittura, per cui si sarebbe potuto effettuare una singola apertura
697   con \const{O\_RDWR}, la doppia apertura comunque ha il vantaggio che non si
698   può scrivere per errore sul capo aperto in sola lettura.}
699
700 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
701   24--28}),\footnote{di solito si effettua l'apertura del capo in lettura in
702   modalità non bloccante, per evitare il rischio di uno stallo (se nessuno
703   apre la fifo in scrittura il processo non ritornerà mai dalla \func{open})
704   che nel nostro caso non esiste, mentre è necessario potersi bloccare in
705   lettura in attesa di una richiesta.} si esegue una seconda apertura in
706 scrittura (\texttt{\small 29--32}), scartando il relativo file descriptor che
707 non sarà mai usato, ma lasciando la fifo comunque aperta anche in scrittura,
708 cosicché le successive possano bloccarsi.
709
710 A questo punto si può entrare nel ciclo principale del programma che fornisce
711 le risposte ai client (\texttt{\small 34--50}), che viene eseguito
712 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
713 modo da passare attraverso la routine di chiusura che cancella la fifo). 
714
715 Il server è progettato per accettare come richieste dai client delle stringhe
716 che contengono il nome della fifo sulla quale deve essere inviata la risposta.
717 Per cui prima (\texttt{\small 35--39}) si esegue la lettura dalla stringa di
718 richiesta dalla fifo nota (che a questo punto si bloccherà tutte le volte che
719 non ci sono richieste). Dopo di che, una volta terminata la stringa
720 (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero casuale per
721 ricavare la frase da inviare, si procederà (\texttt{\small 42--46})
722 all'apertura della fifo per la risposta, che \texttt{\small 47--48}) poi vi
723 sarà scritta. Infine (\texttt{\small 49}) si chiude la fifo di risposta che
724 non serve più. 
725
726 Il codice del client è invece riportato in \figref{fig:ipc_fifo_client}, anche
727 in questo caso si è omessa la gestione delle opzioni e la funzione che stampa
728 a video le informazioni di utilizzo ed esce, riportando solo la sezione
729 principale del programma e le definizioni delle variabili. Il codice completo
730 è nel file \file{FortuneClient.c} dei sorgenti allegati.
731
732 \begin{figure}[!htb]
733   \footnotesize \centering
734   \begin{minipage}[c]{15cm}
735     \begin{lstlisting}{}
736 int main(int argc, char *argv[])
737 {
738 /* Variables definition */
739     int n = 0;
740     char *fortunefilename = "/tmp/fortune.fifo";
741     char line[80];
742     int fifo_server, fifo_client;
743     char fifoname[80];
744     int nread;
745     char buffer[PIPE_BUF];
746     ...
747     snprintf(fifoname, 80, "/tmp/fortune.%d", getpid());     /* compose name */
748     if (mkfifo(fifoname, 0622)) {                        /* open client fifo */
749         if (errno!=EEXIST) {
750             perror("Cannot create well known fifo");
751             exit(-1);
752         }
753     }
754     fifo_server = open(fortunefilename, O_WRONLY);       /* open server fifo */
755     if (fifo_server < 0) {
756         perror("Cannot open well known fifo");
757         exit(-1);
758     }
759     nread = write(fifo_server, fifoname, strlen(fifoname)+1);  /* write name */
760     close(fifo_server);                                 /* close server fifo */
761     fifo_client = open(fifoname, O_RDONLY);              /* open client fifo */
762     if (fifo_client < 0) {
763         perror("Cannot open well known fifo");
764         exit(-1);
765     }
766     nread = read(fifo_client, buffer, sizeof(buffer));        /* read answer */
767     printf("%s", buffer);                                   /* print fortune */
768     close(fifo_client);                                      /* close client */
769     close(fifo_server);                                      /* close server */
770     unlink(fifoname);                                  /* remove client fifo */
771 }
772     \end{lstlisting}
773   \end{minipage} 
774   \normalsize 
775   \caption{Sezione principale del codice del client di \textit{fortunes}
776     basato sulle fifo.}
777   \label{fig:ipc_fifo_client}
778 \end{figure}
779
780 La prima istruzione (\texttt{\small 12}) compone il nome della fifo che dovrà
781 essere utilizzata per ricevere la risposta dal server.  Si usa il \acr{pid}
782 del processo per essere sicuri di avere un nome univoco; dopo di che
783 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
784 in caso di errore (a meno che il file non sia già presente sul filesystem).
785
786 A questo punto il client può effettuare l'interrogazione del server, per
787 questo prima si apre la fifo nota (\texttt{\small 19--23}), e poi ci si scrive
788 (\texttt{\small 24}) la stringa composta in precedenza, che contiene il nome
789 della fifo da utilizzare per la risposta. Infine si richiude la fifo del
790 server che a questo punto non serve più (\texttt{\small 25}).
791
792 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
793 si apre (\texttt{\small 26--30}) la fifo appena creata, da cui si deve
794 riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
795 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
796 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
797 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
798 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
799 fifo e si cancella (\texttt{\small 34}) il relativo file.
800 Si noti come la fifo per la risposta sia stata aperta solo dopo aver inviato
801 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
802 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
803 scrittura e l'apertura si sarebbe bloccata indefinitamente.
804
805 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
806 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
807   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
808   per il server sapere se un client è andato in crash, con la possibilità di
809   far restare le fifo temporanee sul filesystem, di come sia necessario
810   intercettare \const{SIGPIPE} dato che un client può terminare dopo aver
811   fatto una richiesta, ma prima che la risposta sia inviata (cosa che nel
812   nostro esempio non è stata fatta).}; in generale infatti l'interfaccia delle
813 fifo non è adatta a risolvere questo tipo di problemi, che possono essere
814 affrontati in maniera più semplice ed efficace o usando i
815 \textit{socket}\index{socket} (che tratteremo in dettaglio a partire da
816 \capref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione diversi,
817 come quelli che esamineremo in seguito.
818
819
820
821 \subsection{La funzione \func{socketpair}}
822 \label{sec:ipc_socketpair}
823
824 Un meccanismo di comunicazione molto simile alle pipe, ma che non presenta il
825 problema della unidirezionalità del flusso dei dati, è quello dei cosiddetti
826 \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo l'argomento
827 dei \textit{socket}\index{socket} in \capref{cha:socket_intro},\footnote{si
828   tratta comunque di oggetti di comunicazione che, come le pipe, sono
829   utilizzati attraverso dei file descriptor.} nell'ambito dell'interfaccia
830 generale che essi forniscono per la programmazione di rete; e vedremo anche
831 (in~\secref{sec:sock_sa_local}) come si possono definire dei file speciali (di
832 tipo \textit{socket}, analoghi a quello associati alle fifo) cui si accede
833 però attraverso quella medesima interfaccia; vale però la pena esaminare qui
834 una modalità di uso dei socket locali\footnote{la funzione \func{socketpair} è
835   stata introdotta in BSD4.4, ma è supportata in genere da qualunque sistema
836   che fornisca l'interfaccia dei socket.} che li rende sostanzialmente
837 identici ad una pipe bidirezionale.
838
839 La funzione \func{socketpair} infatti consente di creare una coppia di file
840 descriptor connessi fra di loro (tramite un socket\index{socket}, appunto),
841 senza dover ricorrere ad un file speciale sul filesystem, i descrittori sono
842 del tutto analoghi a quelli che si avrebbero con una chiamata a \func{pipe},
843 con la sola differenza è che in questo caso il flusso dei dati può essere
844 effettuato in entrambe le direzioni. Il prototipo della funzione è:
845 \begin{functions}
846   \headdecl{sys/types.h} 
847   \headdecl{sys/socket.h} 
848   
849   \funcdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
850   
851   Crea una coppia di socket\index{socket} connessi fra loro.
852   
853   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
854     errore, nel qual caso \var{errno} assumerà uno dei valori:
855   \begin{errlist}
856   \item[\errcode{EAFNOSUPPORT}] I socket\index{socket} locali non sono
857     supportati.
858   \item[\errcode{EPROTONOSUPPORT}] Il protocollo specificato non è supportato.
859   \item[\errcode{EOPNOTSUPP}] Il protocollo specificato non supporta la
860   creazione di coppie di socket\index{socket}.
861   \end{errlist}
862   ed inoltre \errval{EMFILE},  \errval{EFAULT}.
863 }
864 \end{functions}
865
866 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
867 loro: quello che si scrive su uno di essi sarà ripresentato in input
868 sull'altro e viceversa. I parametri \param{domain}, \param{type} e
869 \param{protocol} derivano dall'interfaccia dei socket\index{socket} (che è
870 quella che fornisce il substrato per connettere i due descrittori), ma in
871 questo caso i soli valori validi che possono essere specificati sono
872 rispettivamente \const{AF\_UNIX}, \const{SOCK\_STREAM} e \var{0}.
873
874 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
875 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei
876 socket\index{socket} locali in generale) permette di trasmettere attraverso le
877 linea non solo dei dati, ma anche dei file descriptor: si può cioè passare da
878 un processo ad un altro un file descriptor, con una sorta di duplicazione
879 dello stesso non all'interno di uno stesso processo, ma fra processi distinti
880 (torneremo su questa funzionalità in \secref{sec:xxx_fd_passing}).
881
882
883 \section{La comunicazione fra processi di System V}
884 \label{sec:ipc_sysv}
885
886 Benché le pipe e le fifo siano ancora ampiamente usate, esse scontano il
887 limite fondamentale che il meccanismo di comunicazione che forniscono è
888 rigidamente sequenziale: una situazione in cui un processo scrive qualcosa che
889 molti altri devono poter leggere non può essere implementata con una pipe.
890
891 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
892 oggetti per la comunicazione fra processi ed una nuova interfaccia di
893 programmazione, che fossero in grado di garantire una maggiore flessibilità.
894 In questa sezione esamineremo come Linux supporta quello che viene chiamato il
895 \textsl{Sistema di comunicazione inter-processo} di System V, cui da qui in
896 avanti faremo riferimento come \textit{SysV IPC} (dove IPC è la sigla di
897 \textit{Inter-Process Comunication}).
898
899
900
901 \subsection{Considerazioni generali}
902 \label{sec:ipc_sysv_generic}
903
904 La principale caratteristica del \textit{SysV IPC} è quella di essere basato
905 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
906 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
907 non vengono cancellati dal sistema una volta che non sono più in uso.
908
909 Questo comporta due problemi: il primo è che, al contrario di quanto avviene
910 per pipe e fifo, la memoria allocata per questi oggetti non viene rilasciata
911 automaticamente quando non c'è più nessuno che li utilizzi, ed essi devono
912 essere cancellati esplicitamente, se non si vuole che restino attivi fino al
913 riavvio del sistema. Il secondo problema è che, dato che non c'è, come per i
914 file, un contatore del numero di riferimenti che ne indichi l'essere in uso,
915 essi possono essere cancellati anche se ci sono dei processi che li stanno
916 utilizzando, con tutte le conseguenze (negative) del caso.
917
918 Un'ulteriore caratteristica negativa è che gli oggetti usati nel \textit{SysV
919   IPC} vengono creati direttamente dal kernel, e sono accessibili solo
920 specificando il relativo \textsl{identificatore}. Questo è un numero
921 progressivo (un po' come il \acr{pid} dei processi) che il kernel assegna a
922 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
923 torneremo in \secref{sec:ipc_sysv_id_use}). L'identificatore viene restituito
924 dalle funzioni che creano l'oggetto, ed è quindi locale al processo che le ha
925 eseguite. Dato che l'identificatore viene assegnato dinamicamente dal kernel
926 non è possibile prevedere quale sarà, né utilizzare un qualche valore statico,
927 si pone perciò il problema di come processi diversi possono accedere allo
928 stesso oggetto.
929
930 Per risolvere il problema nella struttura \var{ipc\_perm} che il kernel
931 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
932 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
933 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
934 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
935   si sposta il problema dell'accesso dalla classificazione in base
936   all'identificatore alla classificazione in base alla chiave, una delle tante
937   complicazioni inutili presenti nel \textit{SysV IPC}.} Oltre la chiave, la
938 struttura, la cui definizione è riportata in \figref{fig:ipc_ipc_perm},
939 mantiene varie proprietà ed informazioni associate all'oggetto.
940
941 \begin{figure}[!htb]
942   \footnotesize \centering
943   \begin{minipage}[c]{15cm}
944     \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm ]{}
945 struct ipc_perm
946 {
947     key_t key;                        /* Key.  */
948     uid_t uid;                        /* Owner's user ID.  */
949     gid_t gid;                        /* Owner's group ID.  */
950     uid_t cuid;                       /* Creator's user ID.  */
951     gid_t cgid;                       /* Creator's group ID.  */
952     unsigned short int mode;          /* Read/write permission.  */
953     unsigned short int seq;           /* Sequence number.  */
954 };
955     \end{lstlisting}
956   \end{minipage} 
957   \normalsize 
958   \caption{La struttura \var{ipc\_perm}, come definita in \file{sys/ipc.h}.} 
959   \label{fig:ipc_ipc_perm}
960 \end{figure}
961
962 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
963 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
964 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
965 sono \textsl{parenti} la soluzione è relativamente semplice, in tal caso
966 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
967 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
968 disponibile in tutti i figli, e potrà essere passato come parametro attraverso
969 una \func{exec}.
970
971 Però quando i processi non sono \textsl{parenti} (come capita tutte le volte
972 che si ha a che fare con un sistema client-server) tutto questo non è
973 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
974 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
975 alternativa più efficace è quella che i programmi usino un valore comune per
976 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
977 sempre il rischio che questa chiave possa essere stata già utilizzata da
978 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
979 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione,
980 \func{ftok}, che permette di ottenere una chiave specificando il nome di un
981 file ed un numero di versione; il suo prototipo è:
982 \begin{functions}
983   \headdecl{sys/types.h} 
984   \headdecl{sys/ipc.h} 
985   
986   \funcdecl{key\_t ftok(const char *pathname, int proj\_id)}
987   
988   Restituisce una chiave per identificare un oggetto del \textit{SysV IPC}.
989   
990   \bodydesc{La funzione restituisce la chiave in caso di successo e -1
991     altrimenti, nel qual caso \var{errno} sarà uno dei possibili codici di
992     errore di \func{stat}.}
993 \end{functions}
994
995 La funzione determina un valore della chiave sulla base di \param{pathname},
996 che deve specificare il pathname di un file effettivamente esistente e di un
997 numero di progetto \param{proj\_id)}, che di norma viene specificato come
998 carattere, dato che ne vengono utilizzati solo gli 8 bit meno
999 significativi.\footnote{nelle libc4 e libc5, come avviene in SunOS,
1000   l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, le \acr{glibc}
1001   usano il prototipo specificato da XPG4, ma vengono lo stesso utilizzati gli
1002   8 bit meno significativi.}
1003
1004 Il problema è che anche così non c'è la sicurezza che il valore della chiave
1005 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
1006 con i 16 bit meno significativi dell'inode\index{inode} del file
1007 \param{pathname} (che vengono ottenuti attraverso \func{stat}, da cui derivano
1008 i possibili errori), e gli 8 bit meno significativi del numero del dispositivo
1009 su cui è il file.  Diventa perciò relativamente facile ottenere delle
1010 collisioni, specie se i file sono su dispositivi con lo stesso \textit{minor
1011   number}, come \file{/dev/hda1} e \file{/dev/sda1}.
1012
1013 In genere quello che si fa è utilizzare un file comune usato dai programmi che
1014 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
1015 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
1016 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
1017 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
1018 bene in fase di creazione, le cose possono complicarsi per i programmi che
1019 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
1020 attributi di \var{ipc\_perm}, non esiste una modalità semplice per essere
1021 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
1022 creato da chi ci si aspetta.
1023
1024 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
1025 contatore di riferimenti per la cancellazione automatica, il principale
1026 problema del \textit{SysV IPC}. Non esiste infatti una modalità chiara per
1027 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
1028 file, e tutta l'interfaccia è inutilmente complessa.  Per questo ne è stata
1029 effettuata una revisione completa nello standard POSIX.1b, che tratteremo in
1030 \secref{sec:ipc_posix}.
1031
1032
1033 \subsection{Il controllo di accesso}
1034 \label{sec:ipc_sysv_access_control}
1035
1036 Oltre alle chiavi, abbiamo visto che ad ogni oggetto sono associate in
1037 \var{ipc\_perm} ulteriori informazioni, come gli identificatori del creatore
1038 (nei campi \var{cuid} e \var{cgid}) e del proprietario (nei campi \var{uid} e
1039 \var{gid}) dello stesso, e un insieme di permessi (nel campo \var{mode}). In
1040 questo modo è possibile definire un controllo di accesso sugli oggetti di IPC,
1041 simile a quello che si ha per i file (vedi \secref{sec:file_perm_overview}).
1042
1043 Benché questo controllo di accesso sia molto simile a quello dei file, restano
1044 delle importanti differenze. La prima è che il permesso di esecuzione non
1045 esiste (e se specificato viene ignorato), per cui si può parlare solo di
1046 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
1047 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
1048 ed hanno lo stesso significato di quelli riportati in
1049 \secref{tab:file_mode_flags}\footnote{se però si vogliono usare le costanti
1050   simboliche ivi definite occorrerà includere il file \file{sys/stat.h},
1051   alcuni sistemi definiscono le costanti \const{MSG\_R} (\texttt{0400}) e
1052   \const{MSG\_W} (\texttt{0200}) per indicare i permessi base di lettura e
1053   scrittura per il proprietario, da utilizzare, con gli opportuni shift, pure
1054   per il gruppo e gli altri, in Linux, visto la loro scarsa utilità, queste
1055   costanti non sono definite.} e come per i file definiscono gli accessi per
1056 il proprietario, il suo gruppo e tutti gli altri.
1057
1058 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
1059 \var{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono settati
1060 rispettivamente al valore dell'userid e del groupid effettivo del processo che
1061 ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
1062 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
1063
1064 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
1065 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
1066 specificano tutte un argomento \param{flag}, in tal caso quando viene
1067 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
1068 permessi, questi vengono controllati e l'identificatore viene restituito solo
1069 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
1070 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
1071 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
1072 nullo, nel qual caso l'identificatore sarà restituito comunque.
1073
1074 Il secondo livello di controllo è quello delle varie funzioni che accedono
1075 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
1076 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
1077 \begin{itemize}
1078 \item se il processo ha i privilegi di amministratore l'accesso è sempre
1079   consentito. 
1080 \item se l'userid effettivo del processo corrisponde o al valore del campo
1081   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
1082   in \var{mode} è appropriato\footnote{per appropriato si intende che è
1083     settato il permesso di scrittura per le operazioni di scrittura e quello
1084     di lettura per le operazioni di lettura.} l'accesso è consentito.
1085 \item se il groupid effettivo del processo corrisponde o al
1086   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
1087   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
1088 \item se il permesso per gli altri è appropriato l'accesso è consentito.
1089 \end{itemize}
1090 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
1091 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
1092 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
1093 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
1094 il valore di \var{umask} (si ricordi quanto esposto in
1095 \secref{sec:file_umask}) non ha alcun significato.
1096
1097
1098 \subsection{Gli identificatori ed il loro utilizzo}
1099 \label{sec:ipc_sysv_id_use}
1100
1101 L'unico campo di \var{ipc\_perm} del quale non abbiamo ancora parlato è
1102 \var{seq}, che in \figref{fig:ipc_ipc_perm} è qualificato con un criptico
1103 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
1104 strettamente attinente alle modalità con cui il kernel assegna gli
1105 identificatori degli oggetti del sistema di IPC.
1106
1107 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
1108 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
1109 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
1110 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
1111 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
1112 dimensioni (inferiori al numero massimo di oggetti disponibili).
1113
1114 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1115 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1116 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1117 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1118 relativo identificatore viene immediatamente assegnato a quelle di un altro
1119 server partito subito dopo, con la possibilità che i client del primo non
1120 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1121 con gli oggetti del secondo, con conseguenze imprevedibili.
1122
1123 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1124 \var{req} per provvedere un meccanismo che porti gli identificatori ad
1125 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1126 un identificatore può venire riutilizzato.
1127
1128 Il sistema dispone sempre di un numero fisso di oggetti di IPC,\footnote{fino
1129   al kernel 2.2.x questi valori, definiti dalle costanti \const{MSGMNI},
1130   \const{SEMMNI} e \const{SHMMNI}, potevano essere cambiati (come tutti gli
1131   altri limiti relativi al \textit{SysV IPC}) solo con una ricompilazione del
1132   kernel, andando a modificarne la definizione nei relativi header file.  A
1133   partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1134   scrivendo sui file \file{shmmni}, \file{msgmni} e \file{sem} di
1135   \file{/proc/sys/kernel} o con l'uso di \texttt{syscntl}.} e per ciascuno di
1136 essi viene mantenuto in \var{seq} un numero di sequenza progressivo che viene
1137 incrementato di uno ogni volta che l'oggetto viene cancellato. Quando
1138 l'oggetto viene creato usando uno spazio che era già stato utilizzato in
1139 precedenza per restituire l'identificatore al numero di oggetti presenti viene
1140 sommato il valore di \var{seq} moltiplicato per il numero massimo di oggetti
1141 di quel tipo,\footnote{questo vale fino ai kernel della serie 2.2.x, dalla
1142   serie 2.4.x viene usato lo stesso fattore per tutti gli oggetti, esso è dato
1143   dalla costante \const{IPCMNI}, definita in \file{include/linux/ipc.h}, che
1144   indica il limite massimo per il numero di tutti oggetti di IPC, ed il cui
1145   valore è 32768.}  si evita così il riutilizzo degli stessi numeri, e si fa
1146 sì che l'identificatore assuma tutti i valori possibili.
1147
1148 \begin{figure}[!htb]
1149   \footnotesize \centering
1150   \begin{minipage}[c]{15cm}
1151     \begin{lstlisting}{}
1152 int main(int argc, char *argv[])
1153 {
1154     ...
1155     switch (type) {
1156     case 'q':   /* Message Queue */
1157         debug("Message Queue Try\n");
1158         for (i=0; i<n; i++) {
1159             id = msgget(IPC_PRIVATE, IPC_CREAT|0666);
1160             printf("Identifier Value %d \n", id);
1161             msgctl(id, IPC_RMID, NULL);
1162         }
1163         break;
1164     case 's':   /* Semaphore */
1165         debug("Semaphore\n");
1166         for (i=0; i<n; i++) {
1167             id = semget(IPC_PRIVATE, 1, IPC_CREAT|0666);
1168             printf("Identifier Value %d \n", id);
1169             semctl(id, 0, IPC_RMID);
1170         }
1171         break;
1172     case 'm':   /* Shared Memory */
1173         debug("Shared Memory\n");
1174         for (i=0; i<n; i++) {
1175             id = shmget(IPC_PRIVATE, 1000, IPC_CREAT|0666);
1176             printf("Identifier Value %d \n", id);
1177             shmctl(id, IPC_RMID, NULL);
1178         }
1179         break;
1180     default:    /* should not reached */
1181         return -1;
1182     }
1183     return 0;
1184 }
1185     \end{lstlisting}
1186   \end{minipage} 
1187   \normalsize 
1188   \caption{Sezione principale del programma di test per l'assegnazione degli
1189     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1190   \label{fig:ipc_sysv_idtest}
1191 \end{figure}
1192
1193 In \figref{fig:ipc_sysv_idtest} è riportato il codice di un semplice programma
1194 di test che si limita a creare un oggetto (specificato a riga di comando),
1195 stamparne il numero di identificatore e cancellarlo per un numero specificato
1196 di volte. Al solito non si è riportato il codice della gestione delle opzioni
1197 a riga di comando, che permette di specificare quante volte effettuare il
1198 ciclo \var{n}, e su quale tipo di oggetto eseguirlo.
1199
1200 La figura non riporta il codice di selezione delle opzioni, che permette di
1201 inizializzare i valori delle variabili \var{type} al tipo di oggetto voluto, e
1202 \var{n} al numero di volte che si vuole effettuare il ciclo di creazione,
1203 stampa, cancellazione. I valori di default sono per l'uso delle code di
1204 messaggi e un ciclo di 5 volte. Se si lancia il comando si otterrà qualcosa
1205 del tipo:
1206 \begin{verbatim}
1207 piccardi@gont sources]$ ./ipctestid
1208 Identifier Value 0 
1209 Identifier Value 32768 
1210 Identifier Value 65536 
1211 Identifier Value 98304 
1212 Identifier Value 131072 
1213 \end{verbatim}%$
1214 il che ci mostra che abbiamo un kernel della serie 2.4.x nel quale non avevamo
1215 ancora usato nessuna coda di messaggi. Se ripetiamo il comando otterremo
1216 ancora:
1217 \begin{verbatim}
1218 [piccardi@gont sources]$ ./ipctestid
1219 Identifier Value 163840 
1220 Identifier Value 196608 
1221 Identifier Value 229376 
1222 Identifier Value 262144 
1223 Identifier Value 294912 
1224 \end{verbatim}%$
1225 che ci mostra come il valore di \var{seq} sia in effetti una quantità
1226 mantenuta staticamente all'interno del sistema.
1227
1228
1229 \subsection{Code di messaggi}
1230 \label{sec:ipc_sysv_mq}
1231
1232 Il primo oggetto introdotto dal \textit{SysV IPC} è quello delle code di
1233 messaggi.  Le code di messaggi sono oggetti analoghi alle pipe o alle fifo,
1234 anche se la loro struttura è diversa. La funzione che permette di ottenerne
1235 una è \func{msgget} ed il suo prototipo è:
1236 \begin{functions}
1237   \headdecl{sys/types.h} 
1238   \headdecl{sys/ipc.h} 
1239   \headdecl{sys/msg.h} 
1240   
1241   \funcdecl{int msgget(key\_t key, int flag)}
1242   
1243   Restituisce l'identificatore di una coda di messaggi.
1244   
1245   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1246     in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1247   \begin{errlist}
1248   \item[\errcode{EACCES}] Il processo chiamante non ha i privilegi per accedere
1249   alla coda richiesta.  
1250   \item[\errcode{EEXIST}] Si è richiesta la creazione di una coda che già
1251   esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}. 
1252   \item[\errcode{EIDRM}] La coda richiesta è marcata per essere cancellata.
1253   \item[\errcode{ENOENT}] Si è cercato di ottenere l'identificatore di una coda
1254     di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1255     non era specificato.
1256   \item[\errcode{ENOSPC}] Si è cercato di creare una coda di messaggi quando è
1257     stato superato il limite massimo di code (\const{MSGMNI}).
1258   \end{errlist}
1259   ed inoltre \errval{ENOMEM}.
1260 }
1261 \end{functions}
1262
1263 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1264 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1265 nuova. L'argomento \param{key} specifica la chiave che è associata
1266 all'oggetto, eccetto il caso in cui si specifichi il valore
1267 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1268 associata alcuna chiave, il processo (ed i suoi eventuali figli) potranno
1269 farvi riferimento solo attraverso l'identificatore.
1270
1271 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE}\footnote{in
1272   Linux questo significa un valore diverso da zero.} l'effetto della funzione
1273 dipende dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1274 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1275 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1276 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1277 validi.
1278
1279 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1280 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1281 corrispondente al valore \const{IPC\_CREAT}. In questo caso i nove bit meno
1282 significativi di \param{flag} saranno usati come permessi per il nuovo
1283 oggetto, secondo quanto illustrato in \secref{sec:ipc_sysv_access_control}.
1284 Se si imposta anche il bit corrispondente a \const{IPC\_EXCL} la funzione avrà
1285 successo solo se l'oggetto non esiste già, fallendo con un errore di
1286 \errcode{EEXIST} altrimenti.
1287
1288 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1289 processi di accedere alla coda (se hanno privilegi sufficienti) una volta che
1290 questi possano indovinare o ricavare (ad esempio per tentativi)
1291 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1292 IPC infatti non esiste una maniera che  garantisca l'accesso esclusivo ad una
1293 coda di messaggi.  Usare \const{IPC\_PRIVATE} o const{IPC\_CREAT} e
1294 \const{IPC\_EXCL} per \param{flag} comporta solo la creazione di una nuova
1295 coda.
1296
1297 \begin{table}[htb]
1298   \footnotesize
1299   \centering
1300   \begin{tabular}[c]{|c|r|l|l|}
1301     \hline
1302     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
1303     & \textbf{Significato} \\
1304     \hline
1305     \hline
1306     \const{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1307                                           messaggi. \\
1308     \const{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1309                                           messaggio.\\
1310     \const{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di 
1311                                           una coda.\\
1312     \hline
1313   \end{tabular}
1314   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1315   \label{tab:ipc_msg_limits}
1316 \end{table}
1317
1318 Le code di messaggi sono caratterizzate da tre limiti fondamentali, definiti
1319 negli header e corrispondenti alle prime tre costanti riportate in
1320 \tabref{tab:ipc_msg_limits}, come accennato però in Linux è possibile
1321 modificare questi limiti attraverso l'uso di \func{syscntl} o scrivendo nei
1322 file \file{msgmax}, \file{msgmnb} e \file{msgmni} di \file{/proc/sys/kernel/}.
1323
1324
1325 \begin{figure}[htb]
1326   \centering \includegraphics[width=15cm]{img/mqstruct}
1327   \caption{Schema della struttura di una coda messaggi.}
1328   \label{fig:ipc_mq_schema}
1329 \end{figure}
1330
1331
1332 Una coda di messaggi è costituita da una \textit{linked list};\footnote{una
1333   \textit{linked list} è una tipica struttura di dati, organizzati in una
1334   lista in cui ciascun elemento contiene un puntatore al successivo. In questo
1335   modo la struttura è veloce nell'estrazione ed immissione dei dati dalle
1336   estremità dalla lista (basta aggiungere un elemento in testa o in coda ed
1337   aggiornare un puntatore), e relativamente veloce da attraversare in ordine
1338   sequenziale (seguendo i puntatori), è invece relativamente lenta
1339   nell'accesso casuale e nella ricerca.}  i nuovi messaggi vengono inseriti in
1340 coda alla lista e vengono letti dalla cima, in \figref{fig:ipc_mq_schema} si è
1341 riportato lo schema con cui queste strutture vengono mantenute dal
1342 kernel.\footnote{lo schema illustrato in \figref{fig:ipc_mq_schema} è in
1343   realtà una semplificazione di quello usato effettivamente fino ai kernel
1344   della serie 2.2.x, nei kernel della serie 2.4.x la gestione delle code di
1345   messaggi è stata modificata ed è effettuata in maniera diversa; abbiamo
1346   mantenuto lo schema precedente in quanto illustra comunque in maniera più
1347   che adeguata i principi di funzionamento delle code di messaggi.}
1348
1349 \begin{figure}[!htb]
1350   \footnotesize \centering
1351   \begin{minipage}[c]{15cm}
1352     \begin{lstlisting}[labelstep=0]{}
1353 struct msqid_ds {
1354     struct ipc_perm msg_perm;     /* structure for operation permission */
1355     time_t msg_stime;             /* time of last msgsnd command */
1356     time_t msg_rtime;             /* time of last msgrcv command */
1357     time_t msg_ctime;             /* time of last change */
1358     msgqnum_t msg_qnum;           /* number of messages currently on queue */
1359     msglen_t msg_qbytes;          /* max number of bytes allowed on queue */
1360     pid_t msg_lspid;              /* pid of last msgsnd() */
1361     pid_t msg_lrpid;              /* pid of last msgrcv() */
1362     struct msg *msg_first;        /* first message on queue, unused  */
1363     struct msg *msg_last;         /* last message in queue, unused */
1364     unsigned long int msg_cbytes; /* current number of bytes on queue */
1365 };
1366     \end{lstlisting}
1367   \end{minipage} 
1368   \normalsize 
1369   \caption{La struttura \var{msgid\_ds}, associata a ciascuna coda di
1370     messaggi.}
1371   \label{fig:ipc_msgid_ds}
1372 \end{figure}
1373
1374 A ciascuna coda è associata una struttura \var{msgid\_ds}, la cui definizione,
1375 è riportata in \secref{fig:ipc_msgid_ds}. In questa struttura il kernel
1376 mantiene le principali informazioni riguardo lo stato corrente della
1377 coda.\footnote{come accennato questo vale fino ai kernel della serie 2.2.x,
1378   essa viene usata nei kernel della serie 2.4.x solo per compatibilità in
1379   quanto è quella restituita dalle funzioni dell'interfaccia.  Si noti come ci
1380   sia una differenza con i campi mostrati nello schema di
1381   \figref{fig:ipc_mq_schema} che sono presi dalla definizione di
1382   \file{linux/msg.h}, e fanno riferimento alla definizione della omonima
1383   struttura usata nel kernel.} In \figref{fig:ipc_msgid_ds} sono elencati i
1384 campi significativi definiti in \file{sys/msg.h}, a cui si sono aggiunti gli
1385 ultimi tre campi che sono previsti dalla implementazione originale di System
1386 V, ma non dallo standard Unix98.
1387
1388 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1389 inizializzata, in particolare il campo \var{msg\_perm} viene inizializzato
1390 come illustrato in \secref{sec:ipc_sysv_access_control}, per quanto riguarda
1391 gli altri campi invece:
1392 \begin{itemize}
1393 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1394   sulla coda, viene inizializzato a 0.
1395 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1396   rispettivamente il \acr{pid} dell'ultimo processo che ha inviato o ricevuto
1397   un messaggio sulla coda, sono inizializzati a 0.
1398 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1399   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1400   messaggio sulla coda, sono inizializzati a 0.
1401 \item il campo \var{msg\_ctime}, che esprime il tempo di creazione della coda,
1402   viene inizializzato al tempo corrente.
1403 \item il campo \var{msg\_qbytes} che esprime la dimensione massima del
1404   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1405   del sistema (\const{MSGMNB}).
1406 \item i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1407   primo e ultimo messaggio sono inizializzati a \val{NULL} e
1408   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1409   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1410   e non devono essere utilizzati da programmi in user space).
1411 \end{itemize}
1412
1413 Una volta creata una coda di messaggi le operazioni di controllo vengono
1414 effettuate con la funzione \func{msgctl}, che (come le analoghe \func{semctl}
1415 e \func{shmctl}) fa le veci di quello che \func{ioctl} è per i file; il suo
1416 prototipo è:
1417 \begin{functions}
1418   \headdecl{sys/types.h} 
1419   \headdecl{sys/ipc.h} 
1420   \headdecl{sys/msg.h} 
1421   
1422   \funcdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1423   
1424   Esegue l'operazione specificata da \param{cmd} sulla coda \param{msqid}.
1425   
1426   \bodydesc{La funzione restituisce 0 in caso di successo o -1 in caso di
1427     errore, nel qual caso \var{errno} assumerà uno dei valori:
1428   \begin{errlist}
1429   \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma processo
1430     chiamante non ha i privilegi di lettura sulla coda.
1431   \item[\errcode{EIDRM}] La coda richiesta è stata cancellata.
1432   \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1433     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1434     \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1435     amministratore.
1436   \end{errlist}
1437   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1438 }
1439 \end{functions}
1440
1441 La funzione permette di accedere ai valori della struttura \var{msqid\_ds},
1442 mantenuta all'indirizzo \param{buf}, per la coda specificata
1443 dall'identificatore \param{msqid}. Il comportamento della funzione dipende dal
1444 valore dell'argomento \param{cmd}, che specifica il tipo di azione da
1445 eseguire; i valori possibili sono:
1446 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1447 \item[\const{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1448   struttura indicata da \param{buf}. Occorre avere il permesso di lettura
1449   sulla coda.
1450 \item[\const{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1451   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1452   riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1453   funzioni di di lettura o di scrittura sulla coda saranno svegliati ricevendo
1454   il medesimo errore. Questo comando può essere eseguito solo da un processo
1455   con userid effettivo corrispondente al creatore o al proprietario della
1456   coda, o all'amministratore.
1457 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1458   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1459   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1460   struttura \var{msqid\_ds} puntata da \param{buf}.  Per modificare i valori
1461   di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid} occorre
1462   essere il proprietario o il creatore della coda, oppure l'amministratore; lo
1463   stesso vale per \var{msg\_qbytes}, ma l'amministratore ha la facoltà di
1464   incrementarne il valore a limiti superiori a \const{MSGMNB}.
1465 \end{basedescript}
1466
1467
1468 Una volta che si abbia a disposizione l'identificatore, per inviare un
1469 messaggio su una coda si utilizza la funzione \func{msgsnd}; il suo prototipo
1470 è:
1471 \begin{functions}
1472   \headdecl{sys/types.h} 
1473   \headdecl{sys/ipc.h} 
1474   \headdecl{sys/msg.h} 
1475   
1476   \funcdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int
1477     msgflg)} 
1478
1479   Invia un messaggio sulla coda \param{msqid}.
1480   
1481   \bodydesc{La funzione restituisce 0, e -1 in caso di errore, nel qual caso
1482     \var{errno} assumerà uno dei valori:
1483   \begin{errlist}
1484   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1485   \item[\errcode{EIDRM}] La coda è stata cancellata.
1486   \item[\errcode{EAGAIN}] Il messaggio non può essere inviato perché si è
1487   superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1488   sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1489   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
1490   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido, o un
1491     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1492     maggiore di \const{MSGMAX}.
1493   \end{errlist}
1494   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}.
1495 }
1496 \end{functions}
1497
1498 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1499 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1500 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1501 puntatore ad una struttura \var{msgbuf} analoga a quella riportata in
1502 \figref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1503 messaggio.  La dimensione massima per il testo di un messaggio non può
1504 comunque superare il limite \const{MSGMAX}.
1505
1506 La struttura di \figref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1507 la definizione contenuta in \file{sys/msg.h} usa esplicitamente per il secondo
1508 campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini pratici.
1509 La sola cosa che conta è che la struttura abbia come primo membro un campo
1510 \var{mtype} come nell'esempio; esso infatti serve ad identificare il tipo di
1511 messaggio e deve essere sempre specificato come intero positivo di tipo
1512 \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1513 dimensione, e serve a contenere il testo del messaggio.
1514
1515 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1516 ridefinire una struttura simile a quella di \figref{fig:ipc_msbuf}, adattando
1517 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1518 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1519 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1520 indica il tipo.
1521
1522 Si tenga presente che la lunghezza che deve essere indicata in questo
1523 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1524 cioè \var{message} è una propria struttura che si passa alla funzione,
1525 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1526 consideriamo il caso dell'esempio in \figref{fig:ipc_msbuf}, \param{msgsz}
1527 dovrà essere pari a \const{LENGTH}).
1528
1529 \begin{figure}[!htb]
1530   \footnotesize \centering
1531   \begin{minipage}[c]{15cm}
1532     \begin{lstlisting}[labelstep=0]{}
1533     struct msgbuf {
1534          long mtype;          /* message type, must be > 0 */
1535          char mtext[LENGTH];  /* message data */
1536     };
1537     \end{lstlisting}
1538   \end{minipage} 
1539   \normalsize 
1540   \caption{Schema della struttura \var{msgbuf}, da utilizzare come argomento
1541     per inviare/ricevere messaggi.}
1542   \label{fig:ipc_msbuf}
1543 \end{figure}
1544
1545 Per capire meglio il funzionamento della funzione riprendiamo in
1546 considerazione la struttura della coda illustrata in
1547 \figref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1548 sarà aggiunto in fondo alla lista inserendo una nuova struttura \var{msg}, il
1549 puntatore \var{msg\_last} di \var{msqid\_ds} verrà aggiornato, come pure il
1550 puntatore al messaggio successivo per quello che era il precedente ultimo
1551 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1552 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1553 all'indirizzo specificato da \var{msg\_spot}.
1554
1555 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1556 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1557 ritorna immediatamente a meno che si sia ecceduto il valore di
1558 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1559 caso si blocca mandando il processo in stato di \textit{sleep}.  Se si
1560 specifica per \param{flag} il valore \const{IPC\_NOWAIT} la funzione opera in
1561 modalità non bloccante, ed in questi casi ritorna immediatamente con un errore
1562 di \errcode{EAGAIN}.
1563
1564 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1565 che non si liberano risorse sufficienti per poter inserire nella coda il
1566 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare, con
1567 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1568 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1569 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1570
1571 Una volta completato con successo l'invio del messaggio sulla coda, la
1572 funzione aggiorna i dati mantenuti in \var{msqid\_ds}, in particolare vengono
1573 modificati:
1574 \begin{itemize*}
1575 \item Il valore di \var{msg\_lspid}, che viene impostato al \acr{pid} del
1576   processo chiamante.
1577 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1578 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1579 \end{itemize*}
1580
1581 La funzione che viene utilizzata per estrarre un messaggio da una coda è
1582 \func{msgrcv}; il suo prototipo è:
1583 \begin{functions}
1584   \headdecl{sys/types.h} 
1585   \headdecl{sys/ipc.h} 
1586   \headdecl{sys/msg.h} 
1587
1588   \funcdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1589     long msgtyp, int msgflg)}
1590   
1591   Legge un messaggio dalla coda \param{msqid}.
1592   
1593   \bodydesc{La funzione restituisce il numero di byte letti in caso di
1594     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà uno
1595     dei valori:
1596   \begin{errlist}
1597   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1598   \item[\errcode{EIDRM}] La coda è stata cancellata.
1599   \item[\errcode{E2BIG}] Il testo del messaggio è più lungo di \param{msgsz} e
1600     non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1601   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale mentre
1602     era in attesa di ricevere un messaggio.
1603   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido o un
1604     valore di \param{msgsz} negativo.
1605   \end{errlist}
1606   ed inoltre \errval{EFAULT}.
1607 }
1608 \end{functions}
1609
1610 La funzione legge un messaggio dalla coda specificata, scrivendolo sulla
1611 struttura puntata da \param{msgp}, che dovrà avere un formato analogo a quello
1612 di \figref{fig:ipc_msbuf}.  Una volta estratto, il messaggio sarà rimosso dalla
1613 coda.  L'argomento \param{msgsz} indica la lunghezza massima del testo del
1614 messaggio (equivalente al valore del parametro \const{LENGTH} nell'esempio di
1615 \figref{fig:ipc_msbuf}).
1616
1617 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1618 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1619 \const{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1620 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1621 un errore di \errcode{E2BIG}.
1622
1623 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1624 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1625 una scansione della struttura mostrata in \figref{fig:ipc_mq_schema},
1626 restituendo il primo messaggio incontrato che corrisponde ai criteri
1627 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1628 coda, è quello meno recente); in particolare:
1629 \begin{itemize*}
1630 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1631   quello fra i presenti che è stato inserito inserito per primo. 
1632 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1633   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1634   \param{msgtyp}.
1635 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1636   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1637   inferiore al valore assoluto di \param{msgtyp}.
1638 \end{itemize*}
1639
1640 Il valore di \param{msgflg} permette di controllare il comportamento della
1641 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1642 valori.  Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1643 valori: \const{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1644 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1645 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1646 ci sono messaggi sulla coda.
1647
1648 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1649 disponibili per la lettura, è di bloccare il processo in stato di
1650 \textit{sleep}. Nel caso però si sia specificato \const{IPC\_NOWAIT} la
1651 funzione ritorna immediatamente con un errore \errcode{ENOMSG}. Altrimenti la
1652 funzione ritorna normalmente non appena viene inserito un messaggio del tipo
1653 desiderato, oppure ritorna con errore qualora la coda sia rimossa (con
1654 \var{errno} impostata a \errcode{EIDRM}) o se il processo viene interrotto da
1655 un segnale (con \var{errno} impostata a \errcode{EINTR}).
1656
1657 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1658 funzione aggiorna i dati mantenuti in \var{msqid\_ds}, in particolare vengono
1659 modificati:
1660 \begin{itemize*}
1661 \item Il valore di \var{msg\_lrpid}, che viene impostato al \acr{pid} del
1662   processo chiamante.
1663 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1664 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1665 \end{itemize*}
1666
1667 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1668 SysV IPC; essendo questi permanenti restano nel sistema occupando risorse
1669 anche quando un processo è terminato, al contrario delle pipe per le quali
1670 tutte le risorse occupate vengono rilasciate quanto l'ultimo processo che le
1671 utilizzava termina. Questo comporta che in caso di errori si può saturare il
1672 sistema, e che devono comunque essere esplicitamente previste delle funzioni
1673 di rimozione in caso di interruzioni o uscite dal programma (come vedremo in
1674 \figref{fig:ipc_mq_fortune_server}).
1675
1676 L'altro problema è non facendo uso di file descriptor le tecniche di
1677 \textit{I/O multiplexing} descritte in \secref{sec:file_multiplexing} non
1678 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1679 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1680 una di queste strutture alla volta; ad esempio non si può scrivere un server
1681 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1682 di \textit{polling}\index{polling} che esegua un ciclo di attesa su ciascuna
1683 di esse.
1684
1685 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1686 server di \textit{fortunes} usando queste al posto delle fifo. In questo caso
1687 useremo una sola coda di messaggi, usando il tipo di messaggio per comunicare
1688 in maniera indipendente con client diversi.
1689
1690 \begin{figure}[!bht]
1691   \footnotesize \centering
1692   \begin{minipage}[c]{15cm}
1693     \begin{lstlisting}{}
1694 int msgid;                                       /* Message queue identifier */
1695 int main(int argc, char *argv[])
1696 {
1697 /* Variables definition */
1698     int i, n = 0;
1699     char **fortune;                       /* array of fortune message string */
1700     char *fortunefilename;                              /* fortune file name */
1701     struct msgbuf_read {      /* message struct to read request from clients */
1702         long mtype;                               /* message type, must be 1 */
1703         long pid;             /* message data, must be the pid of the client */
1704     } msg_read;
1705     struct msgbuf_write {       /* message struct to write result to clients */
1706         long mtype;            /* message type, will be the pid of the client*/
1707         char mtext[MSGMAX];             /* message data, will be the fortune */
1708     } msg_write;
1709     key_t key;                                          /* Message queue key */
1710     int size;                                                /* message size */
1711     ...
1712     Signal(SIGTERM, HandSIGTERM);            /* set handlers for termination */
1713     Signal(SIGINT, HandSIGTERM);
1714     Signal(SIGQUIT, HandSIGTERM);
1715     if (n==0) usage();          /* if no pool depth exit printing usage info */
1716     i = FortuneParse(fortunefilename, fortune, n);          /* parse phrases */
1717     /* Create the queue */
1718     key = ftok("./MQFortuneServer.c", 1); 
1719     msgid = msgget(key, IPC_CREAT|0666);
1720     if (msgid < 0) {
1721         perror("Cannot create message queue");
1722         exit(1);
1723     }
1724     /* Main body: loop over requests */
1725     while (1) {
1726         msgrcv(msgid, &msg_read, sizeof(int), 1, MSG_NOERROR);
1727         n = random() % i;                             /* select random value */
1728         strncpy(msg_write.mtext, fortune[n], MSGMAX);
1729         size = min(strlen(fortune[n])+1, MSGMAX);  
1730         msg_write.mtype=msg_read.pid;             /* use request pid as type */
1731         msgsnd(msgid, &msg_write, size, 0);
1732     }
1733 }
1734 /*
1735  * Signal Handler to manage termination
1736  */
1737 void HandSIGTERM(int signo) {
1738     msgctl(msgid, IPC_RMID, NULL);                   /* remove message queue */
1739     exit(0);
1740 }
1741     \end{lstlisting}
1742   \end{minipage} 
1743   \normalsize 
1744   \caption{Sezione principale del codice del server di \textit{fortunes}
1745     basato sulle \textit{message queue}.}
1746   \label{fig:ipc_mq_fortune_server}
1747 \end{figure}
1748
1749 In \figref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1750 principali del codice del nuovo server (il codice completo è nel file
1751 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1752 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1753 per permettere una comunicazione indipendente fra il server ed i vari client,
1754 usando il \acr{pid} di questi ultimi come identificativo. Questo è possibile
1755 in quanto, al contrario di una fifo, la lettura di una coda di messaggi può
1756 non essere sequenziale, proprio grazie alla classificazione dei messaggi sulla
1757 base del loro tipo.
1758
1759 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1760 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1761 definisce due strutture appositamente per la comunicazione; con
1762 \var{msgbuf\_read} (\texttt{\small 8--11}) vengono passate le richieste mentre
1763 con \var{msgbuf\_write} (\texttt{\small 12--15}) vengono restituite le frasi.
1764
1765 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1766 in \var{n} il numero di frasi da leggere specificato a linea di comando ed in
1767 \var{fortunefilename} il file da cui leggerle; dopo aver installato
1768 (\texttt{\small 19--21}) dei manipolatori per gestire l'uscita dal server,
1769 viene prima controllato (\texttt{\small 22}) il numero di frasi richieste
1770 abbia senso (cioè sia maggiore di zero), le quali poi (\texttt{\small 23})
1771 vengono lette nel vettore in memoria con la stessa funzione
1772 \code{FortuneParse()} usata anche per il server basato sulle fifo.
1773
1774 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1775 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1776 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1777 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1778 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1779 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1780 programma (\texttt{\small 27--29}) in caso di errore.
1781
1782 Finita la fase di inizializzazione il server esegue in permanenza il ciclo
1783 principale (\texttt{\small 32--41}). Questo inizia (\texttt{\small 33}) con il
1784 porsi in attesa di un messaggio di richiesta da parte di un client; si noti
1785 infatti come \func{msgrcv} richieda un messaggio con \var{mtype} uguale a 1:
1786 questo è il valore usato per le richieste dato che corrisponde al \acr{pid} di
1787 \cmd{init}, che non può essere un client. L'uso del flag \const{MSG\_NOERROR}
1788 è solo per sicurezza, dato che i messaggi di richiesta sono di dimensione
1789 fissa (e contengono solo il \acr{pid} del client).
1790
1791 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1792 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1793 di richiesta da parte di un client, in tal caso il ciclo prosegue
1794 (\texttt{\small 34}) selezionando una frase a caso, copiandola (\texttt{\small
1795   35}) nella struttura \var{msgbuf\_write} usata per la risposta e
1796 calcolandone (\texttt{\small 36}) la dimensione.
1797
1798 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1799 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 37})
1800 al valore del \acr{pid} del client ricevuto nel messaggio di richiesta.
1801 L'ultimo passo del ciclo (\texttt{\small 38}) è inviare sulla coda il
1802 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1803 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1804
1805 Si noti che il programma può terminare solo grazie ad una interruzione da
1806 parte di un segnale; in tal caso verrà eseguito il manipolatore
1807 \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1808 (\texttt{\small 44}) ed ad uscire (\texttt{\small 45}).
1809
1810 \begin{figure}[!bht]
1811   \footnotesize \centering
1812   \begin{minipage}[c]{15cm}
1813     \begin{lstlisting}{}
1814 int main(int argc, char *argv[])
1815 {
1816     ...
1817     key = ftok("./MQFortuneServer.c", 1); 
1818     msgid = msgget(key, 0); 
1819     if (msgid < 0) {
1820         perror("Cannot find message queue");
1821         exit(1);
1822     }
1823     /* Main body: do request and write result */
1824     msg_read.mtype = 1;                      /* type for request is always 1 */
1825     msg_read.pid = getpid();                   /* use pid for communications */
1826     size = sizeof(msg_read.pid);  
1827     msgsnd(msgid, &msg_read, size, 0);               /* send request message */
1828     msgrcv(msgid, &msg_write, MSGMAX, msg_read.pid, MSG_NOERROR);
1829     printf("%s", msg_write.mtext);
1830 }
1831     \end{lstlisting}
1832   \end{minipage} 
1833   \normalsize 
1834   \caption{Sezione principale del codice del client di \textit{fortunes}
1835     basato sulle \textit{message queue}.}
1836   \label{fig:ipc_mq_fortune_client}
1837 \end{figure}
1838
1839 In \figref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice del
1840 programma client.  Al solito il codice completo è con i sorgenti allegati, nel
1841 file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti relative
1842 alla gestione delle opzioni, ed in questo caso, anche la dichiarazione delle
1843 variabili, che, per la parte relative alle strutture usate per la
1844 comunicazione tramite le code, sono le stesse viste in
1845 \figref{fig:ipc_mq_fortune_server}.
1846
1847 Il client in questo caso è molto semplice; la prima parte del programma
1848 (\texttt{\small 4--9}) si occupa di accedere alla coda di messaggi, ed è
1849 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1850 non viene chiamata con il flag di creazione in quanto la coda deve essere
1851 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1852 il programma termina immediatamente. 
1853
1854 Una volta acquisito l'identificatore della coda il client compone il
1855 messaggio di richiesta (\texttt{\small 12--13}) in \var{msg\_read}, usando 1
1856 per il tipo ed inserendo il proprio \acr{pid} come dato da passare al server.
1857 Calcolata (\texttt{\small 14}) la dimensione, provvede (\texttt{\small 15}) ad
1858 immettere la richiesta sulla coda. 
1859
1860 A questo punto non resta che (\texttt{\small 16}) rileggere dalla coda la
1861 risposta del server richiedendo a \func{msgrcv} di selezionare i messaggi di
1862 tipo corrispondente al valore del \acr{pid} inviato nella richiesta. L'ultimo
1863 passo (\texttt{\small 17}) prima di uscire è quello di stampare a video il
1864 messaggio ricevuto.
1865  
1866 Benché funzionante questa architettura risente dello stesso inconveniente
1867 visto anche nel caso del precedente server basato sulle fifo; se il client
1868 viene interrotto dopo l'invio del messaggio di richiesta e prima della lettura
1869 della risposta, quest'ultima resta nella coda (così come per le fifo si aveva
1870 il problema delle fifo che restavano nel filesystem). In questo caso però il
1871 problemi sono maggiori, sia perché è molto più facile esaurire la memoria
1872 dedicata ad una coda di messaggi che gli inode\index{inode} di un filesystem,
1873 sia perché, con il riutilizzo dei \acr{pid} da parte dei processi, un client
1874 eseguito in un momento successivo potrebbe ricevere un messaggio non
1875 indirizzato a lui.
1876
1877
1878
1879 \subsection{Semafori}
1880 \label{sec:ipc_sysv_sem}
1881
1882 I semafori non sono meccanismi di intercomunicazione diretta come quelli
1883 (pipe, fifo e code di messaggi) visti finora, e non consentono di scambiare
1884 dati fra processi, ma servono piuttosto come meccanismi di sincronizzazione o
1885 di protezione per le \textsl{sezioni critiche}\index{sezioni critiche} del
1886 codice (si ricordi quanto detto in \secref{sec:proc_race_cond}). 
1887
1888 Un semaforo è uno speciale contatore, mantenuto nel kernel, che permette, a
1889 seconda del suo valore, di consentire o meno la prosecuzione dell'esecuzione
1890 di un programma. In questo modo l'accesso ad una risorsa condivisa da più
1891 processi può essere controllato, associando ad essa un semaforo che consente
1892 di assicurare che non più di un processo alla volta possa usarla.
1893
1894 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1895 assolutamente generico, così come del tutto generali sono modalità con cui lo
1896 si utilizza. Un processo che deve accedere ad una risorsa eseguirà un
1897 controllo del semaforo: se questo è positivo il suo valore sarà decrementato,
1898 indicando che si è consumato una unità della risorsa, ed il processo potrà
1899 proseguire nell'utilizzo di quest'ultima, provvedendo a rilasciarla, una volta
1900 completate le operazioni volute, reincrementando il semaforo.
1901
1902 Se al momento del controllo il valore del semaforo è nullo, siamo invece in
1903 una situazione in cui la risorsa non è disponibile, ed il processo si
1904 bloccherà in stato di \textit{sleep} fin quando chi la sta utilizzando non la
1905 rilascerà, incrementando il valore del semaforo. Non appena il semaforo torna
1906 positivo, indicando che la risorsa è disponibile, il processo sarà svegliato,
1907 e si potrà operare come nel caso precedente (decremento del semaforo, accesso
1908 alla risorsa, incremento del semaforo).
1909
1910 Per poter implementare questo tipo di logica le operazioni di controllo e
1911 decremento del contatore associato al semaforo devono essere atomiche,
1912 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1913 demandata al kernel. La forma più semplice di semaforo è quella del
1914 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1915 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1916 della risorsa; in generale però si possono usare semafori con valori interi,
1917 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1918 ancora disponibili.
1919
1920 Il sistema di comunicazione interprocesso di \textit{SysV IPC} prevede anche i
1921 semafori, ma gli oggetti utilizzati non sono semafori singoli, ma gruppi di
1922 semafori detti \textsl{insiemi} (o \textit{semaphore set}); la funzione che
1923 permette di creare o ottenere l'identificatore di un insieme di semafori è
1924 \func{semget}, ed il suo prototipo è:
1925 \begin{functions}
1926   \headdecl{sys/types.h} 
1927   \headdecl{sys/ipc.h} 
1928   \headdecl{sys/sem.h} 
1929   
1930   \funcdecl{int semget(key\_t key, int nsems, int flag)}
1931   
1932   Restituisce l'identificatore di un insieme di semafori.
1933   
1934   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1935     in caso di errore, nel qual caso \var{errno} assumerà i valori:
1936     \begin{errlist}
1937     \item[\errcode{ENOSPC}] Si è cercato di creare una insieme di semafori
1938       quando è stato superato o il limite per il numero totale di semafori
1939       (\const{SEMMNS}) o quello per il numero totale degli insiemi
1940       (\const{SEMMNI}) nel sistema.
1941     \item[\errcode{EINVAL}] L'argomento \param{nsems} è minore di zero o
1942       maggiore del limite sul numero di semafori per ciascun insieme
1943       (\const{SEMMSL}), o se l'insieme già esiste, maggiore del numero di
1944       semafori che contiene.
1945     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
1946       contenere le strutture per un nuovo insieme di semafori.
1947     \end{errlist}
1948     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
1949     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
1950 \end{functions}
1951
1952 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1953 restituisce l'identificatore di un insieme di semafori, in particolare è
1954 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1955 ripeteremo quanto detto al proposito in \secref{sec:ipc_sysv_mq}. L'argomento
1956 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1957 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1958 richiesta dell'identificatore di un insieme già esistente.
1959
1960 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1961 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1962 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1963 complicazione inutile, il problema è che i semafori del \textit{SysV IPC}
1964 soffrono di altri due, ben più gravi, difetti.
1965
1966 Il primo difetto è che non esiste una funzione che permetta di creare ed
1967 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1968 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1969 perde così ogni possibilità di eseguire l'operazione atomicamente.
1970
1971 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1972 \textit{SysV IPC} di essere risorse globali di sistema, che non vengono
1973 cancellate quando nessuno le usa più; ci si così a trova a dover affrontare
1974 esplicitamente il caso in cui un processo termina per un qualche errore,
1975 lasciando un semaforo occupato, che resterà tale fino al successivo riavvio
1976 del sistema. Come vedremo esistono delle modalità per evitare tutto ciò, ma
1977 diventa necessario indicare esplicitamente che si vuole il ripristino del
1978 semaforo all'uscita del processo.
1979
1980
1981 \begin{figure}[!htb]
1982   \footnotesize \centering
1983   \begin{minipage}[c]{15cm}
1984     \begin{lstlisting}[labelstep=0]{}
1985 struct semid_ds
1986 {
1987     struct ipc_perm sem_perm;           /* operation permission struct */
1988     time_t sem_otime;                   /* last semop() time */
1989     time_t sem_ctime;                   /* last time changed by semctl() */
1990     unsigned long int sem_nsems;        /* number of semaphores in set */
1991 };
1992     \end{lstlisting}
1993   \end{minipage} 
1994   \normalsize 
1995   \caption{La struttura \var{semid\_ds}, associata a ciascun insieme di
1996     semafori.}
1997   \label{fig:ipc_semid_ds}
1998 \end{figure}
1999
2000 A ciascun insieme di semafori è associata una struttura \var{semid\_ds},
2001 riportata in \figref{fig:ipc_semid_ds}.\footnote{non si sono riportati i campi
2002   ad uso interno del kernel, che vedremo in \figref{fig:ipc_sem_schema}, che
2003   dipendono dall'implementazione.} Come nel caso delle code di messaggi quando
2004 si crea un nuovo insieme di semafori con \func{semget} questa struttura viene
2005 inizializzata, in particolare il campo \var{sem\_perm} viene inizializzato
2006 come illustrato in \secref{sec:ipc_sysv_access_control} (si ricordi che in
2007 questo caso il permesso di scrittura è in realtà permesso di alterare il
2008 semaforo), per quanto riguarda gli altri campi invece:
2009 \begin{itemize*}
2010 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
2011   nell'insieme, viene inizializzato al valore di \param{nsems}.
2012 \item il campo \var{sem\_ctime}, che esprime il tempo di creazione
2013   dell'insieme, viene inizializzato al tempo corrente.
2014 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
2015   effettuata, viene inizializzato a zero.
2016 \end{itemize*}
2017
2018
2019 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
2020 \var{sem} che ne contiene i dati essenziali, la sua definizione\footnote{si è
2021   riportata la definizione originaria del kernel 1.0, che contiene la prima
2022   realizzazione del \textit{SysV IPC} in Linux. In realtà questa struttura
2023   ormai è ridotta ai soli due primi membri, e gli altri vengono calcolati
2024   dinamicamente. La si è utilizzata a scopo di esempio, perché indica tutti i
2025   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
2026   citati dalle pagine di manuale.} è riportata in \figref{fig:ipc_sem}. Questa
2027 struttura, non è accessibile in user space, ma i valori in essa specificati
2028 possono essere letti in maniera indiretta, attraverso l'uso delle funzioni di
2029 controllo.
2030
2031 \begin{figure}[!htb]
2032   \footnotesize \centering
2033   \begin{minipage}[c]{15cm}
2034     \begin{lstlisting}[labelstep=0]{}
2035 struct sem {
2036   short   sempid;         /* pid of last operation */
2037   ushort  semval;         /* current value */
2038   ushort  semncnt;        /* num procs awaiting increase in semval */
2039   ushort  semzcnt;        /* num procs awaiting semval = 0 */
2040 };
2041     \end{lstlisting}
2042   \end{minipage} 
2043   \normalsize 
2044   \caption{La struttura \var{sem}, che contiene i dati di un singolo semaforo.}
2045   \label{fig:ipc_sem}
2046 \end{figure}
2047
2048 I dati mantenuti nella struttura, ed elencati in \figref{fig:ipc_sem},
2049 indicano rispettivamente: 
2050 \begin{description*}
2051 \item[\var{semval}] il valore numerico del semaforo.
2052 \item[\var{sempid}] il \acr{pid} dell'ultimo processo che ha eseguito una
2053   operazione sul semaforo.
2054 \item[\var{semncnt}] il numero di processi in attesa che esso venga
2055   incrementato.
2056 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
2057 \end{description*}
2058
2059 \begin{table}[htb]
2060   \footnotesize
2061   \centering
2062   \begin{tabular}[c]{|c|r|p{8cm}|}
2063     \hline
2064     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
2065     \hline
2066     \hline
2067     \const{SEMMNI}&          128 & Numero massimo di insiemi di semafori. \\
2068     \const{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
2069     \const{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
2070                                    nel sistema .\\
2071     \const{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
2072     \const{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
2073                                    \func{semop}. \\
2074     \const{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
2075     \const{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
2076     \const{SEMAEM}&\const{SEMVMX}& valore massimo per l'aggiustamento
2077                                    all'uscita. \\
2078     \hline
2079   \end{tabular}
2080   \caption{Valori delle costanti associate ai limiti degli insiemi di
2081     semafori, definite in \file{linux/sem.h}.} 
2082   \label{tab:ipc_sem_limits}
2083 \end{table}
2084
2085 Come per le code di messaggi anche per gli insiemi di semafori esistono una
2086 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
2087 sono riportate in \tabref{tab:ipc_sem_limits}. Alcuni di questi limiti sono al
2088 solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
2089 direttamente nel file \file{/proc/sys/kernel/sem}.
2090
2091 La funzione che permette di effettuare le varie operazioni di controllo sui
2092 semafori (fra le quali, come accennato, è impropriamente compresa anche la
2093 loro inizializzazione) è \func{semctl}; il suo prototipo è:
2094 \begin{functions}
2095   \headdecl{sys/types.h} 
2096   \headdecl{sys/ipc.h} 
2097   \headdecl{sys/sem.h} 
2098   
2099   \funcdecl{int semctl(int semid, int semnum, int cmd)}
2100   \funcdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
2101   
2102   Esegue le operazioni di controllo su un semaforo o un insieme di semafori.
2103   
2104   \bodydesc{La funzione restituisce in caso di successo un valore positivo
2105     quanto usata con tre argomenti ed un valore nullo quando usata con
2106     quattro. In caso di errore restituisce -1, ed \var{errno} assumerà uno dei
2107     valori:
2108     \begin{errlist}
2109     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
2110       l'operazione richiesta.
2111     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
2112     \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
2113       ma il processo non ha privilegi sufficienti ad eseguire l'operazione.
2114     \item[\errcode{ERANGE}] Si è richiesto \const{SETALL} \const{SETVAL} ma il
2115       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
2116       di \const{SEMVMX}.
2117   \end{errlist}
2118   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2119 }
2120 \end{functions}
2121
2122 La funzione può avere tre o quattro parametri, a seconda dell'operazione
2123 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
2124 \param{semid} o sul singolo semaforo di un insieme, specificato da
2125 \param{semnum}. 
2126
2127 \begin{figure}[!htb]
2128   \footnotesize \centering
2129   \begin{minipage}[c]{15cm}
2130     \begin{lstlisting}[labelstep=0]{}
2131 union semun {
2132       int val;                  /* value for SETVAL */
2133       struct semid_ds *buf;     /* buffer for IPC_STAT, IPC_SET */
2134       unsigned short *array;    /* array for GETALL, SETALL */
2135                                 /* Linux specific part: */
2136       struct seminfo *__buf;    /* buffer for IPC_INFO */
2137 };
2138     \end{lstlisting}
2139   \end{minipage} 
2140   \normalsize 
2141   \caption{La definizione dei possibili valori di una \var{union semun}, usata
2142     come quarto argomento della funzione \func{semctl}.}
2143   \label{fig:ipc_semun}
2144 \end{figure}
2145
2146 Qualora la funzione operi con quattro argomenti \param{arg} è
2147 un argomento generico, che conterrà un dato diverso a seconda dell'azione
2148 richiesta; per unificare l'argomento esso deve essere passato come una
2149 \var{union semun}, la cui definizione, con i possibili valori che può
2150 assumere, è riportata in \figref{fig:ipc_semun}.
2151
2152 Come già accennato sia il comportamento della funzione che il numero di
2153 parametri con cui deve essere invocata, dipendono dal valore dell'argomento
2154 \param{cmd}, che specifica l'azione da intraprendere; i valori validi (che
2155 cioè non causano un errore di \errcode{EINVAL}) per questo argomento sono i
2156 seguenti:
2157 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2158 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiando il
2159   contenuto della relativa struttura \var{semid\_ds} all'indirizzo specificato
2160   con \var{arg.buf}. Occorre avere il permesso di lettura. L'argomento
2161   \param{semnum} viene ignorato.
2162 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
2163   dati, con effetto immediato. Tutti i processi che erano stato di
2164   \textit{sleep} vengono svegliati, ritornando con un errore di
2165   \errcode{EIDRM}.  L'userid effettivo del processo deve corrispondere o al
2166   creatore o al proprietario dell'insieme, o all'amministratore. L'argomento
2167   \param{semnum} viene ignorato.
2168 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2169   dell'insieme. I valori devono essere passati in una struttura
2170   \var{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto i
2171   campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
2172   significativi di \var{sem\_perm.mode}. L'userid effettivo del processo deve
2173   corrispondere o al creatore o al proprietario dell'insieme, o
2174   all'amministratore.  L'argomento \param{semnum} viene ignorato.
2175 \item[\const{GETALL}] Restituisce il valore corrente di ciascun semaforo
2176   dell'insieme (corrispondente al campo \var{semval} di \var{sem}) nel vettore
2177   indicato da \param{arg.array}. Occorre avere il permesso di lettura.
2178   L'argomento \param{semnum} viene ignorato.
2179 \item[\const{GETNCNT}] Restituisce come valore di ritorno della funzione il
2180   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
2181   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
2182   \var{sem}); va invocata con tre argomenti.  Occorre avere il permesso di
2183   lettura.
2184 \item[\const{GETPID}] Restituisce come valore di ritorno della funzione il
2185   \acr{pid} dell'ultimo processo che ha compiuto una operazione sul semaforo
2186   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
2187   \var{sempid} di \var{sem}); va invocata con tre argomenti.  Occorre avere il
2188   permesso di lettura.
2189 \item[\const{GETVAL}] Restituisce come valore di ritorno della funzione il il
2190   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
2191   (corrispondente al campo \var{semval} di \var{sem}); va invocata con tre
2192   argomenti.  Occorre avere il permesso di lettura.
2193 \item[\const{GETZCNT}] Restituisce come valore di ritorno della funzione il
2194   numero di processi in attesa che il valore del semaforo \param{semnum}
2195   dell'insieme \param{semid} diventi nullo (corrispondente al campo
2196   \var{semncnt} di \var{sem}); va invocata con tre argomenti.  Occorre avere
2197   il permesso di lettura.
2198 \item[\const{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
2199   aggiornando il campo \var{sem\_ctime} di \var{semid\_ds}. I valori devono
2200   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
2201   privilegi di scrittura sul semaforo.  L'argomento \param{semnum} viene
2202   ignorato.
2203 \item[\const{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
2204   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
2205   \var{semid\_ds}.  Si devono avere i privilegi di scrittura sul semaforo.
2206 \end{basedescript}
2207
2208 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2209 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2210 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2211 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2212 tutti i semafori il cui valore viene modificato.
2213
2214 \begin{table}[htb]
2215   \footnotesize
2216   \centering
2217   \begin{tabular}[c]{|c|l|}
2218     \hline
2219     \textbf{Operazione}  & \textbf{Valore restituito} \\
2220     \hline
2221     \hline
2222     \const{GETNCNT}& valore di \var{semncnt}.\\
2223     \const{GETPID} & valore di \var{sempid}.\\
2224     \const{GETVAL} & valore di \var{semval}.\\
2225     \const{GETZCNT}& valore di \var{semzcnt}.\\
2226     \hline
2227   \end{tabular}
2228   \caption{Valori di ritorno della funzione \func{semctl}.} 
2229   \label{tab:ipc_semctl_returns}
2230 \end{table}
2231
2232 Il valore di ritorno della funzione in caso di successo dipende
2233 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2234 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2235 \tabref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2236 corrispondente al campo della struttura \var{sem} indicato nella seconda
2237 colonna della tabella.
2238
2239 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2240 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2241 vengono effettuate con la funzione \func{semop}, il cui prototipo è:
2242 \begin{functions}
2243   \headdecl{sys/types.h} 
2244   \headdecl{sys/ipc.h} 
2245   \headdecl{sys/sem.h} 
2246   
2247   \funcdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2248   
2249   Esegue le operazioni ordinarie su un semaforo o un insieme di semafori.
2250   
2251   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2252     errore, nel qual caso \var{errno} assumerà uno dei valori:
2253     \begin{errlist}
2254     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
2255       l'operazione richiesta.
2256     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
2257     \item[\errcode{ENOMEM}] Si è richiesto un \const{SEM\_UNDO} ma il sistema
2258       non ha le risorse per allocare la struttura di ripristino.
2259     \item[\errcode{EAGAIN}] Un'operazione comporterebbe il blocco del processo,
2260       ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2261     \item[\errcode{EINTR}] La funzione, bloccata in attesa dell'esecuzione
2262       dell'operazione, viene interrotta da un segnale.
2263     \item[\errcode{E2BIG}] L'argomento \param{nsops} è maggiore del numero
2264       massimo di operazioni \const{SEMOPM}.
2265     \item[\errcode{ERANGE}] Per alcune operazioni il valore risultante del
2266       semaforo viene a superare il limite massimo \const{SEMVMX}.
2267   \end{errlist}
2268   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2269 }
2270 \end{functions}
2271
2272 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2273 un insieme. La funzione richiede come primo argomento l'identificatore
2274 \param{semid} dell'insieme su cui si vuole operare. Il numero di operazioni da
2275 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2276 contenuto viene passato con un puntatore ad un vettore di strutture
2277 \var{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2278 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante.
2279
2280 \begin{figure}[!htb]
2281   \footnotesize \centering
2282   \begin{minipage}[c]{15cm}
2283     \begin{lstlisting}[labelstep=0]{}
2284 struct sembuf
2285 {
2286   unsigned short int sem_num;   /* semaphore number */
2287   short int sem_op;             /* semaphore operation */
2288   short int sem_flg;            /* operation flag */
2289 };
2290     \end{lstlisting}
2291   \end{minipage} 
2292   \normalsize 
2293   \caption{La struttura \var{sembuf}, usata per le operazioni sui
2294     semafori.}
2295   \label{fig:ipc_sembuf}
2296 \end{figure}
2297
2298 Il contenuto di ciascuna operazione deve essere specificato attraverso una
2299 opportuna struttura \var{sembuf} (la cui definizione è riportata in
2300 \figref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2301 allocare in un opportuno vettore. La struttura permette di indicare il
2302 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2303 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2304 riferimento l'operazione; si ricordi che i semafori sono numerati come in un
2305 vettore, per cui il primo semaforo corrisponde ad un valore nullo di
2306 \var{sem\_num}.
2307
2308 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2309 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2310 \const{SEM\_UNDO}.  Impostando \const{IPC\_NOWAIT} si fa si che, invece di
2311 bloccarsi (in tutti quei casi in cui l'esecuzione di una operazione richiede
2312 che il processo vada in stato di \textit{sleep}), \func{semop} ritorni
2313 immediatamente con un errore di \errcode{EAGAIN}.  Impostando \const{SEM\_UNDO}
2314 si richiede invece che l'operazione venga registrata in modo che il valore del
2315 semaforo possa essere ripristinato all'uscita del processo.
2316
2317 Infine \var{sem\_op} è il campo che controlla l'operazione che viene eseguita
2318 e determina il comportamento della chiamata a \func{semop}; tre sono i casi
2319 possibili:
2320 \begin{basedescript}{\desclabelwidth{2.0cm}}
2321 \item[\var{sem\_op}$>0$] In questo caso il valore di \var{sem\_op} viene
2322   aggiunto al valore corrente di \var{semval}. La funzione ritorna
2323   immediatamente (con un errore di \errcode{ERANGE} qualora si sia superato il
2324   limite \const{SEMVMX}) ed il processo non viene bloccato in nessun caso.
2325   Specificando \const{SEM\_UNDO} si aggiorna il contatore per il ripristino
2326   del valore del semaforo. Al processo chiamante è richiesto il privilegio di
2327   alterazione (scrittura) sull'insieme di semafori.
2328   
2329 \item[\var{sem\_op}$=0$] Nel caso \var{semval} sia zero l'esecuzione procede
2330   immediatamente. Se \var{semval} è diverso da zero il comportamento è
2331   controllato da \var{sem\_flg}, se è stato impostato \const{IPC\_NOWAIT} la
2332   funzione ritorna con un errore di \errcode{EAGAIN}, altrimenti viene
2333   incrementato \var{semzcnt} di uno ed il processo resta in stato di
2334   \textit{sleep} fintanto che non si ha una delle condizioni seguenti:
2335   \begin{itemize*}
2336   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2337     decrementato di uno.
2338   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2339     un errore di \errcode{EIDRM}.
2340   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2341     viene decrementato di uno e \func{semop} ritorna un errore di
2342     \errcode{EINTR}.
2343   \end{itemize*}
2344   Al processo chiamante è richiesto il privilegio di lettura dell'insieme dei
2345   semafori.
2346   
2347 \item[\var{sem\_op}$<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2348   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2349   positiva o nulla) i valori vengono sommati e la funzione ritorna
2350   immediatamente; qualora si sia impostato \const{SEM\_UNDO} viene anche
2351   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2352   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2353   negativo) se si è impostato \const{IPC\_NOWAIT} la funzione ritorna con un
2354   errore di \errcode{EAGAIN}, altrimenti viene incrementato di uno
2355   \var{semncnt} ed il processo resta in stato di \textit{sleep} fintanto che
2356   non si ha una delle condizioni seguenti:
2357   \begin{itemize*}
2358   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2359     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2360     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2361     impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2362     ripristino del valore del semaforo.
2363   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2364     ritorna un errore di \errcode{EIDRM}.
2365   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2366     viene decrementato di uno e \func{semop} ritorna un errore di
2367     \errcode{EINTR}.
2368   \end{itemize*}    
2369   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2370   sull'insieme di semafori.
2371 \end{basedescript}
2372
2373 In caso di successo della funzione viene aggiornato di \var{sempid} per ogni
2374 semaforo modificato al valore del \acr{pid} del processo chiamante; inoltre
2375 vengono pure aggiornati al tempo corrente i campi \var{sem\_otime} e
2376 \var{sem\_ctime}.
2377
2378 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2379 semafori possono restare occupati, abbiamo visto come \func{semop} permetta di
2380 attivare un meccanismo di ripristino attraverso l'uso del flag
2381 \const{SEM\_UNDO}. Il meccanismo è implementato tramite una apposita struttura
2382 \var{sem\_undo}, associata ad ogni processo per ciascun semaforo che esso ha
2383 modificato; all'uscita i semafori modificati vengono ripristinati, e le
2384 strutture disallocate.  Per mantenere coerente il comportamento queste
2385 strutture non vengono ereditate attraverso una \func{fork} (altrimenti si
2386 avrebbe un doppio ripristino), mentre passano inalterate nell'esecuzione di
2387 una \func{exec} (altrimenti non si avrebbe ripristino).
2388
2389 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2390 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2391 in maniera semplificata nello schema di \figref{fig:ipc_sem_schema}.  Si è
2392 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2393 semplice (ed illustrata in dettaglio in \cite{tlk}); nel kernel 2.4.x la
2394 struttura del \textit{SysV IPC} è stata modificata, ma le definizioni relative
2395 a queste strutture restano per compatibilità.\footnote{in particolare con le
2396   vecchie versioni delle librerie del C, come le libc5.}
2397
2398 \begin{figure}[htb]
2399   \centering \includegraphics[width=15cm]{img/semtruct}
2400   \caption{Schema della struttura di un insieme di semafori.}
2401   \label{fig:ipc_sem_schema}
2402 \end{figure}
2403
2404 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2405 \var{semid\_ds} ed il relativo vettore di strutture \var{sem}. Quando si
2406 richiede una operazione viene anzitutto verificato che tutte le operazioni
2407 possono avere successo; se una di esse comporta il blocco del processo il
2408 kernel crea una struttura \var{sem\_queue} che viene aggiunta in fondo alla
2409 coda di attesa associata a ciascun insieme di semafori\footnote{che viene
2410   referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last}
2411   di \var{semid\_ds}.}. Nella struttura viene memorizzato il riferimento alle
2412 operazioni richieste (nel campo \var{sops}, che è un puntatore ad una
2413 struttura \var{sembuf}) e al processo corrente (nel campo \var{sleeper}) poi
2414 quest'ultimo viene messo stato di attesa e viene invocato lo
2415 scheduler\index{scheduler} per passare all'esecuzione di un altro processo.
2416
2417 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2418 immediatamente, dopo di che il kernel esegue una scansione della coda di
2419 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2420 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2421 struttura \var{sem\_queue} viene rimossa e lo stato del processo associato
2422 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2423 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2424 svuotata la coda.
2425
2426 Per gestire il meccanismo del ripristino tutte le volte che per un'operazione
2427 si è specificato il flag \const{SEM\_UNDO} viene mantenuta per ciascun insieme
2428 di semafori una apposita struttura \var{sem\_undo} che contiene (nel vettore
2429 puntato dal campo \var{semadj}) un valore di aggiustamento per ogni semaforo
2430 cui viene sommato l'opposto del valore usato per l'operazione. 
2431
2432 Queste strutture sono mantenute in due liste,\footnote{rispettivamente
2433   attraverso i due campi \var{id\_next} e \var{proc\_next}.} una associata
2434 all'insieme di cui fa parte il semaforo, che viene usata per invalidare le
2435 strutture se questo viene cancellato o per azzerarle se si è eseguita una
2436 operazione con \func{semctl}; l'altra associata al processo che ha eseguito
2437 l'operazione;\footnote{attraverso il campo \var{semundo} di
2438   \var{task\_struct}, come mostrato in \ref{fig:ipc_sem_schema}.} quando un
2439 processo termina, la lista ad esso associata viene scandita e le operazioni
2440 applicate al semaforo.
2441
2442 Siccome un processo può accumulare delle richieste di ripristino per semafori
2443 differenti chiamate attraverso diverse chiamate a \func{semop}, si pone il
2444 problema di come eseguire il ripristino dei semafori all'uscita del processo,
2445 ed in particolare se questo può essere fatto atomicamente. Il punto è cosa
2446 succede quando una delle operazioni previste per il ripristino non può essere
2447 eseguita immediatamente perché ad esempio il semaforo è occupato; in tal caso
2448 infatti, se si pone il processo in stato di \textit{sleep} aspettando la
2449 disponibilità del semaforo (come faceva l'implementazione originaria) si perde
2450 l'atomicità dell'operazione. La scelta fatta dal kernel è pertanto quella di
2451 effettuare subito le operazioni che non prevedono un blocco del processo e di
2452 ignorare silenziosamente le altre; questo però comporta il fatto che il
2453 ripristino non è comunque garantito in tutte le occasioni.
2454
2455 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2456 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2457 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2458 riportato in \figref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2459 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2460 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2461 nullo per segnalarne l'indisponibilità. 
2462
2463 \begin{figure}[!bht]
2464   \footnotesize \centering
2465   \begin{minipage}[c]{15cm}
2466     \begin{lstlisting}{} 
2467 /*
2468  * Function MutexCreate: create a mutex/semaphore
2469  */
2470 int MutexCreate(key_t ipc_key) 
2471 {
2472     const union semun semunion={1};             /* semaphore union structure */
2473     int sem_id, ret;
2474     sem_id = semget(ipc_key, 1, IPC_CREAT|0666);         /* get semaphore ID */
2475     if (sem_id == -1) {                              /* if error return code */
2476         return sem_id;
2477     }
2478     ret = semctl(sem_id, 0, SETVAL, semunion);             /* init semaphore */
2479     if (ret == -1) {
2480         return ret;
2481     }
2482     return sem_id;
2483 }
2484 /*
2485  * Function MutexFind: get the semaphore/mutex Id given the IPC key value
2486  */
2487 int MutexFind(key_t ipc_key) 
2488 {
2489     return semget(ipc_key,1,0);
2490 }
2491 /*
2492  * Function MutexRead: read the current value of the mutex/semaphore
2493  */
2494 int MutexRead(int sem_id) 
2495 {
2496     return semctl(sem_id, 0, GETVAL);
2497 }
2498 /*
2499  * Define sembuf structures to lock and unlock the semaphore 
2500  */
2501 struct sembuf sem_lock={                                /* to lock semaphore */
2502     0,                                   /* semaphore number (only one so 0) */
2503     -1,                                    /* operation (-1 to use resource) */
2504     SEM_UNDO};                                /* flag (set for undo at exit) */
2505 struct sembuf sem_ulock={                             /* to unlock semaphore */
2506     0,                                   /* semaphore number (only one so 0) */
2507     1,                                  /* operation (1 to release resource) */
2508     SEM_UNDO};                                      /* flag (in this case 0) */
2509 /*
2510  * Function MutexLock: to lock a mutex/semaphore
2511  */
2512 int MutexLock(int sem_id) 
2513 {
2514     return semop(sem_id, &sem_lock, 1);
2515 }
2516 /*
2517  * Function MutexUnlock: to unlock a mutex/semaphore
2518  */
2519 int MutexUnlock(int sem_id) 
2520 {
2521     return semop(sem_id, &sem_ulock, 1);
2522 }
2523     \end{lstlisting}
2524   \end{minipage} 
2525   \normalsize 
2526   \caption{Il codice delle funzioni che permettono di creare o recuperare
2527     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2528   \label{fig:ipc_mutex_create}
2529 \end{figure}
2530
2531 La prima funzione (\texttt{\small 1--17}) è \func{MutexCreate} che data una
2532 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2533 l'identificatore. Il primo passo (\texttt{\small 8}) è chiamare \func{semget}
2534 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2535 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2536 (\texttt{\small 9--11}) si ritorna subito il risultato di \func{semget},
2537 altrimenti (\texttt{\small 12}) si inizializza il semaforo chiamando
2538 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2539 \var{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 6}) ad 1
2540 per significare che risorsa è libera. In caso di errore (\texttt{\small
2541   13--16}) si restituisce il valore di ritorno di \func{semctl}, altrimenti si
2542 ritorna l'identificatore del semaforo.
2543
2544 La seconda funzione (\texttt{\small 18--24}) è \func{MutexFind}, che data una
2545 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2546 comprensione del suo funzionamento è immediata in quanto è solo un
2547 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2548   \textsl{involucro} alla chiamata di un altra, usata in genere per
2549   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2550   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2551   stesse funzionalità.} di \func{semget} per cercare l'identificatore
2552 associato alla chiave, restituendo direttamente il valore di ritorno della
2553 funzione.
2554
2555 La terza funzione (\texttt{\small 25--31}) è \func{MutexRead} che, dato
2556 l'identificatore, restituisce il valore del mutex. Anche in questo caso la
2557 funzione è un \textit{wrapper} per la chiamata di \func{semctl}, questa volta
2558 con il comando \const{GETVAL}, che permette di restituire il valore del
2559 semaforo.
2560
2561 La quarta e la quinta funzione (\texttt{\small 43--56}) sono \func{MutexLock},
2562 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2563 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2564 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2565 (\texttt{\small 32--42}). Si noti come per queste ultime si sia fatto uso
2566 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2567 caso di terminazione imprevista del processo.%%  Si noti infine come, essendo
2568 %% tutte le funzioni riportate in \figref{fig:ipc_mutex_create} estremamente
2569 %% semplici, se si sono definite tutte come \ctyp{inline}.\footnote{la direttiva
2570 %%   \func{inline} viene usata per dire al compilatore di non trattare la
2571 %%   funzione cui essa fa riferimento come una funzione, ma di inserire il codice
2572 %%   direttamente nel testo del programma.  Anche se i compilatori più moderni
2573 %%   sono in grado di effettuare da soli queste manipolazioni (impostando le
2574 %%   opportune ottimizzazioni) questa è una tecnica usata per migliorare le
2575 %%   prestazioni per le funzioni piccole ed usate di frequente, in tal caso
2576 %%   infatti le istruzioni per creare un nuovo frame nello stack per chiamare la
2577 %%   funzione costituirebbero una parte rilevante del codice, appesantendo
2578 %%   inutilmente il programma. Originariamente questa era fatto utilizzando delle
2579 %%   macro, ma queste hanno tutta una serie di problemi di sintassi nel passaggio
2580 %%   degli argomenti (si veda ad esempio \cite{PratC} che in questo modo possono
2581 %%   essere evitati.}
2582
2583
2584 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2585 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2586 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2587 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2588 incrementato di uno, sbloccandolo qualora fosse bloccato.  Si noti che occorre
2589 eseguire sempre prima \func{MutexLock} e poi \func{MutexUnlock}, perché se per
2590 un qualche errore si esegue più volte quest'ultima il valore del semaforo
2591 crescerebbe oltre 1, e \func{MutexLock} non avrebbe più l'effetto aspettato
2592 (bloccare la risorsa quando questa è considerata libera). Si tenga presente
2593 che usare \func{MutexRead} per controllare il valore dei mutex prima di
2594 proseguire non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2595 Vedremo in \secref{sec:ipc_posix_sem} come è possibile ottenere un'interfaccia
2596 analoga senza questo problemi usando il file locking\index{file!locking}.
2597
2598
2599
2600 \subsection{Memoria condivisa}
2601 \label{sec:ipc_sysv_shm}
2602
2603 Il terzo oggetto introdotto dal \textit{SysV IPC} è quello dei segmenti di
2604 memoria condivisa. La funzione che permette di ottenerne uno è \func{shmget},
2605 ed il suo prototipo è:
2606 \begin{functions}
2607   \headdecl{sys/types.h} 
2608   \headdecl{sys/ipc.h} 
2609   \headdecl{sys/shm.h}
2610   
2611   \funcdecl{int shmget(key\_t key, int size, int flag)}
2612   
2613   Restituisce l'identificatore di una memoria condivisa.
2614   
2615   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
2616     in caso di errore, nel qual caso \var{errno} assumerà i valori:
2617     \begin{errlist}
2618     \item[\errcode{ENOSPC}] Si è superato il limite (\const{SHMMNI}) sul numero
2619       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2620       cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2621       la memoria ad essi riservata.
2622     \item[\errcode{EINVAL}] Si è richiesta una dimensione per un nuovo segmento
2623       maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2624       già esiste \param{size} è maggiore delle sue dimensioni.
2625     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
2626       contenere le strutture per un nuovo segmento di memoria condivisa.
2627     \end{errlist}
2628     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2629     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2630 \end{functions}
2631
2632 La funzione, come \func{semget}, è del tutto analoga a \func{msgget}, ed
2633 identico è l'uso degli argomenti \param{key} e \param{flag} per cui non
2634 ripeteremo quanto detto al proposito in \secref{sec:ipc_sysv_mq}. L'argomento
2635 \param{size} specifica invece la dimensione, in byte, del segmento, che viene
2636 comunque arrotondata al multiplo superiore di \const{PAGE\_SIZE}.
2637
2638 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2639 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2640 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2641 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2642 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2643 dati in memoria.
2644
2645 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2646 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2647 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2648 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2649 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2650 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2651 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2652 altro processo. Per questo in genere la memoria condivisa viene sempre
2653 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2654 norma, significa insieme a dei semafori.
2655
2656 \begin{figure}[!htb]
2657   \footnotesize \centering
2658   \begin{minipage}[c]{15cm}
2659     \begin{lstlisting}[labelstep=0]{}
2660 struct shmid_ds {
2661      struct    ipc_perm shm_perm;  /* operation perms */
2662      int  shm_segsz;               /* size of segment (bytes) */
2663      time_t    shm_atime;          /* last attach time */
2664      time_t    shm_dtime;          /* last detach time */
2665      time_t    shm_ctime;          /* last change time */
2666      unsigned short shm_cpid;      /* pid of creator */
2667      unsigned short shm_lpid;      /* pid of last operator */
2668      short     shm_nattch;         /* no. of current attaches */
2669 };
2670     \end{lstlisting}
2671   \end{minipage} 
2672   \normalsize 
2673   \caption{La struttura \var{shmid\_ds}, associata a ciascun segmento di
2674     memoria condivisa.}
2675   \label{fig:ipc_shmid_ds}
2676 \end{figure}
2677
2678 A ciascun segmento di memoria condivisa è associata una struttura
2679 \var{shmid\_ds}, riportata in \figref{fig:ipc_shmid_ds}.  Come nel caso delle
2680 code di messaggi quando si crea un nuovo segmento di memoria condivisa con
2681 \func{shmget} questa struttura viene inizializzata, in particolare il campo
2682 \var{shm\_perm} viene inizializzato come illustrato in
2683 \secref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2684 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2685 invece:
2686 \begin{itemize*}
2687 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2688   inizializzato al valore di \param{size}.
2689 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2690   segmento, viene inizializzato al tempo corrente.
2691 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2692   rispettivamente il tempo dell'ultima volta che il segmento è stato
2693   agganciato o sganciato da un processo, vengono inizializzati a zero.
2694 \item il campo \var{shm\_lpid}, che esprime il \acr{pid} del processo che ha
2695   eseguito l'ultima operazione, viene inizializzato a zero.
2696 \item il campo \var{shm\_cpid}, che esprime il \acr{pid} del processo che ha
2697   creato il segmento, viene inizializzato al \acr{pid} del processo chiamante.
2698 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2699   al segmento viene inizializzato a zero.
2700 \end{itemize*}
2701
2702 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2703 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2704 di questi limiti sono al solito accessibili e modificabili attraverso
2705 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2706 \file{/proc/sys/kernel/}. In \tabref{tab:ipc_shm_limits} si sono riportate le
2707 costanti simboliche associate a ciascuno di essi, il loro significato, i
2708 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2709 che permettono di cambiarne il valore. 
2710
2711
2712 \begin{table}[htb]
2713   \footnotesize
2714   \centering
2715   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2716     \hline
2717     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2718     & \textbf{Significato} \\
2719     \hline
2720     \hline
2721     \const{SHMALL}& 0x200000&\file{shmall}& Numero massimo di pagine che 
2722                                        possono essere usate per i segmenti di
2723                                        memoria condivisa. \\
2724     \const{SHMMAX}&0x2000000&\file{shmmax}& Dimensione massima di un segmento 
2725                                             di memoria condivisa.\\
2726     \const{SHMMNI}&     4096&\file{msgmni}& Numero massimo di segmenti di 
2727                                             memoria condivisa presenti nel
2728                                             kernel.\\ 
2729     \const{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2730                                             memoria condivisa. \\
2731     \const{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2732                                             minime di un segmento (deve essere
2733                                             allineato alle dimensioni di una
2734                                             pagina di memoria). \\
2735     \const{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2736                                             memoria condivisa 
2737                                             per ciascun processo.\\
2738
2739
2740     \hline
2741   \end{tabular}
2742   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2743     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2744     valore preimpostato presente nel sistema.} 
2745   \label{tab:ipc_shm_limits}
2746 \end{table}
2747
2748 Al solito la funzione che permette di effettuare le operazioni di controllo su
2749 un segmento di memoria condivisa è \func{shmctl}; il suo prototipo è:
2750 \begin{functions}
2751   \headdecl{sys/ipc.h} 
2752   \headdecl{sys/shm.h}
2753   
2754   \funcdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2755   
2756   Esegue le operazioni di controllo su un segmento di memoria condivisa.
2757   
2758   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2759     errore, nel qual caso \var{errno} assumerà i valori:
2760     \begin{errlist}
2761     \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma i permessi non
2762       consentono l'accesso in lettura al segmento.
2763     \item[\errcode{EINVAL}] O \param{shmid} o \param{cmd} hanno valori non
2764       validi.
2765     \item[\errcode{EIDRM}] L'argomento \param{shmid} fa riferimento ad un
2766       segmento che è stato cancellato.
2767     \item[\errcode{EPERM}] Si è specificato un comando con \const{IPC\_SET} o
2768       \const{IPC\_RMID} senza i permessi necessari.
2769     \item[\errcode{EOVERFLOW}] L'argomento \param{shmid} fa riferimento ad un
2770       segmento che è stato cancellato.
2771     \end{errlist}
2772   ed inoltre \errval{EFAULT}.}
2773 \end{functions}
2774
2775 Il comportamento della funzione dipende dal valore del comando passato
2776 attraverso l'argomento \param{cmd}, i valori possibili sono i seguenti:
2777 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2778 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2779   condivisa nella struttura \var{shmid\_ds} puntata da \param{buf}. Occorre
2780   avere il permesso di lettura sulla coda.
2781 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2782   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2783   processo ad esso agganciato si sarà staccato. Questo comando può essere
2784   eseguito solo da un processo con userid effettivo corrispondente o al
2785   creatore della coda, o al proprietario della coda, o all'amministratore.
2786 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2787   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2788   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2789   il creatore della coda, oppure l'amministratore. Compiuta l'operazione
2790   aggiorna anche il valore del campo \var{shm\_ctime}.
2791 \item[\const{SHM\_LOCK}] Abilita il \textit{memory locking}\index{memory
2792     locking}\footnote{impedisce cioè che la memoria usata per il segmento
2793     venga salvata su disco dal meccanismo della memoria virtuale; si ricordi
2794     quanto trattato in \secref{sec:proc_mem_lock}.} sul segmento di memoria
2795   condivisa. Solo l'amministratore può utilizzare questo comando.
2796 \item[\const{SHM\_UNLOCK}] Disabilita il \textit{memory locking} sul segmento
2797   di memoria condivisa. Solo l'amministratore può utilizzare questo comando.
2798 \end{basedescript}
2799 i primi tre comandi sono gli stessi già visti anche per le code ed i semafori,
2800 gli ultimi due sono delle estensioni previste da Linux. 
2801
2802 Per utilizzare i segmenti di memoria condivisa l'interfaccia prevede due
2803 funzioni, la prima è \func{shmat}, che serve ad agganciare un segmento al
2804 processo chiamante, in modo che quest'ultimo possa vederlo nel suo spazio di
2805 indirizzi; il suo prototipo è:
2806 \begin{functions}
2807   \headdecl{sys/types.h} 
2808   \headdecl{sys/shm.h}
2809   
2810   \funcdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2811   Aggancia al processo un segmento di memoria condivisa.
2812   
2813   \bodydesc{La funzione restituisce l'indirizzo del segmento in caso di
2814     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà i
2815     valori:
2816     \begin{errlist}
2817     \item[\errcode{EACCES}] Il processo non ha i privilegi per accedere al
2818       segmento nella modalità richiesta.
2819     \item[\errcode{EINVAL}] Si è specificato un identificatore invalido per
2820       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2821       per \param{shmaddr}.
2822     \end{errlist}
2823     ed inoltre \errval{ENOMEM}.}
2824 \end{functions}
2825
2826 La funzione inserisce un segmento di memoria condivisa all'interno dello
2827 spazio di indirizzi del processo, in modo che questo possa accedervi
2828 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2829 \figref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2830 ricordi quanto illustrato al proposito in \secref{sec:proc_mem_layout}). In
2831 particolare l'indirizzo finale del segmento dati (quello impostato da
2832 \func{brk}, vedi \secref{sec:proc_mem_sbrk}) non viene influenzato. Si tenga
2833 presente infine che la funzione ha successo anche se il segmento è stato
2834 marcato per la cancellazione.
2835
2836 \begin{figure}[htb]
2837   \centering
2838   \includegraphics[height=10cm]{img/sh_memory_layout}
2839   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2840     agganciato un segmento di memoria condivisa.}
2841   \label{fig:ipc_shmem_layout}
2842 \end{figure}
2843
2844 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{Lo standard
2845   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2846   come il valore di ritorno della funzione. In Linux è stato così con le
2847   \acr{libc4} e le \acr{libc5}, con il passaggio alle \acr{glibc} il tipo di
2848   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2849   ritorno un \ctyp{void *}.} deve essere associato il segmento, se il valore
2850 specificato è \val{NULL} è il sistema a scegliere opportunamente un'area di
2851 memoria libera (questo è il modo più portabile e sicuro di usare la funzione).
2852 Altrimenti il kernel aggancia il segmento all'indirizzo specificato da
2853 \param{shmaddr}; questo però può avvenire solo se l'indirizzo coincide con il
2854 limite di una pagina, cioè se è un multiplo esatto del parametro di sistema
2855 \const{SHMLBA}, che in Linux è sempre uguale \const{PAGE\_SIZE}. 
2856
2857 Si tenga presente però che quando si usa \val{NULL} come valore di
2858 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2859 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2860 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2861 riferiti all'indirizzo di partenza del segmento).
2862
2863 L'argomento \param{shmflg} permette di cambiare il comportamento della
2864 funzione; esso va specificato come maschera binaria, i bit utilizzati sono
2865 solo due e sono identificati dalle costanti \const{SHM\_RND} e
2866 \const{SHM\_RDONLY}, che vanno combinate con un OR aritmetico.  Specificando
2867 \const{SHM\_RND} si evita che \func{shmat} ritorni un errore quando
2868 \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi usare
2869 un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2870 agganciato, ma al più vicino multiplo di \const{SHMLBA} (il nome della
2871 costante sta infatti per \textit{rounded}, e serve per specificare un
2872 indirizzo come arrotondamento, in Linux è equivalente a \const{PAGE\_SIZE}).
2873
2874 L'uso di \const{SHM\_RDONLY} permette di agganciare il segmento in sola
2875 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2876 caso un tentativo di scrivere sul segmento comporterà una violazione di
2877 accesso con l'emissione di un segnale di \const{SIGSEGV}. Il comportamento
2878 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2879 lettura e scrittura (ed il processo deve aver questi permessi in
2880 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2881 sola scrittura.
2882
2883 In caso di successo la funzione aggiorna anche i seguenti campi di
2884 \var{shmid\_ds}:
2885 \begin{itemize*}
2886 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2887   impostato al tempo corrente.
2888 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2889   segmento viene impostato a quello del processo corrente.
2890 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2891   aumentato di uno.
2892 \end{itemize*} 
2893
2894 Come accennato in \secref{sec:proc_fork} un segmento di memoria condivisa
2895 agganciato ad un processo viene ereditato da un figlio attraverso una
2896 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2897 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2898 eseguito un diverso programma con uno spazio di indirizzi completamente
2899 diverso, tutti i segmenti agganciati al processo originario vengono
2900 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2901 attraverso una \func{exit}.
2902
2903 Una volta che un segmento di memoria condivisa non serve più, si può
2904 sganciarlo esplicitamente dal processo usando l'altra funzione
2905 dell'interfaccia, \func{shmdt}, il cui prototipo è:
2906 \begin{functions}
2907   \headdecl{sys/types.h} 
2908   \headdecl{sys/shm.h}
2909
2910   \funcdecl{int shmdt(const void *shmaddr)}
2911   Sgancia dal processo un segmento di memoria condivisa.
2912   
2913   \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
2914     errore, la funzione fallisce solo quando non c'è un segmento agganciato
2915     all'indirizzo \func{shmaddr}, con \var{errno} che assume il valore
2916     \errval{EINVAL}.}
2917 \end{functions}
2918
2919 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2920 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2921 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2922 agganciato al processo.
2923
2924 In caso di successo la funzione aggiorna anche i seguenti campi di
2925 \var{shmid\_ds}:
2926 \begin{itemize*}
2927 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2928   impostato al tempo corrente.
2929 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2930   segmento viene impostato a quello del processo corrente.
2931 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2932   decrementato di uno.
2933 \end{itemize*} 
2934 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2935 viene tolta dallo spazio di indirizzi del processo.
2936
2937
2938 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
2939 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
2940 %% condivisa; uno schema semplificato della struttura è illustrato in
2941 %% \figref{fig:ipc_shm_struct}. 
2942
2943 %% \begin{figure}[htb]
2944 %%   \centering
2945 %%   \includegraphics[width=10cm]{img/shmstruct}
2946 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
2947 %%     Linux.}
2948 %%   \label{fig:ipc_shm_struct}
2949 %% \end{figure}
2950
2951
2952
2953
2954 \section{Tecniche alternative}
2955 \label{sec:ipc_alternatives}
2956
2957 Come abbiamo detto in \secref{sec:ipc_sysv_generic}, e ripreso nella
2958 descrizione dei singoli oggetti che ne fan parte, il \textit{SysV IPC}
2959 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
2960   capitolo 14.}  Stevens ne effettua una accurata analisi (alcuni dei
2961 concetti sono già stati accennati in precedenza) ed elenca alcune possibili
2962 tecniche alternative, che vogliamo riprendere in questa sezione.
2963
2964
2965 \subsection{Alternative alle code di messaggi}
2966 \label{sec:ipc_mq_alternative}
2967  
2968 Le code di messaggi sono probabilmente il meno usato degli oggetti del
2969 \textit{SysV IPC}; esse infatti nacquero principalmente come meccanismo di
2970 comunicazione bidirezionale quando ancora le pipe erano unidirezionali; con la
2971 disponibilità di \func{socketpair} (vedi \secref{sec:ipc_socketpair}) si può
2972 ottenere lo stesso risultato senza incorrere nelle complicazioni introdotte
2973 dal \textit{SysV IPC}.
2974
2975 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
2976 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
2977 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
2978 sono impossibili da ottenere con le pipe e i socket\index{socket} di
2979 \func{socketpair}.  A queste esigenze però si può comunque ovviare in maniera
2980 diversa con un uso combinato della memoria condivisa e dei meccanismi di
2981 sincronizzazione, per cui alla fine l'uso delle code di messaggi classiche è
2982 poco diffuso.
2983
2984
2985
2986 \subsection{I \textsl{file di lock}}
2987 \label{sec:ipc_file_lock}
2988
2989 \index{file!di lock|(}
2990 Come illustrato in \secref{sec:ipc_sysv_sem} i semafori del \textit{SysV IPC}
2991 presentano una interfaccia inutilmente complessa e con alcuni difetti
2992 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
2993 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
2994 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
2995 necessità di un contatore come i semafori, si possono utilizzare metodi
2996 alternativi.
2997
2998 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
2999 dei \textsl{file di lock} (per i quali esiste anche una opportuna directory,
3000 \file{/var/lock}, nel filesystem standard). Per questo si usa la
3001 caratteristica della funzione \func{open} (illustrata in
3002 \secref{sec:file_open}) che prevede\footnote{questo è quanto dettato dallo
3003   standard POSIX.1, ciò non toglie che in alcune implementazioni questa
3004   tecnica possa non funzionare; in particolare per Linux, nel caso di NFS, si
3005   è comunque soggetti alla possibilità di una race condition.} che essa
3006 ritorni un errore quando usata con i flag di \const{O\_CREAT} e
3007 \const{O\_EXCL}. In tal modo la creazione di un \textsl{file di lock} può
3008 essere eseguita atomicamente, il processo che crea il file con successo si può
3009 considerare come titolare del lock (e della risorsa ad esso associata) mentre
3010 il rilascio si può eseguire con una chiamata ad \func{unlink}.
3011
3012 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3013 \func{LockFile} ed \func{UnlockFile} riportate in \figref{fig:ipc_file_lock}
3014 (sono contenute in \file{LockFile.c}, un'altro dei sorgenti allegati alla
3015 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3016   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3017 (\texttt{\small 4--10}) si limita ad aprire il file di lock (\texttt{\small
3018   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11--17}) lo
3019 cancella con \func{unlink}.
3020
3021 \begin{figure}[!htb]
3022   \footnotesize \centering
3023   \begin{minipage}[c]{15cm}
3024     \begin{lstlisting}{} 
3025 #include <sys/types.h>
3026 #include <sys/stat.h>
3027 #include <unistd.h>                               /* unix standard functions */
3028 /*
3029  * Function LockFile:
3030  */
3031 int LockFile(const char* path_name)
3032 {
3033     return open(path_name, O_EXCL|O_CREAT);
3034 }
3035 /*
3036  * Function UnlockFile:
3037  */
3038 int UnlockFile(const char* path_name) 
3039 {
3040     return unlink(path_name);
3041 }
3042
3043     \end{lstlisting}
3044   \end{minipage} 
3045   \normalsize 
3046   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3047     permettono di creare e rimuovere un \textsl{file di lock}.}
3048   \label{fig:ipc_file_lock}
3049 \end{figure}
3050
3051 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3052 \secref{sec:file_open}, questo comportamento di \func{open} può non funzionare
3053 (la funzione viene eseguita, ma non è garantita l'atomicità dell'operazione)
3054 se il filesystem su cui si va ad operare è su NFS; in tal caso si può adottare
3055 una tecnica alternativa che prevede l'uso della \func{link} per creare come
3056 \textsl{file di lock} un hard link ad un file esistente; se il link esiste già
3057 e la funzione fallisce, significa che la risorsa è bloccata e potrà essere
3058 sbloccata solo con un \func{unlink}, altrimenti il link è creato ed il lock
3059 acquisito; il controllo e l'eventuale acquisizione sono atomici; la soluzione
3060 funziona anche su NFS, ma ha un'altro difetto è che è quello di poterla usare
3061 solo se si opera all'interno di uno stesso filesystem.
3062
3063 Un generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3064 problemi, che non lo rendono una alternativa praticabile per la
3065 sincronizzazione: anzitutto anche in questo caso, in caso di terminazione
3066 imprevista del processo, si lascia allocata la risorsa (il \textsl{file di
3067   lock}) e questa deve essere sempre cancellata esplicitamente.  Inoltre il
3068 controllo della disponibilità può essere eseguito solo con una tecnica di
3069 \textit{polling}\index{polling}, ed è quindi molto inefficiente.
3070
3071 La tecnica dei file di lock non di meno ha una sua utilità, e può essere usata
3072 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3073 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3074 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3075 più programmi: qualora si trovi un file di lock il programma che cerca di
3076 accedere alla seriale si limita a segnalare che la risorsa non è
3077 disponibile.\index{file!di lock|)}
3078
3079 \subsection{La sincronizzazione con il \textit{file locking}}
3080 \label{sec:ipc_lock_file}
3081
3082 Dato che i file di lock presentano gli inconvenienti illustrati in precedenza,
3083 la tecnica alternativa più comune è quella di fare ricorso al \textit{file
3084   locking}\index{file!locking} (trattato in \secref{sec:file_locking}) usando
3085 \func{fcntl} su un file creato per l'occasione per ottenere un write lock. In
3086 questo modo potremo usare il lock come un \textit{mutex}: per bloccare la
3087 risorsa basterà acquisire il lock, per sbloccarla basterà rilasciare il lock;
3088 una richiesta fatta con un write lock metterà automaticamente il processo in
3089 stato di attesa, senza necessità di ricorrere al
3090 \textit{polling}\index{polling} per determinare la disponibilità della
3091 risorsa, e al rilascio della stessa da parte del processo che la occupava si
3092 otterrà il nuovo lock atomicamente.
3093
3094 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3095 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3096 chiusura dei relativi file) e non ci si deve preoccupare di niente, inoltre
3097 non consuma risorse permanentemente allocate nel sistema, lo svantaggio è che
3098 dovendo fare ricorso a delle operazioni sul filesystem esso è in genere
3099 leggermente più lento.
3100
3101 \begin{figure}[!htb]
3102   \footnotesize \centering
3103   \begin{minipage}[c]{15cm}
3104     \begin{lstlisting}{} 
3105 /*
3106  * Function LockMutex: lock a file (creating it if not existent).  
3107  */
3108 int LockMutex(const char *path_name)
3109 {
3110     int fd, res;
3111     struct flock lock;                                /* file lock structure */
3112     /* first open the file (creating it if not existent) */
3113     if ( (fd = open(path_name, O_EXCL|O_CREAT)) < 0) {    /* first open file */
3114         return fd;
3115     }
3116     /* set flock structure */
3117     lock.l_type = F_WRLCK;                        /* set type: read or write */
3118     lock.l_whence = SEEK_SET;        /* start from the beginning of the file */
3119     lock.l_start = 0;                  /* set the start of the locked region */
3120     lock.l_len = 0;                   /* set the length of the locked region */
3121     /* do locking */
3122     if ( (res = fcntl(fd, F_SETLKW, &lock)) < 0 ) {
3123         return res;
3124     }
3125     return 0;
3126 }
3127 /*
3128  * Function UnLockMutex: unlock a file.  
3129  */
3130 int UnlockMutex(const char *path_name)
3131 {
3132     int fd, res;
3133     struct flock lock;                                /* file lock structure */
3134     /* first open the file */
3135     if ( (fd = open(path_name, O_RDWR)) < 0) {            /* first open file */
3136         return fd;
3137     }
3138     /* set flock structure */
3139     lock.l_type = F_UNLCK;                               /* set type: unlock */
3140     lock.l_whence = SEEK_SET;        /* start from the beginning of the file */
3141     lock.l_start = 0;                  /* set the start of the locked region */
3142     lock.l_len = 0;                   /* set the length of the locked region */
3143     /* do locking */
3144     if ( (res = fcntl(fd, F_SETLK, &lock)) < 0 ) {
3145         return res;
3146     }
3147     return 0;
3148 }
3149     \end{lstlisting}
3150   \end{minipage} 
3151   \normalsize 
3152   \caption{Il codice delle funzioni che permettono di creare un
3153     \textit{mutex} utilizzando il file locking\index{file!locking}.}
3154   \label{fig:ipc_flock_mutex}
3155 \end{figure}
3156
3157 Il codice per implementare un mutex utilizzando il file
3158 locking\index{file!locking} è riportato in \figref{fig:ipc_flock_mutex}; a
3159 differenza del precedente caso in cui si sono usati i semafori le funzioni
3160 questa volta sono sufficienti due funzioni, \func{LockMutex} e
3161 \func{UnlockMutex}, usate rispettivamente per acquisire e rilasciare il mutex.
3162
3163 La prima funzione (\texttt{\small 1--22}) serve per acquisire il mutex.
3164 Anzitutto si apre (\texttt{\small 9--11}), creandolo se non esiste, il file
3165 specificato dall'argomento \param{pathname}. In caso di errore si ritorna
3166 immediatamente, altrimenti si prosegue impostando (\texttt{\small 12--16}) la
3167 struttura \var{lock} in modo da poter acquisire un write lock sul file. Infine
3168 si richiede (\texttt{\small 17--20}) il file lock (restituendo il codice di
3169 ritorno di \func{fcntl} caso di errore). Se il file è libero il lock è
3170 acquisito e la funzione ritorna immediatamente; altrimenti \func{fcntl} si
3171 bloccherà (si noti che la si è chiamata con \func{F\_SETLKW}) fino al rilascio
3172 del lock.
3173
3174 La seconda funzione (\texttt{\small 23--44}) serve a rilasciare il mutex. Di
3175 nuovo si apre (\texttt{\small 30--33}) il file specificato dall'argomento
3176 \param{pathname} (che stavolta deve esistere), ritornando immediatamente in
3177 caso di errore. Poi si passa ad inizializzare (\texttt{\small 34--38}) la
3178 struttura \var{lock} per il rilascio del lock, che viene effettuato
3179 (\texttt{\small 39--42}) subito dopo.
3180
3181  \subsection{Il \textit{memory mapping} anonimo}
3182 \label{sec:ipc_mmap_anonymous}
3183
3184 Abbiamo già visto che quando i processi sono \textsl{correlati}\footnote{se
3185   cioè hanno almeno un progenitore comune.} l'uso delle pipe può costituire
3186 una valida alternativa alle code di messaggi; nella stessa situazione si può
3187 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3188 \textit{memory mapping} anonimo.
3189
3190 Abbiamo visto in \secref{sec:file_memory_map} che è possibile mappare il
3191 contenuto di un file nella memoria di un processo, e che, quando viene usato
3192 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3193 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3194 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3195 inefficiente, in quanto occorre passare attraverso il disco. Però abbiamo
3196 visto anche che se si esegue la mappatura con il flag \const{MAP\_ANONYMOUS}
3197 la regione mappata non viene associata a nessun file, anche se quanto scritto
3198 rimane in memoria e può essere riletto; allora, dato che un processo figlio
3199 mantiene nel suo spazio degli indirizzi anche le regioni mappate, esso sarà
3200 anche in grado di accedere a quanto in esse è contenuto.
3201
3202 In questo modo diventa possibile creare una memoria condivisa fra processi
3203 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3204 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3205   funzionalità simile a questa viene implementata mappando il file speciale
3206   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3207   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3208   restano in memoria e possono essere riletti secondo le stesse modalità usate
3209   nel \textit{memory mapping} anonimo.} Un esempio di utilizzo di questa
3210 tecnica è mostrato in 
3211
3212
3213
3214 \section{La comunicazione fra processi di POSIX}
3215 \label{sec:ipc_posix}
3216
3217 Per superare i numerosi problemi del \textit{SysV IPC}, evidenziati per i suoi
3218 aspetti generali in coda a \secref{sec:ipc_sysv_generic} e per i singoli
3219 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3220 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3221 una interfaccia completamente nuova, che tratteremo in questa sezione.
3222
3223
3224
3225 \subsection{Considerazioni generali}
3226 \label{sec:ipc_posix_generic}
3227
3228 Il Linux non tutti gli oggetti del POSIX IPC sono supportati nel kernel
3229 ufficiale; solo la memoria condivisa è presente, ma solo a partire dal kernel
3230 2.4.x, per gli altri oggetti esistono patch e librerie non ufficiali.
3231 Nonostante questo è importante esaminare questa interfaccia per la sua netta
3232 superiorità nei confronti di quella del \textit{SysV IPC}.
3233
3234
3235 \subsection{Code di messaggi}
3236 \label{sec:ipc_posix_mq}
3237
3238 Le code di messaggi non sono ancora supportate nel kernel
3239 ufficiale;\footnote{esiste però una proposta di implementazione di Krzysztof
3240   Benedyczak, a partire dal kernel 2.5.50.}  inoltre esse possono essere
3241 implementate, usando la memoria condivisa ed i mutex, con funzioni di
3242 libreria. In generale, come le corrispettive del SysV IPC, sono poco usate,
3243 dato che i socket\index{socket}, nei casi in cui sono sufficienti, sono più
3244 comodi, e negli altri casi la comunicazione può essere gestita direttamente
3245 con mutex e memoria condivisa. Per questo ci limiteremo ad una descrizione
3246 essenziale.
3247
3248
3249
3250 \subsection{Semafori}
3251 \label{sec:ipc_posix_sem}
3252
3253 Dei semafori POSIX esistono sostanzialmente due implementazioni; una è fatta a
3254 livello di libreria ed è fornita dalla libreria dei thread; questa però li
3255 implementa solo a livello di thread e non di processi. Esiste un'altra
3256 versione, realizzata da Konstantin Knizhnik, che reimplementa l'interfaccia
3257 POSIX usando i semafori di SysV IPC.
3258
3259
3260 \subsection{Memoria condivisa}
3261 \label{sec:ipc_posix_shm}
3262
3263 La memoria condivisa è l'unico degli oggetti di IPC POSIX già presente nel
3264 kernel ufficiale. 
3265
3266
3267 %%% Local Variables: 
3268 %%% mode: latex
3269 %%% TeX-master: "gapil"
3270 %%% End: