550b323eca806729ecb7c4dd869b433afc51fc64
[gapil.git] / ipc.tex
1 %% ipc.tex
2 %%
3 %% Copyright (C) 2000-2013 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{L'intercomunicazione fra processi}
13 \label{cha:IPC}
14
15
16 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
17 la comunicazione fra processi. In questo capitolo affronteremo solo i
18 meccanismi più elementari che permettono di mettere in comunicazione processi
19 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
20 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
21
22 Tralasceremo invece tutte le problematiche relative alla comunicazione
23 attraverso la rete (e le relative interfacce) che saranno affrontate in
24 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
25 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) che in
26 genere sono implementati da un ulteriore livello di librerie sopra i
27 meccanismi elementari.
28
29
30 \section{L'intercomunicazione fra processi tradizionale}
31 \label{sec:ipc_unix}
32
33 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
34 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
35 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
36 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
37 ne gestiscono l'uso e le varie forme in cui si è evoluto.
38
39
40 \subsection{Le \textit{pipe} standard}
41 \label{sec:ipc_pipes}
42
43 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
44 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
45 sostanza di una coppia di file descriptor connessi fra di loro in modo che
46 quanto scrive su di uno si può rileggere dall'altro.  Si viene così a
47 costituire un canale di comunicazione realizzato tramite i due file
48 descriptor, che costituisce appunto una sorta di \textsl{tubo} (che appunto il
49 significato del termine inglese \textit{pipe}) attraverso cui si possono far
50 passare i dati.
51
52 In pratica si tratta di un buffer circolare in memoria in cui il kernel
53 appoggia i dati immessi nel file descriptor su cui si scrive per farli poi
54 riemergere dal file descriptor da cui si legge. Si tenga ben presente che in
55 questo passaggio di dati non è previsto nessun tipo di accesso al disco e che
56 nonostante l'uso dei file descriptor le \textit{pipe} non han nulla a che fare
57 con i file di dati di cui si è parlato al cap.~\ref{cha:file_IO_interface}.
58
59 La funzione di sistema che permette di creare questa speciale coppia di file
60 descriptor associati ad una \textit{pipe} è appunto \funcd{pipe}, ed il suo
61 prototipo è:
62
63 \begin{funcproto}{
64 \fhead{unistd.h}
65 \fdecl{int pipe(int filedes[2])}
66 \fdesc{Crea la coppia di file descriptor di una \textit{pipe}.} 
67 }
68
69 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
70   caso \var{errno} assumerà uno dei valori: 
71   \begin{errlist}
72   \item[\errcode{EFAULT}] \param{filedes} non è un indirizzo valido.
73   \end{errlist}
74   ed inoltre \errval{EMFILE} e \errval{ENFILE} nel loro significato generico.}
75 \end{funcproto}
76
77 La funzione restituisce la coppia di file descriptor nel vettore
78 \param{filedes}, il primo è aperto in lettura ed il secondo in scrittura. Come
79 accennato concetto di funzionamento di una \textit{pipe} è semplice: quello
80 che si scrive nel file descriptor aperto in scrittura viene ripresentato tale
81 e quale nel file descriptor aperto in lettura. 
82
83 I file descriptor infatti non sono connessi a nessun file reale, ma, come
84 accennato, ad un buffer nel kernel la cui dimensione è specificata dal
85 parametro di sistema \const{PIPE\_BUF}, (vedi
86 sez.~\ref{sec:sys_file_limits}). Lo schema di funzionamento di una
87 \textit{pipe} è illustrato in fig.~\ref{fig:ipc_pipe_singular}, in cui sono
88 indicati i due capi della \textit{pipe}, associati a ciascun file descriptor,
89 con le frecce che indicano la direzione del flusso dei dati.
90
91 \begin{figure}[!htb]
92   \centering
93   \includegraphics[height=5cm]{img/pipe}
94   \caption{Schema della struttura di una \textit{pipe}.}
95   \label{fig:ipc_pipe_singular}
96 \end{figure}
97
98 Della funzione di sistema esiste una seconda versione, \funcd{pipe2},
99 introdotta con il kernel 2.6.27 e le \acr{glibc} 2.9 e specifica di Linux
100 (utilizzabile solo definendo la macro \macro{\_GNU\_SOURCE}), che consente di
101 impostare atomicamente le caratteristiche dei file descriptor restituiti, il
102 suo prototipo è:
103
104 \begin{funcproto}{
105 \fhead{unistd.h}
106 \fhead{fcntl.h}
107 \fdecl{int pipe2(int pipefd[2], int flags)}
108 \fdesc{Crea la coppia di file descriptor di una \textit{pipe}.} 
109 }
110
111 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
112   caso \var{errno} assumerà uno dei valori: 
113   \begin{errlist}
114   \item[\errcode{EINVAL}] il valore di \param{flags} non valido.
115   \end{errlist}
116   e gli altri già visti per \func{pipe} con lo stesso significato.}
117 \end{funcproto}
118
119 Utilizzando un valore nullo per \param{flags} la funzione è identica a
120 \func{pipe}, si può però passare come valore l'OR aritmetico di uno qualunque
121 fra \const{O\_NONBLOCK} o \const{O\_CLOEXEC} che hanno l'effetto di impostare
122 su entrambi i file descriptor restituiti dalla funzione i relativi flag, già
123 descritti per \func{open} in tab.~\ref{tab:open_operation_flag}, che attivano
124 rispettivamente la modalità di accesso \textsl{non-bloccante} ed il
125 \textit{close-on-exec} \itindex{close-on-exec}.
126
127 Chiaramente creare una \textit{pipe} all'interno di un singolo processo non
128 serve a niente; se però ricordiamo quanto esposto in
129 sez.~\ref{sec:file_shared_access} riguardo al comportamento dei file
130 descriptor nei processi figli, è immediato capire come una \textit{pipe} possa
131 diventare un meccanismo di intercomunicazione. Un processo figlio infatti
132 condivide gli stessi file descriptor del padre, compresi quelli associati ad
133 una \textit{pipe} (secondo la situazione illustrata in
134 fig.~\ref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
135 capo della \textit{pipe}, l'altro può leggere.
136
137 \begin{figure}[!htb]
138   \centering
139   \includegraphics[height=5cm]{img/pipefork}
140   \caption{Schema dei collegamenti ad una \textit{pipe}, condivisi fra
141     processo padre e figlio dopo l'esecuzione \func{fork}.}
142   \label{fig:ipc_pipe_fork}
143 \end{figure}
144
145 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
146 comunicazione fra processi attraverso una \textit{pipe}, utilizzando le
147 proprietà ordinarie dei file, ma ci mostra anche qual è il principale limite
148 nell'uso delle \textit{pipe}.\footnote{Stevens in \cite{APUE} riporta come
149   limite anche il fatto che la comunicazione è unidirezionale, ma in realtà
150   questo è un limite superabile usando una coppia di \textit{pipe}, anche se
151   al costo di una maggiore complessità di gestione.}  È necessario infatti che
152 i processi possano condividere i file descriptor della \textit{pipe}, e per
153 questo essi devono comunque essere \textsl{parenti} (dall'inglese
154 \textit{siblings}), cioè o derivare da uno stesso processo padre in cui è
155 avvenuta la creazione della \textit{pipe}, o, più comunemente, essere nella
156 relazione padre/figlio.
157
158 A differenza di quanto avviene con i file normali, la lettura da una
159 \textit{pipe} può essere bloccante (qualora non siano presenti dati), inoltre
160 se si legge da una \textit{pipe} il cui capo in scrittura è stato chiuso, si
161 avrà la ricezione di un EOF (vale a dire che la funzione \func{read} ritornerà
162 restituendo 0).  Se invece si esegue una scrittura su una \textit{pipe} il cui
163 capo in lettura non è aperto il processo riceverà il segnale \signal{SIGPIPE},
164 e la funzione di scrittura restituirà un errore di \errcode{EPIPE} (al ritorno
165 del gestore, o qualora il segnale sia ignorato o bloccato).
166
167 La dimensione del buffer della \textit{pipe} (\const{PIPE\_BUF}) ci dà inoltre
168 un'altra importante informazione riguardo il comportamento delle operazioni di
169 lettura e scrittura su di una \textit{pipe}; esse infatti sono atomiche
170 fintanto che la quantità di dati da scrivere non supera questa
171 dimensione. Qualora ad esempio si effettui una scrittura di una quantità di
172 dati superiore l'operazione verrà effettuata in più riprese, consentendo
173 l'intromissione di scritture effettuate da altri processi.
174
175 La dimensione originale del buffer era di 4096 byte (uguale ad una pagina di
176 memoria) fino al kernel 2.6.11, ed è stata portata in seguito a 64kb; ma a
177 partire dal kernel 2.6.35 è stata resa disponibile l'operazione di controllo
178 \const{F\_SETPIPE\_SZ} (vedi sez.~\ref{sec:ipc_pipes}) che consente di
179 modificarne la dimensione.
180
181
182
183 \subsection{Un esempio dell'uso delle \textit{pipe}}
184 \label{sec:ipc_pipe_use}
185
186 Per capire meglio il funzionamento delle \textit{pipe} faremo un esempio di
187 quello che è il loro uso più comune, analogo a quello effettuato della shell,
188 e che consiste nell'inviare l'output di un processo (lo standard output)
189 sull'input di un altro. Realizzeremo il programma di esempio nella forma di un
190 \textit{CGI}\footnote{quella dei CGI (\textit{Common Gateway Interface}) è una
191   interfaccia che consente ad un server web di eseguire un programma il cui
192   output (che deve essere opportunamente formattato seguendo le specifiche
193   dell'interfaccia) può essere presentato come risposta ad una richiesta HTTP
194   al posto del contenuto di un file, e che ha costituito probabilmente la
195   prima modalità con cui sono state create pagine HTML dinamiche.}  che genera
196 una immagine JPEG di un codice a barre, specificato come argomento in
197 ingresso.
198
199 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
200 delle caratteristiche specifiche, esso infatti non viene lanciato da una
201 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
202 solito ha la forma:
203 \begin{Verbatim}
204 http://www.sito.it/cgi-bin/programma?argomento
205 \end{Verbatim}
206 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
207 che ne descrive il \textit{mime-type}) sullo \textit{standard output}, in modo
208 che il server web possa reinviarlo al browser che ha effettuato la richiesta,
209 che in questo modo è in grado di visualizzarlo opportunamente.
210
211 \begin{figure}[!htb]
212   \centering
213   \includegraphics[height=5cm]{img/pipeuse}
214   \caption{Schema dell'uso di una \textit{pipe} come mezzo di comunicazione fra
215     due processi attraverso l'esecuzione una \func{fork} e la chiusura dei
216     capi non utilizzati.}
217   \label{fig:ipc_pipe_use}
218 \end{figure}
219
220 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
221 \cmd{gs}, il primo infatti è in grado di generare immagini PostScript di
222 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
223 serve per poter effettuare la conversione della stessa immagine in formato
224 JPEG. Usando una \textit{pipe} potremo inviare l'output del primo sull'input del
225 secondo, secondo lo schema mostrato in fig.~\ref{fig:ipc_pipe_use}, in cui la
226 direzione del flusso dei dati è data dalle frecce continue.
227
228 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
229 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
230 \textit{CGI} può essere eseguito più volte in contemporanea, e si avrebbe una
231 evidente \itindex{race~condition} \textit{race condition} in caso di accesso
232 simultaneo a detto file da istanze diverse. Il problema potrebbe essere
233 superato utilizzando un sempre diverso per il file temporaneo, che verrebbe
234 creato all'avvio di ogni istanza, utilizzato dai sottoprocessi, e cancellato
235 alla fine della sua esecuzione; ma a questo punto le cose non sarebbero più
236 tanto semplici.  L'uso di una \textit{pipe} invece permette di risolvere il
237 problema in maniera semplice ed elegante, oltre ad essere molto più
238 efficiente, dato che non si deve scrivere su disco.
239
240 Il programma ci servirà anche come esempio dell'uso delle funzioni di
241 duplicazione dei file descriptor che abbiamo trattato in
242 sez.~\ref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
243 funzioni infatti che è possibile dirottare gli stream standard dei processi
244 (che abbiamo visto in tab.~\ref{tab:file_std_files} e
245 sez.~\ref{sec:file_stream}) sulla \textit{pipe}. In
246 fig.~\ref{fig:ipc_barcodepage_code} abbiamo riportato il corpo del programma,
247 il cui codice completo è disponibile nel file \file{BarCodePage.c} che si
248 trova nella directory dei sorgenti.
249
250 \begin{figure}[!htb]
251   \footnotesize \centering
252   \begin{minipage}[c]{\codesamplewidth}
253     \includecodesample{listati/BarCodePage.c}
254   \end{minipage} 
255   \normalsize 
256   \caption{Sezione principale del codice del \textit{CGI} 
257     \file{BarCodePage.c}.}
258   \label{fig:ipc_barcodepage_code}
259 \end{figure}
260
261 La prima operazione del programma (\texttt{\small 4--12}) è quella di creare
262 le due \textit{pipe} che serviranno per la comunicazione fra i due comandi
263 utilizzati per produrre il codice a barre; si ha cura di controllare la
264 riuscita della chiamata, inviando in caso di errore un messaggio invece
265 dell'immagine richiesta. La funzione \func{WriteMess} non è riportata in
266 fig.~\ref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
267 formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
268 \textit{mime-type}, e formattando il messaggio in HTML, in modo che
269 quest'ultimo possa essere visualizzato correttamente da un browser.
270
271 Una volta create le \textit{pipe}, il programma può creare (\texttt{\small
272   13-17}) il primo processo figlio, che si incaricherà (\texttt{\small
273   19--25}) di eseguire \cmd{barcode}. Quest'ultimo legge dallo standard input
274 una stringa di caratteri, la converte nell'immagine PostScript del codice a
275 barre ad essa corrispondente, e poi scrive il risultato direttamente sullo
276 standard output.
277
278 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
279 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima
280 \textit{pipe}, e se ne collega (\texttt{\small 21}) il capo in lettura allo
281 \textit{standard input} usando \func{dup2}. Si ricordi che invocando
282 \func{dup2} il secondo file, qualora risulti aperto, viene, come nel caso
283 corrente, chiuso prima di effettuare la duplicazione. Allo stesso modo, dato
284 che \cmd{barcode} scrive l'immagine PostScript del codice a barre sullo
285 standard output, per poter effettuare una ulteriore redirezione il capo in
286 lettura della seconda \textit{pipe} viene chiuso (\texttt{\small 22}) mentre
287 il capo in scrittura viene collegato allo standard output (\texttt{\small
288   23}).
289
290 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
291 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
292 leggerà dalla prima \textit{pipe} la stringa da codificare che gli sarà
293 inviata dal padre, e scriverà l'immagine PostScript del codice a barre sulla
294 seconda.
295
296 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
297 (\texttt{\small 26}) il capo inutilizzato della prima \textit{pipe} (quello in
298 ingresso) e poi scrive (\texttt{\small 27}) la stringa da convertire sul capo
299 in uscita, così che \cmd{barcode} possa riceverla dallo \textit{standard
300   input}. A questo punto l'uso della prima \textit{pipe} da parte del padre è
301 finito ed essa può essere definitivamente chiusa (\texttt{\small 28}), si
302 attende poi (\texttt{\small 29}) che l'esecuzione di \cmd{barcode} sia
303 completata.
304
305 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
306 PostScript del codice a barre sul capo in scrittura della seconda
307 \textit{pipe}; a questo punto si può eseguire la seconda conversione, da PS a
308 JPEG, usando il programma \cmd{gs}. Per questo si crea (\texttt{\small
309   30--34}) un secondo processo figlio, che poi (\texttt{\small 35--42})
310 eseguirà questo programma leggendo l'immagine PostScript creata da
311 \cmd{barcode} dallo \textit{standard input}, per convertirla in JPEG.
312
313 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
314 scrittura della seconda \textit{pipe}, e se ne collega (\texttt{\small 38}) il
315 capo in lettura allo \textit{standard input}. Per poter formattare l'output
316 del programma in maniera utilizzabile da un browser, si provvede anche
317 \texttt{\small 40}) alla scrittura dell'apposita stringa di identificazione
318 del \textit{mime-type} in testa allo \textit{standard output}. A questo punto
319 si può invocare \texttt{\small 41}) \cmd{gs}, provvedendo le opportune opzioni
320 del comando che consentono di leggere il file da convertire dallo
321 \textit{standard input} e di inviare la conversione sullo \textit{standard
322   output}.
323
324 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
325 capo in scrittura della seconda \textit{pipe}, e attende la conclusione del
326 figlio (\texttt{\small 45}); a questo punto può (\texttt{\small 46})
327 uscire. Si tenga conto che l'operazione di chiudere il capo in scrittura della
328 seconda \textit{pipe} è necessaria, infatti, se non venisse chiusa, \cmd{gs},
329 che legge il suo \textit{standard input} da detta \textit{pipe}, resterebbe
330 bloccato in attesa di ulteriori dati in ingresso (l'unico modo che un
331 programma ha per sapere che i dati in ingresso sono terminati è rilevare che
332 lo \textit{standard input} è stato chiuso), e la \func{wait} non ritornerebbe.
333
334
335 \subsection{Le funzioni \func{popen} e \func{pclose}}
336 \label{sec:ipc_popen}
337
338 Come si è visto la modalità più comune di utilizzo di una \textit{pipe} è
339 quella di utilizzarla per fare da tramite fra output ed input di due programmi
340 invocati in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due
341 funzioni che permettono di sintetizzare queste operazioni. La prima di esse si
342 chiama \funcd{popen} ed il suo prototipo è:
343
344
345 \begin{funcproto}{
346 \fhead{stdio.h}
347 \fdecl{FILE *popen(const char *command, const char *type)}
348 \fdesc{Esegue un programma dirottando l'uscita su una \textit{pipe}.} 
349 }
350
351 {La funzione ritorna l'indirizzo dello stream associato alla \textit{pipe} in
352   caso di successo e \val{NULL} per un errore, nel qual caso \var{errno} potrà
353   assumere i valori relativi alle sottostanti invocazioni di \func{pipe} e
354   \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
355 \end{funcproto}
356
357 La funzione crea una \textit{pipe}, esegue una \func{fork} creando un nuovo
358 processe nel quale invoca il programma \param{command} attraverso la shell (in
359 sostanza esegue \file{/bin/sh} con il flag \code{-c}).
360 L'argomento \param{type} deve essere una delle due stringhe \verb|"w"| o
361 \verb|"r"|, per richiedere che la \textit{pipe} restituita come valore di
362 ritorno sia collegata allo \textit{standard input} o allo \textit{standard
363   output} del comando invocato.
364
365 La funzione restituisce il puntatore ad uno stream associato alla
366 \textit{pipe} creata, che sarà aperto in sola lettura (e quindi associato allo
367 \textit{standard output} del programma indicato) in caso si sia indicato
368 \code{r}, o in sola scrittura (e quindi associato allo \textit{standard
369   input}) in caso di \code{w}. A partire dalla versione 2.9 delle \acr{glibc}
370 (questa è una estensione specifica di Linux) all'argomento \param{type} può
371 essere aggiunta la lettera ``\texttt{e}'' per impostare automaticamente il
372 flag di \textit{close-on-exec} \itindex{close-on-exec} sul file descriptor
373 sottostante (si ricordi quanto spiegato in sez.~\ref{sec:file_open_close}).
374
375 Lo \textit{stream} restituito da \func{popen} è identico a tutti gli effetti
376 ai \textit{file stream} visti in sez.~\ref{sec:files_std_interface}, anche se
377 è collegato ad una \textit{pipe} e non ad un file, e viene sempre aperto in
378 modalità \textit{fully-buffered} (vedi sez.~\ref{sec:file_buffering}); l'unica
379 differenza con gli usuali stream è che dovrà essere chiuso dalla seconda delle
380 due nuove funzioni, \funcd{pclose}, il cui prototipo è:
381
382 \begin{funcproto}{
383 \fhead{stdio.h}
384 \fdecl{int pclose(FILE *stream)}
385 \fdesc{Chiude una \textit{pipe} creata con \func{popen}.} 
386 }
387
388 {La funzione ritorna lo stato del processo creato da \func{popen} in caso di
389   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà i valori
390   derivanti dalle sottostanti funzioni \func{fclose} e \func{wait4}.}
391 \end{funcproto}
392
393 La funzione chiude il file \param{stream} associato ad una \textit{pipe}
394 creato da una precedente \func{popen}, ed oltre alla chiusura dello stream si
395 incarica anche di attendere (tramite \func{wait4}) la conclusione del processo
396 creato dalla precedente \func{popen}. Se lo stato di uscita non può essere
397 letto la funzione restituirà per \var{errno} un errore di \errval{ECHILD}.
398
399 Per illustrare l'uso di queste due funzioni riprendiamo il problema
400 precedente: il programma mostrato in fig.~\ref{fig:ipc_barcodepage_code} per
401 quanto funzionante, è volutamente codificato in maniera piuttosto complessa,
402 inoltre doveva scontare un problema di \cmd{gs} che non era in grado di
403 riconoscere correttamente l'Encapsulated PostScript,\footnote{si fa
404   riferimento alla versione di GNU Ghostscript 6.53 del 2002-02-13, quando
405   l'esempio venne scritto per la prima volta.} per cui si era utilizzato il
406 PostScript semplice, generando una pagina intera invece che una immagine delle
407 dimensioni corrispondenti al codice a barre.
408
409 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
410 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
411 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
412 generato da \cmd{barcode} utilizzando l'opzione \cmd{-E}).  Utilizzando un PDF
413 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
414 originarie del codice a barre e produce un JPEG di dimensioni corrette.
415
416 Questo approccio però non può funzionare per via di una delle caratteristiche
417 principali delle \textit{pipe}. Per poter effettuare la conversione di un PDF
418 infatti è necessario, per la struttura del formato, potersi spostare (con
419 \func{lseek}) all'interno del file da convertire. Se si esegue la conversione
420 con \cmd{gs} su un file regolare non ci sono problemi, una \textit{pipe} però
421 è rigidamente sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre
422 con un errore di \errcode{ESPIPE}, rendendo impossibile la conversione.
423 Questo ci dice che in generale la concatenazione di vari programmi funzionerà
424 soltanto quando tutti prevedono una lettura sequenziale del loro input.
425
426 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
427 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
428 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
429   formato usato spesso come formato intermedio per effettuare conversioni, è
430   infatti molto facile da manipolare, dato che usa caratteri ASCII per
431   memorizzare le immagini, anche se per questo è estremamente inefficiente
432   come formato di archiviazione.}  dal quale poi si può ottenere un'immagine
433 di dimensioni corrette attraverso vari programmi di manipolazione
434 (\cmd{pnmcrop}, \cmd{pnmmargin}) che può essere infine trasformata in PNG (con
435 \cmd{pnm2png}).
436
437 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
438 inviando l'uscita di ciascuno all'ingresso del successivo, per poi ottenere il
439 risultato finale sullo \textit{standard output}: un caso classico di
440 utilizzazione delle pipe, in cui l'uso di \func{popen} e \func{pclose}
441 permette di semplificare notevolmente la stesura del codice.
442
443 Nel nostro caso, dato che ciascun processo deve scrivere la sua uscita sullo
444 \textit{standard input} del successivo, occorrerà usare \func{popen} aprendo
445 la \textit{pipe} in scrittura. Il codice del nuovo programma è riportato in
446 fig.~\ref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione
447 dei programmi è l'inverso di quello in cui ci si aspetta che vengano
448 effettivamente eseguiti. Questo non comporta nessun problema dato che la
449 lettura su una \textit{pipe} è bloccante, per cui un processo, anche se
450 lanciato per primo, se non ottiene i dati che gli servono si bloccherà in
451 attesa sullo \textit{standard input} finché non otterrà il risultato
452 dell'elaborazione del processo che li deve creare, che pur essendo logicamente
453 precedente, viene lanciato dopo di lui.
454
455 \begin{figure}[!htb]
456   \footnotesize \centering
457   \begin{minipage}[c]{\codesamplewidth}
458     \includecodesample{listati/BarCode.c}
459   \end{minipage} 
460   \normalsize 
461   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
462   \label{fig:ipc_barcode_code}
463 \end{figure}
464
465 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il
466 \textit{mime-type} sullo \textit{standard output}; a questo punto il processo
467 padre non necessita più di eseguire ulteriori operazioni sullo
468 \textit{standard output} e può tranquillamente provvedere alla redirezione.
469
470 Dato che i vari programmi devono essere lanciati in successione, si è
471 approntato un ciclo (\texttt{\small 15--19}) che esegue le operazioni in
472 sequenza: prima crea una \textit{pipe} (\texttt{\small 17}) per la scrittura
473 eseguendo il programma con \func{popen}, in modo che essa sia collegata allo
474 \textit{standard input}, e poi redirige (\texttt{\small 18}) lo
475 \textit{standard output} su detta \textit{pipe}.
476
477 In questo modo il primo processo ad essere invocato (che è l'ultimo della
478 catena) scriverà ancora sullo \textit{standard output} del processo padre, ma
479 i successivi, a causa di questa redirezione, scriveranno sulla \textit{pipe}
480 associata allo \textit{standard input} del processo invocato nel ciclo
481 precedente.
482
483 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
484 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
485 (\texttt{\small 23}) la stringa del codice a barre sulla \textit{pipe}, che è
486 collegata al suo \textit{standard input}, infine si può eseguire
487 (\texttt{\small 24--27}) un ciclo che chiuda con \func{pclose}, nell'ordine
488 inverso rispetto a quello in cui le si sono create, tutte le \textit{pipe}
489 create in precedenza.
490
491
492 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
493 \label{sec:ipc_named_pipe}
494
495 Come accennato in sez.~\ref{sec:ipc_pipes} il problema delle \textit{pipe} è
496 che esse possono essere utilizzate solo da processi con un progenitore comune
497 o nella relazione padre/figlio. Per superare questo problema lo standard
498 POSIX.1 ha definito dei nuovi oggetti, le \textit{fifo}, che hanno le stesse
499 caratteristiche delle \textit{pipe}, ma che invece di essere strutture interne
500 del kernel, visibili solo attraverso un file descriptor, sono accessibili
501 attraverso un \itindex{inode} \textit{inode} che risiede sul filesystem, così
502 che i processi le possono usare senza dovere per forza essere in una relazione
503 di \textsl{parentela}.
504
505 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le
506 \textit{pipe}, attraverso un apposito buffer nel kernel, senza transitare dal
507 filesystem; \itindex{inode} l'\textit{inode} allocato sul filesystem serve
508 infatti solo a fornire un punto di riferimento per i processi, che permetta
509 loro di accedere alla stessa fifo; il comportamento delle funzioni di lettura
510 e scrittura è identico a quello illustrato per le \textit{pipe} in
511 sez.~\ref{sec:ipc_pipes}.
512
513 Abbiamo già visto in sez.~\ref{sec:file_mknod} le funzioni \func{mknod} e
514 \func{mkfifo} che permettono di creare una \textit{fifo}; per utilizzarne una
515 un processo non avrà che da aprire il relativo \index{file!speciali} file
516 speciale o in lettura o scrittura; nel primo caso sarà collegato al capo di
517 uscita della \textit{fifo}, e dovrà leggere, nel secondo al capo di ingresso,
518 e dovrà scrivere.
519
520 Il kernel crea una singola \textit{pipe} per ciascuna \textit{fifo} che sia
521 stata aperta, che può essere acceduta contemporaneamente da più processi, sia
522 in lettura che in scrittura. Dato che per funzionare deve essere aperta in
523 entrambe le direzioni, per una \textit{fifo} di norma la funzione \func{open}
524 si blocca se viene eseguita quando l'altro capo non è aperto.
525
526 Le \textit{fifo} però possono essere anche aperte in modalità
527 \textsl{non-bloccante}, nel qual caso l'apertura del capo in lettura avrà
528 successo solo quando anche l'altro capo è aperto, mentre l'apertura del capo
529 in scrittura restituirà l'errore di \errcode{ENXIO} fintanto che non verrà
530 aperto il capo in lettura.
531
532 In Linux è possibile aprire le \textit{fifo} anche in
533 lettura/scrittura,\footnote{lo standard POSIX lascia indefinito il
534   comportamento in questo caso.}  operazione che avrà sempre successo
535 immediato qualunque sia la modalità di apertura (bloccante e non bloccante);
536 questo può essere utilizzato per aprire comunque una fifo in scrittura anche
537 se non ci sono ancora processi il lettura; è possibile anche usare la fifo
538 all'interno di un solo processo, nel qual caso però occorre stare molto
539 attenti alla possibili situazioni di stallo.\footnote{se si cerca di leggere
540   da una fifo che non contiene dati si avrà un \itindex{deadlock}
541   \textit{deadlock} immediato, dato che il processo si blocca e non potrà
542   quindi mai eseguire le funzioni di scrittura.}
543
544 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
545 piuttosto frequente l'utilizzo di una fifo come canale di comunicazione nelle
546 situazioni un processo deve ricevere informazioni da altri. In questo caso è
547 fondamentale che le operazioni di scrittura siano atomiche; per questo si deve
548 sempre tenere presente che questo è vero soltanto fintanto che non si supera
549 il limite delle dimensioni di \const{PIPE\_BUF} (si ricordi quanto detto in
550 sez.~\ref{sec:ipc_pipes}).
551
552 A parte il caso precedente, che resta probabilmente il più comune, Stevens
553 riporta in \cite{APUE} altre due casistiche principali per l'uso delle fifo:
554 \begin{itemize*}
555 \item Da parte dei comandi di shell, per evitare la creazione di file
556   temporanei quando si devono inviare i dati di uscita di un processo
557   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
558   
559 \item Come canale di comunicazione fra client ed server (il modello
560   \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}).
561 \end{itemize*}
562
563 Nel primo caso quello che si fa è creare tante fifo, da usare come standard
564 input, quanti sono i processi a cui i vogliono inviare i dati, questi ultimi
565 saranno stati posti in esecuzione ridirigendo lo standard input dalle fifo, si
566 potrà poi eseguire il processo che fornisce l'output replicando quest'ultimo,
567 con il comando \cmd{tee}, sulle varie fifo.
568
569 Il secondo caso è relativamente semplice qualora si debba comunicare con un
570 processo alla volta (nel qual caso basta usare due fifo, una per leggere ed
571 una per scrivere), le cose diventano invece molto più complesse quando si
572 vuole effettuare una comunicazione fra il server ed un numero imprecisato di
573 client; se il primo infatti può ricevere le richieste attraverso una fifo
574 ``\textsl{nota}'', per le risposte non si può fare altrettanto, dato che, per
575 la struttura sequenziale delle fifo, i client dovrebbero sapere, prima di
576 leggerli, quando i dati inviati sono destinati a loro.
577
578 Per risolvere questo problema, si può usare un'architettura come quella
579 illustrata in fig.~\ref{fig:ipc_fifo_server_arch} in cui i client inviano le
580 richieste al server su una fifo nota mentre le risposte vengono reinviate dal
581 server a ciascuno di essi su una fifo temporanea creata per l'occasione.
582
583 \begin{figure}[!htb]
584   \centering
585   \includegraphics[height=9cm]{img/fifoserver}
586   \caption{Schema dell'utilizzo delle fifo nella realizzazione di una
587   architettura di comunicazione client/server.}
588   \label{fig:ipc_fifo_server_arch}
589 \end{figure}
590
591 Come esempio di uso questa architettura e dell'uso delle fifo, abbiamo scritto
592 un server di \textit{fortunes}, che restituisce, alle richieste di un client,
593 un detto a caso estratto da un insieme di frasi; sia il numero delle frasi
594 dell'insieme, che i file da cui esse vengono lette all'avvio, sono importabili
595 da riga di comando. Il corpo principale del server è riportato in
596 fig.~\ref{fig:ipc_fifo_server}, dove si è tralasciata la parte che tratta la
597 gestione delle opzioni a riga di comando, che effettua l'impostazione delle
598 variabili \var{fortunefilename}, che indica il file da cui leggere le frasi,
599 ed \var{n}, che indica il numero di frasi tenute in memoria, ad un valore
600 diverso da quelli preimpostati. Il codice completo è nel file
601 \file{FortuneServer.c}.
602
603 \begin{figure}[!htbp]
604   \footnotesize \centering
605   \begin{minipage}[c]{\codesamplewidth}
606     \includecodesample{listati/FortuneServer.c}
607   \end{minipage} 
608   \normalsize 
609   \caption{Sezione principale del codice del server di \textit{fortunes}
610     basato sulle fifo.}
611   \label{fig:ipc_fifo_server}
612 \end{figure}
613
614 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
615 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
616 \var{fortune} avviene solo quando questa dimensione viene specificata, la
617 presenza di un valore nullo provoca l'uscita dal programma attraverso la
618 funzione (non riportata) che ne stampa le modalità d'uso.  Dopo di che
619 installa (\texttt{\small 13--15}) la funzione che gestisce i segnali di
620 interruzione (anche questa non è riportata in fig.~\ref{fig:ipc_fifo_server})
621 che si limita a rimuovere dal filesystem la fifo usata dal server per
622 comunicare.
623
624 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
625 funzione \code{FortuneParse} che legge dal file specificato in
626 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
627 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
628 Anche il codice della funzione non è riportato, in quanto non direttamente
629 attinente allo scopo dell'esempio.
630
631 Il passo successivo (\texttt{\small 17--22}) è quello di creare con
632 \func{mkfifo} la fifo nota sulla quale il server ascolterà le richieste,
633 qualora si riscontri un errore il server uscirà (escludendo ovviamente il caso
634 in cui la funzione \func{mkfifo} fallisce per la precedente esistenza della
635 fifo).
636
637 Una volta che si è certi che la fifo di ascolto esiste la procedura di
638 inizializzazione è completata. A questo punto si può chiamare (\texttt{\small
639   23}) la funzione \func{daemon} per far proseguire l'esecuzione del programma
640 in background come demone.  Si può quindi procedere (\texttt{\small 24--33})
641 alla apertura della fifo: si noti che questo viene fatto due volte, prima in
642 lettura e poi in scrittura, per evitare di dover gestire all'interno del ciclo
643 principale il caso in cui il server è in ascolto ma non ci sono client che
644 effettuano richieste.  Si ricordi infatti che quando una fifo è aperta solo
645 dal capo in lettura, l'esecuzione di \func{read} ritorna con zero byte (si ha
646 cioè una condizione di end-of-file).
647
648 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
649 client non apre a sua volta la fifo nota in scrittura per effettuare la sua
650 richiesta. Pertanto all'inizio non ci sono problemi, il client però, una volta
651 ricevuta la risposta, uscirà, chiudendo tutti i file aperti, compresa la fifo.
652 A questo punto il server resta (se non ci sono altri client che stanno
653 effettuando richieste) con la fifo chiusa sul lato in lettura, ed in questo
654 stato la funzione \func{read} non si bloccherà in attesa di input, ma
655 ritornerà in continuazione, restituendo un end-of-file.\footnote{si è usata
656   questa tecnica per compatibilità, Linux infatti supporta l'apertura delle
657   fifo in lettura/scrittura, per cui si sarebbe potuto effettuare una singola
658   apertura con \const{O\_RDWR}, la doppia apertura comunque ha il vantaggio
659   che non si può scrivere per errore sul capo aperto in sola lettura.}
660
661 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
662   24--28}),\footnote{di solito si effettua l'apertura del capo in lettura di
663   una fifo in modalità non bloccante, per evitare il rischio di uno stallo: se
664   infatti nessuno apre la fifo in scrittura il processo non ritornerà mai
665   dalla \func{open}. Nel nostro caso questo rischio non esiste, mentre è
666   necessario potersi bloccare in lettura in attesa di una richiesta.} si
667 esegue una seconda apertura in scrittura (\texttt{\small 29--32}), scartando
668 il relativo file descriptor, che non sarà mai usato, in questo modo però la
669 fifo resta comunque aperta anche in scrittura, cosicché le successive chiamate
670 a \func{read} possono bloccarsi.
671
672 A questo punto si può entrare nel ciclo principale del programma che fornisce
673 le risposte ai client (\texttt{\small 34--50}); questo viene eseguito
674 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
675 modo da passare attraverso la funzione di chiusura che cancella la fifo).
676
677 Il server è progettato per accettare come richieste dai client delle stringhe
678 che contengono il nome della fifo sulla quale deve essere inviata la risposta.
679 Per cui prima (\texttt{\small 35--39}) si esegue la lettura dalla stringa di
680 richiesta dalla fifo nota (che a questo punto si bloccherà tutte le volte che
681 non ci sono richieste). Dopo di che, una volta terminata la stringa
682 (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero casuale per
683 ricavare la frase da inviare, si procederà (\texttt{\small 42--46})
684 all'apertura della fifo per la risposta, che poi \texttt{\small 47--48}) vi
685 sarà scritta. Infine (\texttt{\small 49}) si chiude la fifo di risposta che
686 non serve più.
687
688 Il codice del client è invece riportato in fig.~\ref{fig:ipc_fifo_client},
689 anche in questo caso si è omessa la gestione delle opzioni e la funzione che
690 stampa a video le informazioni di utilizzo ed esce, riportando solo la sezione
691 principale del programma e le definizioni delle variabili. Il codice completo
692 è nel file \file{FortuneClient.c} dei sorgenti allegati.
693
694 \begin{figure}[!htbp]
695   \footnotesize \centering
696   \begin{minipage}[c]{\codesamplewidth}
697     \includecodesample{listati/FortuneClient.c}
698   \end{minipage} 
699   \normalsize 
700   \caption{Sezione principale del codice del client di \textit{fortunes}
701     basato sulle fifo.}
702   \label{fig:ipc_fifo_client}
703 \end{figure}
704
705 La prima istruzione (\texttt{\small 12}) compone il nome della fifo che dovrà
706 essere utilizzata per ricevere la risposta dal server.  Si usa il \ids{PID}
707 del processo per essere sicuri di avere un nome univoco; dopo di che
708 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
709 in caso di errore (a meno che il file non sia già presente sul filesystem).
710
711 A questo punto il client può effettuare l'interrogazione del server, per
712 questo prima si apre la fifo nota (\texttt{\small 19--23}), e poi ci si scrive
713 (\texttt{\small 24}) la stringa composta in precedenza, che contiene il nome
714 della fifo da utilizzare per la risposta. Infine si richiude la fifo del
715 server che a questo punto non serve più (\texttt{\small 25}).
716
717 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
718 si apre (\texttt{\small 26--30}) la fifo appena creata, da cui si deve
719 riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
720 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
721 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
722 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
723 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
724 fifo e si cancella (\texttt{\small 34}) il relativo file.
725 Si noti come la fifo per la risposta sia stata aperta solo dopo aver inviato
726 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
727 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
728 scrittura e l'apertura si sarebbe bloccata indefinitamente.
729
730 Verifichiamo allora il comportamento dei nostri programmi, in questo, come in
731 altri esempi precedenti, si fa uso delle varie funzioni di servizio, che sono
732 state raccolte nella libreria \file{libgapil.so}, per poter usare quest'ultima
733 occorrerà definire la variabile di ambiente \envvar{LD\_LIBRARY\_PATH} in modo
734 che il linker dinamico possa accedervi.
735
736 In generale questa variabile indica il \textit{pathname} della directory
737 contenente la libreria. Nell'ipotesi (che daremo sempre per verificata) che si
738 facciano le prove direttamente nella directory dei sorgenti (dove di norma
739 vengono creati sia i programmi che la libreria), il comando da dare sarà
740 \code{export LD\_LIBRARY\_PATH=./}; a questo punto potremo lanciare il server,
741 facendogli leggere una decina di frasi, con:
742 \begin{Verbatim}
743 [piccardi@gont sources]$ ./fortuned -n10
744 \end{Verbatim}
745 %$
746
747 Avendo usato \func{daemon} per eseguire il server in background il comando
748 ritornerà immediatamente, ma potremo verificare con \cmd{ps} che in effetti il
749 programma resta un esecuzione in background, e senza avere associato un
750 terminale di controllo (si ricordi quanto detto in sez.~\ref{sec:sess_daemon}):
751 \begin{Verbatim}
752 [piccardi@gont sources]$ ps aux
753 ...
754 piccardi 27489  0.0  0.0  1204  356 ?        S    01:06   0:00 ./fortuned -n10
755 piccardi 27492  3.0  0.1  2492  764 pts/2    R    01:08   0:00 ps aux
756 \end{Verbatim}
757 %$
758 e si potrà verificare anche che in \file{/tmp} è stata creata la fifo di
759 ascolto \file{fortune.fifo}. A questo punto potremo interrogare il server con
760 il programma client; otterremo così:
761 \begin{Verbatim}
762 [piccardi@gont sources]$ ./fortune
763 Linux ext2fs has been stable for a long time, now it's time to break it
764         -- Linuxkongreß '95 in Berlin
765 [piccardi@gont sources]$ ./fortune
766 Let's call it an accidental feature.
767         --Larry Wall
768 [piccardi@gont sources]$ ./fortune
769 .........    Escape the 'Gates' of Hell
770   `:::'                  .......  ......
771    :::  *                  `::.    ::'
772    ::: .::  .:.::.  .:: .::  `::. :'
773    :::  ::   ::  ::  ::  ::    :::.
774    ::: .::. .::  ::.  `::::. .:'  ::.
775 ...:::.....................::'   .::::..
776         -- William E. Roadcap
777 [piccardi@gont sources]$ ./fortune
778 Linux ext2fs has been stable for a long time, now it's time to break it
779         -- Linuxkongreß '95 in Berlin
780 \end{Verbatim}
781 %$
782 e ripetendo varie volte il comando otterremo, in ordine casuale, le dieci
783 frasi tenute in memoria dal server.
784
785 Infine per chiudere il server basterà inviare un segnale di terminazione con
786 \code{killall fortuned} e potremo verificare che il gestore del segnale ha
787 anche correttamente cancellato la fifo di ascolto da \file{/tmp}.
788
789 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
790 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
791   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
792   per il server sapere se un client è andato in crash, con la possibilità di
793   far restare le fifo temporanee sul filesystem, di come sia necessario
794   intercettare \signal{SIGPIPE} dato che un client può terminare dopo aver
795   fatto una richiesta, ma prima che la risposta sia inviata (cosa che nel
796   nostro esempio non è stata fatta).}; in generale infatti l'interfaccia delle
797 fifo non è adatta a risolvere questo tipo di problemi, che possono essere
798 affrontati in maniera più semplice ed efficace o usando i socket (che
799 tratteremo in dettaglio a partire da cap.~\ref{cha:socket_intro}) o ricorrendo
800 a meccanismi di comunicazione diversi, come quelli che esamineremo in seguito.
801
802
803
804 \subsection{La funzione \func{socketpair}}
805 \label{sec:ipc_socketpair}
806
807 Un meccanismo di comunicazione molto simile alle pipe, ma che non presenta il
808 problema della unidirezionalità del flusso dei dati, è quello dei cosiddetti
809 \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo l'argomento
810 dei socket in cap.~\ref{cha:socket_intro},\footnote{si tratta comunque di
811   oggetti di comunicazione che, come le pipe, sono utilizzati attraverso dei
812   file descriptor.} nell'ambito dell'interfaccia generale che essi forniscono
813 per la programmazione di rete; e vedremo anche
814 (in~sez.~\ref{sec:sock_sa_local}) come si possono definire dei
815 \index{file!speciali} file speciali (di tipo socket, analoghi a quello
816 associati alle fifo) cui si accede però attraverso quella medesima
817 interfaccia; vale però la pena esaminare qui una modalità di uso dei socket
818 locali\footnote{la funzione \func{socketpair} è stata introdotta in BSD4.4, ma
819   è supportata in genere da qualunque sistema che fornisca l'interfaccia dei
820   socket.} che li rende sostanzialmente identici ad una pipe bidirezionale.
821
822 La funzione \funcd{socketpair} infatti consente di creare una coppia di file
823 descriptor connessi fra di loro (tramite un socket, appunto), senza dover
824 ricorrere ad un \index{file!speciali} file speciale sul filesystem, i
825 descrittori sono del tutto analoghi a quelli che si avrebbero con una chiamata
826 a \func{pipe}, con la sola differenza è che in questo caso il flusso dei dati
827 può essere effettuato in entrambe le direzioni. Il prototipo della funzione è:
828 \begin{functions}
829   \headdecl{sys/types.h} 
830   \headdecl{sys/socket.h} 
831   
832   \funcdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
833   
834   Crea una coppia di socket connessi fra loro.
835   
836   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
837     errore, nel qual caso \var{errno} assumerà uno dei valori:
838   \begin{errlist}
839   \item[\errcode{EAFNOSUPPORT}] i socket locali non sono supportati.
840   \item[\errcode{EPROTONOSUPPORT}] il protocollo specificato non è supportato.
841   \item[\errcode{EOPNOTSUPP}] il protocollo specificato non supporta la
842   creazione di coppie di socket.
843   \end{errlist}
844   ed inoltre \errval{EMFILE},  \errval{EFAULT}.
845 }
846 \end{functions}
847
848 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
849 loro: quello che si scrive su uno di essi sarà ripresentato in input
850 sull'altro e viceversa. Gli argomenti \param{domain}, \param{type} e
851 \param{protocol} derivano dall'interfaccia dei socket (vedi
852 sez.~\ref{sec:sock_creation}) che è quella che fornisce il substrato per
853 connettere i due descrittori, ma in questo caso i soli valori validi che
854 possono essere specificati sono rispettivamente \const{AF\_UNIX},
855 \const{SOCK\_STREAM} e \val{0}.
856
857 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
858 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei socket
859 locali in generale) permette di trasmettere attraverso le linea non solo dei
860 dati, ma anche dei file descriptor: si può cioè passare da un processo ad un
861 altro un file descriptor, con una sorta di duplicazione dello stesso non
862 all'interno di uno stesso processo, ma fra processi distinti (torneremo su
863 questa funzionalità in sez.~\ref{sec:sock_fd_passing}).
864
865
866 \section{L'intercomunicazione fra processi di System V}
867 \label{sec:ipc_sysv}
868
869 Benché le pipe e le fifo siano ancora ampiamente usate, esse scontano il
870 limite fondamentale che il meccanismo di comunicazione che forniscono è
871 rigidamente sequenziale: una situazione in cui un processo scrive qualcosa che
872 molti altri devono poter leggere non può essere implementata con una pipe.
873
874 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
875 oggetti per la comunicazione fra processi ed una nuova interfaccia di
876 programmazione, che fossero in grado di garantire una maggiore flessibilità.
877 In questa sezione esamineremo come Linux supporta quello che viene chiamato il
878 \textsl{Sistema di comunicazione fra processi} di System V, cui da qui in
879 avanti faremo riferimento come \textit{SysV IPC} (dove IPC è la sigla di
880 \textit{Inter-Process Comunication}).
881
882
883
884 \subsection{Considerazioni generali}
885 \label{sec:ipc_sysv_generic}
886
887 La principale caratteristica del \textit{SysV IPC} è quella di essere basato
888 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
889 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
890 non vengono cancellati dal sistema una volta che non sono più in uso.
891
892 Questo comporta due problemi: il primo è che, al contrario di quanto avviene
893 per pipe e fifo, la memoria allocata per questi oggetti non viene rilasciata
894 automaticamente quando non c'è più nessuno che li utilizzi, ed essi devono
895 essere cancellati esplicitamente, se non si vuole che restino attivi fino al
896 riavvio del sistema. Il secondo problema è che, dato che non c'è, come per i
897 file, un contatore del numero di riferimenti che ne indichi l'essere in uso,
898 essi possono essere cancellati anche se ci sono dei processi che li stanno
899 utilizzando, con tutte le conseguenze (negative) del caso.
900
901 Un'ulteriore caratteristica negativa è che gli oggetti usati nel \textit{SysV
902   IPC} vengono creati direttamente dal kernel, e sono accessibili solo
903 specificando il relativo \textsl{identificatore}. Questo è un numero
904 progressivo (un po' come il \ids{PID} dei processi) che il kernel assegna a
905 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
906 torneremo in sez.~\ref{sec:ipc_sysv_id_use}). L'identificatore viene restituito
907 dalle funzioni che creano l'oggetto, ed è quindi locale al processo che le ha
908 eseguite. Dato che l'identificatore viene assegnato dinamicamente dal kernel
909 non è possibile prevedere quale sarà, né utilizzare un qualche valore statico,
910 si pone perciò il problema di come processi diversi possono accedere allo
911 stesso oggetto.
912
913 Per risolvere il problema nella struttura \struct{ipc\_perm} che il kernel
914 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
915 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
916 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
917 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
918   si sposta il problema dell'accesso dalla classificazione in base
919   all'identificatore alla classificazione in base alla chiave, una delle tante
920   complicazioni inutili presenti nel \textit{SysV IPC}.} Oltre la chiave, la
921 struttura, la cui definizione è riportata in fig.~\ref{fig:ipc_ipc_perm},
922 mantiene varie proprietà ed informazioni associate all'oggetto.
923
924 \begin{figure}[!htb]
925   \footnotesize \centering
926   \begin{minipage}[c]{\textwidth}
927     \includestruct{listati/ipc_perm.h}
928   \end{minipage} 
929   \normalsize 
930   \caption{La struttura \structd{ipc\_perm}, come definita in
931     \headfile{sys/ipc.h}.}
932   \label{fig:ipc_ipc_perm}
933 \end{figure}
934
935 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
936 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
937 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
938 sono \textsl{imparentati} la soluzione è relativamente semplice, in tal caso
939 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
940 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
941 disponibile in tutti i figli, e potrà essere passato come argomento attraverso
942 una \func{exec}.
943
944 Però quando i processi non sono \textsl{imparentati} (come capita tutte le
945 volte che si ha a che fare con un sistema client-server) tutto questo non è
946 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
947 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
948 alternativa più efficace è quella che i programmi usino un valore comune per
949 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
950 sempre il rischio che questa chiave possa essere stata già utilizzata da
951 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
952 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione
953 apposita, \funcd{ftok}, che permette di ottenere una chiave specificando il
954 nome di un file ed un numero di versione; il suo prototipo è:
955 \begin{functions}
956   \headdecl{sys/types.h} 
957   \headdecl{sys/ipc.h} 
958   
959   \funcdecl{key\_t ftok(const char *pathname, int proj\_id)}
960   
961   Restituisce una chiave per identificare un oggetto del \textit{SysV IPC}.
962   
963   \bodydesc{La funzione restituisce la chiave in caso di successo e -1
964     altrimenti, nel qual caso \var{errno} sarà uno dei possibili codici di
965     errore di \func{stat}.}
966 \end{functions}
967
968 La funzione determina un valore della chiave sulla base di \param{pathname},
969 che deve specificare il \textit{pathname} di un file effettivamente esistente
970 e di un numero di progetto \param{proj\_id)}, che di norma viene specificato
971 come carattere, dato che ne vengono utilizzati solo gli 8 bit meno
972 significativi.\footnote{nelle libc4 e libc5, come avviene in SunOS,
973   l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, la \acr{glibc}
974   usa il prototipo specificato da XPG4, ma vengono lo stesso utilizzati gli 8
975   bit meno significativi.}
976
977 Il problema è che anche così non c'è la sicurezza che il valore della chiave
978 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
979 con i 16 bit meno significativi \itindex{inode} dell'inode del file
980 \param{pathname} (che vengono ottenuti attraverso \func{stat}, da cui derivano
981 i possibili errori), e gli 8 bit meno significativi del numero del dispositivo
982 su cui è il file.  Diventa perciò relativamente facile ottenere delle
983 collisioni, specie se i file sono su dispositivi con lo stesso
984 \itindex{minor~number} \textit{minor number}, come \file{/dev/hda1} e
985 \file{/dev/sda1}.
986
987 In genere quello che si fa è utilizzare un file comune usato dai programmi che
988 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
989 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
990 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
991 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
992 bene in fase di creazione, le cose possono complicarsi per i programmi che
993 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
994 attributi di \struct{ipc\_perm}, non esiste una modalità semplice per essere
995 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
996 creato da chi ci si aspetta.
997
998 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
999 contatore di riferimenti per la cancellazione automatica, il principale
1000 problema del \textit{SysV IPC}. Non esiste infatti una modalità chiara per
1001 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
1002 file, e tutta l'interfaccia è inutilmente complessa.  Per questo ne è stata
1003 effettuata una revisione completa nello standard POSIX.1b, che tratteremo in
1004 sez.~\ref{sec:ipc_posix}.
1005
1006
1007 \subsection{Il controllo di accesso}
1008 \label{sec:ipc_sysv_access_control}
1009
1010 Oltre alle chiavi, abbiamo visto che ad ogni oggetto sono associate in
1011 \struct{ipc\_perm} ulteriori informazioni, come gli identificatori del creatore
1012 (nei campi \var{cuid} e \var{cgid}) e del proprietario (nei campi \var{uid} e
1013 \var{gid}) dello stesso, e un insieme di permessi (nel campo \var{mode}). In
1014 questo modo è possibile definire un controllo di accesso sugli oggetti di IPC,
1015 simile a quello che si ha per i file (vedi sez.~\ref{sec:file_perm_overview}).
1016
1017 Benché questo controllo di accesso sia molto simile a quello dei file, restano
1018 delle importanti differenze. La prima è che il permesso di esecuzione non
1019 esiste (e se specificato viene ignorato), per cui si può parlare solo di
1020 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
1021 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
1022 ed hanno lo stesso significato di quelli riportati in
1023 tab.~\ref{tab:file_mode_flags}\footnote{se però si vogliono usare le costanti
1024   simboliche ivi definite occorrerà includere il file \headfile{sys/stat.h},
1025   alcuni sistemi definiscono le costanti \const{MSG\_R} (\texttt{0400}) e
1026   \const{MSG\_W} (\texttt{0200}) per indicare i permessi base di lettura e
1027   scrittura per il proprietario, da utilizzare, con gli opportuni shift, pure
1028   per il gruppo e gli altri, in Linux, visto la loro scarsa utilità, queste
1029   costanti non sono definite.} e come per i file definiscono gli accessi per
1030 il proprietario, il suo gruppo e tutti gli altri.
1031
1032 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
1033 \struct{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono impostati
1034 rispettivamente al valore dell'\ids{UID} e del \ids{GID} effettivo del processo
1035 che ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
1036 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
1037
1038 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
1039 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
1040 specificano tutte un argomento \param{flag}, in tal caso quando viene
1041 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
1042 permessi, questi vengono controllati e l'identificatore viene restituito solo
1043 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
1044 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
1045 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
1046 nullo, nel qual caso l'identificatore sarà restituito comunque.
1047
1048 Il secondo livello di controllo è quello delle varie funzioni che accedono
1049 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
1050 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
1051 \begin{itemize*}
1052 \item se il processo ha i privilegi di amministratore l'accesso è sempre
1053   consentito. 
1054 \item se l'\ids{UID} effettivo del processo corrisponde o al valore del campo
1055   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
1056   in \var{mode} è appropriato\footnote{per appropriato si intende che è
1057     impostato il permesso di scrittura per le operazioni di scrittura e quello
1058     di lettura per le operazioni di lettura.} l'accesso è consentito.
1059 \item se il \ids{GID} effettivo del processo corrisponde o al
1060   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
1061   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
1062 \item se il permesso per gli altri è appropriato l'accesso è consentito.
1063 \end{itemize*}
1064 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
1065 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
1066 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
1067 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
1068 il valore di \itindex{umask} \textit{umask} (si ricordi quanto esposto in
1069 sez.~\ref{sec:file_perm_management}) non ha alcun significato.
1070
1071
1072 \subsection{Gli identificatori ed il loro utilizzo}
1073 \label{sec:ipc_sysv_id_use}
1074
1075 L'unico campo di \struct{ipc\_perm} del quale non abbiamo ancora parlato è
1076 \var{seq}, che in fig.~\ref{fig:ipc_ipc_perm} è qualificato con un criptico
1077 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
1078 strettamente attinente alle modalità con cui il kernel assegna gli
1079 identificatori degli oggetti del sistema di IPC.
1080
1081 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
1082 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
1083 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
1084 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
1085 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
1086 dimensioni (inferiori al numero massimo di oggetti disponibili).
1087
1088 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1089 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1090 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1091 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1092 relativo identificatore viene immediatamente assegnato a quelle di un altro
1093 server partito subito dopo, con la possibilità che i client del primo non
1094 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1095 con gli oggetti del secondo, con conseguenze imprevedibili.
1096
1097 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1098 \var{seq} per provvedere un meccanismo che porti gli identificatori ad
1099 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1100 un identificatore può venire riutilizzato.
1101
1102 Il sistema dispone sempre di un numero fisso di oggetti di IPC,\footnote{fino
1103   al kernel 2.2.x questi valori, definiti dalle costanti \const{MSGMNI},
1104   \const{SEMMNI} e \const{SHMMNI}, potevano essere cambiati (come tutti gli
1105   altri limiti relativi al \textit{SysV IPC}) solo con una ricompilazione del
1106   kernel, andando a modificarne la definizione nei relativi header file.  A
1107   partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1108   scrivendo sui file \sysctlrelfile{kernel}{shmmni},
1109   \sysctlrelfile{kernel}{msgmni} e \sysctlrelfile{kernel}{sem}
1110   di \file{/proc/sys/kernel} o con l'uso di \func{sysctl}.} e per ciascuno di
1111 essi viene mantenuto in \var{seq} un numero di sequenza progressivo che viene
1112 incrementato di uno ogni volta che l'oggetto viene cancellato. Quando
1113 l'oggetto viene creato usando uno spazio che era già stato utilizzato in
1114 precedenza per restituire l'identificatore al numero di oggetti presenti viene
1115 sommato il valore di \var{seq} moltiplicato per il numero massimo di oggetti
1116 di quel tipo,\footnote{questo vale fino ai kernel della serie 2.2.x, dalla
1117   serie 2.4.x viene usato lo stesso fattore per tutti gli oggetti, esso è dato
1118   dalla costante \const{IPCMNI}, definita in \file{include/linux/ipc.h}, che
1119   indica il limite massimo per il numero di tutti oggetti di IPC, ed il cui
1120   valore è 32768.}  si evita così il riutilizzo degli stessi numeri, e si fa
1121 sì che l'identificatore assuma tutti i valori possibili.
1122
1123 \begin{figure}[!htbp]
1124   \footnotesize \centering
1125   \begin{minipage}[c]{\codesamplewidth}
1126     \includecodesample{listati/IPCTestId.c}
1127   \end{minipage} 
1128   \normalsize 
1129   \caption{Sezione principale del programma di test per l'assegnazione degli
1130     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1131   \label{fig:ipc_sysv_idtest}
1132 \end{figure}
1133
1134 In fig.~\ref{fig:ipc_sysv_idtest} è riportato il codice di un semplice
1135 programma di test che si limita a creare un oggetto (specificato a riga di
1136 comando), stamparne il numero di identificatore e cancellarlo per un numero
1137 specificato di volte. Al solito non si è riportato il codice della gestione
1138 delle opzioni a riga di comando, che permette di specificare quante volte
1139 effettuare il ciclo \var{n}, e su quale tipo di oggetto eseguirlo.
1140
1141 La figura non riporta il codice di selezione delle opzioni, che permette di
1142 inizializzare i valori delle variabili \var{type} al tipo di oggetto voluto, e
1143 \var{n} al numero di volte che si vuole effettuare il ciclo di creazione,
1144 stampa, cancellazione. I valori di default sono per l'uso delle code di
1145 messaggi e un ciclo di 5 volte. Se si lancia il comando si otterrà qualcosa
1146 del tipo:
1147 \begin{Verbatim}
1148 piccardi@gont sources]$ ./ipctestid
1149 Identifier Value 0 
1150 Identifier Value 32768 
1151 Identifier Value 65536 
1152 Identifier Value 98304 
1153 Identifier Value 131072 
1154 \end{Verbatim}
1155 %$
1156 il che ci mostra che abbiamo un kernel della serie 2.4.x nel quale non avevamo
1157 ancora usato nessuna coda di messaggi. Se ripetiamo il comando otterremo
1158 ancora:
1159 \begin{Verbatim}
1160 [piccardi@gont sources]$ ./ipctestid
1161 Identifier Value 163840 
1162 Identifier Value 196608 
1163 Identifier Value 229376 
1164 Identifier Value 262144 
1165 Identifier Value 294912 
1166 \end{Verbatim}
1167 %$
1168 che ci mostra come il valore di \var{seq} sia in effetti una quantità
1169 mantenuta staticamente all'interno del sistema.
1170
1171
1172 \subsection{Code di messaggi}
1173 \label{sec:ipc_sysv_mq}
1174
1175 Il primo oggetto introdotto dal \textit{SysV IPC} è quello delle code di
1176 messaggi.  Le code di messaggi sono oggetti analoghi alle pipe o alle fifo,
1177 anche se la loro struttura è diversa, ed il loro scopo principale è appunto
1178 quello di permettere a processi diversi di scambiarsi dei dati.
1179
1180 La funzione che permette di richiedere al sistema l'identificatore di una coda
1181 di messaggi esistente (o di crearne una se questa non esiste) è
1182 \funcd{msgget}; il suo prototipo è:
1183 \begin{functions}
1184   \headdecl{sys/types.h} 
1185   \headdecl{sys/ipc.h} 
1186   \headdecl{sys/msg.h} 
1187   
1188   \funcdecl{int msgget(key\_t key, int flag)}
1189   
1190   Restituisce l'identificatore di una coda di messaggi.
1191   
1192   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1193     in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1194   \begin{errlist}
1195   \item[\errcode{EACCES}] il processo chiamante non ha i privilegi per accedere
1196   alla coda richiesta.  
1197   \item[\errcode{EEXIST}] si è richiesta la creazione di una coda che già
1198   esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}. 
1199   \item[\errcode{EIDRM}] la coda richiesta è marcata per essere cancellata.
1200   \item[\errcode{ENOENT}] si è cercato di ottenere l'identificatore di una coda
1201     di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1202     non era specificato.
1203   \item[\errcode{ENOSPC}] si è cercato di creare una coda di messaggi quando è
1204     stato superato il limite massimo di code (\const{MSGMNI}).
1205   \end{errlist}
1206   ed inoltre \errval{ENOMEM}.
1207 }
1208 \end{functions}
1209
1210 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1211 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1212 nuova. L'argomento \param{key} specifica la chiave che è associata
1213 all'oggetto, eccetto il caso in cui si specifichi il valore
1214 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1215 associata alcuna chiave, il processo (ed i suoi eventuali figli) potranno
1216 farvi riferimento solo attraverso l'identificatore.
1217
1218 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE}\footnote{in
1219   Linux questo significa un valore diverso da zero.} l'effetto della funzione
1220 dipende dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1221 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1222 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1223 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1224 validi.
1225
1226 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1227 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1228 corrispondente al valore \const{IPC\_CREAT}. In questo caso i nove bit meno
1229 significativi di \param{flag} saranno usati come permessi per il nuovo
1230 oggetto, secondo quanto illustrato in sez.~\ref{sec:ipc_sysv_access_control}.
1231 Se si imposta anche il bit corrispondente a \const{IPC\_EXCL} la funzione avrà
1232 successo solo se l'oggetto non esiste già, fallendo con un errore di
1233 \errcode{EEXIST} altrimenti.
1234
1235 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1236 processi di accedere alla coda (se hanno privilegi sufficienti) una volta che
1237 questi possano indovinare o ricavare (ad esempio per tentativi)
1238 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1239 IPC infatti non esiste una maniera che  garantisca l'accesso esclusivo ad una
1240 coda di messaggi.  Usare \const{IPC\_PRIVATE} o const{IPC\_CREAT} e
1241 \const{IPC\_EXCL} per \param{flag} comporta solo la creazione di una nuova
1242 coda.
1243
1244 \begin{table}[htb]
1245   \footnotesize
1246   \centering
1247   \begin{tabular}[c]{|c|r|l|l|}
1248     \hline
1249     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
1250     & \textbf{Significato} \\
1251     \hline
1252     \hline
1253     \const{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1254                                           messaggi.\\
1255     \const{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1256                                           messaggio.\\
1257     \const{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di 
1258                                           una coda.\\
1259     \hline
1260   \end{tabular}
1261   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1262   \label{tab:ipc_msg_limits}
1263 \end{table}
1264
1265 Le code di messaggi sono caratterizzate da tre limiti fondamentali, definiti
1266 negli header e corrispondenti alle prime tre costanti riportate in
1267 tab.~\ref{tab:ipc_msg_limits}, come accennato però in Linux è possibile
1268 modificare questi limiti attraverso l'uso di \func{sysctl} o scrivendo nei
1269 file \sysctlrelfile{kernel}{msgmax},
1270 \sysctlrelfile{kernel}{msgmnb} e
1271 \sysctlrelfile{kernel}{msgmni} di \file{/proc/sys/kernel/}.
1272
1273 \begin{figure}[!htb]
1274   \centering \includegraphics[width=13cm]{img/mqstruct}
1275   \caption{Schema della struttura di una coda messaggi.}
1276   \label{fig:ipc_mq_schema}
1277 \end{figure}
1278
1279
1280 Una coda di messaggi è costituita da una \itindex{linked~list} \textit{linked
1281   list};\footnote{una \itindex{linked~list} \textit{linked list} è una tipica
1282   struttura di dati, organizzati in una lista in cui ciascun elemento contiene
1283   un puntatore al successivo. In questo modo la struttura è veloce
1284   nell'estrazione ed immissione dei dati dalle estremità dalla lista (basta
1285   aggiungere un elemento in testa o in coda ed aggiornare un puntatore), e
1286   relativamente veloce da attraversare in ordine sequenziale (seguendo i
1287   puntatori), è invece relativamente lenta nell'accesso casuale e nella
1288   ricerca.}  i nuovi messaggi vengono inseriti in coda alla lista e vengono
1289 letti dalla cima, in fig.~\ref{fig:ipc_mq_schema} si è riportato lo schema con
1290 cui queste strutture vengono mantenute dal kernel.\footnote{lo schema
1291   illustrato in fig.~\ref{fig:ipc_mq_schema} è in realtà una semplificazione
1292   di quello usato effettivamente fino ai kernel della serie 2.2.x, nei kernel
1293   della serie 2.4.x la gestione delle code di messaggi è stata modificata ed è
1294   effettuata in maniera diversa; abbiamo mantenuto lo schema precedente in
1295   quanto illustra comunque in maniera più che adeguata i principi di
1296   funzionamento delle code di messaggi.}
1297
1298 \begin{figure}[!htb]
1299   \footnotesize \centering
1300   \begin{minipage}[c]{\textwidth}
1301     \includestruct{listati/msqid_ds.h}
1302   \end{minipage} 
1303   \normalsize 
1304   \caption{La struttura \structd{msqid\_ds}, associata a ciascuna coda di
1305     messaggi.}
1306   \label{fig:ipc_msqid_ds}
1307 \end{figure}
1308
1309 A ciascuna coda è associata una struttura \struct{msqid\_ds}, la cui
1310 definizione, è riportata in fig.~\ref{fig:ipc_msqid_ds}. In questa struttura
1311 il kernel mantiene le principali informazioni riguardo lo stato corrente della
1312 coda.\footnote{come accennato questo vale fino ai kernel della serie 2.2.x,
1313   essa viene usata nei kernel della serie 2.4.x solo per compatibilità in
1314   quanto è quella restituita dalle funzioni dell'interfaccia.  Si noti come ci
1315   sia una differenza con i campi mostrati nello schema di
1316   fig.~\ref{fig:ipc_mq_schema} che sono presi dalla definizione di
1317   \file{include/linux/msg.h}, e fanno riferimento alla definizione della
1318   omonima struttura usata nel kernel.} In fig.~\ref{fig:ipc_msqid_ds} sono
1319 elencati i campi significativi definiti in \headfile{sys/msg.h}, a cui si sono
1320 aggiunti gli ultimi tre campi che sono previsti dalla implementazione
1321 originale di System V, ma non dallo standard Unix98.
1322
1323 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1324 inizializzata, in particolare il campo \var{msg\_perm} viene inizializzato
1325 come illustrato in sez.~\ref{sec:ipc_sysv_access_control}, per quanto riguarda
1326 gli altri campi invece:
1327 \begin{itemize*}
1328 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1329   sulla coda, viene inizializzato a 0.
1330 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1331   rispettivamente il \ids{PID} dell'ultimo processo che ha inviato o ricevuto
1332   un messaggio sulla coda, sono inizializzati a 0.
1333 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1334   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1335   messaggio sulla coda, sono inizializzati a 0.
1336 \item il campo \var{msg\_ctime}, che esprime il tempo di creazione della coda,
1337   viene inizializzato al tempo corrente.
1338 \item il campo \var{msg\_qbytes} che esprime la dimensione massima del
1339   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1340   del sistema (\const{MSGMNB}).
1341 \item i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1342   primo e ultimo messaggio sono inizializzati a \val{NULL} e
1343   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1344   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1345   e non devono essere utilizzati da programmi in user space).
1346 \end{itemize*}
1347
1348 Una volta creata una coda di messaggi le operazioni di controllo vengono
1349 effettuate con la funzione \funcd{msgctl}, che (come le analoghe \func{semctl}
1350 e \func{shmctl}) fa le veci di quello che \func{ioctl} è per i file; il suo
1351 prototipo è:
1352 \begin{functions}
1353   \headdecl{sys/types.h} 
1354   \headdecl{sys/ipc.h} 
1355   \headdecl{sys/msg.h} 
1356   
1357   \funcdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1358   
1359   Esegue l'operazione specificata da \param{cmd} sulla coda \param{msqid}.
1360   
1361   \bodydesc{La funzione restituisce 0 in caso di successo o $-1$ in caso di
1362     errore, nel qual caso \var{errno} assumerà uno dei valori:
1363   \begin{errlist}
1364   \item[\errcode{EACCES}] si è richiesto \const{IPC\_STAT} ma processo
1365     chiamante non ha i privilegi di lettura sulla coda.
1366   \item[\errcode{EIDRM}] la coda richiesta è stata cancellata.
1367   \item[\errcode{EPERM}] si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1368     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1369     \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1370     amministratore.
1371   \end{errlist}
1372   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1373 }
1374 \end{functions}
1375
1376 La funzione permette di accedere ai valori della struttura \struct{msqid\_ds},
1377 mantenuta all'indirizzo \param{buf}, per la coda specificata
1378 dall'identificatore \param{msqid}. Il comportamento della funzione dipende dal
1379 valore dell'argomento \param{cmd}, che specifica il tipo di azione da
1380 eseguire; i valori possibili sono:
1381 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1382 \item[\const{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1383   struttura indicata da \param{buf}. Occorre avere il permesso di lettura
1384   sulla coda.
1385 \item[\const{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1386   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1387   riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1388   funzioni di lettura o di scrittura sulla coda saranno svegliati ricevendo
1389   il medesimo errore. Questo comando può essere eseguito solo da un processo
1390   con \ids{UID} effettivo corrispondente al creatore o al proprietario della
1391   coda, o all'amministratore.
1392 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1393   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1394   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1395   struttura \struct{msqid\_ds} puntata da \param{buf}.  Per modificare i valori
1396   di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid} occorre
1397   essere il proprietario o il creatore della coda, oppure l'amministratore; lo
1398   stesso vale per \var{msg\_qbytes}, ma l'amministratore ha la facoltà di
1399   incrementarne il valore a limiti superiori a \const{MSGMNB}.
1400 \end{basedescript}
1401
1402
1403 Una volta che si abbia a disposizione l'identificatore, per inviare un
1404 messaggio su una coda si utilizza la funzione \funcd{msgsnd}; il suo prototipo
1405 è:
1406 \begin{functions}
1407   \headdecl{sys/types.h} 
1408   \headdecl{sys/ipc.h} 
1409   \headdecl{sys/msg.h} 
1410   
1411   \funcdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int
1412     msgflg)} 
1413
1414   Invia un messaggio sulla coda \param{msqid}.
1415   
1416   \bodydesc{La funzione restituisce 0, e $-1$ in caso di errore, nel qual caso
1417     \var{errno} assumerà uno dei valori:
1418   \begin{errlist}
1419   \item[\errcode{EACCES}] non si hanno i privilegi di accesso sulla coda.
1420   \item[\errcode{EIDRM}] la coda è stata cancellata.
1421   \item[\errcode{EAGAIN}] il messaggio non può essere inviato perché si è
1422   superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1423   sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1424   \item[\errcode{EINVAL}] si è specificato un \param{msgid} invalido, o un
1425     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1426     maggiore di \const{MSGMAX}.
1427   \end{errlist}
1428   ed inoltre \errval{EFAULT}, \errval{EINTR} ed \errval{ENOMEM}.  }
1429 \end{functions}
1430
1431 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1432 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1433 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1434 puntatore ad una struttura \struct{msgbuf} analoga a quella riportata in
1435 fig.~\ref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1436 messaggio.  La dimensione massima per il testo di un messaggio non può
1437 comunque superare il limite \const{MSGMAX}.
1438
1439 La struttura di fig.~\ref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1440 la definizione contenuta in \headfile{sys/msg.h} usa esplicitamente per il
1441 secondo campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini
1442 pratici.  La sola cosa che conta è che la struttura abbia come primo membro un
1443 campo \var{mtype} come nell'esempio; esso infatti serve ad identificare il
1444 tipo di messaggio e deve essere sempre specificato come intero positivo di
1445 tipo \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1446 dimensione, e serve a contenere il testo del messaggio.
1447
1448 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1449 ridefinire una struttura simile a quella di fig.~\ref{fig:ipc_msbuf}, adattando
1450 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1451 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1452 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1453 indica il tipo.
1454
1455 Si tenga presente che la lunghezza che deve essere indicata in questo
1456 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1457 cioè \var{message} è una propria struttura che si passa alla funzione,
1458 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1459 consideriamo il caso dell'esempio in fig.~\ref{fig:ipc_msbuf}, \param{msgsz}
1460 dovrà essere pari a \const{LENGTH}).
1461
1462 \begin{figure}[!htb]
1463   \footnotesize \centering
1464   \begin{minipage}[c]{\textwidth}
1465     \includestruct{listati/msgbuf.h}
1466   \end{minipage} 
1467   \normalsize 
1468   \caption{Schema della struttura \structd{msgbuf}, da utilizzare come
1469     argomento per inviare/ricevere messaggi.}
1470   \label{fig:ipc_msbuf}
1471 \end{figure}
1472
1473 Per capire meglio il funzionamento della funzione riprendiamo in
1474 considerazione la struttura della coda illustrata in
1475 fig.~\ref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1476 sarà aggiunto in fondo alla lista inserendo una nuova struttura \struct{msg},
1477 il puntatore \var{msg\_last} di \struct{msqid\_ds} verrà aggiornato, come pure
1478 il puntatore al messaggio successivo per quello che era il precedente ultimo
1479 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1480 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1481 all'indirizzo specificato da \var{msg\_spot}.
1482
1483 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1484 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1485 ritorna immediatamente a meno che si sia ecceduto il valore di
1486 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1487 caso si blocca mandando il processo in stato di \textit{sleep}.  Se si
1488 specifica per \param{flag} il valore \const{IPC\_NOWAIT} la funzione opera in
1489 modalità non bloccante, ed in questi casi ritorna immediatamente con un errore
1490 di \errcode{EAGAIN}.
1491
1492 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1493 che non si liberano risorse sufficienti per poter inserire nella coda il
1494 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare, con
1495 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1496 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1497 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1498
1499 Una volta completato con successo l'invio del messaggio sulla coda, la
1500 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1501 vengono modificati:
1502 \begin{itemize*}
1503 \item Il valore di \var{msg\_lspid}, che viene impostato al \ids{PID} del
1504   processo chiamante.
1505 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1506 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1507 \end{itemize*}
1508
1509 La funzione che viene utilizzata per estrarre un messaggio da una coda è
1510 \funcd{msgrcv}; il suo prototipo è:
1511 \begin{functions}
1512   \headdecl{sys/types.h} 
1513   \headdecl{sys/ipc.h} 
1514   \headdecl{sys/msg.h} 
1515
1516   \funcdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1517     long msgtyp, int msgflg)}
1518   
1519   Legge un messaggio dalla coda \param{msqid}.
1520   
1521   \bodydesc{La funzione restituisce il numero di byte letti in caso di
1522     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà uno
1523     dei valori:
1524   \begin{errlist}
1525   \item[\errcode{EACCES}] non si hanno i privilegi di accesso sulla coda.
1526   \item[\errcode{EIDRM}] la coda è stata cancellata.
1527   \item[\errcode{E2BIG}] il testo del messaggio è più lungo di \param{msgsz} e
1528     non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1529   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale mentre
1530     era in attesa di ricevere un messaggio.
1531   \item[\errcode{EINVAL}] si è specificato un \param{msgid} invalido o un
1532     valore di \param{msgsz} negativo.
1533   \end{errlist}
1534   ed inoltre \errval{EFAULT}.
1535 }
1536 \end{functions}
1537
1538 La funzione legge un messaggio dalla coda specificata, scrivendolo sulla
1539 struttura puntata da \param{msgp}, che dovrà avere un formato analogo a quello
1540 di fig.~\ref{fig:ipc_msbuf}.  Una volta estratto, il messaggio sarà rimosso
1541 dalla coda.  L'argomento \param{msgsz} indica la lunghezza massima del testo
1542 del messaggio (equivalente al valore del parametro \const{LENGTH} nell'esempio
1543 di fig.~\ref{fig:ipc_msbuf}).
1544
1545 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1546 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1547 \const{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1548 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1549 un errore di \errcode{E2BIG}.
1550
1551 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1552 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1553 una scansione della struttura mostrata in fig.~\ref{fig:ipc_mq_schema},
1554 restituendo il primo messaggio incontrato che corrisponde ai criteri
1555 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1556 coda, è quello meno recente); in particolare:
1557 \begin{itemize}
1558 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1559   quello fra i presenti che è stato inserito per primo. 
1560 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1561   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1562   \param{msgtyp}.
1563 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1564   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1565   inferiore al valore assoluto di \param{msgtyp}.
1566 \end{itemize}
1567
1568 Il valore di \param{msgflg} permette di controllare il comportamento della
1569 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1570 valori.  Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1571 valori: \const{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1572 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1573 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1574 ci sono messaggi sulla coda.
1575
1576 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1577 disponibili per la lettura, è di bloccare il processo in stato di
1578 \textit{sleep}. Nel caso però si sia specificato \const{IPC\_NOWAIT} la
1579 funzione ritorna immediatamente con un errore \errcode{ENOMSG}. Altrimenti la
1580 funzione ritorna normalmente non appena viene inserito un messaggio del tipo
1581 desiderato, oppure ritorna con errore qualora la coda sia rimossa (con
1582 \var{errno} impostata a \errcode{EIDRM}) o se il processo viene interrotto da
1583 un segnale (con \var{errno} impostata a \errcode{EINTR}).
1584
1585 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1586 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1587 vengono modificati:
1588 \begin{itemize*}
1589 \item Il valore di \var{msg\_lrpid}, che viene impostato al \ids{PID} del
1590   processo chiamante.
1591 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1592 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1593 \end{itemize*}
1594
1595 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1596 SysV IPC; essendo questi permanenti restano nel sistema occupando risorse
1597 anche quando un processo è terminato, al contrario delle pipe per le quali
1598 tutte le risorse occupate vengono rilasciate quanto l'ultimo processo che le
1599 utilizzava termina. Questo comporta che in caso di errori si può saturare il
1600 sistema, e che devono comunque essere esplicitamente previste delle funzioni
1601 di rimozione in caso di interruzioni o uscite dal programma (come vedremo in
1602 fig.~\ref{fig:ipc_mq_fortune_server}).
1603
1604 L'altro problema è non facendo uso di file descriptor le tecniche di
1605 \textit{I/O multiplexing} descritte in sez.~\ref{sec:file_multiplexing} non
1606 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1607 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1608 una di queste strutture alla volta; ad esempio non si può scrivere un server
1609 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1610 di \itindex{polling} \textit{polling} che esegua un ciclo di attesa su
1611 ciascuna di esse.
1612
1613 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1614 server di \textit{fortunes} usando queste al posto delle fifo. In questo caso
1615 useremo una sola coda di messaggi, usando il tipo di messaggio per comunicare
1616 in maniera indipendente con client diversi.
1617
1618 \begin{figure}[!htbp]
1619   \footnotesize \centering
1620   \begin{minipage}[c]{\codesamplewidth}
1621     \includecodesample{listati/MQFortuneServer.c}
1622   \end{minipage} 
1623   \normalsize 
1624   \caption{Sezione principale del codice del server di \textit{fortunes}
1625     basato sulle \textit{message queue}.}
1626   \label{fig:ipc_mq_fortune_server}
1627 \end{figure}
1628
1629 In fig.~\ref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1630 principali del codice del nuovo server (il codice completo è nel file
1631 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1632 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1633 per permettere una comunicazione indipendente fra il server ed i vari client,
1634 usando il \ids{PID} di questi ultimi come identificativo. Questo è possibile
1635 in quanto, al contrario di una fifo, la lettura di una coda di messaggi può
1636 non essere sequenziale, proprio grazie alla classificazione dei messaggi sulla
1637 base del loro tipo.
1638
1639 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1640 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1641 definisce due strutture appositamente per la comunicazione; con
1642 \var{msgbuf\_read} (\texttt{\small 8--11}) vengono passate le richieste mentre
1643 con \var{msgbuf\_write} (\texttt{\small 12--15}) vengono restituite le frasi.
1644
1645 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1646 in \var{n} il numero di frasi da leggere specificato a linea di comando ed in
1647 \var{fortunefilename} il file da cui leggerle; dopo aver installato
1648 (\texttt{\small 19--21}) i gestori dei segnali per trattare l'uscita dal
1649 server, viene prima controllato (\texttt{\small 22}) il numero di frasi
1650 richieste abbia senso (cioè sia maggiore di zero), le quali poi
1651 (\texttt{\small 23}) vengono lette nel vettore in memoria con la stessa
1652 funzione \code{FortuneParse} usata anche per il server basato sulle fifo.
1653
1654 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1655 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1656 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1657 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1658 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1659 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1660 programma (\texttt{\small 27--29}) in caso di errore.
1661
1662 Finita la fase di inizializzazione il server prima (\texttt{\small 32}) chiama
1663 la funzione \func{daemon} per andare in background e poi esegue in permanenza
1664 il ciclo principale (\texttt{\small 33--40}). Questo inizia (\texttt{\small
1665   34}) con il porsi in attesa di un messaggio di richiesta da parte di un
1666 client; si noti infatti come \func{msgrcv} richieda un messaggio con
1667 \var{mtype} uguale a 1: questo è il valore usato per le richieste dato che
1668 corrisponde al \ids{PID} di \cmd{init}, che non può essere un client. L'uso
1669 del flag \const{MSG\_NOERROR} è solo per sicurezza, dato che i messaggi di
1670 richiesta sono di dimensione fissa (e contengono solo il \ids{PID} del
1671 client).
1672
1673 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1674 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1675 di richiesta da parte di un client, in tal caso il ciclo prosegue
1676 (\texttt{\small 35}) selezionando una frase a caso, copiandola (\texttt{\small
1677   36}) nella struttura \var{msgbuf\_write} usata per la risposta e
1678 calcolandone (\texttt{\small 37}) la dimensione.
1679
1680 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1681 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 38})
1682 al valore del \ids{PID} del client ricevuto nel messaggio di richiesta.
1683 L'ultimo passo del ciclo (\texttt{\small 39}) è inviare sulla coda il
1684 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1685 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1686
1687 Si noti che il programma può terminare solo grazie ad una interruzione da
1688 parte di un segnale; in tal caso verrà eseguito (\texttt{\small 45--48}) il
1689 gestore \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1690 (\texttt{\small 46}) ed ad uscire (\texttt{\small 47}).
1691
1692 \begin{figure}[!htbp]
1693   \footnotesize \centering
1694   \begin{minipage}[c]{\codesamplewidth}
1695     \includecodesample{listati/MQFortuneClient.c}
1696   \end{minipage} 
1697   \normalsize 
1698   \caption{Sezione principale del codice del client di \textit{fortunes}
1699     basato sulle \textit{message queue}.}
1700   \label{fig:ipc_mq_fortune_client}
1701 \end{figure}
1702
1703 In fig.~\ref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice
1704 del programma client.  Al solito il codice completo è con i sorgenti allegati,
1705 nel file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti
1706 relative alla gestione delle opzioni, ed in questo caso, anche la
1707 dichiarazione delle variabili, che, per la parte relative alle strutture usate
1708 per la comunicazione tramite le code, sono le stesse viste in
1709 fig.~\ref{fig:ipc_mq_fortune_server}.
1710
1711 Il client in questo caso è molto semplice; la prima parte del programma
1712 (\texttt{\small 4--9}) si occupa di accedere alla coda di messaggi, ed è
1713 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1714 non viene chiamata con il flag di creazione in quanto la coda deve essere
1715 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1716 il programma termina immediatamente. 
1717
1718 Una volta acquisito l'identificatore della coda il client compone il
1719 messaggio di richiesta (\texttt{\small 12--13}) in \var{msg\_read}, usando 1
1720 per il tipo ed inserendo il proprio \ids{PID} come dato da passare al server.
1721 Calcolata (\texttt{\small 14}) la dimensione, provvede (\texttt{\small 15}) ad
1722 immettere la richiesta sulla coda. 
1723
1724 A questo punto non resta che (\texttt{\small 16}) rileggere dalla coda la
1725 risposta del server richiedendo a \func{msgrcv} di selezionare i messaggi di
1726 tipo corrispondente al valore del \ids{PID} inviato nella richiesta. L'ultimo
1727 passo (\texttt{\small 17}) prima di uscire è quello di stampare a video il
1728 messaggio ricevuto.
1729  
1730 Proviamo allora il nostro nuovo sistema, al solito occorre definire
1731 \code{LD\_LIBRARY\_PATH} per accedere alla libreria \file{libgapil.so}, dopo di
1732 che, in maniera del tutto analoga a quanto fatto con il programma che usa le
1733 fifo, potremo far partire il server con:
1734 \begin{verbatim}
1735 [piccardi@gont sources]$ ./mqfortuned -n10
1736 \end{verbatim}%$
1737 come nel caso precedente, avendo eseguito il server in background, il comando
1738 ritornerà immediatamente; potremo però verificare con \cmd{ps} che il
1739 programma è effettivamente in esecuzione, e che ha creato una coda di
1740 messaggi:
1741 \begin{verbatim}
1742 [piccardi@gont sources]$ ipcs
1743
1744 ------ Shared Memory Segments --------
1745 key        shmid      owner      perms      bytes      nattch     status      
1746
1747 ------ Semaphore Arrays --------
1748 key        semid      owner      perms      nsems     
1749
1750 ------ Message Queues --------
1751 key        msqid      owner      perms      used-bytes   messages    
1752 0x0102dc6a 0          piccardi   666        0            0           
1753 \end{verbatim}
1754 a questo punto potremo usare il client per ottenere le nostre frasi:
1755 \begin{verbatim}
1756 [piccardi@gont sources]$ ./mqfortune
1757 Linux ext2fs has been stable for a long time, now it's time to break it
1758         -- Linuxkongreß '95 in Berlin
1759 [piccardi@gont sources]$ ./mqfortune
1760 Let's call it an accidental feature.
1761         --Larry Wall
1762 \end{verbatim}
1763 con un risultato del tutto equivalente al precedente. Infine potremo chiudere
1764 il server inviando il segnale di terminazione con il comando \code{killall
1765   mqfortuned} verificando che effettivamente la coda di messaggi viene rimossa.
1766
1767 Benché funzionante questa architettura risente dello stesso inconveniente
1768 visto anche nel caso del precedente server basato sulle fifo; se il client
1769 viene interrotto dopo l'invio del messaggio di richiesta e prima della lettura
1770 della risposta, quest'ultima resta nella coda (così come per le fifo si aveva
1771 il problema delle fifo che restavano nel filesystem). In questo caso però il
1772 problemi sono maggiori, sia perché è molto più facile esaurire la memoria
1773 dedicata ad una coda di messaggi che gli \itindex{inode} inode di un filesystem,
1774 sia perché, con il riutilizzo dei \ids{PID} da parte dei processi, un client
1775 eseguito in un momento successivo potrebbe ricevere un messaggio non
1776 indirizzato a lui.
1777
1778
1779
1780 \subsection{Semafori}
1781 \label{sec:ipc_sysv_sem}
1782
1783 I semafori non sono meccanismi di intercomunicazione diretta come quelli
1784 (pipe, fifo e code di messaggi) visti finora, e non consentono di scambiare
1785 dati fra processi, ma servono piuttosto come meccanismi di sincronizzazione o
1786 di protezione per le \index{sezione~critica} \textsl{sezioni critiche} del
1787 codice (si ricordi quanto detto in sez.~\ref{sec:proc_race_cond}).
1788
1789 Un semaforo è uno speciale contatore, mantenuto nel kernel, che permette, a
1790 seconda del suo valore, di consentire o meno la prosecuzione dell'esecuzione
1791 di un programma. In questo modo l'accesso ad una risorsa condivisa da più
1792 processi può essere controllato, associando ad essa un semaforo che consente
1793 di assicurare che non più di un processo alla volta possa usarla.
1794
1795 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1796 assolutamente generico, così come del tutto generali sono modalità con cui lo
1797 si utilizza. Un processo che deve accedere ad una risorsa eseguirà un
1798 controllo del semaforo: se questo è positivo il suo valore sarà decrementato,
1799 indicando che si è consumato una unità della risorsa, ed il processo potrà
1800 proseguire nell'utilizzo di quest'ultima, provvedendo a rilasciarla, una volta
1801 completate le operazioni volute, reincrementando il semaforo.
1802
1803 Se al momento del controllo il valore del semaforo è nullo, siamo invece in
1804 una situazione in cui la risorsa non è disponibile, ed il processo si
1805 bloccherà in stato di \textit{sleep} fin quando chi la sta utilizzando non la
1806 rilascerà, incrementando il valore del semaforo. Non appena il semaforo torna
1807 positivo, indicando che la risorsa è disponibile, il processo sarà svegliato,
1808 e si potrà operare come nel caso precedente (decremento del semaforo, accesso
1809 alla risorsa, incremento del semaforo).
1810
1811 Per poter implementare questo tipo di logica le operazioni di controllo e
1812 decremento del contatore associato al semaforo devono essere atomiche,
1813 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1814 demandata al kernel. La forma più semplice di semaforo è quella del
1815 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1816 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1817 della risorsa. In generale però si possono usare semafori con valori interi,
1818 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1819 ancora disponibili.
1820
1821 Il sistema di comunicazione inter-processo di \textit{SysV IPC} prevede anche i
1822 semafori, ma gli oggetti utilizzati non sono semafori singoli, ma gruppi di
1823 semafori detti \textsl{insiemi} (o \textit{semaphore set}); la funzione che
1824 permette di creare o ottenere l'identificatore di un insieme di semafori è
1825 \funcd{semget}, ed il suo prototipo è:
1826 \begin{functions}
1827   \headdecl{sys/types.h} 
1828   \headdecl{sys/ipc.h} 
1829   \headdecl{sys/sem.h} 
1830   
1831   \funcdecl{int semget(key\_t key, int nsems, int flag)}
1832   
1833   Restituisce l'identificatore di un insieme di semafori.
1834   
1835   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1836     in caso di errore, nel qual caso \var{errno} assumerà i valori:
1837     \begin{errlist}
1838     \item[\errcode{ENOSPC}] si è cercato di creare una insieme di semafori
1839       quando è stato superato o il limite per il numero totale di semafori
1840       (\const{SEMMNS}) o quello per il numero totale degli insiemi
1841       (\const{SEMMNI}) nel sistema.
1842     \item[\errcode{EINVAL}] l'argomento \param{nsems} è minore di zero o
1843       maggiore del limite sul numero di semafori per ciascun insieme
1844       (\const{SEMMSL}), o se l'insieme già esiste, maggiore del numero di
1845       semafori che contiene.
1846     \item[\errcode{ENOMEM}] il sistema non ha abbastanza memoria per poter
1847       contenere le strutture per un nuovo insieme di semafori.
1848     \end{errlist}
1849     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
1850     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
1851 \end{functions}
1852
1853 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1854 restituisce l'identificatore di un insieme di semafori, in particolare è
1855 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1856 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
1857 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1858 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1859 richiesta dell'identificatore di un insieme già esistente.
1860
1861 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1862 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1863 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1864 complicazione inutile, il problema è che i semafori del \textit{SysV IPC}
1865 soffrono di altri due, ben più gravi, difetti.
1866
1867 Il primo difetto è che non esiste una funzione che permetta di creare ed
1868 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1869 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1870 perde così ogni possibilità di eseguire l'operazione atomicamente.
1871
1872 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1873 \textit{SysV IPC} di essere risorse globali di sistema, che non vengono
1874 cancellate quando nessuno le usa più; ci si così a trova a dover affrontare
1875 esplicitamente il caso in cui un processo termina per un qualche errore,
1876 lasciando un semaforo occupato, che resterà tale fino al successivo riavvio
1877 del sistema. Come vedremo esistono delle modalità per evitare tutto ciò, ma
1878 diventa necessario indicare esplicitamente che si vuole il ripristino del
1879 semaforo all'uscita del processo.
1880
1881 \begin{figure}[!htb]
1882   \footnotesize \centering
1883   \begin{minipage}[c]{\textwidth}
1884     \includestruct{listati/semid_ds.h}
1885   \end{minipage} 
1886   \normalsize 
1887   \caption{La struttura \structd{semid\_ds}, associata a ciascun insieme di
1888     semafori.}
1889   \label{fig:ipc_semid_ds}
1890 \end{figure}
1891
1892 A ciascun insieme di semafori è associata una struttura \struct{semid\_ds},
1893 riportata in fig.~\ref{fig:ipc_semid_ds}.\footnote{non si sono riportati i
1894   campi ad uso interno del kernel, che vedremo in
1895   fig.~\ref{fig:ipc_sem_schema}, che dipendono dall'implementazione.} Come nel
1896 caso delle code di messaggi quando si crea un nuovo insieme di semafori con
1897 \func{semget} questa struttura viene inizializzata, in particolare il campo
1898 \var{sem\_perm} viene inizializzato come illustrato in
1899 sez.~\ref{sec:ipc_sysv_access_control} (si ricordi che in questo caso il
1900 permesso di scrittura è in realtà permesso di alterare il semaforo), per
1901 quanto riguarda gli altri campi invece:
1902 \begin{itemize*}
1903 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
1904   nell'insieme, viene inizializzato al valore di \param{nsems}.
1905 \item il campo \var{sem\_ctime}, che esprime il tempo di creazione
1906   dell'insieme, viene inizializzato al tempo corrente.
1907 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
1908   effettuata, viene inizializzato a zero.
1909 \end{itemize*}
1910
1911 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
1912 \struct{sem} che ne contiene i dati essenziali, la sua definizione\footnote{si
1913   è riportata la definizione originaria del kernel 1.0, che contiene la prima
1914   realizzazione del \textit{SysV IPC} in Linux. In realtà questa struttura
1915   ormai è ridotta ai soli due primi membri, e gli altri vengono calcolati
1916   dinamicamente. La si è utilizzata a scopo di esempio, perché indica tutti i
1917   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
1918   citati dalle pagine di manuale.} è riportata in fig.~\ref{fig:ipc_sem}.
1919 Questa struttura, non è accessibile in user space, ma i valori in essa
1920 specificati possono essere letti in maniera indiretta, attraverso l'uso delle
1921 funzioni di controllo.
1922
1923 \begin{figure}[!htb]
1924   \footnotesize \centering
1925   \begin{minipage}[c]{\textwidth}
1926     \includestruct{listati/sem.h}
1927   \end{minipage} 
1928   \normalsize 
1929   \caption{La struttura \structd{sem}, che contiene i dati di un singolo
1930     semaforo.} 
1931   \label{fig:ipc_sem}
1932 \end{figure}
1933
1934 I dati mantenuti nella struttura, ed elencati in fig.~\ref{fig:ipc_sem},
1935 indicano rispettivamente:
1936 \begin{description*}
1937 \item[\var{semval}] il valore numerico del semaforo.
1938 \item[\var{sempid}] il \ids{PID} dell'ultimo processo che ha eseguito una
1939   operazione sul semaforo.
1940 \item[\var{semncnt}] il numero di processi in attesa che esso venga
1941   incrementato.
1942 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
1943 \end{description*}
1944
1945 \begin{table}[htb]
1946   \footnotesize
1947   \centering
1948   \begin{tabular}[c]{|c|r|p{8cm}|}
1949     \hline
1950     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
1951     \hline
1952     \hline
1953     \const{SEMMNI}&          128 & Numero massimo di insiemi di semafori.\\
1954     \const{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
1955     \const{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
1956                                    nel sistema.\\
1957     \const{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
1958     \const{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
1959                                    \func{semop}. \\
1960     \const{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
1961     \const{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
1962     \const{SEMAEM}&\const{SEMVMX}& Valore massimo per l'aggiustamento
1963                                    all'uscita. \\
1964     \hline
1965   \end{tabular}
1966   \caption{Valori delle costanti associate ai limiti degli insiemi di
1967     semafori, definite in \file{linux/sem.h}.} 
1968   \label{tab:ipc_sem_limits}
1969 \end{table}
1970
1971 Come per le code di messaggi anche per gli insiemi di semafori esistono una
1972 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
1973 sono riportate in tab.~\ref{tab:ipc_sem_limits}. Alcuni di questi limiti sono
1974 al solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
1975 direttamente nel file \sysctlfile{kernel/sem}.
1976
1977 La funzione che permette di effettuare le varie operazioni di controllo sui
1978 semafori (fra le quali, come accennato, è impropriamente compresa anche la
1979 loro inizializzazione) è \funcd{semctl}; il suo prototipo è:
1980 \begin{functions}
1981   \headdecl{sys/types.h} 
1982   \headdecl{sys/ipc.h} 
1983   \headdecl{sys/sem.h} 
1984   
1985   \funcdecl{int semctl(int semid, int semnum, int cmd)}
1986   \funcdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
1987   
1988   Esegue le operazioni di controllo su un semaforo o un insieme di semafori.
1989   
1990   \bodydesc{La funzione restituisce in caso di successo un valore positivo
1991     quanto usata con tre argomenti ed un valore nullo quando usata con
1992     quattro. In caso di errore restituisce -1, ed \var{errno} assumerà uno dei
1993     valori:
1994     \begin{errlist}
1995     \item[\errcode{EACCES}] il processo non ha i privilegi per eseguire
1996       l'operazione richiesta.
1997     \item[\errcode{EIDRM}] l'insieme di semafori è stato cancellato.
1998     \item[\errcode{EPERM}] si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
1999       ma il processo non ha privilegi sufficienti ad eseguire l'operazione.
2000     \item[\errcode{ERANGE}] si è richiesto \const{SETALL} \const{SETVAL} ma il
2001       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
2002       di \const{SEMVMX}.
2003   \end{errlist}
2004   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2005 }
2006 \end{functions}
2007
2008 La funzione può avere tre o quattro argomenti, a seconda dell'operazione
2009 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
2010 \param{semid} o sul singolo semaforo di un insieme, specificato da
2011 \param{semnum}. 
2012
2013 \begin{figure}[!htb]
2014   \footnotesize \centering
2015   \begin{minipage}[c]{\textwidth}
2016     \includestruct{listati/semun.h}
2017   \end{minipage} 
2018   \normalsize 
2019   \caption{La definizione dei possibili valori di una \direct{union}
2020     \structd{semun}, usata come quarto argomento della funzione
2021     \func{semctl}.}
2022   \label{fig:ipc_semun}
2023 \end{figure}
2024
2025 Qualora la funzione operi con quattro argomenti \param{arg} è un argomento
2026 generico, che conterrà un dato diverso a seconda dell'azione richiesta; per
2027 unificare l'argomento esso deve essere passato come una \struct{semun}, la cui
2028 definizione, con i possibili valori che può assumere, è riportata in
2029 fig.~\ref{fig:ipc_semun}.
2030
2031 Come già accennato sia il comportamento della funzione che il numero di
2032 argomenti con cui deve essere invocata dipendono dal valore dell'argomento
2033 \param{cmd}, che specifica l'azione da intraprendere; i valori validi (che
2034 cioè non causano un errore di \errcode{EINVAL}) per questo argomento sono i
2035 seguenti:
2036 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2037 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiando il
2038   contenuto della relativa struttura \struct{semid\_ds} all'indirizzo
2039   specificato con \var{arg.buf}. Occorre avere il permesso di lettura.
2040   L'argomento \param{semnum} viene ignorato.
2041 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
2042   dati, con effetto immediato. Tutti i processi che erano stato di
2043   \textit{sleep} vengono svegliati, ritornando con un errore di
2044   \errcode{EIDRM}.  L'\ids{UID} effettivo del processo deve corrispondere o al
2045   creatore o al proprietario dell'insieme, o all'amministratore. L'argomento
2046   \param{semnum} viene ignorato.
2047 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2048   dell'insieme. I valori devono essere passati in una struttura
2049   \struct{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto i
2050   campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
2051   significativi di \var{sem\_perm.mode}. L'\ids{UID} effettivo del processo deve
2052   corrispondere o al creatore o al proprietario dell'insieme, o
2053   all'amministratore.  L'argomento \param{semnum} viene ignorato.
2054 \item[\const{GETALL}] Restituisce il valore corrente di ciascun semaforo
2055   dell'insieme (corrispondente al campo \var{semval} di \struct{sem}) nel
2056   vettore indicato da \param{arg.array}. Occorre avere il permesso di lettura.
2057   L'argomento \param{semnum} viene ignorato.
2058 \item[\const{GETNCNT}] Restituisce come valore di ritorno della funzione il
2059   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
2060   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
2061   \struct{sem}); va invocata con tre argomenti.  Occorre avere il permesso di
2062   lettura.
2063 \item[\const{GETPID}] Restituisce come valore di ritorno della funzione il
2064   \ids{PID} dell'ultimo processo che ha compiuto una operazione sul semaforo
2065   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
2066   \var{sempid} di \struct{sem}); va invocata con tre argomenti.  Occorre avere
2067   il permesso di lettura.
2068 \item[\const{GETVAL}] Restituisce come valore di ritorno della funzione il il
2069   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
2070   (corrispondente al campo \var{semval} di \struct{sem}); va invocata con tre
2071   argomenti.  Occorre avere il permesso di lettura.
2072 \item[\const{GETZCNT}] Restituisce come valore di ritorno della funzione il
2073   numero di processi in attesa che il valore del semaforo \param{semnum}
2074   dell'insieme \param{semid} diventi nullo (corrispondente al campo
2075   \var{semncnt} di \struct{sem}); va invocata con tre argomenti.  Occorre avere
2076   il permesso di lettura.
2077 \item[\const{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
2078   aggiornando il campo \var{sem\_ctime} di \struct{semid\_ds}. I valori devono
2079   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
2080   privilegi di scrittura sul semaforo.  L'argomento \param{semnum} viene
2081   ignorato.
2082 \item[\const{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
2083   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
2084   \struct{semid\_ds}.  Si devono avere i privilegi di scrittura sul semaforo.
2085 \end{basedescript}
2086
2087 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2088 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2089 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2090 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2091 tutti i semafori il cui valore viene modificato.
2092
2093 \begin{table}[htb]
2094   \footnotesize
2095   \centering
2096   \begin{tabular}[c]{|c|l|}
2097     \hline
2098     \textbf{Operazione}  & \textbf{Valore restituito} \\
2099     \hline
2100     \hline
2101     \const{GETNCNT}& Valore di \var{semncnt}.\\
2102     \const{GETPID} & Valore di \var{sempid}.\\
2103     \const{GETVAL} & Valore di \var{semval}.\\
2104     \const{GETZCNT}& Valore di \var{semzcnt}.\\
2105     \hline
2106   \end{tabular}
2107   \caption{Valori di ritorno della funzione \func{semctl}.} 
2108   \label{tab:ipc_semctl_returns}
2109 \end{table}
2110
2111 Il valore di ritorno della funzione in caso di successo dipende
2112 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2113 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2114 tab.~\ref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2115 corrispondente al campo della struttura \struct{sem} indicato nella seconda
2116 colonna della tabella.
2117
2118 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2119 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2120 vengono effettuate con la funzione \funcd{semop}, il cui prototipo è:
2121 \begin{functions}
2122   \headdecl{sys/types.h} 
2123   \headdecl{sys/ipc.h} 
2124   \headdecl{sys/sem.h} 
2125   
2126   \funcdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2127   
2128   Esegue le operazioni ordinarie su un semaforo o un insieme di semafori.
2129   
2130   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2131     errore, nel qual caso \var{errno} assumerà uno dei valori:
2132     \begin{errlist}
2133     \item[\errcode{EACCES}] il processo non ha i privilegi per eseguire
2134       l'operazione richiesta.
2135     \item[\errcode{EIDRM}] l'insieme di semafori è stato cancellato.
2136     \item[\errcode{ENOMEM}] si è richiesto un \const{SEM\_UNDO} ma il sistema
2137       non ha le risorse per allocare la struttura di ripristino.
2138     \item[\errcode{EAGAIN}] un'operazione comporterebbe il blocco del processo,
2139       ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2140     \item[\errcode{EINTR}] la funzione, bloccata in attesa dell'esecuzione
2141       dell'operazione, viene interrotta da un segnale.
2142     \item[\errcode{E2BIG}] l'argomento \param{nsops} è maggiore del numero
2143       massimo di operazioni \const{SEMOPM}.
2144     \item[\errcode{ERANGE}] per alcune operazioni il valore risultante del
2145       semaforo viene a superare il limite massimo \const{SEMVMX}.
2146   \end{errlist}
2147   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2148 }
2149 \end{functions}
2150
2151
2152 %TODO manca semtimedop, trattare qui, referenziata in
2153 %sez.~\ref{sec:sig_gen_beha}.
2154
2155 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2156 un insieme. La funzione richiede come primo argomento l'identificatore
2157 \param{semid} dell'insieme su cui si vuole operare. Il numero di operazioni da
2158 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2159 contenuto viene passato con un puntatore ad un vettore di strutture
2160 \struct{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2161 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante.
2162
2163 \begin{figure}[!htb]
2164   \footnotesize \centering
2165   \begin{minipage}[c]{\textwidth}
2166     \includestruct{listati/sembuf.h}
2167   \end{minipage} 
2168   \normalsize 
2169   \caption{La struttura \structd{sembuf}, usata per le operazioni sui
2170     semafori.}
2171   \label{fig:ipc_sembuf}
2172 \end{figure}
2173
2174 Il contenuto di ciascuna operazione deve essere specificato attraverso una
2175 opportuna struttura \struct{sembuf} (la cui definizione è riportata in
2176 fig.~\ref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2177 allocare in un opportuno vettore. La struttura permette di indicare il
2178 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2179 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2180 riferimento l'operazione; si ricordi che i semafori sono numerati come in un
2181 vettore, per cui il primo semaforo corrisponde ad un valore nullo di
2182 \var{sem\_num}.
2183
2184 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2185 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2186 \const{SEM\_UNDO}.  Impostando \const{IPC\_NOWAIT} si fa si che, invece di
2187 bloccarsi (in tutti quei casi in cui l'esecuzione di una operazione richiede
2188 che il processo vada in stato di \textit{sleep}), \func{semop} ritorni
2189 immediatamente con un errore di \errcode{EAGAIN}.  Impostando \const{SEM\_UNDO}
2190 si richiede invece che l'operazione venga registrata in modo che il valore del
2191 semaforo possa essere ripristinato all'uscita del processo.
2192
2193 Infine \var{sem\_op} è il campo che controlla l'operazione che viene eseguita
2194 e determina il comportamento della chiamata a \func{semop}; tre sono i casi
2195 possibili:
2196 \begin{basedescript}{\desclabelwidth{2.0cm}}
2197 \item[\var{sem\_op}$>0$] In questo caso il valore di \var{sem\_op} viene
2198   aggiunto al valore corrente di \var{semval}. La funzione ritorna
2199   immediatamente (con un errore di \errcode{ERANGE} qualora si sia superato il
2200   limite \const{SEMVMX}) ed il processo non viene bloccato in nessun caso.
2201   Specificando \const{SEM\_UNDO} si aggiorna il contatore per il ripristino
2202   del valore del semaforo. Al processo chiamante è richiesto il privilegio di
2203   alterazione (scrittura) sull'insieme di semafori.
2204   
2205 \item[\var{sem\_op}$=0$] Nel caso \var{semval} sia zero l'esecuzione procede
2206   immediatamente. Se \var{semval} è diverso da zero il comportamento è
2207   controllato da \var{sem\_flg}, se è stato impostato \const{IPC\_NOWAIT} la
2208   funzione ritorna con un errore di \errcode{EAGAIN}, altrimenti viene
2209   incrementato \var{semzcnt} di uno ed il processo resta in stato di
2210   \textit{sleep} fintanto che non si ha una delle condizioni seguenti:
2211   \begin{itemize*}
2212   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2213     decrementato di uno.
2214   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2215     un errore di \errcode{EIDRM}.
2216   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2217     viene decrementato di uno e \func{semop} ritorna un errore di
2218     \errcode{EINTR}.
2219   \end{itemize*}
2220   Al processo chiamante è richiesto il privilegio di lettura dell'insieme dei
2221   semafori.
2222   
2223 \item[\var{sem\_op}$<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2224   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2225   positiva o nulla) i valori vengono sommati e la funzione ritorna
2226   immediatamente; qualora si sia impostato \const{SEM\_UNDO} viene anche
2227   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2228   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2229   negativo) se si è impostato \const{IPC\_NOWAIT} la funzione ritorna con un
2230   errore di \errcode{EAGAIN}, altrimenti viene incrementato di uno
2231   \var{semncnt} ed il processo resta in stato di \textit{sleep} fintanto che
2232   non si ha una delle condizioni seguenti:
2233   \begin{itemize*}
2234   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2235     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2236     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2237     impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2238     ripristino del valore del semaforo.
2239   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2240     ritorna un errore di \errcode{EIDRM}.
2241   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2242     viene decrementato di uno e \func{semop} ritorna un errore di
2243     \errcode{EINTR}.
2244   \end{itemize*}    
2245   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2246   sull'insieme di semafori.
2247 \end{basedescript}
2248
2249 In caso di successo della funzione viene aggiornato il campo \var{sempid} per
2250 ogni semaforo modificato al valore del \ids{PID} del processo chiamante;
2251 inoltre vengono pure aggiornati al tempo corrente i campi \var{sem\_otime} e
2252 \var{sem\_ctime}.
2253
2254 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2255 semafori possono restare occupati, abbiamo visto come \func{semop} permetta di
2256 attivare un meccanismo di ripristino attraverso l'uso del flag
2257 \const{SEM\_UNDO}. Il meccanismo è implementato tramite una apposita struttura
2258 \kstruct{sem\_undo}, associata ad ogni processo per ciascun semaforo che esso
2259 ha modificato; all'uscita i semafori modificati vengono ripristinati, e le
2260 strutture disallocate.  Per mantenere coerente il comportamento queste
2261 strutture non vengono ereditate attraverso una \func{fork} (altrimenti si
2262 avrebbe un doppio ripristino), mentre passano inalterate nell'esecuzione di
2263 una \func{exec} (altrimenti non si avrebbe ripristino).
2264
2265 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2266 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2267 in maniera semplificata nello schema di fig.~\ref{fig:ipc_sem_schema}.  Si è
2268 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2269 semplice (ed illustrata in dettaglio in \cite{tlk}); nel kernel 2.4.x la
2270 struttura del \textit{SysV IPC} è stata modificata, ma le definizioni relative
2271 a queste strutture restano per compatibilità.\footnote{in particolare con le
2272   vecchie versioni delle librerie del C, come le libc5.}
2273
2274 \begin{figure}[!htb]
2275   \centering \includegraphics[width=13cm]{img/semtruct}
2276   \caption{Schema della struttura di un insieme di semafori.}
2277   \label{fig:ipc_sem_schema}
2278 \end{figure}
2279
2280 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2281 \struct{semid\_ds} ed il relativo vettore di strutture \struct{sem}. Quando si
2282 richiede una operazione viene anzitutto verificato che tutte le operazioni
2283 possono avere successo; se una di esse comporta il blocco del processo il
2284 kernel crea una struttura \kstruct{sem\_queue} che viene aggiunta in fondo alla
2285 coda di attesa associata a ciascun insieme di semafori\footnote{che viene
2286   referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last}
2287   di \struct{semid\_ds}.}. 
2288
2289 Nella struttura viene memorizzato il riferimento alle operazioni richieste
2290 (nel campo \var{sops}, che è un puntatore ad una struttura \struct{sembuf}) e
2291 al processo corrente (nel campo \var{sleeper}) poi quest'ultimo viene messo
2292 stato di attesa e viene invocato lo \itindex{scheduler} scheduler per passare
2293 all'esecuzione di un altro processo.
2294
2295 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2296 immediatamente, dopo di che il kernel esegue una scansione della coda di
2297 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2298 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2299 struttura \kstruct{sem\_queue} viene rimossa e lo stato del processo associato
2300 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2301 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2302 svuotata la coda.  Per gestire il meccanismo del ripristino tutte le volte che
2303 per un'operazione si è specificato il flag \const{SEM\_UNDO} viene mantenuta
2304 per ciascun insieme di semafori una apposita struttura \kstruct{sem\_undo} che
2305 contiene (nel vettore puntato dal campo \var{semadj}) un valore di
2306 aggiustamento per ogni semaforo cui viene sommato l'opposto del valore usato
2307 per l'operazione.
2308
2309 %TODO verificare queste strutture \kstruct{sem\_queue} e \kstruct{sem\_undo}
2310
2311 Queste strutture sono mantenute in due liste,\footnote{rispettivamente
2312   attraverso i due campi \var{id\_next} e \var{proc\_next}.} una associata
2313 all'insieme di cui fa parte il semaforo, che viene usata per invalidare le
2314 strutture se questo viene cancellato o per azzerarle se si è eseguita una
2315 operazione con \func{semctl}; l'altra associata al processo che ha eseguito
2316 l'operazione;\footnote{attraverso il campo \var{semundo} di
2317   \kstruct{task\_struct}, come mostrato in \ref{fig:ipc_sem_schema}.} quando un
2318 processo termina, la lista ad esso associata viene scandita e le operazioni
2319 applicate al semaforo.  Siccome un processo può accumulare delle richieste di
2320 ripristino per semafori differenti chiamate attraverso diverse chiamate a
2321 \func{semop}, si pone il problema di come eseguire il ripristino dei semafori
2322 all'uscita del processo, ed in particolare se questo può essere fatto
2323 atomicamente.
2324
2325 Il punto è cosa succede quando una delle operazioni previste per il ripristino
2326 non può essere eseguita immediatamente perché ad esempio il semaforo è
2327 occupato; in tal caso infatti, se si pone il processo in stato di
2328 \textit{sleep} aspettando la disponibilità del semaforo (come faceva
2329 l'implementazione originaria) si perde l'atomicità dell'operazione. La scelta
2330 fatta dal kernel è pertanto quella di effettuare subito le operazioni che non
2331 prevedono un blocco del processo e di ignorare silenziosamente le altre;
2332 questo però comporta il fatto che il ripristino non è comunque garantito in
2333 tutte le occasioni.
2334
2335 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2336 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2337 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2338 riportato in fig.~\ref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2339 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2340 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2341 nullo per segnalarne l'indisponibilità. 
2342
2343 \begin{figure}[!htbp]
2344   \footnotesize \centering
2345   \begin{minipage}[c]{\codesamplewidth}
2346     \includecodesample{listati/Mutex.c}
2347   \end{minipage} 
2348   \normalsize 
2349   \caption{Il codice delle funzioni che permettono di creare o recuperare
2350     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2351   \label{fig:ipc_mutex_create}
2352 \end{figure}
2353
2354 La prima funzione (\texttt{\small 2--15}) è \func{MutexCreate} che data una
2355 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2356 l'identificatore. Il primo passo (\texttt{\small 6}) è chiamare \func{semget}
2357 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2358 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2359 (\texttt{\small 7--9}) si ritorna subito il risultato di \func{semget},
2360 altrimenti (\texttt{\small 10}) si inizializza il semaforo chiamando
2361 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2362 \struct{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 4})
2363 ad 1 per significare che risorsa è libera. In caso di errore (\texttt{\small
2364   11--13}) si restituisce il valore di ritorno di \func{semctl}, altrimenti
2365 (\texttt{\small 14}) si ritorna l'identificatore del semaforo.
2366
2367 La seconda funzione (\texttt{\small 17--20}) è \func{MutexFind}, che, data una
2368 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2369 comprensione del suo funzionamento è immediata in quanto essa è soltanto un
2370 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2371   \textsl{involucro} alla chiamata di un altra, usata in genere per
2372   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2373   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2374   stesse funzionalità.} di una chiamata a \func{semget} per cercare
2375 l'identificatore associato alla chiave, il valore di ritorno di quest'ultima
2376 viene passato all'indietro al chiamante.
2377
2378 La terza funzione (\texttt{\small 22--25}) è \func{MutexRead} che, dato un
2379 identificatore, restituisce il valore del semaforo associato al mutex. Anche
2380 in questo caso la funzione è un \textit{wrapper} per una chiamata a
2381 \func{semctl} con il comando \const{GETVAL}, che permette di restituire il
2382 valore del semaforo.
2383
2384 La quarta e la quinta funzione (\texttt{\small 36--44}) sono \func{MutexLock},
2385 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2386 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2387 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2388 (\texttt{\small 27--34}). Si noti come per queste ultime si sia fatto uso
2389 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2390 caso di terminazione imprevista del processo.
2391
2392 L'ultima funzione (\texttt{\small 46--49}) della serie, è \func{MutexRemove},
2393 che rimuove il mutex. Anche in questo caso si ha un wrapper per una chiamata a
2394 \func{semctl} con il comando \const{IPC\_RMID}, che permette di cancellare il
2395 semaforo; il valore di ritorno di quest'ultima viene passato all'indietro.
2396
2397 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2398 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2399 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2400 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2401 incrementato di uno, sbloccandolo qualora fosse bloccato.  
2402
2403 Si noti che occorre eseguire sempre prima \func{MutexLock} e poi
2404 \func{MutexUnlock}, perché se per un qualche errore si esegue più volte
2405 quest'ultima il valore del semaforo crescerebbe oltre 1, e \func{MutexLock}
2406 non avrebbe più l'effetto aspettato (bloccare la risorsa quando questa è
2407 considerata libera).  Infine si tenga presente che usare \func{MutexRead} per
2408 controllare il valore dei mutex prima di proseguire in una operazione di
2409 sblocco non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2410 Vedremo in sez.~\ref{sec:ipc_lock_file} come sia possibile ottenere
2411 un'interfaccia analoga a quella appena illustrata, senza incorrere in questi
2412 problemi, usando il \itindex{file~locking} \textit{file locking}.
2413
2414
2415 \subsection{Memoria condivisa}
2416 \label{sec:ipc_sysv_shm}
2417
2418 Il terzo oggetto introdotto dal \textit{SysV IPC} è quello dei segmenti di
2419 memoria condivisa. La funzione che permette di ottenerne uno è \funcd{shmget},
2420 ed il suo prototipo è:
2421 \begin{functions}
2422   \headdecl{sys/types.h} 
2423   \headdecl{sys/ipc.h} 
2424   \headdecl{sys/shm.h}
2425   
2426   \funcdecl{int shmget(key\_t key, int size, int flag)}
2427   
2428   Restituisce l'identificatore di una memoria condivisa.
2429   
2430   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
2431     in caso di errore, nel qual caso \var{errno} assumerà i valori:
2432     \begin{errlist}
2433     \item[\errcode{ENOSPC}] si è superato il limite (\const{SHMMNI}) sul numero
2434       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2435       cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2436       la memoria ad essi riservata.
2437     \item[\errcode{EINVAL}] si è richiesta una dimensione per un nuovo segmento
2438       maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2439       già esiste \param{size} è maggiore delle sue dimensioni.
2440     \item[\errcode{ENOMEM}] il sistema non ha abbastanza memoria per poter
2441       contenere le strutture per un nuovo segmento di memoria condivisa.
2442     \end{errlist}
2443     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2444     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2445 \end{functions}
2446
2447 La funzione, come \func{semget}, è del tutto analoga a \func{msgget}, ed
2448 identico è l'uso degli argomenti \param{key} e \param{flag} per cui non
2449 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
2450 \param{size} specifica invece la dimensione, in byte, del segmento, che viene
2451 comunque arrotondata al multiplo superiore di \const{PAGE\_SIZE}.
2452
2453 % TODO aggiungere l'uso di SHM_HUGETLB introdotto con il kernel 2.6.0
2454
2455 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2456 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2457 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2458 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2459 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2460 dati in memoria.
2461
2462 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2463 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2464 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2465 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2466 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2467 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2468 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2469 altro processo. Per questo in genere la memoria condivisa viene sempre
2470 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2471 norma, significa insieme a dei semafori.
2472
2473 \begin{figure}[!htb]
2474   \footnotesize \centering
2475   \begin{minipage}[c]{\textwidth}
2476     \includestruct{listati/shmid_ds.h}
2477   \end{minipage} 
2478   \normalsize 
2479   \caption{La struttura \structd{shmid\_ds}, associata a ciascun segmento di
2480     memoria condivisa.}
2481   \label{fig:ipc_shmid_ds}
2482 \end{figure}
2483
2484 A ciascun segmento di memoria condivisa è associata una struttura
2485 \struct{shmid\_ds}, riportata in fig.~\ref{fig:ipc_shmid_ds}.  Come nel caso
2486 delle code di messaggi quando si crea un nuovo segmento di memoria condivisa
2487 con \func{shmget} questa struttura viene inizializzata, in particolare il
2488 campo \var{shm\_perm} viene inizializzato come illustrato in
2489 sez.~\ref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2490 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2491 invece:
2492 \begin{itemize}
2493 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2494   inizializzato al valore di \param{size}.
2495 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2496   segmento, viene inizializzato al tempo corrente.
2497 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2498   rispettivamente il tempo dell'ultima volta che il segmento è stato
2499   agganciato o sganciato da un processo, vengono inizializzati a zero.
2500 \item il campo \var{shm\_lpid}, che esprime il \ids{PID} del processo che ha
2501   eseguito l'ultima operazione, viene inizializzato a zero.
2502 \item il campo \var{shm\_cpid}, che esprime il \ids{PID} del processo che ha
2503   creato il segmento, viene inizializzato al \ids{PID} del processo chiamante.
2504 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2505   al segmento viene inizializzato a zero.
2506 \end{itemize}
2507
2508 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2509 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2510 di questi limiti sono al solito accessibili e modificabili attraverso
2511 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2512 \file{/proc/sys/kernel/}. 
2513
2514 In tab.~\ref{tab:ipc_shm_limits} si sono riportate le
2515 costanti simboliche associate a ciascuno di essi, il loro significato, i
2516 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2517 che permettono di cambiarne il valore. 
2518
2519
2520 \begin{table}[htb]
2521   \footnotesize
2522   \centering
2523   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2524     \hline
2525     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2526     & \textbf{Significato} \\
2527     \hline
2528     \hline
2529     \const{SHMALL}& 0x200000&\sysctlrelfile{kernel}{shmall}
2530                             & Numero massimo di pagine che 
2531                               possono essere usate per i segmenti di
2532                               memoria condivisa.\\
2533     \const{SHMMAX}&0x2000000&\sysctlrelfile{kernel}{shmmax} 
2534                             & Dimensione massima di un segmento di memoria
2535                               condivisa.\\ 
2536     \const{SHMMNI}&     4096&\sysctlrelfile{kernel}{msgmni}
2537                             & Numero massimo di segmenti di memoria condivisa
2538                               presenti nel kernel.\\ 
2539     \const{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2540                                             memoria condivisa.\\
2541     \const{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2542                                             minime di un segmento (deve essere
2543                                             allineato alle dimensioni di una
2544                                             pagina di memoria).\\
2545     \const{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2546                                             memoria condivisa per ciascun
2547                                             processo.\\
2548
2549
2550     \hline
2551   \end{tabular}
2552   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2553     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2554     valore preimpostato presente nel sistema.} 
2555   \label{tab:ipc_shm_limits}
2556 \end{table}
2557
2558 Al solito la funzione che permette di effettuare le operazioni di controllo su
2559 un segmento di memoria condivisa è \funcd{shmctl}; il suo prototipo è:
2560 \begin{functions}
2561   \headdecl{sys/ipc.h} 
2562   \headdecl{sys/shm.h}
2563   
2564   \funcdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2565   
2566   Esegue le operazioni di controllo su un segmento di memoria condivisa.
2567   
2568   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2569     errore, nel qual caso \var{errno} assumerà i valori:
2570     \begin{errlist}
2571     \item[\errcode{EACCES}] si è richiesto \const{IPC\_STAT} ma i permessi non
2572       consentono l'accesso in lettura al segmento.
2573     \item[\errcode{EINVAL}] o \param{shmid} non è un identificatore valido o
2574       \param{cmd} non è un comando valido.
2575     \item[\errcode{EIDRM}] l'argomento \param{shmid} fa riferimento ad un
2576       segmento che è stato cancellato.
2577     \item[\errcode{EPERM}] si è specificato un comando con \const{IPC\_SET} o
2578       \const{IPC\_RMID} senza i permessi necessari.
2579     \item[\errcode{EOVERFLOW}] si è tentato il comando \const{IPC\_STAT} ma il
2580       valore del \ids{GID} o dell'\ids{UID} è troppo grande per essere
2581       memorizzato nella struttura puntata da \param{buf}.
2582     \item[\errcode{EFAULT}] l'indirizzo specificato con \param{buf} non è
2583       valido.
2584     \end{errlist}
2585 }
2586 \end{functions}
2587
2588 Il comando specificato attraverso l'argomento \param{cmd} determina i diversi
2589 effetti della funzione; i possibili valori che esso può assumere, ed il
2590 corrispondente comportamento della funzione, sono i seguenti:
2591
2592 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2593 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2594   condivisa nella struttura \struct{shmid\_ds} puntata da \param{buf}. Occorre
2595   che il processo chiamante abbia il permesso di lettura sulla segmento.
2596 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2597   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2598   processo ad esso agganciato si sarà staccato. Questo comando può essere
2599   eseguito solo da un processo con \ids{UID} effettivo corrispondente o al
2600   creatore del segmento, o al proprietario del segmento, o all'amministratore.
2601 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2602   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2603   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2604   il creatore del segmento, oppure l'amministratore. Compiuta l'operazione
2605   aggiorna anche il valore del campo \var{shm\_ctime}.
2606 \item[\const{SHM\_LOCK}] Abilita il \itindex{memory~locking} \textit{memory
2607     locking}\footnote{impedisce cioè che la memoria usata per il segmento
2608     venga salvata su disco dal meccanismo della \index{memoria~virtuale}
2609     memoria virtuale; si ricordi quanto trattato in
2610     sez.~\ref{sec:proc_mem_lock}.} sul segmento di memoria condivisa. Solo
2611   l'amministratore può utilizzare questo comando.
2612 \item[\const{SHM\_UNLOCK}] Disabilita il \itindex{memory~locking}
2613   \textit{memory locking} sul segmento di memoria condivisa.  Solo
2614   l'amministratore può utilizzare questo comando.
2615 \end{basedescript}
2616 i primi tre comandi sono gli stessi già visti anche per le code di messaggi e
2617 gli insiemi di semafori, gli ultimi due sono delle estensioni specifiche
2618 previste da Linux, che permettono di abilitare e disabilitare il meccanismo
2619 della \index{memoria~virtuale} memoria virtuale per il segmento.
2620
2621 L'argomento \param{buf} viene utilizzato solo con i comandi \const{IPC\_STAT}
2622 e \const{IPC\_SET} nel qual caso esso dovrà puntare ad una struttura
2623 \struct{shmid\_ds} precedentemente allocata, in cui nel primo caso saranno
2624 scritti i dati del segmento di memoria restituiti dalla funzione e da cui, nel
2625 secondo caso, verranno letti i dati da impostare sul segmento.
2626
2627 Una volta che lo si è creato, per utilizzare un segmento di memoria condivisa
2628 l'interfaccia prevede due funzioni, \funcd{shmat} e \func{shmdt}. La prima di
2629 queste serve ad agganciare un segmento al processo chiamante, in modo che
2630 quest'ultimo possa inserirlo nel suo spazio di indirizzi per potervi accedere;
2631 il suo prototipo è:
2632 \begin{functions}
2633   \headdecl{sys/types.h} 
2634   \headdecl{sys/shm.h}
2635   
2636   \funcdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2637   Aggancia al processo un segmento di memoria condivisa.
2638   
2639   \bodydesc{La funzione restituisce l'indirizzo del segmento in caso di
2640     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà i
2641     valori:
2642     \begin{errlist}
2643     \item[\errcode{EACCES}] il processo non ha i privilegi per accedere al
2644       segmento nella modalità richiesta.
2645     \item[\errcode{EINVAL}] si è specificato un identificatore invalido per
2646       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2647       per \param{shmaddr}.
2648     \end{errlist}
2649     ed inoltre \errval{ENOMEM}.}
2650 \end{functions}
2651
2652 La funzione inserisce un segmento di memoria condivisa all'interno dello
2653 spazio di indirizzi del processo, in modo che questo possa accedervi
2654 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2655 fig.~\ref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2656 ricordi quanto illustrato al proposito in sez.~\ref{sec:proc_mem_layout}). In
2657 particolare l'indirizzo finale del segmento dati (quello impostato da
2658 \func{brk}, vedi sez.~\ref{sec:proc_mem_alloc}) non viene influenzato.
2659 Si tenga presente infine che la funzione ha successo anche se il segmento è
2660 stato marcato per la cancellazione.
2661
2662 \begin{figure}[!htb]
2663   \centering \includegraphics[height=10cm]{img/sh_memory_layout}
2664   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2665     agganciato un segmento di memoria condivisa.}
2666   \label{fig:ipc_shmem_layout}
2667 \end{figure}
2668
2669 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{lo standard
2670   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2671   come il valore di ritorno della funzione; in Linux è stato così con le
2672   \acr{libc4} e le \acr{libc5}, con il passaggio alla \acr{glibc} il tipo di
2673   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2674   ritorno un \ctyp{void *}.} deve essere associato il segmento, se il valore
2675 specificato è \val{NULL} è il sistema a scegliere opportunamente un'area di
2676 memoria libera (questo è il modo più portabile e sicuro di usare la funzione).
2677 Altrimenti il kernel aggancia il segmento all'indirizzo specificato da
2678 \param{shmaddr}; questo però può avvenire solo se l'indirizzo coincide con il
2679 limite di una pagina, cioè se è un multiplo esatto del parametro di sistema
2680 \const{SHMLBA}, che in Linux è sempre uguale \const{PAGE\_SIZE}. 
2681
2682 Si tenga presente però che quando si usa \val{NULL} come valore di
2683 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2684 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2685 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2686 riferiti all'indirizzo di partenza del segmento).
2687
2688 L'argomento \param{shmflg} permette di cambiare il comportamento della
2689 funzione; esso va specificato come maschera binaria, i bit utilizzati sono
2690 solo due e sono identificati dalle costanti \const{SHM\_RND} e
2691 \const{SHM\_RDONLY}, che vanno combinate con un OR aritmetico.  Specificando
2692 \const{SHM\_RND} si evita che \func{shmat} ritorni un errore quando
2693 \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi usare
2694 un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2695 agganciato, ma al più vicino multiplo di \const{SHMLBA} (il nome della
2696 costante sta infatti per \textit{rounded}, e serve per specificare un
2697 indirizzo come arrotondamento, in Linux è equivalente a \const{PAGE\_SIZE}).
2698
2699 L'uso di \const{SHM\_RDONLY} permette di agganciare il segmento in sola
2700 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2701 caso un tentativo di scrivere sul segmento comporterà una
2702 \itindex{segment~violation} violazione di accesso con l'emissione di un
2703 segnale di \signal{SIGSEGV}. Il comportamento usuale di \func{shmat} è quello
2704 di agganciare il segmento con l'accesso in lettura e scrittura (ed il processo
2705 deve aver questi permessi in \var{shm\_perm}), non è prevista la possibilità
2706 di agganciare un segmento in sola scrittura.
2707
2708 In caso di successo la funzione aggiorna anche i seguenti campi di
2709 \struct{shmid\_ds}:
2710 \begin{itemize*}
2711 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2712   impostato al tempo corrente.
2713 \item il \ids{PID} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2714   segmento viene impostato a quello del processo corrente.
2715 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2716   aumentato di uno.
2717 \end{itemize*} 
2718
2719 Come accennato in sez.~\ref{sec:proc_fork} un segmento di memoria condivisa
2720 agganciato ad un processo viene ereditato da un figlio attraverso una
2721 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2722 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2723 eseguito un diverso programma con uno spazio di indirizzi completamente
2724 diverso, tutti i segmenti agganciati al processo originario vengono
2725 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2726 attraverso una \func{exit}.
2727
2728 Una volta che un segmento di memoria condivisa non serve più, si può
2729 sganciarlo esplicitamente dal processo usando l'altra funzione
2730 dell'interfaccia, \funcd{shmdt}, il cui prototipo è:
2731 \begin{functions}
2732   \headdecl{sys/types.h} 
2733   \headdecl{sys/shm.h}
2734
2735   \funcdecl{int shmdt(const void *shmaddr)}
2736   Sgancia dal processo un segmento di memoria condivisa.
2737   
2738   \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
2739     errore, la funzione fallisce solo quando non c'è un segmento agganciato
2740     all'indirizzo \param{shmaddr}, con \var{errno} che assume il valore
2741     \errval{EINVAL}.}
2742 \end{functions}
2743
2744 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2745 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2746 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2747 agganciato al processo.
2748
2749 In caso di successo la funzione aggiorna anche i seguenti campi di
2750 \struct{shmid\_ds}:
2751 \begin{itemize*}
2752 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2753   impostato al tempo corrente.
2754 \item il \ids{PID} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2755   segmento viene impostato a quello del processo corrente.
2756 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2757   decrementato di uno.
2758 \end{itemize*} 
2759 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2760 viene tolta dallo spazio di indirizzi del processo.
2761
2762 \begin{figure}[!htbp]
2763   \footnotesize \centering
2764   \begin{minipage}[c]{\codesamplewidth}
2765     \includecodesample{listati/SharedMem.c}
2766   \end{minipage} 
2767   \normalsize 
2768   \caption{Il codice delle funzioni che permettono di creare, trovare e
2769     rimuovere un segmento di memoria condivisa.}
2770   \label{fig:ipc_sysv_shm_func}
2771 \end{figure}
2772
2773 Come esempio di uso di queste funzioni vediamo come implementare una serie di
2774 funzioni di libreria che ne semplifichino l'uso, automatizzando le operazioni
2775 più comuni; il codice, contenuto nel file \file{SharedMem.c}, è riportato in
2776 fig.~\ref{fig:ipc_sysv_shm_func}.
2777
2778 La prima funzione (\texttt{\small 3--16}) è \func{ShmCreate} che, data una
2779 chiave, crea il segmento di memoria condivisa restituendo il puntatore allo
2780 stesso. La funzione comincia (\texttt{\small 6}) con il chiamare
2781 \func{shmget}, usando il flag \const{IPC\_CREATE} per creare il segmento
2782 qualora non esista, ed assegnandogli i privilegi specificati dall'argomento
2783 \var{perm} e la dimensione specificata dall'argomento \var{shm\_size}.  In
2784 caso di errore (\texttt{\small 7--9}) si ritorna immediatamente un puntatore
2785 nullo, altrimenti (\texttt{\small 10}) si prosegue agganciando il segmento di
2786 memoria condivisa al processo con \func{shmat}. In caso di errore
2787 (\texttt{\small 11--13}) si restituisce di nuovo un puntatore nullo, infine
2788 (\texttt{\small 14}) si inizializza con \func{memset} il contenuto del
2789 segmento al valore costante specificato dall'argomento \var{fill}, e poi si
2790 ritorna il puntatore al segmento stesso.
2791
2792 La seconda funzione (\texttt{\small 17--31}) è \func{ShmFind}, che, data una
2793 chiave, restituisce l'indirizzo del segmento ad essa associato. Anzitutto
2794 (\texttt{\small 22}) si richiede l'identificatore del segmento con
2795 \func{shmget}, ritornando (\texttt{\small 23--25}) un puntatore nullo in caso
2796 di errore. Poi si prosegue (\texttt{\small 26}) agganciando il segmento al
2797 processo con \func{shmat}, restituendo (\texttt{\small 27--29}) di nuovo un
2798 puntatore nullo in caso di errore, se invece non ci sono errori si restituisce
2799 il puntatore ottenuto da \func{shmat}.
2800
2801 La terza funzione (\texttt{\small 32--51}) è \func{ShmRemove} che, data la
2802 chiave ed il puntatore associati al segmento di memoria condivisa, prima lo
2803 sgancia dal processo e poi lo rimuove. Il primo passo (\texttt{\small 37}) è
2804 la chiamata a \func{shmdt} per sganciare il segmento, restituendo
2805 (\texttt{\small 38--39}) un valore -1 in caso di errore. Il passo successivo
2806 (\texttt{\small 41}) è utilizzare \func{shmget} per ottenere l'identificatore
2807 associato al segmento data la chiave \var{key}. Al solito si restituisce un
2808 valore di -1 (\texttt{\small 42--45}) in caso di errore, mentre se tutto va
2809 bene si conclude restituendo un valore nullo.
2810
2811 Benché la memoria condivisa costituisca il meccanismo di intercomunicazione
2812 fra processi più veloce, essa non è sempre il più appropriato, dato che, come
2813 abbiamo visto, si avrà comunque la necessità di una sincronizzazione degli
2814 accessi.  Per questo motivo, quando la comunicazione fra processi è
2815 sequenziale, altri meccanismi come le pipe, le fifo o i socket, che non
2816 necessitano di sincronizzazione esplicita, sono da preferire. Essa diventa
2817 l'unico meccanismo possibile quando la comunicazione non è
2818 sequenziale\footnote{come accennato in sez.~\ref{sec:ipc_sysv_mq} per la
2819   comunicazione non sequenziale si possono usare le code di messaggi,
2820   attraverso l'uso del campo \var{mtype}, ma solo se quest'ultima può essere
2821   effettuata in forma di messaggio.} o quando non può avvenire secondo una
2822 modalità predefinita.
2823
2824 Un esempio classico di uso della memoria condivisa è quello del
2825 ``\textit{monitor}'', in cui viene per scambiare informazioni fra un processo
2826 server, che vi scrive dei dati di interesse generale che ha ottenuto, e i
2827 processi client interessati agli stessi dati che così possono leggerli in
2828 maniera completamente asincrona.  Con questo schema di funzionamento da una
2829 parte si evita che ciascun processo client debba compiere l'operazione,
2830 potenzialmente onerosa, di ricavare e trattare i dati, e dall'altra si evita
2831 al processo server di dover gestire l'invio a tutti i client di tutti i dati
2832 (non potendo il server sapere quali di essi servono effettivamente al singolo
2833 client).
2834
2835 Nel nostro caso implementeremo un ``\textsl{monitor}'' di una directory: un
2836 processo si incaricherà di tenere sotto controllo alcuni parametri relativi ad
2837 una directory (il numero dei file contenuti, la dimensione totale, quante
2838 directory, link simbolici, file normali, ecc.) che saranno salvati in un
2839 segmento di memoria condivisa cui altri processi potranno accedere per
2840 ricavare la parte di informazione che interessa.
2841
2842 In fig.~\ref{fig:ipc_dirmonitor_main} si è riportata la sezione principale del
2843 corpo del programma server, insieme alle definizioni delle altre funzioni
2844 usate nel programma e delle \index{variabili!globali} variabili globali,
2845 omettendo tutto quello che riguarda la gestione delle opzioni e la stampa
2846 delle istruzioni di uso a video; al solito il codice completo si trova con i
2847 sorgenti allegati nel file \file{DirMonitor.c}.
2848
2849 \begin{figure}[!htbp]
2850   \footnotesize \centering
2851   \begin{minipage}[c]{\codesamplewidth}
2852     \includecodesample{listati/DirMonitor.c}
2853   \end{minipage} 
2854   \normalsize 
2855   \caption{Codice della funzione principale del programma \file{DirMonitor.c}.}
2856   \label{fig:ipc_dirmonitor_main}
2857 \end{figure}
2858
2859 Il programma usa delle \index{variabili!globali} variabili globali
2860 (\texttt{\small 2--14}) per mantenere i valori relativi agli oggetti usati per
2861 la comunicazione inter-processo; si è definita inoltre una apposita struttura
2862 \struct{DirProp} che contiene i dati relativi alle proprietà che si vogliono
2863 mantenere nella memoria condivisa, per l'accesso da parte dei client.
2864
2865 Il programma, dopo la sezione, omessa, relativa alla gestione delle opzioni da
2866 riga di comando (che si limitano alla eventuale stampa di un messaggio di
2867 aiuto a video ed all'impostazione della durata dell'intervallo con cui viene
2868 ripetuto il calcolo delle proprietà della directory) controlla (\texttt{\small
2869   20--23}) che sia stato specificato l'argomento necessario contenente il nome
2870 della directory da tenere sotto controllo, senza il quale esce immediatamente
2871 con un messaggio di errore.
2872
2873 Poi, per verificare che l'argomento specifichi effettivamente una directory,
2874 si esegue (\texttt{\small 24--26}) su di esso una \func{chdir}, uscendo
2875 immediatamente in caso di errore.  Questa funzione serve anche per impostare
2876 la \index{directory~di~lavoro} directory di lavoro del programma nella
2877 directory da tenere sotto controllo, in vista del successivo uso della
2878 funzione \func{daemon}.\footnote{si noti come si è potuta fare questa scelta,
2879   nonostante le indicazioni illustrate in sez.~\ref{sec:sess_daemon}, per il
2880   particolare scopo del programma, che necessita comunque di restare
2881   all'interno di una directory.} Infine (\texttt{\small 27--29}) si installano
2882 i gestori per i vari segnali di terminazione che, avendo a che fare con un
2883 programma che deve essere eseguito come server, sono il solo strumento
2884 disponibile per concluderne l'esecuzione.
2885
2886 Il passo successivo (\texttt{\small 30--39}) è quello di creare gli oggetti di
2887 intercomunicazione necessari. Si inizia costruendo (\texttt{\small 30}) la
2888 chiave da usare come riferimento con il nome del programma,\footnote{si è
2889   usato un riferimento relativo alla home dell'utente, supposto che i sorgenti
2890   di GaPiL siano stati installati direttamente in essa. Qualora si effettui
2891   una installazione diversa si dovrà correggere il programma.} dopo di che si
2892 richiede (\texttt{\small 31}) la creazione di un segmento di memoria condivisa
2893 con usando la funzione \func{ShmCreate} illustrata in precedenza (una pagina
2894 di memoria è sufficiente per i dati che useremo), uscendo (\texttt{\small
2895   32--35}) qualora la creazione ed il successivo agganciamento al processo non
2896 abbia successo. Con l'indirizzo \var{shmptr} così ottenuto potremo poi
2897 accedere alla memoria condivisa, che, per come abbiamo lo abbiamo definito,
2898 sarà vista nella forma data da \struct{DirProp}. Infine (\texttt{\small
2899   36--39}) utilizzando sempre la stessa chiave, si crea, tramite le funzioni
2900 di interfaccia già descritte in sez.~\ref{sec:ipc_sysv_sem}, anche un mutex,
2901 che utilizzeremo per regolare l'accesso alla memoria condivisa.
2902
2903 \begin{figure}[!htbp]
2904   \footnotesize \centering
2905   \begin{minipage}[c]{\codesamplewidth}
2906     \includecodesample{listati/ComputeValues.c}
2907   \end{minipage} 
2908   \normalsize 
2909   \caption{Codice delle funzioni ausiliarie usate da \file{DirMonitor.c}.}
2910   \label{fig:ipc_dirmonitor_sub}
2911 \end{figure}
2912
2913 Completata l'inizializzazione e la creazione degli oggetti di
2914 intercomunicazione il programma entra nel ciclo principale (\texttt{\small
2915   40--49}) dove vengono eseguite indefinitamente le attività di monitoraggio.
2916 Il primo passo (\texttt{\small 41}) è eseguire \func{daemon} per proseguire
2917 con l'esecuzione in background come si conviene ad un programma demone; si
2918 noti che si è mantenuta, usando un valore non nullo del primo argomento, la
2919 \index{directory~di~lavoro} directory di lavoro corrente.  Una volta che il
2920 programma è andato in background l'esecuzione prosegue (\texttt{\small
2921   42--48}) all'interno di un ciclo infinito: si inizia (\texttt{\small 43})
2922 bloccando il mutex con \func{MutexLock} per poter accedere alla memoria
2923 condivisa (la funzione si bloccherà automaticamente se qualche client sta
2924 leggendo), poi (\texttt{\small 44}) si cancellano i valori precedentemente
2925 immagazzinati nella memoria condivisa con \func{memset}, e si esegue
2926 (\texttt{\small 45}) un nuovo calcolo degli stessi utilizzando la funzione
2927 \myfunc{dir\_scan}; infine (\texttt{\small 46}) si sblocca il mutex con
2928 \func{MutexUnlock}, e si attende (\texttt{\small 47}) per il periodo di tempo
2929 specificato a riga di comando con l'opzione \code{-p} con una \func{sleep}.
2930
2931 Si noti come per il calcolo dei valori da mantenere nella memoria condivisa si
2932 sia usata ancora una volta la funzione \myfunc{dir\_scan}, già utilizzata (e
2933 descritta in dettaglio) in sez.~\ref{sec:file_dir_read}, che ci permette di
2934 effettuare la scansione delle voci della directory, chiamando per ciascuna di
2935 esse la funzione \func{ComputeValues}, che esegue tutti i calcoli necessari.
2936
2937 Il codice di quest'ultima è riportato in fig.~\ref{fig:ipc_dirmonitor_sub}.
2938 Come si vede la funzione (\texttt{\small 2--16}) è molto semplice e si limita
2939 a chiamare (\texttt{\small 5}) la funzione \func{stat} sul file indicato da
2940 ciascuna voce, per ottenerne i dati, che poi utilizza per incrementare i vari
2941 contatori nella memoria condivisa, cui accede grazie alla
2942 \index{variabili!globali} variabile globale \var{shmptr}.
2943
2944 Dato che la funzione è chiamata da \myfunc{dir\_scan}, si è all'interno del
2945 ciclo principale del programma, con un mutex acquisito, perciò non è
2946 necessario effettuare nessun controllo e si può accedere direttamente alla
2947 memoria condivisa usando \var{shmptr} per riempire i campi della struttura
2948 \struct{DirProp}; così prima (\texttt{\small 6--7}) si sommano le dimensioni
2949 dei file ed il loro numero, poi, utilizzando le macro di
2950 tab.~\ref{tab:file_type_macro}, si contano (\texttt{\small 8--14}) quanti ce
2951 ne sono per ciascun tipo.
2952
2953 In fig.~\ref{fig:ipc_dirmonitor_sub} è riportato anche il codice
2954 (\texttt{\small 17--23}) del gestore dei segnali di terminazione, usato per
2955 chiudere il programma. Esso, oltre a provocare l'uscita del programma, si
2956 incarica anche di cancellare tutti gli oggetti di intercomunicazione non più
2957 necessari.  Per questo anzitutto (\texttt{\small 19}) acquisisce il mutex con
2958 \func{MutexLock}, per evitare di operare mentre un client sta ancora leggendo
2959 i dati, dopo di che (\texttt{\small 20}) distacca e rimuove il segmento di
2960 memoria condivisa usando \func{ShmRemove}.  Infine (\texttt{\small 21})
2961 rimuove il mutex con \func{MutexRemove} ed esce (\texttt{\small 22}).
2962
2963 \begin{figure}[!htbp]
2964   \footnotesize \centering
2965   \begin{minipage}[c]{\codesamplewidth}
2966     \includecodesample{listati/ReadMonitor.c}
2967   \end{minipage} 
2968   \normalsize 
2969   \caption{Codice del programma client del monitor delle proprietà di una
2970     directory, \file{ReadMonitor.c}.}
2971   \label{fig:ipc_dirmonitor_client}
2972 \end{figure}
2973
2974 Il codice del client usato per leggere le informazioni mantenute nella memoria
2975 condivisa è riportato in fig.~\ref{fig:ipc_dirmonitor_client}. Al solito si è
2976 omessa la sezione di gestione delle opzioni e la funzione che stampa a video
2977 le istruzioni; il codice completo è nei sorgenti allegati, nel file
2978 \file{ReadMonitor.c}.
2979
2980 Una volta conclusa la gestione delle opzioni a riga di comando il programma
2981 rigenera (\texttt{\small 7}) con \func{ftok} la stessa chiave usata dal server
2982 per identificare il segmento di memoria condivisa ed il mutex, poi
2983 (\texttt{\small 8}) richiede con \func{ShmFind} l'indirizzo della memoria
2984 condivisa agganciando al contempo il segmento al processo, Infine
2985 (\texttt{\small 17--20}) con \func{MutexFind} si richiede l'identificatore del
2986 mutex.  Completata l'inizializzazione ed ottenuti i riferimenti agli oggetti
2987 di intercomunicazione necessari viene eseguito il corpo principale del
2988 programma (\texttt{\small 21--33}); si comincia (\texttt{\small 22})
2989 acquisendo il mutex con \func{MutexLock}; qui avviene il blocco del processo
2990 se la memoria condivisa non è disponibile.  Poi (\texttt{\small 23--31}) si
2991 stampano i vari valori mantenuti nella memoria condivisa attraverso l'uso di
2992 \var{shmptr}.  Infine (\texttt{\small 41}) con \func{MutexUnlock} si rilascia
2993 il mutex, prima di uscire.
2994
2995 Verifichiamo allora il funzionamento dei nostri programmi; al solito, usando
2996 le funzioni di libreria occorre definire opportunamente
2997 \code{LD\_LIBRARY\_PATH}; poi si potrà lanciare il server con:
2998 \begin{Verbatim}
2999 [piccardi@gont sources]$ ./dirmonitor ./
3000 \end{Verbatim}
3001 %$
3002 ed avendo usato \func{daemon} il comando ritornerà immediatamente. Una volta
3003 che il server è in esecuzione, possiamo passare ad invocare il client per
3004 verificarne i risultati, in tal caso otterremo:
3005 \begin{Verbatim}
3006 [piccardi@gont sources]$ ./readmon 
3007 Ci sono 68 file dati
3008 Ci sono 3 directory
3009 Ci sono 0 link
3010 Ci sono 0 fifo
3011 Ci sono 0 socket
3012 Ci sono 0 device a caratteri
3013 Ci sono 0 device a blocchi
3014 Totale  71 file, per 489831 byte
3015 \end{Verbatim}
3016 %$
3017 ed un rapido calcolo (ad esempio con \code{ls -a | wc} per contare i file) ci
3018 permette di verificare che il totale dei file è giusto. Un controllo con
3019 \cmd{ipcs} ci permette inoltre di verificare la presenza di un segmento di
3020 memoria condivisa e di un semaforo:
3021 \begin{Verbatim}
3022 [piccardi@gont sources]$ ipcs
3023 ------ Shared Memory Segments --------
3024 key        shmid      owner      perms      bytes      nattch     status      
3025 0xffffffff 54067205   piccardi  666        4096       1                       
3026
3027 ------ Semaphore Arrays --------
3028 key        semid      owner      perms      nsems     
3029 0xffffffff 229376     piccardi  666        1         
3030
3031 ------ Message Queues --------
3032 key        msqid      owner      perms      used-bytes   messages    
3033 \end{Verbatim}
3034 %$
3035
3036 Se a questo punto aggiungiamo un file, ad esempio con \code{touch prova},
3037 potremo verificare che, passati nel peggiore dei casi almeno 10 secondi (o
3038 l'eventuale altro intervallo impostato per la rilettura dei dati) avremo:
3039 \begin{Verbatim}
3040 [piccardi@gont sources]$ ./readmon 
3041 Ci sono 69 file dati
3042 Ci sono 3 directory
3043 Ci sono 0 link
3044 Ci sono 0 fifo
3045 Ci sono 0 socket
3046 Ci sono 0 device a caratteri
3047 Ci sono 0 device a blocchi
3048 Totale  72 file, per 489887 byte
3049 \end{Verbatim}
3050 %$
3051
3052 A questo punto possiamo far uscire il server inviandogli un segnale di
3053 \signal{SIGTERM} con il comando \code{killall dirmonitor}, a questo punto
3054 ripetendo la lettura, otterremo un errore:
3055 \begin{Verbatim}
3056 [piccardi@gont sources]$ ./readmon 
3057 Cannot find shared memory: No such file or directory
3058 \end{Verbatim}
3059 %$
3060 e inoltre potremo anche verificare che anche gli oggetti di intercomunicazione
3061 visti in precedenza sono stati regolarmente  cancellati:
3062 \begin{Verbatim}
3063 [piccardi@gont sources]$ ipcs
3064 ------ Shared Memory Segments --------
3065 key        shmid      owner      perms      bytes      nattch     status      
3066
3067 ------ Semaphore Arrays --------
3068 key        semid      owner      perms      nsems     
3069
3070 ------ Message Queues --------
3071 key        msqid      owner      perms      used-bytes   messages    
3072 \end{Verbatim}
3073 %$
3074
3075
3076 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
3077 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
3078 %% condivisa; uno schema semplificato della struttura è illustrato in
3079 %% fig.~\ref{fig:ipc_shm_struct}. 
3080
3081 %% \begin{figure}[!htb]
3082 %%   \centering
3083 %%   \includegraphics[width=10cm]{img/shmstruct}
3084 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
3085 %%     Linux.}
3086 %%   \label{fig:ipc_shm_struct}
3087 %% \end{figure}
3088
3089
3090
3091
3092 \section{Tecniche alternative}
3093 \label{sec:ipc_alternatives}
3094
3095 Come abbiamo detto in sez.~\ref{sec:ipc_sysv_generic}, e ripreso nella
3096 descrizione dei singoli oggetti che ne fan parte, il \textit{SysV IPC}
3097 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
3098   capitolo 14.}  Stevens ne effettua una accurata analisi (alcuni dei concetti
3099 sono già stati accennati in precedenza) ed elenca alcune possibili tecniche
3100 alternative, che vogliamo riprendere in questa sezione.
3101
3102
3103 \subsection{Alternative alle code di messaggi}
3104 \label{sec:ipc_mq_alternative}
3105  
3106 Le code di messaggi sono probabilmente il meno usato degli oggetti del
3107 \textit{SysV IPC}; esse infatti nacquero principalmente come meccanismo di
3108 comunicazione bidirezionale quando ancora le pipe erano unidirezionali; con la
3109 disponibilità di \func{socketpair} (vedi sez.~\ref{sec:ipc_socketpair}) o
3110 utilizzando una coppia di pipe, si può ottenere questo risultato senza
3111 incorrere nelle complicazioni introdotte dal \textit{SysV IPC}.
3112
3113 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
3114 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
3115 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
3116 sono impossibili da ottenere con le pipe e i socket di \func{socketpair}.  A
3117 queste esigenze però si può comunque ovviare in maniera diversa con un uso
3118 combinato della memoria condivisa e dei meccanismi di sincronizzazione, per
3119 cui alla fine l'uso delle code di messaggi classiche è relativamente poco
3120 diffuso.
3121
3122 % TODO: trattare qui, se non ssis trova posto migliore, copy_from_process e
3123 % copy_to_process, introdotte con il kernel 3.2. Vedi
3124 % http://lwn.net/Articles/405346/ e
3125 % http://ozlabs.org/~cyeoh/cma/process_vm_readv.txt 
3126
3127
3128 \subsection{I \textsl{file di lock}}
3129 \label{sec:ipc_file_lock}
3130
3131 \index{file!di lock|(}
3132
3133 Come illustrato in sez.~\ref{sec:ipc_sysv_sem} i semafori del \textit{SysV IPC}
3134 presentano una interfaccia inutilmente complessa e con alcuni difetti
3135 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
3136 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
3137 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
3138 necessità di un contatore come i semafori, si possono utilizzare metodi
3139 alternativi.
3140
3141 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
3142 dei \textsl{file di lock} (per i quali esiste anche una opportuna directory,
3143 \file{/var/lock}, nel filesystem standard). Per questo si usa la
3144 caratteristica della funzione \func{open} (illustrata in
3145 sez.~\ref{sec:file_open_close}) che prevede\footnote{questo è quanto dettato dallo
3146   standard POSIX.1, ciò non toglie che in alcune implementazioni questa
3147   tecnica possa non funzionare; in particolare per Linux, nel caso di NFS, si
3148   è comunque soggetti alla possibilità di una \itindex{race~condition}
3149   \textit{race condition}.} che essa ritorni un errore quando usata con i
3150 flag di \const{O\_CREAT} e \const{O\_EXCL}. In tal modo la creazione di un
3151 \textsl{file di lock} può essere eseguita atomicamente, il processo che crea
3152 il file con successo si può considerare come titolare del lock (e della
3153 risorsa ad esso associata) mentre il rilascio si può eseguire con una chiamata
3154 ad \func{unlink}.
3155
3156 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3157 \func{LockFile} ed \func{UnlockFile} riportate in fig.~\ref{fig:ipc_file_lock}
3158 (sono contenute in \file{LockFile.c}, un altro dei sorgenti allegati alla
3159 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3160   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3161 (\texttt{\small 4--10}) si limita ad aprire il file di lock (\texttt{\small
3162   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11--17}) lo
3163 cancella con \func{unlink}.
3164
3165 \begin{figure}[!htbp]
3166   \footnotesize \centering
3167   \begin{minipage}[c]{\codesamplewidth}
3168     \includecodesample{listati/LockFile.c}
3169   \end{minipage} 
3170   \normalsize 
3171   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3172     permettono di creare e rimuovere un \textsl{file di lock}.}
3173   \label{fig:ipc_file_lock}
3174 \end{figure}
3175
3176 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3177 sez.~\ref{sec:file_open_close}, questo comportamento di \func{open} può non
3178 funzionare (la funzione viene eseguita, ma non è garantita l'atomicità
3179 dell'operazione) se il filesystem su cui si va ad operare è su NFS; in tal
3180 caso si può adottare una tecnica alternativa che prevede l'uso della
3181 \func{link} per creare come \textsl{file di lock} un hard link ad un file
3182 esistente; se il link esiste già e la funzione fallisce, significa che la
3183 risorsa è bloccata e potrà essere sbloccata solo con un \func{unlink},
3184 altrimenti il link è creato ed il lock acquisito; il controllo e l'eventuale
3185 acquisizione sono atomici; la soluzione funziona anche su NFS, ma ha un altro
3186 difetto è che è quello di poterla usare solo se si opera all'interno di uno
3187 stesso filesystem.
3188
3189 In generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3190 problemi che non lo rendono una alternativa praticabile per la
3191 sincronizzazione: anzitutto in caso di terminazione imprevista del processo,
3192 si lascia allocata la risorsa (il \textsl{file di lock}) e questa deve essere
3193 sempre cancellata esplicitamente.  Inoltre il controllo della disponibilità
3194 può essere eseguito solo con una tecnica di \itindex{polling}
3195 \textit{polling}, ed è quindi molto inefficiente.
3196
3197 La tecnica dei file di lock ha comunque una sua utilità, e può essere usata
3198 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3199 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3200 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3201 più programmi: qualora si trovi un file di lock il programma che cerca di
3202 accedere alla seriale si limita a segnalare che la risorsa non è disponibile.
3203
3204 \index{file!di lock|)}
3205
3206
3207 \subsection{La sincronizzazione con il \textit{file locking}}
3208 \label{sec:ipc_lock_file}
3209
3210 Dato che i \index{file!di lock} file di lock presentano gli inconvenienti
3211 illustrati in precedenza, la tecnica alternativa di sincronizzazione più
3212 comune è quella di fare ricorso al \itindex{file~locking} \textit{file
3213   locking} (trattato in sez.~\ref{sec:file_locking}) usando \func{fcntl} su un
3214 file creato per l'occasione per ottenere un write lock. In questo modo potremo
3215 usare il lock come un \textit{mutex}: per bloccare la risorsa basterà
3216 acquisire il lock, per sbloccarla basterà rilasciare il lock. Una richiesta
3217 fatta con un write lock metterà automaticamente il processo in stato di
3218 attesa, senza necessità di ricorrere al \itindex{polling} \textit{polling} per
3219 determinare la disponibilità della risorsa, e al rilascio della stessa da
3220 parte del processo che la occupava si otterrà il nuovo lock atomicamente.
3221
3222 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3223 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3224 chiusura dei relativi file) e non ci si deve preoccupare di niente; inoltre
3225 non consuma risorse permanentemente allocate nel sistema. Lo svantaggio è che,
3226 dovendo fare ricorso a delle operazioni sul filesystem, esso è in genere
3227 leggermente più lento.
3228
3229 \begin{figure}[!htbp]
3230   \footnotesize \centering
3231   \begin{minipage}[c]{\codesamplewidth}
3232     \includecodesample{listati/MutexLocking.c}
3233   \end{minipage} 
3234   \normalsize 
3235   \caption{Il codice delle funzioni che permettono per la gestione dei 
3236     \textit{mutex} con il \itindex{file~locking} \textit{file locking}.}
3237   \label{fig:ipc_flock_mutex}
3238 \end{figure}
3239
3240 Il codice delle varie funzioni usate per implementare un mutex utilizzando il
3241 \textit{file locking} \itindex{file~locking} è riportato in
3242 fig.~\ref{fig:ipc_flock_mutex}; si è mantenuta volutamente una struttura
3243 analoga alle precedenti funzioni che usano i semafori, anche se le due
3244 interfacce non possono essere completamente equivalenti, specie per quanto
3245 riguarda la rimozione del mutex.
3246
3247 La prima funzione (\texttt{\small 1--5}) è \func{CreateMutex}, e serve a
3248 creare il mutex; la funzione è estremamente semplice, e si limita
3249 (\texttt{\small 4}) a creare, con una opportuna chiamata ad \func{open}, il
3250 file che sarà usato per il successivo \textit{file locking}, assicurandosi che
3251 non esista già (nel qual caso segnala un errore); poi restituisce il file
3252 descriptor che sarà usato dalle altre funzioni per acquisire e rilasciare il
3253 mutex.
3254
3255 La seconda funzione (\texttt{\small 6--10}) è \func{FindMutex}, che, come la
3256 precedente, è stata definita per mantenere una analogia con la corrispondente
3257 funzione basata sui semafori. Anch'essa si limita (\texttt{\small 9}) ad
3258 aprire il file da usare per il \itindex{file~locking} \textit{file locking},
3259 solo che in questo caso le opzioni di \func{open} sono tali che il file in
3260 questione deve esistere di già.
3261
3262 La terza funzione (\texttt{\small 11--22}) è \func{LockMutex} e serve per
3263 acquisire il mutex. La funzione definisce (\texttt{\small 14}) e inizializza
3264 (\texttt{\small 16--19}) la struttura \var{lock} da usare per acquisire un
3265 write lock sul file, che poi (\texttt{\small 21}) viene richiesto con
3266 \func{fcntl}, restituendo il valore di ritorno di quest'ultima. Se il file è
3267 libero il lock viene acquisito e la funzione ritorna immediatamente;
3268 altrimenti \func{fcntl} si bloccherà (si noti che la si è chiamata con
3269 \const{F\_SETLKW}) fino al rilascio del lock.
3270
3271 La quarta funzione (\texttt{\small 24--34}) è \func{UnlockMutex} e serve a
3272 rilasciare il mutex. La funzione è analoga alla precedente, solo che in questo
3273 caso si inizializza (\texttt{\small 28--31}) la struttura \var{lock} per il
3274 rilascio del lock, che viene effettuato (\texttt{\small 33}) con la opportuna
3275 chiamata a \func{fcntl}. Avendo usato il \itindex{file~locking} \textit{file
3276   locking} in semantica POSIX (si riveda quanto detto
3277 sez.~\ref{sec:file_posix_lock}) solo il processo che ha precedentemente
3278 eseguito il lock può sbloccare il mutex.
3279
3280 La quinta funzione (\texttt{\small 36--39}) è \func{RemoveMutex} e serve a
3281 cancellare il mutex. Anche questa funzione è stata definita per mantenere una
3282 analogia con le funzioni basate sui semafori, e si limita a cancellare
3283 (\texttt{\small 38}) il file con una chiamata ad \func{unlink}. Si noti che in
3284 questo caso la funzione non ha effetto sui mutex già ottenuti con precedenti
3285 chiamate a \func{FindMutex} o \func{CreateMutex}, che continueranno ad essere
3286 disponibili fintanto che i relativi file descriptor restano aperti. Pertanto
3287 per rilasciare un mutex occorrerà prima chiamare \func{UnlockMutex} oppure
3288 chiudere il file usato per il lock.
3289
3290 La sesta funzione (\texttt{\small 41--55}) è \func{ReadMutex} e serve a
3291 leggere lo stato del mutex. In questo caso si prepara (\texttt{\small 46--49})
3292 la solita struttura \var{lock} come l'acquisizione del lock, ma si effettua
3293 (\texttt{\small 51}) la chiamata a \func{fcntl} usando il comando
3294 \const{F\_GETLK} per ottenere lo stato del lock, e si restituisce
3295 (\texttt{\small 52}) il valore di ritorno in caso di errore, ed il valore del
3296 campo \var{l\_type} (che descrive lo stato del lock) altrimenti
3297 (\texttt{\small 54}). Per questo motivo la funzione restituirà -1 in caso di
3298 errore e uno dei due valori \const{F\_UNLCK} o \const{F\_WRLCK}\footnote{non
3299   si dovrebbe mai avere il terzo valore possibile, \const{F\_RDLCK}, dato che
3300   la nostra interfaccia usa solo i write lock. Però è sempre possibile che
3301   siano richiesti altri lock sul file al di fuori dell'interfaccia, nel qual
3302   caso si potranno avere, ovviamente, interferenze indesiderate.} in caso di
3303 successo, ad indicare che il mutex è, rispettivamente, libero o occupato.
3304
3305 Basandosi sulla semantica dei file lock POSIX valgono tutte le considerazioni
3306 relative al comportamento di questi ultimi fatte in
3307 sez.~\ref{sec:file_posix_lock}; questo significa ad esempio che, al contrario
3308 di quanto avveniva con l'interfaccia basata sui semafori, chiamate multiple a
3309 \func{UnlockMutex} o \func{LockMutex} non si cumulano e non danno perciò
3310 nessun inconveniente.
3311
3312
3313 \subsection{Il \textit{memory mapping} anonimo}
3314 \label{sec:ipc_mmap_anonymous}
3315
3316 \itindbeg{memory~mapping}
3317 Abbiamo già visto che quando i processi sono \textsl{correlati}\footnote{se
3318   cioè hanno almeno un progenitore comune.} l'uso delle pipe può costituire
3319 una valida alternativa alle code di messaggi; nella stessa situazione si può
3320 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3321 \textit{memory mapping} anonimo.
3322
3323 In sez.~\ref{sec:file_memory_map} abbiamo visto come sia possibile mappare il
3324 contenuto di un file nella memoria di un processo, e che, quando viene usato
3325 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3326 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3327 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3328 inefficiente, in quanto occorre passare attraverso il disco. Però abbiamo
3329 visto anche che se si esegue la mappatura con il flag \const{MAP\_ANONYMOUS}
3330 la regione mappata non viene associata a nessun file, anche se quanto scritto
3331 rimane in memoria e può essere riletto; allora, dato che un processo figlio
3332 mantiene nel suo spazio degli indirizzi anche le regioni mappate, esso sarà
3333 anche in grado di accedere a quanto in esse è contenuto.
3334
3335 In questo modo diventa possibile creare una memoria condivisa fra processi
3336 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3337 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3338   funzionalità simile a questa viene implementata mappando il file speciale
3339   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3340   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3341   restano in memoria e possono essere riletti secondo le stesse modalità usate
3342   nel \textit{memory mapping} anonimo.} Vedremo come utilizzare questa tecnica
3343 più avanti, quando realizzeremo una nuova versione del monitor visto in
3344 sez.~\ref{sec:ipc_sysv_shm} che possa restituisca i risultati via rete.
3345 \itindend{memory~mapping}
3346
3347 % TODO: fare esempio di mmap anonima
3348
3349 % TODO: con il kernel 3.2 è stata introdotta un nuovo meccanismo di
3350 % intercomunicazione veloce chiamato Cross Memory Attach, da capire se e come
3351 % trattarlo qui, vedi http://lwn.net/Articles/405346/
3352 % https://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commitdiff;h=fcf634098c00dd9cd247447368495f0b79be12d1
3353
3354 \section{L'intercomunicazione fra processi di POSIX}
3355 \label{sec:ipc_posix}
3356
3357 Per superare i numerosi problemi del \textit{SysV IPC}, evidenziati per i suoi
3358 aspetti generali in coda a sez.~\ref{sec:ipc_sysv_generic} e per i singoli
3359 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3360 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3361 una interfaccia completamente nuova, che tratteremo in questa sezione.
3362
3363
3364 \subsection{Considerazioni generali}
3365 \label{sec:ipc_posix_generic}
3366
3367 Oggi Linux supporta tutti gli oggetti definito nello standard POSIX per l'IPC,
3368 ma a lungo non è stato così; la memoria condivisa è presente a partire dal
3369 kernel 2.4.x, i semafori sono forniti dalla \acr{glibc} nella sezione che
3370 implementa i \itindex{thread} \textit{thread} POSIX di nuova generazione che
3371 richiedono il kernel 2.6, le code di messaggi sono supportate a partire dal
3372 kernel 2.6.6.
3373
3374 La caratteristica fondamentale dell'interfaccia POSIX è l'abbandono dell'uso
3375 degli identificatori e delle chiavi visti nel SysV IPC, per passare ai
3376 \itindex{POSIX~IPC~names} \textit{POSIX IPC names}, che sono sostanzialmente
3377 equivalenti ai nomi dei file. Tutte le funzioni che creano un oggetto di IPC
3378 POSIX prendono come primo argomento una stringa che indica uno di questi nomi;
3379 lo standard è molto generico riguardo l'implementazione, ed i nomi stessi
3380 possono avere o meno una corrispondenza sul filesystem; tutto quello che è
3381 richiesto è che:
3382 \begin{itemize*}
3383 \item i nomi devono essere conformi alle regole che caratterizzano i
3384   \textit{pathname}, in particolare non essere più lunghi di \const{PATH\_MAX}
3385   byte e terminati da un carattere nullo.
3386 \item se il nome inizia per una \texttt{/} chiamate differenti allo stesso
3387   nome fanno riferimento allo stesso oggetto, altrimenti l'interpretazione del
3388   nome dipende dall'implementazione.
3389 \item l'interpretazione di ulteriori \texttt{/} presenti nel nome dipende
3390   dall'implementazione.
3391 \end{itemize*}
3392
3393 Data la assoluta genericità delle specifiche, il comportamento delle funzioni
3394 è subordinato in maniera quasi completa alla relativa
3395 implementazione.\footnote{tanto che Stevens in \cite{UNP2} cita questo caso
3396   come un esempio della maniera standard usata dallo standard POSIX per
3397   consentire implementazioni non standardizzabili.} Nel caso di Linux, sia per
3398 quanto riguarda la memoria condivisa ed i semafori, che per quanto riguarda le
3399 code di messaggi, tutto viene creato usando come radici delle opportune
3400 directory (rispettivamente \file{/dev/shm} e \file{/dev/mqueue}, per i
3401 dettagli si faccia riferimento a sez.~\ref{sec:ipc_posix_shm},
3402 sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq}) ed i nomi
3403 specificati nelle relative funzioni sono considerati come un
3404 \itindsub{pathname}{assoluto} \textit{pathname} assoluto (comprendente
3405 eventuali sottodirectory) rispetto a queste radici.
3406
3407 Il vantaggio degli oggetti di IPC POSIX è comunque che essi vengono inseriti
3408 nell'albero dei file, e possono essere maneggiati con le usuali funzioni e
3409 comandi di accesso ai file,\footnote{questo è vero nel caso di Linux, che usa
3410   una implementazione che lo consente, non è detto che altrettanto valga per
3411   altri kernel; in particolare, come si può facilmente verificare con uno
3412   \cmd{strace}, sia per la memoria condivisa che per le code di messaggi le
3413   system call utilizzate da Linux sono le stesse di quelle dei file, essendo
3414   detti oggetti realizzati come tali in appositi filesystem.}  che funzionano
3415 come su dei file normali.
3416
3417 In particolare i permessi associati agli oggetti di IPC POSIX sono identici ai
3418 permessi dei file, ed il controllo di accesso segue esattamente la stessa
3419 semantica (quella illustrata in sez.~\ref{sec:file_access_control}), e non
3420 quella particolare (si ricordi quanto visto in
3421 sez.~\ref{sec:ipc_sysv_access_control}) che viene usata per gli oggetti del
3422 SysV IPC.  Per quanto riguarda l'attribuzione dell'utente e del gruppo
3423 proprietari dell'oggetto alla creazione di quest'ultimo essa viene effettuata
3424 secondo la semantica SysV: corrispondono cioè a \ids{UID} e \ids{GID} effettivi
3425 del processo che esegue la creazione.
3426
3427
3428 \subsection{Code di messaggi}
3429 \label{sec:ipc_posix_mq}
3430
3431 Le code di messaggi POSIX sono supportate da Linux a partire dalla versione
3432 2.6.6-rc1 del kernel,\footnote{l'implementazione è dovuta a Michal Wronski e
3433   Krzysztof Benedyczak, e le relative informazioni si possono trovare su
3434   \url{http://www.geocities.com/wronski12/posix_ipc/index.html}.} In
3435 generale, come le corrispettive del SysV IPC, le code di messaggi sono poco
3436 usate, dato che i socket, nei casi in cui sono sufficienti, sono più comodi, e
3437 che in casi più complessi la comunicazione può essere gestita direttamente con
3438 mutex (o semafori) e memoria condivisa con tutta la flessibilità che occorre.
3439
3440 Per poter utilizzare le code di messaggi, oltre ad utilizzare un kernel
3441 superiore al 2.6.6 (o precedente, se sono stati opportunamente applicati i
3442 relativi patch) occorre utilizzare la libreria \file{libmqueue}\footnote{i
3443   programmi che usano le code di messaggi cioè devono essere compilati
3444   aggiungendo l'opzione \code{-lmqueue} al comando \cmd{gcc}; in
3445   corrispondenza all'inclusione del supporto nel kernel ufficiale anche
3446   \file{libmqueue} è stata inserita nella \acr{glibc}, a partire dalla
3447   versione 2.3.4 delle medesime.} che contiene le funzioni dell'interfaccia
3448 POSIX.\footnote{in realtà l'implementazione è realizzata tramite delle
3449   opportune chiamate ad \func{ioctl} sui file del filesystem speciale su cui
3450   vengono mantenuti questi oggetti di IPC.}
3451
3452 La libreria inoltre richiede la presenza dell'apposito filesystem di tipo
3453 \texttt{mqueue} montato su \file{/dev/mqueue}; questo può essere fatto
3454 aggiungendo ad \conffile{/etc/fstab} una riga come:
3455 \begin{verbatim}
3456 mqueue   /dev/mqueue       mqueue    defaults        0      0
3457 \end{verbatim}
3458 ed esso sarà utilizzato come radice sulla quale vengono risolti i nomi delle
3459 code di messaggi che iniziano con una ``\texttt{/}''. Le opzioni di mount
3460 accettate sono \texttt{uid}, \texttt{gid} e \texttt{mode} che permettono
3461 rispettivamente di impostare l'utente, il gruppo ed i permessi associati al
3462 filesystem.
3463
3464
3465 La funzione che permette di aprire (e crearla se non esiste ancora) una coda
3466 di messaggi POSIX è \funcd{mq\_open}, ed il suo prototipo è:
3467 \begin{functions}
3468   \headdecl{mqueue.h} 
3469   
3470   \funcdecl{mqd\_t mq\_open(const char *name, int oflag)}
3471   
3472   \funcdecl{mqd\_t mq\_open(const char *name, int oflag, unsigned long mode,
3473     struct mq\_attr *attr)}
3474   
3475   Apre una coda di messaggi POSIX impostandone le caratteristiche.
3476   
3477   \bodydesc{La funzione restituisce il descrittore associato alla coda in caso
3478     di successo e -1 per un errore; nel quel caso \var{errno} assumerà i
3479     valori:
3480     \begin{errlist}
3481     \item[\errcode{EACCES}] il processo non ha i privilegi per accedere al
3482       alla memoria secondo quanto specificato da \param{oflag}.
3483     \item[\errcode{EEXIST}] si è specificato \const{O\_CREAT} e
3484       \const{O\_EXCL} ma la coda già esiste.
3485     \item[\errcode{EINVAL}] il file non supporta la funzione, o si è
3486       specificato \const{O\_CREAT} con una valore non nullo di \param{attr} e
3487       valori non validi di \var{mq\_maxmsg} e \var{mq\_msgsize}.
3488     \item[\errcode{ENOENT}] non si è specificato \const{O\_CREAT} ma la coda
3489       non esiste.
3490     \end{errlist}
3491     ed inoltre \errval{ENOMEM}, \errval{ENOSPC}, \errval{EFAULT},
3492     \errval{EMFILE}, \errval{EINTR} ed \errval{ENFILE}.
3493 }
3494 \end{functions}
3495
3496 La funzione apre la coda di messaggi identificata dall'argomento \param{name}
3497 restituendo il descrittore ad essa associato, del tutto analogo ad un file
3498 descriptor, con l'unica differenza che lo standard prevede un apposito tipo
3499 \type{mqd\_t}.\footnote{nel caso di Linux si tratta in effetti proprio di un
3500   normale file descriptor; pertanto, anche se questo comportamento non è
3501   portabile, lo si può tenere sotto osservazione con le funzioni dell'I/O
3502   multiplexing (vedi sez.~\ref{sec:file_multiplexing}) come possibile
3503   alternativa all'uso dell'interfaccia di notifica di \func{mq\_notify} (che
3504   vedremo a breve).} Se la coda esiste già il descrittore farà riferimento
3505 allo stesso oggetto, consentendo così la comunicazione fra due processi
3506 diversi.
3507
3508 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3509 possono essere specificati per \param{oflag}, che deve essere specificato come
3510 maschera binaria; i valori possibili per i vari bit sono quelli visti in
3511 sez.~\ref{sec:file_open_close} dei quali però \func{mq\_open} riconosce solo i
3512 seguenti:
3513 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
3514 \item[\const{O\_RDONLY}] Apre la coda solo per la ricezione di messaggi. Il
3515   processo potrà usare il descrittore con \func{mq\_receive} ma non con
3516   \func{mq\_send}.
3517 \item[\const{O\_WRONLY}] Apre la coda solo per la trasmissione di messaggi. Il
3518   processo potrà usare il descrittore con \func{mq\_send} ma non con
3519   \func{mq\_receive}.
3520 \item[\const{O\_RDWR}] Apre la coda solo sia per la trasmissione che per la
3521   ricezione. 
3522 \item[\const{O\_CREAT}] Necessario qualora si debba creare la coda; la
3523   presenza di questo bit richiede la presenza degli ulteriori argomenti
3524   \param{mode} e \param{attr}.
3525 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3526   chiamata se la coda esiste già, altrimenti esegue la creazione atomicamente.
3527 \item[\const{O\_NONBLOCK}] Imposta la coda in modalità non bloccante, le
3528   funzioni di ricezione e trasmissione non si bloccano quando non ci sono le
3529   risorse richieste, ma ritornano immediatamente con un errore di
3530   \errcode{EAGAIN}.
3531 \end{basedescript}
3532
3533 I primi tre bit specificano la modalità di apertura della coda, e sono fra
3534 loro esclusivi. Ma qualunque sia la modalità in cui si è aperta una coda,
3535 questa potrà essere riaperta più volte in una modalità diversa, e vi si potrà
3536 sempre accedere attraverso descrittori diversi, esattamente come si può fare
3537 per i file normali.
3538
3539 Se la coda non esiste e la si vuole creare si deve specificare
3540 \const{O\_CREAT}, in tal caso occorre anche specificare i permessi di
3541 creazione con l'argomento \param{mode};\footnote{fino al 2.6.14 per un bug i
3542   valori della \textit{umask} del processo non venivano applicati a questi
3543   permessi.} i valori di quest'ultimo sono identici a quelli usati per
3544 \func{open}, anche se per le code di messaggi han senso solo i permessi di
3545 lettura e scrittura. Oltre ai permessi di creazione possono essere specificati
3546 anche gli attributi specifici della coda tramite l'argomento \param{attr};
3547 quest'ultimo è un puntatore ad una apposita struttura \struct{mq\_attr}, la
3548 cui definizione è riportata in fig.~\ref{fig:ipc_mq_attr}.
3549
3550 \begin{figure}[!htb]
3551   \footnotesize \centering
3552   \begin{minipage}[c]{\textwidth}
3553     \includestruct{listati/mq_attr.h}
3554   \end{minipage} 
3555   \normalsize
3556   \caption{La struttura \structd{mq\_attr}, contenente gli attributi di una
3557     coda di messaggi POSIX.}
3558   \label{fig:ipc_mq_attr}
3559 \end{figure}
3560
3561 Per la creazione della coda i campi della struttura che devono essere
3562 specificati sono \var{mq\_maxmsg} e \var{mq\_msgsize}, che indicano
3563 rispettivamente il numero massimo di messaggi che può contenere e la
3564 dimensione massima di un messaggio. Il valore dovrà essere positivo e minore
3565 dei rispettivi limiti di sistema \const{MQ\_MAXMSG} e \const{MQ\_MSGSIZE},
3566 altrimenti la funzione fallirà con un errore di \errcode{EINVAL}.
3567 Se \param{attr} è un puntatore nullo gli attributi della coda saranno
3568 impostati ai valori predefiniti.
3569
3570 Quando l'accesso alla coda non è più necessario si può chiudere il relativo
3571 descrittore con la funzione \funcd{mq\_close}, il cui prototipo è:
3572 \begin{prototype}{mqueue.h}
3573 {int mq\_close(mqd\_t mqdes)}
3574
3575 Chiude la coda \param{mqdes}.
3576   
3577 \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore;
3578   nel quel caso \var{errno} assumerà i valori \errval{EBADF} o
3579   \errval{EINTR}.}
3580 \end{prototype}
3581
3582 La funzione è analoga a \func{close},\footnote{in Linux, dove le code sono
3583   implementate come file su un filesystem dedicato, è esattamente la stessa
3584   funzione.} dopo la sua esecuzione il processo non sarà più in grado di usare
3585 il descrittore della coda, ma quest'ultima continuerà ad esistere nel sistema
3586 e potrà essere acceduta con un'altra chiamata a \func{mq\_open}. All'uscita di
3587 un processo tutte le code aperte, così come i file, vengono chiuse
3588 automaticamente. Inoltre se il processo aveva agganciato una richiesta di
3589 notifica sul descrittore che viene chiuso, questa sarà rilasciata e potrà
3590 essere richiesta da qualche altro processo.
3591
3592
3593 Quando si vuole effettivamente rimuovere una coda dal sistema occorre usare la
3594 funzione \funcd{mq\_unlink}, il cui prototipo è:
3595 \begin{prototype}{mqueue.h}
3596 {int mq\_unlink(const char *name)}
3597
3598 Rimuove una coda di messaggi.
3599   
3600 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3601   errore; nel quel caso \var{errno} assumerà gli stessi valori riportati da
3602   \func{unlink}.}
3603 \end{prototype}
3604
3605 Anche in questo caso il comportamento della funzione è analogo a quello di
3606 \func{unlink} per i file,\footnote{di nuovo l'implementazione di Linux usa
3607   direttamente \func{unlink}.} la funzione rimuove la coda \param{name}, così
3608 che una successiva chiamata a \func{mq\_open} fallisce o crea una coda
3609 diversa. 
3610
3611 Come per i file ogni coda di messaggi ha un contatore di riferimenti, per cui
3612 la coda non viene effettivamente rimossa dal sistema fin quando questo non si
3613 annulla. Pertanto anche dopo aver eseguito con successo \func{mq\_unlink} la
3614 coda resterà accessibile a tutti i processi che hanno un descrittore aperto su
3615 di essa.  Allo stesso modo una coda ed i suoi contenuti resteranno disponibili
3616 all'interno del sistema anche quando quest'ultima non è aperta da nessun
3617 processo (questa è una delle differenze più rilevanti nei confronti di pipe e
3618 fifo).  La sola differenza fra code di messaggi POSIX e file normali è che,
3619 essendo il filesystem delle code di messaggi virtuale e basato su oggetti
3620 interni al kernel, il suo contenuto viene perduto con il riavvio del sistema.
3621
3622 Come accennato ad ogni coda di messaggi è associata una struttura
3623 \struct{mq\_attr}, che può essere letta e modificata attraverso le due
3624 funzioni \funcd{mq\_getattr} e \funcd{mq\_setattr}, i cui prototipi sono:
3625 \begin{functions}
3626   \headdecl{mqueue.h} 
3627   
3628   \funcdecl{int mq\_getattr(mqd\_t mqdes, struct mq\_attr *mqstat)}
3629   Legge gli attributi di una coda di messaggi POSIX.
3630   
3631   \funcdecl{int mq\_setattr(mqd\_t mqdes, const struct mq\_attr *mqstat,
3632     struct mq\_attr *omqstat)}
3633   Modifica gli attributi di una coda di messaggi POSIX.
3634   
3635   \bodydesc{Entrambe le funzioni restituiscono 0 in caso di successo e -1 in
3636     caso di errore; nel quel caso \var{errno} assumerà i valori \errval{EBADF}
3637     o \errval{EINVAL}.}
3638 \end{functions}
3639
3640 La funzione \func{mq\_getattr} legge i valori correnti degli attributi della
3641 coda nella struttura puntata da \param{mqstat}; di questi l'unico relativo
3642 allo stato corrente della coda è \var{mq\_curmsgs} che indica il numero di
3643 messaggi da essa contenuti, gli altri indicano le caratteristiche generali
3644 della stessa.
3645
3646 La funzione \func{mq\_setattr} permette di modificare gli attributi di una
3647 coda tramite i valori contenuti nella struttura puntata da \param{mqstat}, ma
3648 può essere modificato solo il campo \var{mq\_flags}, gli altri campi vengono
3649 ignorati. In particolare i valori di \var{mq\_maxmsg} e \var{mq\_msgsize}
3650 possono essere specificati solo in fase ci creazione della coda.  Inoltre i
3651 soli valori possibili per \var{mq\_flags} sono 0 e \const{O\_NONBLOCK}, per
3652 cui alla fine la funzione può essere utilizzata solo per abilitare o
3653 disabilitare la modalità non bloccante. L'argomento \param{omqstat} viene
3654 usato, quando diverso da \val{NULL}, per specificare l'indirizzo di una
3655 struttura su cui salvare i valori degli attributi precedenti alla chiamata
3656 della funzione.
3657
3658 Per inserire messaggi su di una coda sono previste due funzioni,
3659 \funcd{mq\_send} e \funcd{mq\_timedsend}, i cui prototipi sono:
3660 \begin{functions}
3661   \headdecl{mqueue.h} 
3662   
3663   \funcdecl{int mq\_send(mqd\_t mqdes, const char *msg\_ptr, size\_t msg\_len,
3664     unsigned int msg\_prio)} 
3665   Esegue l'inserimento di un messaggio su una coda.
3666   
3667   \funcdecl{int mq\_timedsend(mqd\_t mqdes, const char *msg\_ptr, size\_t
3668     msg\_len, unsigned msg\_prio, const struct timespec *abs\_timeout)}   
3669   Esegue l'inserimento di un messaggio su una coda entro il tempo
3670   \param{abs\_timeout}.
3671
3672   
3673   \bodydesc{Le funzioni restituiscono 0 in caso di successo e $-1$ per un
3674     errore; nel quel caso \var{errno} assumerà i valori:
3675     \begin{errlist}
3676     \item[\errcode{EAGAIN}] si è aperta la coda con \const{O\_NONBLOCK}, e la
3677       coda è piena.
3678     \item[\errcode{EMSGSIZE}] la lunghezza del messaggio \param{msg\_len}
3679       eccede il limite impostato per la coda.
3680     \item[\errcode{EINVAL}] si è specificato un valore nullo per
3681       \param{msg\_len}, o un valore di \param{msg\_prio} fuori dai limiti, o
3682       un valore non valido per \param{abs\_timeout}.
3683     \item[\errcode{ETIMEDOUT}] l'inserimento del messaggio non è stato
3684       effettuato entro il tempo stabilito.
3685     \end{errlist}    
3686     ed inoltre \errval{EBADF}, \errval{ENOMEM} ed \errval{EINTR}.}
3687 \end{functions}
3688
3689 Entrambe le funzioni richiedono un puntatore al testo del messaggio
3690 nell'argomento \param{msg\_ptr} e la relativa lunghezza in \param{msg\_len}.
3691 Se quest'ultima eccede la dimensione massima specificata da \var{mq\_msgsize}
3692 le funzioni ritornano immediatamente con un errore di \errcode{EMSGSIZE}.
3693
3694 L'argomento \param{msg\_prio} indica la priorità dell'argomento; i messaggi di
3695 priorità maggiore vengono inseriti davanti a quelli di priorità inferiore (e
3696 quindi saranno riletti per primi). A parità del valore della priorità il
3697 messaggio sarà inserito in coda a tutti quelli con la stessa priorità. Il
3698 valore della priorità non può eccedere il limite di sistema
3699 \const{MQ\_PRIO\_MAX}, che nel caso è pari a 32768.
3700
3701 Qualora la coda sia piena, entrambe le funzioni si bloccano, a meno che non
3702 sia stata selezionata in fase di apertura la modalità non
3703 bloccante,\footnote{o si sia impostato il flag \const{O\_NONBLOCK} sul file
3704   descriptor della coda.} nel qual caso entrambe ritornano \errcode{EAGAIN}.
3705 La sola differenza fra le due funzioni è che la seconda, passato il tempo
3706 massimo impostato con l'argomento \param{abs\_timeout},\footnote{deve essere
3707   specificato un tempo assoluto tramite una struttura \struct{timespec} (vedi
3708   fig.~\ref{fig:sys_timespec_struct}) indicato in numero di secondi e
3709   nanosecondi a partire dal 1 gennaio 1970.} ritorna comunque con un errore di
3710 \errcode{ETIMEDOUT}, se invece il tempo è già scaduto al momento della
3711 chiamata e la coda è vuota la funzione ritorna immediatamente.
3712
3713 Come per l'inserimento, anche per l'estrazione dei messaggi da una coda sono
3714 previste due funzioni, \funcd{mq\_receive} e \funcd{mq\_timedreceive}, i cui
3715 prototipi sono:
3716 \begin{functions}
3717   \headdecl{mqueue.h} 
3718   
3719   \funcdecl{ssize\_t mq\_receive(mqd\_t mqdes, char *msg\_ptr, size\_t
3720     msg\_len, unsigned int *msg\_prio)}   
3721   Effettua la ricezione di un messaggio da una coda.
3722   
3723   \funcdecl{ssize\_t mq\_timedreceive(mqd\_t mqdes, char *msg\_ptr, size\_t
3724     msg\_len, unsigned int *msg\_prio, const struct timespec *abs\_timeout)}
3725   Effettua la ricezione di un messaggio da una coda entro il tempo
3726   \param{abs\_timeout}.
3727   
3728   \bodydesc{Le funzioni restituiscono il numero di byte del messaggio in caso
3729     di successo e -1 in caso di errore; nel quel caso \var{errno} assumerà i
3730     valori:
3731     \begin{errlist}
3732     \item[\errcode{EAGAIN}] si è aperta la coda con \const{O\_NONBLOCK}, e la
3733       coda è vuota.
3734     \item[\errcode{EMSGSIZE}] la lunghezza del messaggio sulla coda eccede il
3735       valore \param{msg\_len} specificato per la ricezione.
3736     \item[\errcode{EINVAL}] si è specificato un valore nullo per
3737       \param{msg\_ptr}, o un valore non valido per \param{abs\_timeout}.
3738     \item[\errcode{ETIMEDOUT}] la ricezione del messaggio non è stata
3739       effettuata entro il tempo stabilito.
3740     \end{errlist}    
3741     ed inoltre \errval{EBADF}, \errval{EINTR}, \errval{ENOMEM}, o
3742     \errval{EINVAL}.}
3743 \end{functions}
3744
3745 La funzione estrae dalla coda il messaggio a priorità più alta, o il più
3746 vecchio fra quelli della stessa priorità. Una volta ricevuto il messaggio
3747 viene tolto dalla coda e la sua dimensione viene restituita come valore di
3748 ritorno.\footnote{si tenga presente che 0 è una dimensione valida e che la
3749   condizione di errore è restituita dal valore -1; Stevens in \cite{UNP2} fa
3750   notare che questo è uno dei casi in cui vale ciò che lo standard
3751   \textsl{non} dice, una dimensione nulla infatti, pur non essendo citata, non
3752   viene proibita.}
3753
3754 Se la dimensione specificata da \param{msg\_len} non è sufficiente a contenere
3755 il messaggio, entrambe le funzioni, al contrario di quanto avveniva nelle code
3756 di messaggi di SysV, ritornano un errore di \errcode{EMSGSIZE} senza estrarre
3757 il messaggio.  È pertanto opportuno eseguire sempre una chiamata a
3758 \func{mq\_getattr} prima di eseguire una ricezione, in modo da ottenere la
3759 dimensione massima dei messaggi sulla coda, per poter essere in grado di
3760 allocare dei buffer sufficientemente ampi per la lettura.
3761
3762 Se si specifica un puntatore per l'argomento \param{msg\_prio} il valore della
3763 priorità del messaggio viene memorizzato all'indirizzo da esso indicato.
3764 Qualora non interessi usare la priorità dei messaggi si può specificare
3765 \var{NULL}, ed usare un valore nullo della priorità nelle chiamate a
3766 \func{mq\_send}.
3767
3768 Si noti che con le code di messaggi POSIX non si ha la possibilità di
3769 selezionare quale messaggio estrarre con delle condizioni sulla priorità, a
3770 differenza di quanto avveniva con le code di messaggi di SysV che permettono
3771 invece la selezione in base al valore del campo \var{mtype}. 
3772
3773 % TODO inserire i dati di /proc/sys/fs/mqueue 
3774
3775 Qualora la coda sia vuota entrambe le funzioni si bloccano, a meno che non si
3776 sia selezionata la modalità non bloccante; in tal caso entrambe ritornano
3777 immediatamente con l'errore \errcode{EAGAIN}. Anche in questo caso la sola
3778 differenza fra le due funzioni è che la seconda non attende indefinitamente e
3779 passato il tempo massimo \param{abs\_timeout} ritorna comunque con un errore
3780 di \errcode{ETIMEDOUT}.
3781
3782 Uno dei problemi sottolineati da Stevens in \cite{UNP2}, comuni ad entrambe le
3783 tipologie di code messaggi, è che non è possibile per chi riceve identificare
3784 chi è che ha inviato il messaggio, in particolare non è possibile sapere da
3785 quale utente esso provenga. Infatti, in mancanza di un meccanismo interno al
3786 kernel, anche se si possono inserire delle informazioni nel messaggio, queste
3787 non possono essere credute, essendo completamente dipendenti da chi lo invia.
3788 Vedremo però come, attraverso l'uso del meccanismo di notifica, sia possibile
3789 superare in parte questo problema.
3790
3791 Una caratteristica specifica delle code di messaggi POSIX è la possibilità di
3792 usufruire di un meccanismo di notifica asincrono; questo può essere attivato
3793 usando la funzione \funcd{mq\_notify}, il cui prototipo è:
3794 \begin{prototype}{mqueue.h}
3795 {int mq\_notify(mqd\_t mqdes, const struct sigevent *notification)}
3796
3797 Attiva il meccanismo di notifica per la coda \param{mqdes}.
3798   
3799 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3800   errore; nel quel caso \var{errno} assumerà i valori: 
3801     \begin{errlist}
3802     \item[\errcode{EBUSY}] c'è già un processo registrato per la notifica.
3803     \item[\errcode{EBADF}] il descrittore non fa riferimento ad una coda di
3804       messaggi.
3805     \end{errlist}}
3806 \end{prototype}
3807
3808 Il meccanismo di notifica permette di segnalare in maniera asincrona ad un
3809 processo la presenza di dati sulla coda, in modo da evitare la necessità di
3810 bloccarsi nell'attesa. Per far questo un processo deve registrarsi con la
3811 funzione \func{mq\_notify}, ed il meccanismo è disponibile per un solo
3812 processo alla volta per ciascuna coda.
3813
3814 Il comportamento di \func{mq\_notify} dipende dal valore dell'argomento
3815 \param{notification}, che è un puntatore ad una apposita struttura
3816 \struct{sigevent}, (definita in fig.~\ref{fig:struct_sigevent}) introdotta
3817 dallo standard POSIX.1b per gestire la notifica di eventi; per altri dettagli
3818 si può vedere quanto detto in sez.~\ref{sec:sig_timer_adv} a proposito
3819 dell'uso della stessa struttura per la notifica delle scadenze dei
3820 \textit{timer}.
3821
3822 Attraverso questa struttura si possono impostare le modalità con cui viene
3823 effettuata la notifica nel campo \var{sigev\_notify}, che può assumere i
3824 valori di tab.~\ref{tab:sigevent_sigev_notify}.\footnote{la pagina di manuale
3825   riporta soltanto i primi tre (inizialmente era possibile solo
3826   \const{SIGEV\_SIGNAL}).} Il metodo consigliato è quello di usare
3827 \const{SIGEV\_SIGNAL} usando il campo \var{sigev\_signo} per indicare il quale
3828 segnale deve essere inviato al processo. Inoltre il campo \var{sigev\_value} è
3829 un puntatore ad una struttura \struct{sigval} (definita in
3830 fig.~\ref{fig:sig_sigval}) che permette di restituire al gestore del segnale
3831 un valore numerico o un indirizzo,\footnote{per il suo uso si riveda la
3832   trattazione fatta in sez.~\ref{sec:sig_real_time} a proposito dei segnali
3833   \textit{real-time}.} posto che questo sia installato nella forma estesa
3834 vista in sez.~\ref{sec:sig_sigaction}.
3835
3836 La funzione registra il processo chiamante per la notifica se
3837 \param{notification} punta ad una struttura \struct{sigevent} opportunamente
3838 inizializzata, o cancella una precedente registrazione se è \val{NULL}. Dato
3839 che un solo processo alla volta può essere registrato, la funzione fallisce
3840 con \errcode{EBUSY} se c'è un altro processo già registrato.\footnote{questo
3841   significa anche che se si registra una notifica con \const{SIGEV\_NONE} il
3842   processo non la riceverà, ma impedirà anche che altri possano registrarsi
3843   per poterlo fare.}  Si tenga presente inoltre che alla chiusura del
3844 descrittore associato alla coda (e quindi anche all'uscita del processo) ogni
3845 eventuale registrazione di notifica presente viene cancellata.
3846
3847 La notifica del segnale avviene all'arrivo di un messaggio in una coda vuota
3848 (cioè solo se sulla coda non ci sono messaggi) e se non c'è nessun processo
3849 bloccato in una chiamata a \func{mq\_receive}, in questo caso infatti il
3850 processo bloccato ha la precedenza ed il messaggio gli viene immediatamente
3851 inviato, mentre per il meccanismo di notifica tutto funziona come se la coda
3852 fosse rimasta vuota.
3853
3854 Quando un messaggio arriva su una coda vuota al processo che si era registrato
3855 viene inviato il segnale specificato da \code{notification->sigev\_signo}, e
3856 la coda diventa disponibile per una ulteriore registrazione.  Questo comporta
3857 che se si vuole mantenere il meccanismo di notifica occorre ripetere la
3858 registrazione chiamando nuovamente \func{mq\_notify} all'interno del gestore
3859 del segnale di notifica. A differenza della situazione simile che si aveva con
3860 i segnali non affidabili,\footnote{l'argomento è stato affrontato in
3861   \ref{sec:sig_semantics}.} questa caratteristica non configura una
3862 \itindex{race~condition} \textit{race condition} perché l'invio di un segnale
3863 avviene solo se la coda è vuota; pertanto se si vuole evitare di correre il
3864 rischio di perdere eventuali ulteriori segnali inviati nel lasso di tempo che
3865 occorre per ripetere la richiesta di notifica basta avere cura di eseguire
3866 questa operazione prima di estrarre i messaggi presenti dalla coda.
3867
3868 L'invio del segnale di notifica avvalora alcuni campi di informazione
3869 restituiti al gestore attraverso la struttura \struct{siginfo\_t} (definita in
3870 fig.~\ref{fig:sig_siginfo_t}). In particolare \var{si\_pid} viene impostato al
3871 valore del \ids{PID} del processo che ha emesso il segnale, \var{si\_uid}
3872 all'userid effettivo, \var{si\_code} a \const{SI\_MESGQ}, e \var{si\_errno} a
3873 0. Questo ci dice che, se si effettua la ricezione dei messaggi usando
3874 esclusivamente il meccanismo di notifica, è possibile ottenere le informazioni
3875 sul processo che ha inserito un messaggio usando un gestore per il segnale in
3876 forma estesa.\footnote{di nuovo si faccia riferimento a quanto detto al
3877   proposito in sez.~\ref{sec:sig_sigaction} e sez.~\ref{sec:sig_real_time}.}
3878
3879
3880
3881 \subsection{Memoria condivisa}
3882 \label{sec:ipc_posix_shm}
3883
3884 La memoria condivisa è stato il primo degli oggetti di IPC POSIX inserito nel
3885 kernel ufficiale; il supporto a questo tipo di oggetti è realizzato attraverso
3886 il filesystem \texttt{tmpfs}, uno speciale filesystem che mantiene tutti i
3887 suoi contenuti in memoria, che viene attivato abilitando l'opzione
3888 \texttt{CONFIG\_TMPFS} in fase di compilazione del kernel.
3889
3890 Per potere utilizzare l'interfaccia POSIX per la memoria condivisa la
3891 \acr{glibc}\footnote{le funzioni sono state introdotte con la versione 2.2.}
3892 richiede di compilare i programmi con l'opzione \code{-lrt}; inoltre è
3893 necessario che in \file{/dev/shm} sia montato un filesystem \texttt{tmpfs};
3894 questo di norma viene fatto aggiungendo una riga del tipo di:
3895 \begin{verbatim}
3896 tmpfs   /dev/shm        tmpfs   defaults        0      0
3897 \end{verbatim}
3898 ad \conffile{/etc/fstab}. In realtà si può montare un filesystem \texttt{tmpfs}
3899 dove si vuole, per usarlo come RAM disk, con un comando del tipo:
3900 \begin{verbatim}
3901 mount -t tmpfs -o size=128M,nr_inodes=10k,mode=700 tmpfs /mytmpfs
3902 \end{verbatim}
3903
3904 Il filesystem riconosce, oltre quelle mostrate, le opzioni \texttt{uid} e
3905 \texttt{gid} che identificano rispettivamente utente e gruppo cui assegnarne
3906 la titolarità, e \texttt{nr\_blocks} che permette di specificarne la
3907 dimensione in blocchi, cioè in multipli di \const{PAGECACHE\_SIZE} che in
3908 questo caso è l'unità di allocazione elementare.
3909
3910 La funzione che permette di aprire un segmento di memoria condivisa POSIX, ed
3911 eventualmente di crearlo se non esiste ancora, è \funcd{shm\_open}; il suo
3912 prototipo è:
3913 \begin{functions}
3914   \headdecl{sys/mman.h} 
3915   \headdecl{sys/stat.h} 
3916   \headdecl{fcntl.h} 
3917
3918   \funcdecl{int shm\_open(const char *name, int oflag, mode\_t mode)} 
3919
3920   Apre un segmento di memoria condivisa.
3921   
3922   \bodydesc{La funzione restituisce un file descriptor positivo in caso di
3923     successo e -1 in caso di errore; nel quel caso \var{errno} assumerà gli
3924     stessi valori riportati da \func{open}.}
3925 \end{functions}
3926
3927 La funzione apre un segmento di memoria condivisa identificato dal nome
3928 \param{name}. Come già spiegato in sez.~\ref{sec:ipc_posix_generic} questo
3929 nome può essere specificato in forma standard solo facendolo iniziare per
3930 ``\file{/}'' e senza ulteriori ``\file{/}''. Linux supporta comunque nomi
3931 generici, che verranno interpretati prendendo come radice
3932 \file{/dev/shm}.\footnote{occorre pertanto evitare di specificare qualcosa del
3933   tipo \file{/dev/shm/nome} all'interno di \param{name}, perché questo
3934   comporta, da parte delle funzioni di libreria, il tentativo di accedere a
3935   \file{/dev/shm/dev/shm/nome}.}
3936
3937 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3938 possono essere specificati per \param{oflag}, che deve essere specificato come
3939 maschera binaria comprendente almeno uno dei due valori \const{O\_RDONLY} e
3940 \const{O\_RDWR}; i valori possibili per i vari bit sono quelli visti in
3941 sez.~\ref{sec:file_open_close} dei quali però \func{shm\_open} riconosce solo
3942 i seguenti:
3943 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
3944 \item[\const{O\_RDONLY}] Apre il file descriptor associato al segmento di
3945   memoria condivisa per l'accesso in sola lettura.
3946 \item[\const{O\_RDWR}] Apre il file descriptor associato al segmento di
3947   memoria condivisa per l'accesso in lettura e scrittura.
3948 \item[\const{O\_CREAT}] Necessario qualora si debba creare il segmento di
3949   memoria condivisa se esso non esiste; in questo caso viene usato il valore
3950   di \param{mode} per impostare i permessi, che devono essere compatibili con
3951   le modalità con cui si è aperto il file.
3952 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3953   chiamata a \func{shm\_open} se il segmento esiste già, altrimenti esegue la
3954   creazione atomicamente.
3955 \item[\const{O\_TRUNC}] Se il segmento di memoria condivisa esiste già, ne
3956   tronca le dimensioni a 0 byte.
3957 \end{basedescript}
3958
3959 In caso di successo la funzione restituisce un file descriptor associato al
3960 segmento di memoria condiviso con le stesse modalità di
3961 \func{open}\footnote{in realtà, come accennato, \func{shm\_open} è un semplice
3962   wrapper per \func{open}, usare direttamente quest'ultima avrebbe lo stesso
3963   effetto.}  viste in sez.~\ref{sec:file_open_close}; in particolare viene impostato
3964 il flag \const{FD\_CLOEXEC}.  Chiamate effettuate da diversi processi usando
3965 lo stesso nome, restituiranno file descriptor associati allo stesso segmento
3966 (così come, nel caso di file di dati, essi sono associati allo stesso
3967 \itindex{inode} inode).  In questo modo è possibile effettuare una chiamata ad
3968 \func{mmap} sul file descriptor restituito da \func{shm\_open} ed i processi
3969 vedranno lo stesso segmento di memoria condivisa.
3970
3971 Quando il nome non esiste il segmento può essere creato specificando
3972 \const{O\_CREAT}; in tal caso il segmento avrà (così come i nuovi file)
3973 lunghezza nulla. Dato che un segmento di lunghezza nulla è di scarsa utilità,
3974 per impostarne la dimensione si deve usare \func{ftruncate} (vedi
3975 sez.~\ref{sec:file_file_size}), prima di mapparlo in memoria con \func{mmap}.
3976 Si tenga presente che una volta chiamata \func{mmap} si può chiudere il file
3977 descriptor (con \func{close}), senza che la mappatura ne risenta.
3978
3979 Come per i file, quando si vuole effettivamente rimuovere segmento di memoria
3980 condivisa, occorre usare la funzione \funcd{shm\_unlink}, il cui prototipo è:
3981 \begin{prototype}{sys/mman.h}
3982 {int shm\_unlink(const char *name)}
3983
3984 Rimuove un segmento di memoria condivisa.
3985   
3986 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3987   errore; nel quel caso \var{errno} assumerà gli stessi valori riportati da
3988   \func{unlink}.}
3989 \end{prototype}
3990
3991 La funzione è del tutto analoga ad \func{unlink}, e si limita a cancellare il
3992 nome del segmento da \file{/dev/shm}, senza nessun effetto né sui file
3993 descriptor precedentemente aperti con \func{shm\_open}, né sui segmenti già
3994 mappati in memoria; questi verranno cancellati automaticamente dal sistema
3995 solo con le rispettive chiamate a \func{close} e \func{munmap}.  Una volta
3996 eseguita questa funzione però, qualora si richieda l'apertura di un segmento
3997 con lo stesso nome, la chiamata a \func{shm\_open} fallirà, a meno di non aver
3998 usato \const{O\_CREAT}, in quest'ultimo caso comunque si otterrà un file
3999 descriptor che fa riferimento ad un segmento distinto da eventuali precedenti.
4000
4001 \begin{figure}[!htbp]
4002   \footnotesize \centering
4003   \begin{minipage}[c]{\codesamplewidth}
4004     \includecodesample{listati/MemShared.c}
4005   \end{minipage} 
4006   \normalsize 
4007   \caption{Il codice delle funzioni di gestione dei segmenti di memoria
4008     condivisa POSIX.}
4009   \label{fig:ipc_posix_shmmem}
4010 \end{figure}
4011
4012 Come esempio per l'uso di queste funzioni vediamo come è possibile riscrivere
4013 una interfaccia semplificata analoga a quella vista in
4014 fig.~\ref{fig:ipc_sysv_shm_func} per la memoria condivisa in stile SysV. Il
4015 codice, riportato in fig.~\ref{fig:ipc_posix_shmmem}, è sempre contenuto nel
4016 file \file{SharedMem.c} dei sorgenti allegati.
4017
4018 La prima funzione (\texttt{\small 1--24}) è \func{CreateShm} che, dato un nome
4019 nell'argomento \var{name} crea un nuovo segmento di memoria condivisa,
4020 accessibile in lettura e scrittura, e ne restituisce l'indirizzo. Anzitutto si
4021 definiscono (\texttt{\small 8}) i flag per la successiva (\texttt{\small 9})
4022 chiamata a \func{shm\_open}, che apre il segmento in lettura e scrittura
4023 (creandolo se non esiste, ed uscendo in caso contrario) assegnandogli sul
4024 filesystem i permessi specificati dall'argomento \var{perm}. In caso di errore
4025 (\texttt{\small 10--12}) si restituisce un puntatore nullo, altrimenti si
4026 prosegue impostando (\texttt{\small 14}) la dimensione del segmento con
4027 \func{ftruncate}. Di nuovo (\texttt{\small 15--16}) si esce immediatamente
4028 restituendo un puntatore nullo in caso di errore. Poi si passa (\texttt{\small
4029   18}) a mappare in memoria il segmento con \func{mmap} specificando dei
4030 diritti di accesso corrispondenti alla modalità di apertura.  Di nuovo si
4031 restituisce (\texttt{\small 19--21}) un puntatore nullo in caso di errore,
4032 altrimenti si inizializza (\texttt{\small 22}) il contenuto del segmento al
4033 valore specificato dall'argomento \var{fill} con \func{memset}, e se ne
4034 restituisce (\texttt{\small 23}) l'indirizzo.
4035
4036 La seconda funzione (\texttt{\small 25--40}) è \func{FindShm} che trova un
4037 segmento di memoria condiviso già esistente, restituendone l'indirizzo. In
4038 questo caso si apre (\texttt{\small 31}) il segmento con \func{shm\_open}
4039 richiedendo che il segmento sia già esistente, in caso di errore
4040 (\texttt{\small 31--33}) si ritorna immediatamente un puntatore nullo.
4041 Ottenuto il file descriptor del segmento lo si mappa (\texttt{\small 35}) in
4042 memoria con \func{mmap}, restituendo (\texttt{\small 36--38}) un puntatore
4043 nullo in caso di errore, o l'indirizzo (\texttt{\small 39}) dello stesso in
4044 caso di successo.
4045
4046 La terza funzione (\texttt{\small 40--45}) è \func{RemoveShm}, e serve a
4047 cancellare un segmento di memoria condivisa. Dato che al contrario di quanto
4048 avveniva con i segmenti del SysV IPC gli oggetti allocati nel kernel vengono
4049 rilasciati automaticamente quando nessuna li usa più, tutto quello che c'è da
4050 fare (\texttt{\small 44}) in questo caso è chiamare \func{shm\_unlink},
4051 restituendo al chiamante il valore di ritorno.
4052
4053
4054
4055
4056 \subsection{Semafori}
4057 \label{sec:ipc_posix_sem}
4058
4059 Fino alla serie 2.4.x del kernel esisteva solo una implementazione parziale
4060 dei semafori POSIX che li realizzava solo a livello di \itindex{thread}
4061 \textit{thread} e non di processi,\footnote{questo significava che i semafori
4062   erano visibili solo all'interno dei \itindex{thread} \textit{thread} creati
4063   da un singolo processo, e non potevano essere usati come meccanismo di
4064   sincronizzazione fra processi diversi.} fornita attraverso la sezione delle
4065 estensioni \textit{real-time} della \acr{glibc}.\footnote{quelle che si
4066   accedono collegandosi alla libreria \texttt{librt}.} Esisteva inoltre una
4067 libreria che realizzava (parzialmente) l'interfaccia POSIX usando le funzioni
4068 dei semafori di SysV IPC (mantenendo così tutti i problemi sottolineati in
4069 sez.~\ref{sec:ipc_sysv_sem}).
4070
4071 A partire dal kernel 2.5.7 è stato introdotto un meccanismo di
4072 sincronizzazione completamente nuovo, basato sui cosiddetti
4073 \textit{futex},\footnote{la sigla sta per \textit{fast user mode mutex}.} con
4074 il quale è stato possibile implementare una versione nativa dei semafori
4075 POSIX.  Grazie a questo con i kernel della serie 2.6 e le nuove versioni della
4076 \acr{glibc} che usano questa nuova infrastruttura per quella che viene quella
4077 che viene chiamata \textit{New Posix Thread Library}, sono state implementate
4078 anche tutte le funzioni dell'interfaccia dei semafori POSIX.
4079
4080 Anche in questo caso è necessario appoggiarsi alla libreria per le estensioni
4081 \textit{real-time} \texttt{librt}, questo significa che se si vuole utilizzare
4082 questa interfaccia, oltre ad utilizzare gli opportuni file di definizione,
4083 occorrerà compilare i programmi con l'opzione \texttt{-lrt}. 
4084
4085 La funzione che permette di creare un nuovo semaforo POSIX, creando il
4086 relativo file, o di accedere ad uno esistente, è \funcd{sem\_open}, questa
4087 prevede due forme diverse a seconda che sia utilizzata per aprire un semaforo
4088 esistente o per crearne uno nuovi, i relativi prototipi sono:
4089 \begin{functions}
4090   \headdecl{semaphore.h} 
4091   
4092   \funcdecl{sem\_t *sem\_open(const char *name, int oflag)}
4093   
4094   \funcdecl{sem\_t *sem\_open(const char *name, int oflag, mode\_t mode,
4095     unsigned int value)} 
4096
4097   Crea un semaforo o ne apre uno esistente.
4098   
4099   \bodydesc{La funzione restituisce l'indirizzo del semaforo in caso di
4100     successo e \const{SEM\_FAILED} in caso di errore; nel quel caso
4101     \var{errno} assumerà i valori:
4102     \begin{errlist}
4103     \item[\errcode{EACCES}] il semaforo esiste ma non si hanno permessi
4104       sufficienti per accedervi.
4105     \item[\errcode{EEXIST}] si sono specificati \const{O\_CREAT} e
4106       \const{O\_EXCL} ma il semaforo esiste.
4107     \item[\errcode{EINVAL}] il valore di \param{value} eccede
4108       \const{SEM\_VALUE\_MAX}.
4109     \item[\errcode{ENAMETOOLONG}] si è utilizzato un nome troppo lungo.
4110     \item[\errcode{ENOENT}] non si è usato \const{O\_CREAT} ed il nome
4111       specificato non esiste.
4112     \end{errlist}    
4113     ed inoltre \errval{ENFILE} ed \errval{ENOMEM}.}
4114 \end{functions}
4115
4116 L'argomento \param{name} definisce il nome del semaforo che si vuole
4117 utilizzare, ed è quello che permette a processi diversi di accedere allo
4118 stesso semaforo. Questo deve essere specificato con un \textit{pathname} nella
4119 forma \texttt{/qualchenome}, che non ha una corrispondenza diretta con un
4120 \textit{pathname} reale; con Linux infatti i file associati ai semafori sono
4121 mantenuti nel filesystem virtuale \texttt{/dev/shm}, e gli viene assegnato
4122 automaticamente un nome nella forma \texttt{sem.qualchenome}.\footnote{si ha
4123   cioè una corrispondenza per cui \texttt{/qualchenome} viene rimappato, nella
4124   creazione tramite \func{sem\_open}, su \texttt{/dev/shm/sem.qualchenome}.}
4125
4126 L'argomento \param{oflag} è quello che controlla le modalità con cui opera la
4127 funzione, ed è passato come maschera binaria; i bit corrispondono a quelli
4128 utilizzati per l'analogo argomento di \func{open}, anche se dei possibili
4129 valori visti in sez.~\ref{sec:file_open_close} sono utilizzati soltanto
4130 \const{O\_CREAT} e \const{O\_EXCL}.
4131
4132 Se si usa \const{O\_CREAT} si richiede la creazione del semaforo qualora
4133 questo non esista, ed in tal caso occorre utilizzare la seconda forma della
4134 funzione, in cui si devono specificare sia un valore iniziale con l'argomento
4135 \param{value},\footnote{e si noti come così diventa possibile, differenza di
4136   quanto avviene per i semafori del \textit{SysV IPC}, effettuare in maniera
4137   atomica creazione ed inizializzazione di un semaforo usando una unica
4138   funzione.} che una maschera dei permessi con l'argomento
4139 \param{mode};\footnote{anche questo argomento prende gli stessi valori
4140   utilizzati per l'analogo di \func{open}, che si sono illustrati in dettaglio
4141   sez.~\ref{sec:file_perm_overview}.} questi verranno assegnati al semaforo
4142 appena creato. Se il semaforo esiste già i suddetti valori saranno invece
4143 ignorati. Usando il flag \const{O\_EXCL} si richiede invece la verifica che il
4144 semaforo non esiste, usandolo insieme ad \const{O\_CREAT} la funzione fallisce
4145 qualora un semaforo con lo stesso nome sia già presente.
4146
4147 La funzione restituisce in caso di successo un puntatore all'indirizzo del
4148 semaforo con un valore di tipo \ctyp{sem\_t *}, è questo valore che dovrà
4149 essere passato alle altre funzioni per operare sul semaforo stesso. Si tenga
4150 presente che, come accennato in sez.~\ref{sec:ipc_posix_generic}, i semafori
4151 usano la semantica standard dei file per quanto riguarda i controlli di
4152 accesso. 
4153
4154 Questo significa che un nuovo semaforo viene sempre creato con l'\ids{UID} ed
4155 il \ids{GID} effettivo del processo chiamante, e che i permessi indicati con
4156 \param{mode} vengono filtrati dal valore della \itindex{umask} \textit{umask}
4157 del processo.  Inoltre per poter aprire un semaforo è necessario avere su di
4158 esso sia il permesso di lettura che quello di scrittura.
4159
4160 Una volta che si sia ottenuto l'indirizzo di un semaforo, sarà possibile
4161 utilizzarlo; se si ricorda quanto detto all'inizio di
4162 sez.~\ref{sec:ipc_sysv_sem}, dove si sono introdotti i concetti generali
4163 relativi ai semafori, le operazioni principali sono due, quella che richiede
4164 l'uso di una risorsa bloccando il semaforo e quella che rilascia la risorsa
4165 liberando il semaforo. La prima operazione è effettuata dalla funzione
4166 \funcd{sem\_wait}, il cui prototipo è:
4167 \begin{functions}
4168   \headdecl{semaphore.h} 
4169   
4170   \funcdecl{int sem\_wait(sem\_t *sem)}
4171   
4172   Blocca il semaforo \param{sem}.
4173   
4174   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4175     errore; nel quel caso \var{errno} assumerà i valori:
4176     \begin{errlist}
4177     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
4178     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4179     \end{errlist}    
4180 }
4181 \end{functions}
4182
4183 La funzione cerca di decrementare il valore del semaforo indicato dal
4184 puntatore \param{sem}, se questo ha un valore positivo, cosa che significa che
4185 la risorsa è disponibile, la funzione ha successo, il valore del semaforo
4186 viene diminuito di 1 ed essa ritorna immediatamente; se il valore è nullo la
4187 funzione si blocca fintanto che il valore del semaforo non torni
4188 positivo\footnote{ovviamente per opera di altro processo che lo rilascia
4189   chiamando \func{sem\_post}.} così che poi essa possa decrementarlo con
4190 successo e proseguire. 
4191
4192 Si tenga presente che la funzione può sempre essere interrotta da un segnale
4193 (nel qual caso si avrà un errore di \const{EINTR}) e che questo avverrà
4194 comunque, anche se si è richiesta la semantica BSD installando il relativo
4195 gestore con \const{SA\_RESTART} (vedi sez.~\ref{sec:sig_sigaction}) per
4196 riavviare le system call interrotte.
4197
4198 Della funzione \func{sem\_wait} esistono due varianti che consentono di
4199 gestire diversamente le modalità di attesa in caso di risorsa occupata, la
4200 prima di queste è \funcd{sem\_trywait}, che serve ad effettuare un tentativo
4201 di acquisizione senza bloccarsi; il suo prototipo è:
4202 \begin{functions}
4203   \headdecl{semaphore.h} 
4204   
4205   \funcdecl{int sem\_trywait(sem\_t *sem)}
4206   
4207   Tenta di bloccare il semaforo \param{sem}.
4208   
4209   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4210     errore; nel quel caso \var{errno} assumerà gli stessi valori:
4211     \begin{errlist}
4212     \item[\errcode{EAGAIN}] il semaforo non può essere acquisito senza
4213       bloccarsi. 
4214     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4215     \end{errlist}    
4216 }
4217 \end{functions}
4218
4219 La funzione è identica a \func{sem\_wait} ed se la risorsa è libera ha lo
4220 stesso effetto, vale a dire che in caso di semaforo diverso da zero la
4221 funzione lo decrementa e ritorna immediatamente; la differenza è che nel caso
4222 in cui il semaforo è occupato essa non si blocca e di nuovo ritorna
4223 immediatamente, restituendo però un errore di \errval{EAGAIN}, così che il
4224 programma possa proseguire.
4225
4226 La seconda variante di \func{sem\_wait} è una estensione specifica che può
4227 essere utilizzata soltanto se viene definita la macro \macro{\_XOPEN\_SOURCE}
4228 ad un valore di 600 prima di includere \headfile{semaphore.h}, la funzione è
4229 \funcd{sem\_timedwait}, ed il suo prototipo è:
4230 \begin{functions}
4231   \headdecl{semaphore.h} 
4232
4233   \funcdecl{int sem\_timedwait(sem\_t *sem, const struct timespec
4234     *abs\_timeout)}
4235   
4236   Blocca il semaforo \param{sem}.
4237   
4238   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4239     errore; nel quel caso \var{errno} assumerà gli stessi valori:
4240     \begin{errlist}
4241     \item[\errcode{ETIMEDOUT}] è scaduto il tempo massimo di attesa. 
4242     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4243     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
4244     \end{errlist}    
4245 }
4246 \end{functions}
4247
4248 Anche in questo caso il comportamento della funzione è identico a quello di
4249 \func{sem\_wait}, la sola differenza consiste nel fatto che con questa
4250 funzione è possibile impostare tramite l'argomento \param{abs\_timeout} un
4251 tempo limite per l'attesa, scaduto il quale la funzione ritorna comunque,
4252 anche se non è possibile acquisire il semaforo. In tal caso la funzione
4253 fallirà, riportando un errore di \errval{ETIMEDOUT}.
4254
4255 La seconda funzione principale utilizzata per l'uso dei semafori è
4256 \funcd{sem\_post}, che viene usata per rilasciare un semaforo occupato o, in
4257 generale, per aumentare di una unità il valore dello stesso anche qualora non
4258 fosse occupato;\footnote{si ricordi che in generale un semaforo viene usato
4259   come indicatore di un numero di risorse disponibili.} il suo prototipo è:
4260 \begin{functions}
4261   \headdecl{semaphore.h} 
4262   
4263   \funcdecl{int sem\_post(sem\_t *sem)}
4264   
4265   Rilascia il semaforo \param{sem}.
4266   
4267   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4268     errore; nel quel caso \var{errno} assumerà i valori:
4269     \begin{errlist}
4270     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4271     \end{errlist}    
4272 }
4273 \end{functions}
4274
4275 La funzione incrementa di uno il valore corrente del semaforo indicato
4276 dall'argomento \param{sem}, se questo era nullo la relativa risorsa risulterà
4277 sbloccata, cosicché un altro processo (o \itindex{thread} \textit{thread})
4278 eventualmente bloccato in una \func{sem\_wait} sul semaforo potrà essere
4279 svegliato e rimesso in esecuzione.  Si tenga presente che la funzione è sicura
4280 \index{funzioni!sicure} per l'uso all'interno di un gestore di segnali (si
4281 ricordi quanto detto in sez.~\ref{sec:sig_signal_handler}).
4282
4283 Se invece di operare su un semaforo se ne vuole solamente leggere il valore,
4284 si può usare la funzione \funcd{sem\_getvalue}, il cui prototipo è:
4285 \begin{functions}
4286   \headdecl{semaphore.h} 
4287   
4288   \funcdecl{int sem\_getvalue(sem\_t *sem, int *sval)}
4289   
4290   Richiede il valore del semaforo \param{sem}.
4291   
4292   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4293     errore; nel quel caso \var{errno} assumerà i valori:
4294     \begin{errlist}
4295     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4296     \end{errlist}    
4297 }
4298 \end{functions}
4299
4300 La funzione legge il valore del semaforo indicato dall'argomento \param{sem} e
4301 lo restituisce nella variabile intera puntata dall'argomento
4302 \param{sval}. Qualora ci siano uno o più processi bloccati in attesa sul
4303 semaforo lo standard prevede che la funzione possa restituire un valore nullo
4304 oppure il numero di processi bloccati in una \func{sem\_wait} sul suddetto
4305 semaforo; nel caso di Linux vale la prima opzione.
4306
4307 Questa funzione può essere utilizzata per avere un suggerimento sullo stato di
4308 un semaforo, ovviamente non si può prendere il risultato riportato in
4309 \param{sval} che come indicazione, il valore del semaforo infatti potrebbe
4310 essere già stato modificato al ritorno della funzione.
4311
4312 % TODO verificare comportamento sem_getvalue
4313
4314 Una volta che non ci sia più la necessità di operare su un semaforo se ne può
4315 terminare l'uso con la funzione \funcd{sem\_close}, il cui prototipo è:
4316 \begin{functions}
4317   \headdecl{semaphore.h} 
4318   
4319   \funcdecl{int sem\_close(sem\_t *sem)}
4320   
4321   Chiude il semaforo \param{sem}.
4322   
4323   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4324     errore; nel quel caso \var{errno} assumerà i valori:
4325     \begin{errlist}
4326     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4327     \end{errlist}    
4328 }
4329 \end{functions}
4330
4331 La funzione chiude il semaforo indicato dall'argomento \param{sem}; questo
4332 comporta che tutte le risorse che il sistema può avere assegnato al processo
4333 nell'uso dello stesso vengono rilasciate. Questo significa che un altro
4334 processo bloccato sul semaforo a causa della acquisizione da parte del
4335 processo che chiama \func{sem\_close} potrà essere riavviato.
4336
4337 Si tenga presente poi che come per i file all'uscita di un processo tutti i
4338 semafori che questo aveva aperto vengono automaticamente chiusi; questo
4339 comportamento risolve il problema che si aveva con i semafori del \textit{SysV
4340   IPC} (di cui si è parlato in sez.~\ref{sec:ipc_sysv_sem}) per i quali le
4341 risorse possono restare bloccate. Si tenga poi presente che, a differenza di
4342 quanto avviene per i file, in caso di una chiamata ad \func{execve} tutti i
4343 semafori vengono chiusi automaticamente.
4344
4345 Come per i semafori del \textit{SysV IPC} anche quelli POSIX hanno una
4346 persistenza di sistema; questo significa che una volta che si è creato un
4347 semaforo con \func{sem\_open} questo continuerà ad esistere fintanto che il
4348 kernel resta attivo (vale a dire fino ad un successivo riavvio) a meno che non
4349 lo si cancelli esplicitamente. Per far questo si può utilizzare la funzione
4350 \funcd{sem\_unlink}, il cui prototipo è:
4351 \begin{functions}
4352   \headdecl{semaphore.h} 
4353   
4354   \funcdecl{int sem\_unlink(const char *name)}
4355   
4356   Rimuove il semaforo \param{name}.
4357   
4358   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4359     errore; nel quel caso \var{errno} assumerà i valori:
4360     \begin{errlist}
4361     \item[\errcode{EACCES}] non si hanno i permessi necessari a cancellare il
4362       semaforo.
4363     \item[\errcode{ENAMETOOLONG}] il nome indicato è troppo lungo.
4364     \item[\errcode{ENOENT}] il semaforo \param{name} non esiste.
4365     \end{errlist}    
4366 }
4367 \end{functions}
4368
4369 La funzione rimuove il semaforo indicato dall'argomento \param{name}, che
4370 prende un valore identico a quello usato per creare il semaforo stesso con
4371 \func{sem\_open}. Il semaforo viene rimosso dal filesystem immediatamente; ma
4372 il semaforo viene effettivamente cancellato dal sistema soltanto quando tutti
4373 i processi che lo avevano aperto lo chiudono. Si segue cioè la stessa
4374 semantica usata con \func{unlink} per i file, trattata in dettaglio in
4375 sez.~\ref{sec:link_symlink_rename}.
4376
4377 Una delle caratteristiche peculiari dei semafori POSIX è che questi possono
4378 anche essere utilizzati anche in forma anonima, senza necessità di fare
4379 ricorso ad un nome sul filesystem o ad altri indicativi.  In questo caso si
4380 dovrà porre la variabile che contiene l'indirizzo del semaforo in un tratto di
4381 memoria che sia accessibile a tutti i processi in gioco.  La funzione che
4382 consente di inizializzare un semaforo anonimo è \funcd{sem\_init}, il cui
4383 prototipo è:
4384 \begin{functions}
4385   \headdecl{semaphore.h} 
4386   
4387   \funcdecl{int sem\_init(sem\_t *sem, int pshared, unsigned int value)}
4388
4389   Inizializza il semaforo anonimo \param{sem}.
4390   
4391   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4392     errore; nel quel caso \var{errno} assumerà i valori:
4393     \begin{errlist}
4394     \item[\errcode{EINVAL}] il valore di \param{value} eccede
4395       \const{SEM\_VALUE\_MAX}.
4396     \item[\errcode{ENOSYS}] il valore di \param{pshared} non è nullo ed il
4397       sistema non supporta i semafori per i processi.
4398     \end{errlist}
4399 }
4400 \end{functions}
4401
4402 La funzione inizializza un semaforo all'indirizzo puntato dall'argomento
4403 \param{sem}, e come per \func{sem\_open} consente di impostare un valore
4404 iniziale con \param{value}. L'argomento \param{pshared} serve ad indicare se
4405 il semaforo deve essere utilizzato dai \itindex{thread} \textit{thread} di uno
4406 stesso processo (con un valore nullo) o condiviso fra processi diversi (con un
4407 valore non nullo).
4408
4409 Qualora il semaforo debba essere condiviso dai \itindex{thread}
4410 \textit{thread} di uno stesso processo (nel qual caso si parla di
4411 \textit{thread-shared semaphore}), occorrerà che \param{sem} sia l'indirizzo
4412 di una variabile visibile da tutti i \itindex{thread} \textit{thread}, si
4413 dovrà usare cioè una \index{variabili!globali} variabile globale o una
4414 variabile allocata dinamicamente nello \itindex{heap} \textit{heap}.
4415
4416 Qualora il semaforo debba essere condiviso fra più processi (nel qual caso si
4417 parla di \textit{process-shared semaphore}) la sola scelta possibile per
4418 renderlo visibile a tutti è di porlo in un tratto di memoria condivisa. Questo
4419 potrà essere ottenuto direttamente sia con \func{shmget} (vedi
4420 sez.~\ref{sec:ipc_sysv_shm}) che con \func{shm\_open} (vedi
4421 sez.~\ref{sec:ipc_posix_shm}), oppure, nel caso che tutti i processi in gioco
4422 abbiano un genitore comune, con una mappatura anonima con \func{mmap} (vedi
4423 sez.~\ref{sec:file_memory_map}),\footnote{si ricordi che i tratti di memoria
4424   condivisa vengono mantenuti nei processi figli attraverso la funzione
4425   \func{fork}.} a cui essi poi potranno accedere.
4426
4427 Una volta inizializzato il semaforo anonimo con \func{sem\_init} lo si potrà
4428 utilizzare nello stesso modo dei semafori normali con \func{sem\_wait} e
4429 \func{sem\_post}. Si tenga presente però che inizializzare due volte lo stesso
4430 semaforo può dar luogo ad un comportamento indefinito. 
4431
4432 Una volta che non si intenda più utilizzare un semaforo anonimo questo può
4433 essere eliminato dal sistema; per far questo di deve utilizzare una apposita
4434 funzione, \funcd{sem\_destroy}, il cui prototipo è:
4435 \begin{functions}
4436   \headdecl{semaphore.h} 
4437   
4438   \funcdecl{int sem\_destroy(sem\_t *sem)}
4439
4440   Elimina il semaforo anonimo \param{sem}.
4441   
4442   \bodydesc{La funzione restituisce 0 in caso di successo e $-1$ in caso di
4443     errore; nel quel caso \var{errno} assumerà i valori:
4444     \begin{errlist}
4445     \item[\errcode{EINVAL}] il valore di \param{value} eccede
4446       \const{SEM\_VALUE\_MAX}.
4447     \end{errlist}
4448 }
4449 \end{functions}
4450
4451 La funzione prende come unico argomento l'indirizzo di un semaforo che deve
4452 essere stato inizializzato con \func{sem\_init}; non deve quindi essere
4453 applicata a semafori creati con \func{sem\_open}. Inoltre si deve essere
4454 sicuri che il semaforo sia effettivamente inutilizzato, la distruzione di un
4455 semaforo su cui sono presenti processi (o \itindex{thread} \textit{thread}) in
4456 attesa (cioè bloccati in una \func{sem\_wait}) provoca un comportamento
4457 indefinito.
4458
4459 Si tenga presente infine che utilizzare un semaforo che è stato distrutto con
4460 \func{sem\_destroy} di nuovo può dare esito a comportamenti indefiniti.  Nel
4461 caso ci si trovi in una tale evenienza occorre reinizializzare il semaforo una
4462 seconda volta con \func{sem\_init}.
4463
4464 Come esempio di uso sia della memoria condivisa che dei semafori POSIX si sono
4465 scritti due semplici programmi con i quali è possibile rispettivamente
4466 monitorare il contenuto di un segmento di memoria condivisa e modificarne il
4467 contenuto. 
4468
4469 \begin{figure}[!htbp]
4470   \footnotesize \centering
4471   \begin{minipage}[c]{\codesamplewidth}
4472     \includecodesample{listati/message_getter.c}
4473   \end{minipage} 
4474   \normalsize 
4475   \caption{Sezione principale del codice del programma
4476     \file{message\_getter.c}.}
4477   \label{fig:ipc_posix_sem_shm_message_server}
4478 \end{figure}
4479
4480 Il corpo principale del primo dei due, il cui codice completo è nel file
4481 \file{message\_getter.c} dei sorgenti allegati, è riportato in
4482 fig.~\ref{fig:ipc_posix_sem_shm_message_server}; si è tralasciata la parte che
4483 tratta la gestione delle opzioni a riga di comando (che consentono di
4484 impostare un nome diverso per il semaforo e il segmento di memoria condivisa)
4485 ed il controllo che al programma venga fornito almeno un argomento, contenente
4486 la stringa iniziale da inserire nel segmento di memoria condivisa.
4487
4488 Lo scopo del programma è quello di creare un segmento di memoria condivisa su
4489 cui registrare una stringa, e tenerlo sotto osservazione stampando la stessa
4490 una volta al secondo. Si utilizzerà un semaforo per proteggere l'accesso in
4491 lettura alla stringa, in modo che questa non possa essere modificata
4492 dall'altro programma prima di averla finita di stampare.
4493
4494 La parte iniziale del programma contiene le definizioni (\texttt{\small 1--8})
4495 del gestore del segnale usato per liberare le risorse utilizzate, delle
4496 \index{variabili!globali} variabili globali contenenti i nomi di default del
4497 segmento di memoria condivisa e del semaforo (il default scelto è
4498 \texttt{messages}), e delle altre variabili utilizzate dal programma.
4499
4500 Come prima istruzione (\texttt{\small 10}) si è provveduto ad installare un
4501 gestore di segnale che consentirà di effettuare le operazioni di pulizia
4502 (usando la funzione \func{Signal} illustrata in
4503 fig.~\ref{fig:sig_Signal_code}), dopo di che (\texttt{\small 10--16}) si è
4504 creato il segmento di memoria condivisa con la funzione \func{CreateShm} che
4505 abbiamo appena trattato in sez.~\ref{sec:ipc_posix_shm}, uscendo con un
4506 messaggio in caso di errore. 
4507
4508 Si tenga presente che la funzione \func{CreateShm} richiede che il segmento
4509 non sia già presente e fallirà qualora un'altra istanza, o un altro programma
4510 abbia già allocato un segmento con quello stesso nome. Per semplicità di
4511 gestione si è usata una dimensione fissa pari a 256 byte, definita tramite la
4512 costante \texttt{MSGMAXSIZE}.
4513
4514 Il passo successivo (\texttt{\small 17--21}) è quello della creazione del
4515 semaforo che regola l'accesso al segmento di memoria condivisa con
4516 \func{sem\_open}; anche in questo caso si gestisce l'uscita con stampa di un
4517 messaggio in caso di errore. Anche per il semaforo, avendo specificato la
4518 combinazione di flag \code{O\_CREAT|O\_EXCL} come secondo argomento, si esce
4519 qualora fosse già esistente; altrimenti esso verrà creato con gli opportuni
4520 permessi specificati dal terzo argomento, (indicante lettura e scrittura in
4521 notazione ottale). Infine il semaforo verrà inizializzato ad un valore nullo
4522 (il quarto argomento), corrispondete allo stato in cui risulta bloccato.
4523
4524 A questo punto (\texttt{\small 23}) si potrà inizializzare il messaggio posto
4525 nel segmento di memoria condivisa usando la stringa passata come argomento al
4526 programma. Essendo il semaforo stato creato già bloccato non ci si dovrà
4527 preoccupare di eventuali \itindex{race~condition} \textit{race condition}
4528 qualora il programma di modifica del messaggio venisse lanciato proprio in
4529 questo momento.  Una volta inizializzato il messaggio occorrerà però
4530 rilasciare il semaforo (\texttt{\small 25--28}) per consentirne l'uso; in
4531 tutte queste operazioni si provvederà ad uscire dal programma con un opportuno
4532 messaggio in caso di errore.
4533
4534 Una volta completate le inizializzazioni il ciclo principale del programma
4535 (\texttt{\small 29--47}) viene ripetuto indefinitamente (\texttt{\small 29})
4536 per stampare sia il contenuto del messaggio che una serie di informazioni di
4537 controllo. Il primo passo (\texttt{\small 30--34}) è quello di acquisire (con
4538 \func{sem\_getvalue}, con uscita in caso di errore) e stampare il valore del
4539 semaforo ad inizio del ciclo; seguito (\texttt{\small 35--36}) dal tempo
4540 corrente.
4541
4542 \begin{figure}[!htbp]
4543   \footnotesize \centering
4544   \begin{minipage}[c]{\codesamplewidth}
4545     \includecodesample{listati/HandSigInt.c}
4546   \end{minipage} 
4547   \normalsize 
4548   \caption{Codice del gestore di segnale del programma
4549     \file{message\_getter.c}.}
4550   \label{fig:ipc_posix_sem_shm_message_server_handler}
4551 \end{figure}
4552
4553 Prima della stampa del messaggio invece si deve acquisire il semaforo
4554 (\texttt{\small 31--34}) per evitare accessi concorrenti alla stringa da parte
4555 del programma di modifica. Una volta eseguita la stampa (\texttt{\small 41})
4556 il semaforo dovrà essere rilasciato (\texttt{\small 42--45}). Il passo finale
4557 (\texttt{\small 46}) è attendere per un secondo prima di eseguire da capo il
4558 ciclo. 
4559
4560 Per uscire in maniera corretta dal programma sarà necessario interromperlo con
4561 il break da tastiera (\texttt{C-c}), che corrisponde all'invio del segnale
4562 \signal{SIGINT}, per il quale si è installato (\texttt{\small 10}) una
4563 opportuna funzione di gestione, riportata in
4564 fig.~\ref{fig:ipc_posix_sem_shm_message_server_handler}. La funzione è molto
4565 semplice e richiama le funzioni di rimozione sia per il segmento di memoria
4566 condivisa che per il semaforo, garantendo così che possa essere riaperto
4567 ex-novo senza errori in un futuro riutilizzo del comando.
4568
4569 \begin{figure}[!htbp]
4570   \footnotesize \centering
4571   \begin{minipage}[c]{\codesamplewidth}
4572     \includecodesample{listati/message_setter.c}
4573   \end{minipage} 
4574   \normalsize 
4575   \caption{Sezione principale del codice del programma
4576     \file{message\_setter.c}.}
4577   \label{fig:ipc_posix_sem_shm_message_setter}
4578 \end{figure}
4579
4580 Il secondo programma di esempio è \file{message\_setter.c}, di cui si è
4581 riportato il corpo principale in
4582 fig.~\ref{fig:ipc_posix_sem_shm_message_setter},\footnote{al solito il codice
4583   completo è nel file dei sorgenti allegati.} dove si è tralasciata, non
4584 essendo significativa per quanto si sta trattando, la parte relativa alla
4585 gestione delle opzioni a riga di comando e degli argomenti, che sono identici
4586 a quelli usati da \file{message\_getter}, con l'unica aggiunta di un'opzione
4587 ``\texttt{-t}'' che consente di indicare un tempo di attesa (in secondi) in
4588 cui il programma si ferma tenendo bloccato il semaforo.
4589
4590 Una volta completata la gestione delle opzioni e degli argomenti (ne deve
4591 essere presente uno solo, contenente la nuova stringa da usare come
4592 messaggio), il programma procede (\texttt{\small 10--14}) con l'acquisizione
4593 del segmento di memoria condivisa usando la funzione \func{FindShm} (trattata
4594 in sez.~\ref{sec:ipc_posix_shm}) che stavolta deve già esistere.  Il passo
4595 successivo (\texttt{\small 16--19}) è quello di aprire il semaforo, e a
4596 differenza di \file{message\_getter}, in questo caso si richiede a
4597 \func{sem\_open} che questo esista, passando uno zero come secondo ed unico
4598 argomento.
4599
4600 Una volta completate con successo le precedenti inizializzazioni, il passo
4601 seguente (\texttt{\small 21--24}) è quello di acquisire il semaforo, dopo di
4602 che sarà possibile eseguire la sostituzione del messaggio (\texttt{\small 25})
4603 senza incorrere in possibili \itindex{race~condition} \textit{race condition}
4604 con la stampa dello stesso da parte di \file{message\_getter}.
4605
4606 Una volta effettuata la modifica viene stampato (\texttt{\small 26}) il tempo
4607 di attesa impostato con l'opzione ``\texttt{-t}'' dopo di che (\texttt{\small
4608   27}) viene eseguita la stessa, senza rilasciare il semaforo che resterà
4609 quindi bloccato (causando a questo punto una interruzione delle stampe
4610 eseguite da \file{message\_getter}). Terminato il tempo di attesa si rilascerà
4611 (\texttt{\small 29--32}) il semaforo per poi uscire.
4612
4613 Per verificare il funzionamento dei programmi occorrerà lanciare per primo
4614 \file{message\_getter}\footnote{lanciare per primo \file{message\_setter} darà
4615   luogo ad un errore, non essendo stati creati il semaforo ed il segmento di
4616   memoria condivisa.} che inizierà a stampare una volta al secondo il
4617 contenuto del messaggio ed i suoi dati, con qualcosa del tipo:
4618 \begin{Verbatim}
4619 piccardi@hain:~/gapil/sources$  ./message_getter messaggio
4620 sem=1, Fri Dec 31 14:12:41 2010
4621 message: messaggio
4622 sem=1, Fri Dec 31 14:12:42 2010
4623 message: messaggio
4624 ...
4625 \end{Verbatim}
4626 %$
4627 proseguendo indefinitamente fintanto che non si prema \texttt{C-c} per farlo
4628 uscire. Si noti come il valore del semaforo risulti sempre pari ad 1 (in
4629 quanto al momento esso sarà sempre libero). 
4630
4631 A questo punto si potrà lanciare \file{message\_setter} per cambiare il
4632 messaggio, nel nostro caso per rendere evidente il funzionamento del blocco
4633 richiederemo anche una attesa di 3 secondi, ed otterremo qualcosa del tipo:
4634 \begin{Verbatim}
4635 piccardi@hain:~/gapil/sources$ ./message_setter -t 3 ciao
4636 Sleeping for 3 seconds
4637 \end{Verbatim}
4638 %$
4639 dove il programma si fermerà per 3 secondi prima di rilasciare il semaforo e
4640 terminare. 
4641
4642 L'effetto di questo programma si potrà però apprezzare meglio nell'uscita di
4643 \file{message\_getter}, che verrà interrotta per questo stesso tempo, prima di
4644 ricominciare con il nuovo testo:
4645 \begin{Verbatim}
4646 ...
4647 sem=1, Fri Dec 31 14:16:27 2010
4648 message: messaggio
4649 sem=1, Fri Dec 31 14:16:28 2010
4650 message: messaggio
4651 sem=0, Fri Dec 31 14:16:29 2010
4652 message: ciao
4653 sem=1, Fri Dec 31 14:16:32 2010
4654 message: ciao
4655 sem=1, Fri Dec 31 14:16:33 2010
4656 message: ciao
4657 ...
4658 \end{Verbatim}
4659 %$
4660
4661 E si noterà come nel momento in cui si è lanciato \file{message\_setter} le
4662 stampe di \file{message\_getter} si bloccheranno, come corretto, dopo aver
4663 registrato un valore nullo per il semaforo.  Il programma infatti resterà
4664 bloccato nella \func{sem\_wait} (quella di riga (\texttt{\small 37}) in
4665 fig.~\ref{fig:ipc_posix_sem_shm_message_server}) fino alla scadenza
4666 dell'attesa di \file{message\_setter} (con l'esecuzione della \func{sem\_post}
4667 della riga (\texttt{\small 29}) di
4668 fig.~\ref{fig:ipc_posix_sem_shm_message_setter}), e riprenderanno con il nuovo
4669 testo alla terminazione di quest'ultimo.
4670
4671
4672 % LocalWords:  like fifo System POSIX RPC Calls Common Object Request Brocker
4673 % LocalWords:  Architecture descriptor kernel unistd int filedes errno EMFILE
4674 % LocalWords:  ENFILE EFAULT BUF sez fig fork Stevens siblings EOF read SIGPIPE
4675 % LocalWords:  EPIPE shell CGI Gateway Interface HTML JPEG URL mime type gs dup
4676 % LocalWords:  barcode PostScript race condition stream BarCodePage WriteMess
4677 % LocalWords:  size PS switch wait popen pclose stdio const char command NULL
4678 % LocalWords:  EINVAL cap fully buffered Ghostscript l'Encapsulated epstopsf of
4679 % LocalWords:  PDF EPS lseek ESPIPE PPM Portable PixMap format pnmcrop PNG pnm
4680 % LocalWords:  pnmmargin png BarCode inode filesystem l'inode mknod mkfifo RDWR
4681 % LocalWords:  ENXIO deadlock client reinviate fortunes fortunefilename daemon
4682 % LocalWords:  FortuneServer FortuneParse FortuneClient pid libgapil  LD librt
4683 % LocalWords:  PATH linker pathname ps tmp killall fortuned crash socket domain
4684 % LocalWords:  socketpair BSD sys protocol sv EAFNOSUPPORT EPROTONOSUPPORT AF
4685 % LocalWords:  EOPNOTSUPP SOCK SysV IPC Process Comunication ipc perm key exec
4686 % LocalWords:  header ftok proj stat libc SunOS glibc XPG dell'inode number uid
4687 % LocalWords:  cuid cgid gid tab MSG shift group umask seq MSGMNI SEMMNI SHMMNI
4688 % LocalWords:  shmmni msgmni sem sysctl IPCMNI IPCTestId msgget EACCES EEXIST
4689 % LocalWords:  CREAT EXCL EIDRM ENOENT ENOSPC ENOMEM novo proc MSGMAX msgmax ds
4690 % LocalWords:  MSGMNB msgmnb linked list msqid msgid linux msg qnum lspid lrpid
4691 % LocalWords:  rtime ctime qbytes first last cbytes msgctl semctl shmctl ioctl
4692 % LocalWords:  cmd struct buf EPERM RMID msgsnd msgbuf msgp msgsz msgflg EAGAIN
4693 % LocalWords:  NOWAIT EINTR mtype mtext long message sizeof LENGTH ts sleep BIG
4694 % LocalWords:  msgrcv ssize msgtyp NOERROR EXCEPT ENOMSG multiplexing select ls
4695 % LocalWords:  poll polling queue MQFortuneServer write init HandSIGTERM  l'IPC
4696 % LocalWords:  MQFortuneClient mqfortuned mutex risorse' inter semaphore semget
4697 % LocalWords:  nsems SEMMNS SEMMSL semid otime semval sempid semncnt semzcnt nr
4698 % LocalWords:  SEMVMX SEMOPM semop SEMMNU SEMUME SEMAEM semnum union semun arg
4699 % LocalWords:  ERANGE SETALL SETVAL GETALL array GETNCNT GETPID GETVAL GETZCNT
4700 % LocalWords:  sembuf sops unsigned nsops UNDO flg nsop num undo pending semadj
4701 % LocalWords:  sleeper scheduler running next semundo MutexCreate semunion lock
4702 % LocalWords:  MutexFind wrapper MutexRead MutexLock MutexUnlock unlock locking
4703 % LocalWords:  MutexRemove shmget SHMALL SHMMAX SHMMIN shmid shm segsz atime FD
4704 % LocalWords:  dtime lpid cpid nattac shmall shmmax SHMLBA SHMSEG EOVERFLOW brk
4705 % LocalWords:  memory shmat shmdt void shmaddr shmflg SVID RND RDONLY rounded
4706 % LocalWords:  SIGSEGV nattch exit SharedMem ShmCreate memset fill ShmFind home
4707 % LocalWords:  ShmRemove DirMonitor DirProp chdir GaPiL shmptr ipcs NFS
4708 % LocalWords:  ComputeValues ReadMonitor touch SIGTERM dirmonitor unlink fcntl
4709 % LocalWords:  LockFile UnlockFile CreateMutex FindMutex LockMutex SETLKW GETLK
4710 % LocalWords:  UnlockMutex RemoveMutex ReadMutex UNLCK WRLCK RDLCK mapping MAP
4711 % LocalWords:  SHARED ANONYMOUS thread patch names strace system call userid Di
4712 % LocalWords:  groupid Michal Wronski Krzysztof Benedyczak wrona posix mqueue
4713 % LocalWords:  lmqueue gcc mount mqd name oflag attr maxmsg msgsize receive ptr
4714 % LocalWords:  send WRONLY NONBLOCK close mqdes EBADF getattr setattr mqstat to
4715 % LocalWords:  omqstat curmsgs flags timedsend len prio timespec abs EMSGSIZE
4716 % LocalWords:  ETIMEDOUT timedreceive getaddr notify sigevent notification l'I
4717 % LocalWords:  EBUSY sigev SIGNAL signo value sigval siginfo all'userid MESGQ
4718 % LocalWords:  Konstantin Knizhnik futex tmpfs ramfs cache shared swap CONFIG
4719 % LocalWords:  lrt blocks PAGECACHE TRUNC CLOEXEC mmap ftruncate munmap FindShm
4720 % LocalWords:  CreateShm RemoveShm LIBRARY Library libmqueue FAILED has
4721 % LocalWords:  ENAMETOOLONG qualchenome RESTART trywait XOPEN SOURCE timedwait
4722 % LocalWords:  process getvalue sval execve pshared ENOSYS heap PAGE destroy it
4723 % LocalWords:  xffffffff Arrays owner perms Queues used bytes messages device
4724 % LocalWords:  Cannot find such Segments getter Signal MSGMAXSIZE been stable
4725 % LocalWords:  for now it's break Berlin sources Let's an accidental feature
4726 % LocalWords:  Larry Wall Escape the Hell William ipctestid Identifier segment
4727 % LocalWords:  violation dell'I SIGINT setter Fri Dec Sleeping seconds
4728
4729
4730 %%% Local Variables: 
4731 %%% mode: latex
4732 %%% TeX-master: "gapil"
4733 %%% End: