Altre ripuliture
[gapil.git] / ipc.tex
1 %% ipc.tex
2 %%
3 %% Copyright (C) 2000-2015 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{L'intercomunicazione fra processi}
13 \label{cha:IPC}
14
15
16 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
17 la comunicazione fra processi. In questo capitolo affronteremo solo i
18 meccanismi più elementari che permettono di mettere in comunicazione processi
19 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
20 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
21
22 Tralasceremo invece tutte le problematiche relative alla comunicazione
23 attraverso la rete (e le relative interfacce) che saranno affrontate in
24 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
25 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) che in
26 genere sono implementati da un ulteriore livello di librerie sopra i
27 meccanismi elementari.
28
29
30 \section{L'intercomunicazione fra processi tradizionale}
31 \label{sec:ipc_unix}
32
33 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
34 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
35 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
36 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
37 ne gestiscono l'uso e le varie forme in cui si è evoluto.
38
39
40 \subsection{Le \textit{pipe} standard}
41 \label{sec:ipc_pipes}
42
43 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
44 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
45 sostanza di una coppia di file descriptor connessi fra di loro in modo che
46 quanto scrive su di uno si può rileggere dall'altro.  Si viene così a
47 costituire un canale di comunicazione realizzato tramite i due file
48 descriptor, che costituisce appunto una sorta di \textsl{tubo} (che appunto il
49 significato del termine inglese \textit{pipe}) attraverso cui si possono far
50 passare i dati.
51
52 In pratica si tratta di un buffer circolare in memoria in cui il kernel
53 appoggia i dati immessi nel file descriptor su cui si scrive per farli poi
54 riemergere dal file descriptor da cui si legge. Si tenga ben presente che in
55 questo passaggio di dati non è previsto nessun tipo di accesso al disco e che
56 nonostante l'uso dei file descriptor le \textit{pipe} non han nulla a che fare
57 con i file di dati di cui si è parlato al cap.~\ref{cha:file_IO_interface}.
58
59 La funzione di sistema che permette di creare questa speciale coppia di file
60 descriptor associati ad una \textit{pipe} è appunto \funcd{pipe}, ed il suo
61 prototipo è:
62
63 \begin{funcproto}{
64 \fhead{unistd.h}
65 \fdecl{int pipe(int filedes[2])}
66 \fdesc{Crea la coppia di file descriptor di una \textit{pipe}.} 
67 }
68
69 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
70   caso \var{errno} assumerà uno dei valori: 
71   \begin{errlist}
72   \item[\errcode{EFAULT}] \param{filedes} non è un indirizzo valido.
73   \end{errlist}
74   ed inoltre \errval{EMFILE} e \errval{ENFILE} nel loro significato generico.}
75 \end{funcproto}
76
77 La funzione restituisce la coppia di file descriptor nel vettore
78 \param{filedes}, il primo è aperto in lettura ed il secondo in scrittura. Come
79 accennato concetto di funzionamento di una \textit{pipe} è semplice: quello
80 che si scrive nel file descriptor aperto in scrittura viene ripresentato tale
81 e quale nel file descriptor aperto in lettura. 
82
83 I file descriptor infatti non sono connessi a nessun file reale, ma, come
84 accennato, ad un buffer nel kernel la cui dimensione è specificata dal
85 parametro di sistema \const{PIPE\_BUF}, (vedi
86 sez.~\ref{sec:sys_file_limits}). Lo schema di funzionamento di una
87 \textit{pipe} è illustrato in fig.~\ref{fig:ipc_pipe_singular}, in cui sono
88 indicati i due capi della \textit{pipe}, associati a ciascun file descriptor,
89 con le frecce che indicano la direzione del flusso dei dati.
90
91 \begin{figure}[!htb]
92   \centering
93   \includegraphics[height=5cm]{img/pipe}
94   \caption{Schema della struttura di una \textit{pipe}.}
95   \label{fig:ipc_pipe_singular}
96 \end{figure}
97
98 Della funzione di sistema esiste una seconda versione, \funcd{pipe2},
99 introdotta con il kernel 2.6.27 e le \acr{glibc} 2.9 e specifica di Linux
100 (utilizzabile solo definendo la macro \macro{\_GNU\_SOURCE}), che consente di
101 impostare atomicamente le caratteristiche dei file descriptor restituiti, il
102 suo prototipo è:
103
104 \begin{funcproto}{
105 \fhead{unistd.h}
106 \fhead{fcntl.h}
107 \fdecl{int pipe2(int pipefd[2], int flags)}
108 \fdesc{Crea la coppia di file descriptor di una \textit{pipe}.} 
109 }
110
111 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
112   caso \var{errno} assumerà uno dei valori: 
113   \begin{errlist}
114   \item[\errcode{EINVAL}] il valore di \param{flags} non valido.
115   \end{errlist}
116   e gli altri già visti per \func{pipe} con lo stesso significato.}
117 \end{funcproto}
118
119 Utilizzando un valore nullo per \param{flags} la funzione è identica a
120 \func{pipe}, si può però passare come valore l'OR aritmetico di uno qualunque
121 fra \const{O\_NONBLOCK} o \const{O\_CLOEXEC} che hanno l'effetto di impostare
122 su entrambi i file descriptor restituiti dalla funzione i relativi flag, già
123 descritti per \func{open} in tab.~\ref{tab:open_operation_flag}, che attivano
124 rispettivamente la modalità di accesso \textsl{non-bloccante} ed il
125 \textit{close-on-exec}.
126
127 Chiaramente creare una \textit{pipe} all'interno di un singolo processo non
128 serve a niente; se però ricordiamo quanto esposto in
129 sez.~\ref{sec:file_shared_access} riguardo al comportamento dei file
130 descriptor nei processi figli, è immediato capire come una \textit{pipe} possa
131 diventare un meccanismo di intercomunicazione. Un processo figlio infatti
132 condivide gli stessi file descriptor del padre, compresi quelli associati ad
133 una \textit{pipe} (secondo la situazione illustrata in
134 fig.~\ref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
135 capo della \textit{pipe}, l'altro può leggere.
136
137 \begin{figure}[!htb]
138   \centering
139   \includegraphics[height=5cm]{img/pipefork}
140   \caption{Schema dei collegamenti ad una \textit{pipe}, condivisi fra
141     processo padre e figlio dopo l'esecuzione \func{fork}.}
142   \label{fig:ipc_pipe_fork}
143 \end{figure}
144
145 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
146 comunicazione fra processi attraverso una \textit{pipe}, utilizzando le
147 proprietà ordinarie dei file, ma ci mostra anche qual è il principale limite
148 nell'uso delle \textit{pipe}.\footnote{Stevens in \cite{APUE} riporta come
149   limite anche il fatto che la comunicazione è unidirezionale, ma in realtà
150   questo è un limite superabile usando una coppia di \textit{pipe}, anche se
151   al costo di una maggiore complessità di gestione.}  È necessario infatti che
152 i processi possano condividere i file descriptor della \textit{pipe}, e per
153 questo essi devono comunque essere \textsl{parenti} (dall'inglese
154 \textit{siblings}), cioè o derivare da uno stesso processo padre in cui è
155 avvenuta la creazione della \textit{pipe}, o, più comunemente, essere nella
156 relazione padre/figlio.
157
158 A differenza di quanto avviene con i file normali, la lettura da una
159 \textit{pipe} può essere bloccante (qualora non siano presenti dati), inoltre
160 se si legge da una \textit{pipe} il cui capo in scrittura è stato chiuso, si
161 avrà la ricezione di un EOF (vale a dire che la funzione \func{read} ritornerà
162 restituendo 0).  Se invece si esegue una scrittura su una \textit{pipe} il cui
163 capo in lettura non è aperto il processo riceverà il segnale \signal{SIGPIPE},
164 e la funzione di scrittura restituirà un errore di \errcode{EPIPE} (al ritorno
165 del gestore, o qualora il segnale sia ignorato o bloccato).
166
167 La dimensione del buffer della \textit{pipe} (\const{PIPE\_BUF}) ci dà inoltre
168 un'altra importante informazione riguardo il comportamento delle operazioni di
169 lettura e scrittura su di una \textit{pipe}; esse infatti sono atomiche
170 fintanto che la quantità di dati da scrivere non supera questa
171 dimensione. Qualora ad esempio si effettui una scrittura di una quantità di
172 dati superiore l'operazione verrà effettuata in più riprese, consentendo
173 l'intromissione di scritture effettuate da altri processi.
174
175 La dimensione originale del buffer era di 4096 byte (uguale ad una pagina di
176 memoria) fino al kernel 2.6.11, ed è stata portata in seguito a 64kb; ma a
177 partire dal kernel 2.6.35 è stata resa disponibile l'operazione di controllo
178 \const{F\_SETPIPE\_SZ} (vedi sez.~\ref{sec:ipc_pipes}) che consente di
179 modificarne la dimensione.
180
181
182
183 \subsection{Un esempio dell'uso delle \textit{pipe}}
184 \label{sec:ipc_pipe_use}
185
186 Per capire meglio il funzionamento delle \textit{pipe} faremo un esempio di
187 quello che è il loro uso più comune, analogo a quello effettuato della shell,
188 e che consiste nell'inviare l'output di un processo (lo standard output)
189 sull'input di un altro. Realizzeremo il programma di esempio nella forma di un
190 \textit{CGI}\footnote{quella dei CGI (\textit{Common Gateway Interface}) è una
191   interfaccia che consente ad un server web di eseguire un programma il cui
192   output (che deve essere opportunamente formattato seguendo le specifiche
193   dell'interfaccia) può essere presentato come risposta ad una richiesta HTTP
194   al posto del contenuto di un file, e che ha costituito probabilmente la
195   prima modalità con cui sono state create pagine HTML dinamiche.}  che genera
196 una immagine JPEG di un codice a barre, specificato come argomento in
197 ingresso.
198
199 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
200 delle caratteristiche specifiche, esso infatti non viene lanciato da una
201 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
202 solito ha la forma:
203 \begin{Example}
204 http://www.sito.it/cgi-bin/programma?argomento
205 \end{Example}
206 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
207 che ne descrive il \textit{mime-type}) sullo \textit{standard output}, in modo
208 che il server web possa reinviarlo al browser che ha effettuato la richiesta,
209 che in questo modo è in grado di visualizzarlo opportunamente.
210
211 \begin{figure}[!htb]
212   \centering
213   \includegraphics[height=5cm]{img/pipeuse}
214   \caption{Schema dell'uso di una \textit{pipe} come mezzo di comunicazione fra
215     due processi attraverso l'esecuzione una \func{fork} e la chiusura dei
216     capi non utilizzati.}
217   \label{fig:ipc_pipe_use}
218 \end{figure}
219
220 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
221 \cmd{gs}, il primo infatti è in grado di generare immagini PostScript di
222 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
223 serve per poter effettuare la conversione della stessa immagine in formato
224 JPEG. Usando una \textit{pipe} potremo inviare l'output del primo sull'input del
225 secondo, secondo lo schema mostrato in fig.~\ref{fig:ipc_pipe_use}, in cui la
226 direzione del flusso dei dati è data dalle frecce continue.
227
228 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
229 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
230 \textit{CGI} può essere eseguito più volte in contemporanea, e si avrebbe una
231 evidente \textit{race condition} in caso di accesso simultaneo a detto file da
232 istanze diverse. Il problema potrebbe essere superato utilizzando un sempre
233 diverso per il file temporaneo, che verrebbe creato all'avvio di ogni istanza,
234 utilizzato dai sottoprocessi, e cancellato alla fine della sua esecuzione; ma
235 a questo punto le cose non sarebbero più tanto semplici.  L'uso di una
236 \textit{pipe} invece permette di risolvere il problema in maniera semplice ed
237 elegante, oltre ad essere molto più efficiente, dato che non si deve scrivere
238 su disco.
239
240 Il programma ci servirà anche come esempio dell'uso delle funzioni di
241 duplicazione dei file descriptor che abbiamo trattato in
242 sez.~\ref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
243 funzioni infatti che è possibile dirottare gli stream standard dei processi
244 (che abbiamo visto in tab.~\ref{tab:file_std_files} e
245 sez.~\ref{sec:file_stream}) sulla \textit{pipe}. In
246 fig.~\ref{fig:ipc_barcodepage_code} abbiamo riportato il corpo del programma,
247 il cui codice completo è disponibile nel file \file{BarCodePage.c} che si
248 trova nella directory dei sorgenti.
249
250 \begin{figure}[!htb]
251   \footnotesize \centering
252   \begin{minipage}[c]{\codesamplewidth}
253     \includecodesample{listati/BarCodePage.c}
254   \end{minipage} 
255   \normalsize 
256   \caption{Sezione principale del codice del \textit{CGI} 
257     \file{BarCodePage.c}.}
258   \label{fig:ipc_barcodepage_code}
259 \end{figure}
260
261 La prima operazione del programma (\texttt{\small 4-12}) è quella di creare
262 le due \textit{pipe} che serviranno per la comunicazione fra i due comandi
263 utilizzati per produrre il codice a barre; si ha cura di controllare la
264 riuscita della chiamata, inviando in caso di errore un messaggio invece
265 dell'immagine richiesta. La funzione \func{WriteMess} non è riportata in
266 fig.~\ref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
267 formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
268 \textit{mime-type}, e formattando il messaggio in HTML, in modo che
269 quest'ultimo possa essere visualizzato correttamente da un browser.
270
271 Una volta create le \textit{pipe}, il programma può creare (\texttt{\small
272   13-17}) il primo processo figlio, che si incaricherà (\texttt{\small
273   19-25}) di eseguire \cmd{barcode}. Quest'ultimo legge dallo standard input
274 una stringa di caratteri, la converte nell'immagine PostScript del codice a
275 barre ad essa corrispondente, e poi scrive il risultato direttamente sullo
276 standard output.
277
278 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
279 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima
280 \textit{pipe}, e se ne collega (\texttt{\small 21}) il capo in lettura allo
281 \textit{standard input} usando \func{dup2}. Si ricordi che invocando
282 \func{dup2} il secondo file, qualora risulti aperto, viene, come nel caso
283 corrente, chiuso prima di effettuare la duplicazione. Allo stesso modo, dato
284 che \cmd{barcode} scrive l'immagine PostScript del codice a barre sullo
285 standard output, per poter effettuare una ulteriore redirezione il capo in
286 lettura della seconda \textit{pipe} viene chiuso (\texttt{\small 22}) mentre
287 il capo in scrittura viene collegato allo standard output (\texttt{\small
288   23}).
289
290 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
291 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
292 leggerà dalla prima \textit{pipe} la stringa da codificare che gli sarà
293 inviata dal padre, e scriverà l'immagine PostScript del codice a barre sulla
294 seconda.
295
296 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
297 (\texttt{\small 26}) il capo inutilizzato della prima \textit{pipe} (quello in
298 ingresso) e poi scrive (\texttt{\small 27}) la stringa da convertire sul capo
299 in uscita, così che \cmd{barcode} possa riceverla dallo \textit{standard
300   input}. A questo punto l'uso della prima \textit{pipe} da parte del padre è
301 finito ed essa può essere definitivamente chiusa (\texttt{\small 28}), si
302 attende poi (\texttt{\small 29}) che l'esecuzione di \cmd{barcode} sia
303 completata.
304
305 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
306 PostScript del codice a barre sul capo in scrittura della seconda
307 \textit{pipe}; a questo punto si può eseguire la seconda conversione, da PS a
308 JPEG, usando il programma \cmd{gs}. Per questo si crea (\texttt{\small
309   30-34}) un secondo processo figlio, che poi (\texttt{\small 35-42})
310 eseguirà questo programma leggendo l'immagine PostScript creata da
311 \cmd{barcode} dallo \textit{standard input}, per convertirla in JPEG.
312
313 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
314 scrittura della seconda \textit{pipe}, e se ne collega (\texttt{\small 38}) il
315 capo in lettura allo \textit{standard input}. Per poter formattare l'output
316 del programma in maniera utilizzabile da un browser, si provvede anche
317 \texttt{\small 40}) alla scrittura dell'apposita stringa di identificazione
318 del \textit{mime-type} in testa allo \textit{standard output}. A questo punto
319 si può invocare \texttt{\small 41}) \cmd{gs}, provvedendo le opportune opzioni
320 del comando che consentono di leggere il file da convertire dallo
321 \textit{standard input} e di inviare la conversione sullo \textit{standard
322   output}.
323
324 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
325 capo in scrittura della seconda \textit{pipe}, e attende la conclusione del
326 figlio (\texttt{\small 45}); a questo punto può (\texttt{\small 46})
327 uscire. Si tenga conto che l'operazione di chiudere il capo in scrittura della
328 seconda \textit{pipe} è necessaria, infatti, se non venisse chiusa, \cmd{gs},
329 che legge il suo \textit{standard input} da detta \textit{pipe}, resterebbe
330 bloccato in attesa di ulteriori dati in ingresso (l'unico modo che un
331 programma ha per sapere che i dati in ingresso sono terminati è rilevare che
332 lo \textit{standard input} è stato chiuso), e la \func{wait} non ritornerebbe.
333
334
335 \subsection{Le funzioni \func{popen} e \func{pclose}}
336 \label{sec:ipc_popen}
337
338 Come si è visto la modalità più comune di utilizzo di una \textit{pipe} è
339 quella di utilizzarla per fare da tramite fra output ed input di due programmi
340 invocati in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due
341 funzioni che permettono di sintetizzare queste operazioni. La prima di esse si
342 chiama \funcd{popen} ed il suo prototipo è:
343
344
345 \begin{funcproto}{
346 \fhead{stdio.h}
347 \fdecl{FILE *popen(const char *command, const char *type)}
348 \fdesc{Esegue un programma dirottando l'uscita su una \textit{pipe}.} 
349 }
350
351 {La funzione ritorna l'indirizzo dello stream associato alla \textit{pipe} in
352   caso di successo e \val{NULL} per un errore, nel qual caso \var{errno} potrà
353   assumere i valori relativi alle sottostanti invocazioni di \func{pipe} e
354   \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
355 \end{funcproto}
356
357 La funzione crea una \textit{pipe}, esegue una \func{fork} creando un nuovo
358 processo nel quale invoca il programma \param{command} attraverso la shell (in
359 sostanza esegue \file{/bin/sh} con il flag \code{-c}).
360 L'argomento \param{type} deve essere una delle due stringhe \verb|"w"| o
361 \verb|"r"|, per richiedere che la \textit{pipe} restituita come valore di
362 ritorno sia collegata allo \textit{standard input} o allo \textit{standard
363   output} del comando invocato.
364
365 La funzione restituisce il puntatore ad uno stream associato alla
366 \textit{pipe} creata, che sarà aperto in sola lettura (e quindi associato allo
367 \textit{standard output} del programma indicato) in caso si sia indicato
368 \code{r}, o in sola scrittura (e quindi associato allo \textit{standard
369   input}) in caso di \code{w}. A partire dalla versione 2.9 delle \acr{glibc}
370 (questa è una estensione specifica di Linux) all'argomento \param{type} può
371 essere aggiunta la lettera ``\texttt{e}'' per impostare automaticamente il
372 flag di \textit{close-on-exec} sul file descriptor sottostante (si ricordi
373 quanto spiegato in sez.~\ref{sec:file_open_close}).
374
375 Lo \textit{stream} restituito da \func{popen} è identico a tutti gli effetti
376 ai \textit{file stream} visti in sez.~\ref{sec:files_std_interface}, anche se
377 è collegato ad una \textit{pipe} e non ad un file, e viene sempre aperto in
378 modalità \textit{fully-buffered} (vedi sez.~\ref{sec:file_buffering}); l'unica
379 differenza con gli usuali stream è che dovrà essere chiuso dalla seconda delle
380 due nuove funzioni, \funcd{pclose}, il cui prototipo è:
381
382 \begin{funcproto}{
383 \fhead{stdio.h}
384 \fdecl{int pclose(FILE *stream)}
385 \fdesc{Chiude una \textit{pipe} creata con \func{popen}.} 
386 }
387
388 {La funzione ritorna lo stato del processo creato da \func{popen} in caso di
389   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà i valori
390   derivanti dalle sottostanti funzioni \func{fclose} e \func{wait4}.}
391 \end{funcproto}
392
393 La funzione chiude il file \param{stream} associato ad una \textit{pipe}
394 creato da una precedente \func{popen}, ed oltre alla chiusura dello stream si
395 incarica anche di attendere (tramite \func{wait4}) la conclusione del processo
396 creato dalla precedente \func{popen}. Se lo stato di uscita non può essere
397 letto la funzione restituirà per \var{errno} un errore di \errval{ECHILD}.
398
399 Per illustrare l'uso di queste due funzioni riprendiamo il problema
400 precedente: il programma mostrato in fig.~\ref{fig:ipc_barcodepage_code} per
401 quanto funzionante, è volutamente codificato in maniera piuttosto complessa,
402 inoltre doveva scontare un problema di \cmd{gs} che non era in grado di
403 riconoscere correttamente l'Encapsulated PostScript,\footnote{si fa
404   riferimento alla versione di GNU Ghostscript 6.53 (2002-02-13), usata quando
405   l'esempio venne scritto per la prima volta.} per cui si era utilizzato il
406 PostScript semplice, generando una pagina intera invece che una immagine delle
407 dimensioni corrispondenti al codice a barre.
408
409 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
410 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
411 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
412 generato da \cmd{barcode} utilizzando l'opzione \cmd{-E}).  Utilizzando un PDF
413 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
414 originarie del codice a barre e produce un JPEG di dimensioni corrette.
415
416 Questo approccio però non può funzionare per via di una delle caratteristiche
417 principali delle \textit{pipe}. Per poter effettuare la conversione di un PDF
418 infatti è necessario, per la struttura del formato, potersi spostare (con
419 \func{lseek}) all'interno del file da convertire. Se si esegue la conversione
420 con \cmd{gs} su un file regolare non ci sono problemi, una \textit{pipe} però
421 è rigidamente sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre
422 con un errore di \errcode{ESPIPE}, rendendo impossibile la conversione.
423 Questo ci dice che in generale la concatenazione di vari programmi funzionerà
424 soltanto quando tutti prevedono una lettura sequenziale del loro input.
425
426 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
427 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
428 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
429   formato usato spesso come formato intermedio per effettuare conversioni, è
430   infatti molto facile da manipolare, dato che usa caratteri ASCII per
431   memorizzare le immagini, anche se per questo è estremamente inefficiente
432   come formato di archiviazione.}  dal quale poi si può ottenere un'immagine
433 di dimensioni corrette attraverso vari programmi di manipolazione
434 (\cmd{pnmcrop}, \cmd{pnmmargin}) che può essere infine trasformata in PNG (con
435 \cmd{pnm2png}).
436
437 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
438 inviando l'uscita di ciascuno all'ingresso del successivo, per poi ottenere il
439 risultato finale sullo \textit{standard output}: un caso classico di
440 utilizzazione delle \textit{pipe}, in cui l'uso di \func{popen} e \func{pclose}
441 permette di semplificare notevolmente la stesura del codice.
442
443 Nel nostro caso, dato che ciascun processo deve scrivere la sua uscita sullo
444 \textit{standard input} del successivo, occorrerà usare \func{popen} aprendo
445 la \textit{pipe} in scrittura. Il codice del nuovo programma è riportato in
446 fig.~\ref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione
447 dei programmi è l'inverso di quello in cui ci si aspetta che vengano
448 effettivamente eseguiti. Questo non comporta nessun problema dato che la
449 lettura su una \textit{pipe} è bloccante, per cui un processo, anche se
450 lanciato per primo, se non ottiene i dati che gli servono si bloccherà in
451 attesa sullo \textit{standard input} finché non otterrà il risultato
452 dell'elaborazione del processo che li deve creare, che pur essendo logicamente
453 precedente, viene lanciato dopo di lui.
454
455 \begin{figure}[!htb]
456   \footnotesize \centering
457   \begin{minipage}[c]{\codesamplewidth}
458     \includecodesample{listati/BarCode.c}
459   \end{minipage} 
460   \normalsize 
461   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
462   \label{fig:ipc_barcode_code}
463 \end{figure}
464
465 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il
466 \textit{mime-type} sullo \textit{standard output}; a questo punto il processo
467 padre non necessita più di eseguire ulteriori operazioni sullo
468 \textit{standard output} e può tranquillamente provvedere alla redirezione.
469
470 Dato che i vari programmi devono essere lanciati in successione, si è
471 approntato un ciclo (\texttt{\small 15-19}) che esegue le operazioni in
472 sequenza: prima crea una \textit{pipe} (\texttt{\small 17}) per la scrittura
473 eseguendo il programma con \func{popen}, in modo che essa sia collegata allo
474 \textit{standard input}, e poi redirige (\texttt{\small 18}) lo
475 \textit{standard output} su detta \textit{pipe}.
476
477 In questo modo il primo processo ad essere invocato (che è l'ultimo della
478 catena) scriverà ancora sullo \textit{standard output} del processo padre, ma
479 i successivi, a causa di questa redirezione, scriveranno sulla \textit{pipe}
480 associata allo \textit{standard input} del processo invocato nel ciclo
481 precedente.
482
483 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
484 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
485 (\texttt{\small 23}) la stringa del codice a barre sulla \textit{pipe}, che è
486 collegata al suo \textit{standard input}, infine si può eseguire
487 (\texttt{\small 24-27}) un ciclo che chiuda con \func{pclose}, nell'ordine
488 inverso rispetto a quello in cui le si sono create, tutte le \textit{pipe}
489 create in precedenza.
490
491
492 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
493 \label{sec:ipc_named_pipe}
494
495 Come accennato in sez.~\ref{sec:ipc_pipes} il problema delle \textit{pipe} è
496 che esse possono essere utilizzate solo da processi con un progenitore comune
497 o nella relazione padre/figlio. Per superare questo problema lo standard
498 POSIX.1 ha introdotto le \textit{fifo}, che hanno le stesse caratteristiche
499 delle \textit{pipe}, ma che invece di essere visibili solo attraverso un file
500 descriptor creato all'interno di un processo da una \textit{system call}
501 apposita, costituiscono un oggetto che risiede sul filesystem (si rammenti
502 quanto detto in sez.~\ref{sec:file_file_types}) che può essere aperto come un
503 qualunque file, così che i processi le possono usare senza dovere per forza
504 essere in una relazione di \textsl{parentela}.
505
506 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le
507 \textit{pipe}, attraverso un buffer nel kernel, senza transitare dal
508 filesystem. Il fatto che siano associate ad un \itindex{inode}
509 \textit{inode} presente sul filesystem serve infatti solo a fornire un punto
510 di accesso per i processi, che permetta a questi ultimi di accedere alla
511 stessa \textit{fifo} senza avere nessuna relazione, con una semplice
512 \func{open}. Il comportamento delle funzioni di lettura e scrittura è identico
513 a quello illustrato per le \textit{pipe} in sez.~\ref{sec:ipc_pipes}.
514
515 Abbiamo già trattato in sez.~\ref{sec:file_mknod} le funzioni \func{mknod} e
516 \func{mkfifo} che permettono di creare una \textit{fifo}. Per utilizzarne una
517 un processo non avrà che da aprire il relativo file speciale o in lettura o
518 scrittura; nel primo caso il processo sarà collegato al capo di uscita della
519 \textit{fifo}, e dovrà leggere, nel secondo al capo di ingresso, e dovrà
520 scrivere.
521
522 Il kernel alloca un singolo buffer per ciascuna \textit{fifo} che sia stata
523 aperta, e questa potrà essere acceduta contemporaneamente da più processi, sia
524 in lettura che in scrittura. Dato che per funzionare deve essere aperta in
525 entrambe le direzioni, per una \textit{fifo} la funzione \func{open} di norma
526 si blocca se viene eseguita quando l'altro capo non è aperto.
527
528 Le \textit{fifo} però possono essere anche aperte in modalità
529 \textsl{non-bloccante}, nel qual caso l'apertura del capo in lettura avrà
530 successo solo quando anche l'altro capo è aperto, mentre l'apertura del capo
531 in scrittura restituirà l'errore di \errcode{ENXIO} fintanto che non verrà
532 aperto il capo in lettura.
533
534 In Linux è possibile aprire le \textit{fifo} anche in lettura/scrittura (lo
535 standard POSIX lascia indefinito il comportamento in questo caso) operazione
536 che avrà sempre successo immediato qualunque sia la modalità di apertura,
537 bloccante e non bloccante.  Questo può essere utilizzato per aprire comunque
538 una \textit{fifo} in scrittura anche se non ci sono ancora processi il
539 lettura. Infine è possibile anche usare la \textit{fifo} all'interno di un
540 solo processo, nel qual caso però occorre stare molto attenti alla possibili
541 situazioni di stallo: se si cerca di leggere da una \textit{fifo} che non
542 contiene dati si avrà infatti un \itindex{deadlock} \textit{deadlock}
543 immediato, dato che il processo si blocca e quindi non potrà mai eseguire le
544 funzioni di scrittura.
545
546 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
547 piuttosto frequente l'utilizzo di una \textit{fifo} come canale di
548 comunicazione nelle situazioni un processo deve ricevere informazioni da
549 altri. In questo caso è fondamentale che le operazioni di scrittura siano
550 atomiche; per questo si deve sempre tenere presente che questo è vero soltanto
551 fintanto che non si supera il limite delle dimensioni di \const{PIPE\_BUF} (si
552 ricordi quanto detto in sez.~\ref{sec:ipc_pipes}).
553
554 A parte il caso precedente, che resta probabilmente il più comune, Stevens
555 riporta in \cite{APUE} altre due casistiche principali per l'uso delle
556 \textit{fifo}:
557 \begin{itemize*}
558 \item Da parte dei comandi di shell, per evitare la creazione di file
559   temporanei quando si devono inviare i dati di uscita di un processo
560   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).  
561 \item Come canale di comunicazione fra un client ed un
562   server (il modello \textit{client-server} è illustrato in
563   sez.~\ref{sec:net_cliserv}).
564 \end{itemize*}
565
566 Nel primo caso quello che si fa è creare tante \textit{fifo} da usare come
567 \textit{standard input} quanti sono i processi a cui i vogliono inviare i
568 dati; questi ultimi saranno stati posti in esecuzione ridirigendo lo
569 \textit{standard input} dalle \textit{fifo}, si potrà poi eseguire il processo
570 che fornisce l'output replicando quest'ultimo, con il comando \cmd{tee}, sulle
571 varie \textit{fifo}.
572
573 Il secondo caso è relativamente semplice qualora si debba comunicare con un
574 processo alla volta, nel qual caso basta usare due \textit{fifo}, una per
575 leggere ed una per scrivere. Le cose diventano invece molto più complesse
576 quando si vuole effettuare una comunicazione fra un server ed un numero
577 imprecisato di client. Se il primo infatti può ricevere le richieste
578 attraverso una \textit{fifo} ``\textsl{nota}'', per le risposte non si può
579 fare altrettanto, dato che, per la struttura sequenziale delle \textit{fifo},
580 i client dovrebbero sapere prima di leggerli quando i dati inviati sono
581 destinati a loro.
582
583 Per risolvere questo problema, si può usare un'architettura come quella
584 illustrata in fig.~\ref{fig:ipc_fifo_server_arch} in cui i client
585 inviano le richieste al server su una \textit{fifo} nota mentre le
586 risposte vengono reinviate dal server a ciascuno di essi su una
587 \textit{fifo} temporanea creata per l'occasione.
588
589 \begin{figure}[!htb]
590   \centering
591   \includegraphics[height=9cm]{img/fifoserver}
592   \caption{Schema dell'utilizzo delle \textit{fifo} nella realizzazione di una
593     architettura di comunicazione client/server.}
594   \label{fig:ipc_fifo_server_arch}
595 \end{figure}
596
597 Come esempio di uso questa architettura e dell'uso delle \textit{fifo},
598 abbiamo scritto un server di \textit{fortunes}, che restituisce, alle
599 richieste di un client, un detto a caso estratto da un insieme di frasi. Sia
600 il numero delle frasi dell'insieme, che i file da cui esse vengono lette
601 all'avvio, sono impostabili da riga di comando. Il corpo principale del
602 server è riportato in fig.~\ref{fig:ipc_fifo_server}, dove si è
603 tralasciata la parte che tratta la gestione delle opzioni a riga di comando,
604 che effettua l'impostazione delle variabili \var{fortunefilename}, che indica
605 il file da cui leggere le frasi, ed \var{n}, che indica il numero di frasi
606 tenute in memoria, ad un valore diverso da quelli preimpostati. Il codice
607 completo è nel file \file{FortuneServer.c}.
608
609 \begin{figure}[!htbp]
610   \footnotesize \centering
611   \begin{minipage}[c]{\codesamplewidth}
612     \includecodesample{listati/FortuneServer.c}
613   \end{minipage} 
614   \normalsize 
615   \caption{Sezione principale del codice del server di \textit{fortunes}
616     basato sulle \textit{fifo}.}
617   \label{fig:ipc_fifo_server}
618 \end{figure}
619
620 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
621 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
622 \var{fortune} avviene solo quando questa dimensione viene specificata, la
623 presenza di un valore nullo provoca l'uscita dal programma attraverso la
624 funzione (non riportata) che ne stampa le modalità d'uso.  Dopo di che
625 installa (\texttt{\small 13-15}) la funzione che gestisce i segnali di
626 interruzione (anche questa non è riportata in fig.~\ref{fig:ipc_fifo_server})
627 che si limita a rimuovere dal filesystem la \textit{fifo} usata dal server per
628 comunicare.
629
630 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
631 funzione \code{FortuneParse} che legge dal file specificato in
632 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
633 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
634 Anche il codice della funzione non è riportato, in quanto non direttamente
635 attinente allo scopo dell'esempio.
636
637 Il passo successivo (\texttt{\small 17-22}) è quello di creare con
638 \func{mkfifo} la \textit{fifo} nota sulla quale il server ascolterà le
639 richieste, qualora si riscontri un errore il server uscirà (escludendo
640 ovviamente il caso in cui la funzione \func{mkfifo} fallisce per la precedente
641 esistenza della \textit{fifo}).
642
643 Una volta che si è certi che la \textit{fifo} di ascolto esiste la procedura
644 di inizializzazione è completata. A questo punto (\texttt{\small 23}) si può
645 chiamare la funzione \func{daemon} per far proseguire l'esecuzione del
646 programma in background come demone.  Si può quindi procedere (\texttt{\small
647   24-33}) alla apertura della \textit{fifo}: si noti che questo viene fatto
648 due volte, prima in lettura e poi in scrittura, per evitare di dover gestire
649 all'interno del ciclo principale il caso in cui il server è in ascolto ma non
650 ci sono client che effettuano richieste.  Si ricordi infatti che quando una
651 \textit{fifo} è aperta solo dal capo in lettura, l'esecuzione di \func{read}
652 ritorna con zero byte (si ha cioè una condizione di end-of-file).
653
654 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
655 client non apre a sua volta la \textit{fifo} nota in scrittura per effettuare
656 la sua richiesta. Pertanto all'inizio non ci sono problemi, il client però,
657 una volta ricevuta la risposta, uscirà, chiudendo tutti i file aperti,
658 compresa la \textit{fifo}.  A questo punto il server resta (se non ci sono
659 altri client che stanno effettuando richieste) con la \textit{fifo} chiusa sul
660 lato in lettura, ed in questo stato la funzione \func{read} non si bloccherà
661 in attesa di dati in ingresso, ma ritornerà in continuazione, restituendo una
662 condizione di \textit{end-of-file}.
663
664 Si è usata questa tecnica per compatibilità, Linux infatti supporta l'apertura
665 delle \textit{fifo} in lettura/scrittura, per cui si sarebbe potuto effettuare
666 una singola apertura con \const{O\_RDWR}; la doppia apertura comunque ha il
667 vantaggio che non si può scrivere per errore sul capo aperto in sola lettura.
668
669 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
670   24-28}),\footnote{di solito si effettua l'apertura del capo in lettura di
671   una \textit{fifo} in modalità non bloccante, per evitare il rischio di uno
672   stallo: se infatti nessuno apre la \textit{fifo} in scrittura il processo
673   non ritornerà mai dalla \func{open}. Nel nostro caso questo rischio non
674   esiste, mentre è necessario potersi bloccare in lettura in attesa di una
675   richiesta.}  si esegue una seconda apertura in scrittura (\texttt{\small
676   29-32}), scartando il relativo file descriptor, che non sarà mai usato, in
677 questo modo però la \textit{fifo} resta comunque aperta anche in scrittura,
678 cosicché le successive chiamate a \func{read} possono bloccarsi.
679
680 A questo punto si può entrare nel ciclo principale del programma che fornisce
681 le risposte ai client (\texttt{\small 34-50}); questo viene eseguito
682 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
683 modo da passare attraverso la funzione di chiusura che cancella la
684 \textit{fifo}).
685
686 Il server è progettato per accettare come richieste dai client delle stringhe
687 che contengono il nome della \textit{fifo} sulla quale deve essere inviata la
688 risposta.  Per cui prima (\texttt{\small 35-39}) si esegue la lettura dalla
689 stringa di richiesta dalla \textit{fifo} nota (che a questo punto si bloccherà
690 tutte le volte che non ci sono richieste). Dopo di che, una volta terminata la
691 stringa (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero
692 casuale per ricavare la frase da inviare, si procederà (\texttt{\small
693   42-46}) all'apertura della \textit{fifo} per la risposta, che poi 
694 (\texttt{\small 47-48}) vi sarà scritta. Infine (\texttt{\small 49}) si
695 chiude la \textit{fifo} di risposta che non serve più.
696
697 Il codice del client è invece riportato in fig.~\ref{fig:ipc_fifo_client},
698 anche in questo caso si è omessa la gestione delle opzioni e la funzione che
699 stampa a video le informazioni di utilizzo ed esce, riportando solo la sezione
700 principale del programma e le definizioni delle variabili. Il codice completo
701 è nel file \file{FortuneClient.c} dei sorgenti allegati.
702
703 \begin{figure}[!htbp]
704   \footnotesize \centering
705   \begin{minipage}[c]{\codesamplewidth}
706     \includecodesample{listati/FortuneClient.c}
707   \end{minipage} 
708   \normalsize 
709   \caption{Sezione principale del codice del client di \textit{fortunes}
710     basato sulle \textit{fifo}.}
711   \label{fig:ipc_fifo_client}
712 \end{figure}
713
714 La prima istruzione (\texttt{\small 12}) compone il nome della \textit{fifo}
715 che dovrà essere utilizzata per ricevere la risposta dal server.  Si usa il
716 \ids{PID} del processo per essere sicuri di avere un nome univoco; dopo di che
717 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
718 in caso di errore (a meno che il file non sia già presente sul filesystem).
719
720 A questo punto il client può effettuare l'interrogazione del server, per
721 questo prima si apre la \textit{fifo} nota (\texttt{\small 19-23}), e poi ci
722 si scrive (\texttt{\small 24}) la stringa composta in precedenza, che contiene
723 il nome della \textit{fifo} da utilizzare per la risposta. Infine si richiude
724 la \textit{fifo} del server che a questo punto non serve più (\texttt{\small
725   25}). 
726
727 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
728 si apre (\texttt{\small 26-30}) la \textit{fifo} appena creata, da cui si
729 deve riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
730 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
731 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
732 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
733 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
734 \textit{fifo} e si cancella (\texttt{\small 34}) il relativo file.  Si noti
735 come la \textit{fifo} per la risposta sia stata aperta solo dopo aver inviato
736 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
737 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
738 scrittura e l'apertura si sarebbe bloccata indefinitamente.
739
740 Verifichiamo allora il comportamento dei nostri programmi, in questo, come in
741 altri esempi precedenti, si fa uso delle varie funzioni di servizio, che sono
742 state raccolte nella libreria \file{libgapil.so}, e per poterla usare
743 occorrerà definire la variabile di ambiente \envvar{LD\_LIBRARY\_PATH} in modo
744 che il linker dinamico possa accedervi.
745
746 In generale questa variabile indica il \textit{pathname} della directory
747 contenente la libreria. Nell'ipotesi (che daremo sempre per verificata) che si
748 facciano le prove direttamente nella directory dei sorgenti (dove di norma
749 vengono creati sia i programmi che la libreria), il comando da dare sarà
750 \code{export LD\_LIBRARY\_PATH=./}; a questo punto potremo lanciare il server,
751 facendogli leggere una decina di frasi, con:
752 \begin{Console}
753 [piccardi@gont sources]$ \textbf{./fortuned -n10}
754 \end{Console}
755 %$
756
757 Avendo usato \func{daemon} per eseguire il server in background il comando
758 ritornerà immediatamente, ma potremo verificare con \cmd{ps} che in effetti il
759 programma resta un esecuzione in background, e senza avere associato un
760 terminale di controllo (si ricordi quanto detto in sez.~\ref{sec:sess_daemon}):
761 \begin{Console}
762 [piccardi@gont sources]$ \textbf{ps aux}
763 ...
764 piccardi 27489  0.0  0.0  1204  356 ?        S    01:06   0:00 ./fortuned -n10
765 piccardi 27492  3.0  0.1  2492  764 pts/2    R    01:08   0:00 ps aux
766 \end{Console}
767 %$
768 e si potrà verificare anche che in \file{/tmp} è stata creata la \textit{fifo}
769 di ascolto \file{fortune.fifo}. A questo punto potremo interrogare il server
770 con il programma client; otterremo così:
771 \begin{Console}
772 [piccardi@gont sources]$ \textbf{./fortune}
773 Linux ext2fs has been stable for a long time, now it's time to break it
774         -- Linuxkongreß '95 in Berlin
775 [piccardi@gont sources]$ \textbf{./fortune}
776 Let's call it an accidental feature.
777         --Larry Wall
778 [piccardi@gont sources]$ \textbf{./fortune}
779 .........    Escape the 'Gates' of Hell
780   `:::'                  .......  ......
781    :::  *                  `::.    ::'
782    ::: .::  .:.::.  .:: .::  `::. :'
783    :::  ::   ::  ::  ::  ::    :::.
784    ::: .::. .::  ::.  `::::. .:'  ::.
785 ...:::.....................::'   .::::..
786         -- William E. Roadcap
787 [piccardi@gont sources]$ ./fortune
788 Linux ext2fs has been stable for a long time, now it's time to break it
789         -- Linuxkongreß '95 in Berlin
790 \end{Console}
791 %$
792 e ripetendo varie volte il comando otterremo, in ordine casuale, le dieci
793 frasi tenute in memoria dal server.
794
795 Infine per chiudere il server basterà inviargli un segnale di terminazione (ad
796 esempio con \cmd{killall fortuned}) e potremo verificare che il gestore del
797 segnale ha anche correttamente cancellato la \textit{fifo} di ascolto da
798 \file{/tmp}.
799
800 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
801 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
802   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
803   per il server sapere se un client è andato in crash, con la possibilità di
804   far restare le \textit{fifo} temporanee sul filesystem, di come sia
805   necessario intercettare \signal{SIGPIPE} dato che un client può terminare
806   dopo aver fatto una richiesta, ma prima che la risposta sia inviata (cosa
807   che nel nostro esempio non è stata fatta).}; in generale infatti
808 l'interfaccia delle \textit{fifo} non è adatta a risolvere questo tipo di
809 problemi, che possono essere affrontati in maniera più semplice ed efficace o
810 usando i socket (che tratteremo in dettaglio a partire da
811 cap.~\ref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione
812 diversi, come quelli che esamineremo in seguito.
813
814
815
816 \subsection{La funzione \func{socketpair}}
817 \label{sec:ipc_socketpair}
818
819 Un meccanismo di comunicazione molto simile alle \textit{pipe}, ma che non
820 presenta il problema della unidirezionalità del flusso dei dati, è quello dei
821 cosiddetti \textsl{socket locali} (o \textit{Unix domain socket}).  Tratteremo
822 in generale i socket in cap.~\ref{cha:socket_intro}, nell'ambito
823 dell'interfaccia che essi forniscono per la programmazione di rete, e vedremo
824 anche (in~sez.~\ref{sec:sock_sa_local}) come si possono utilizzare i file
825 speciali di tipo socket, analoghi a quelli associati alle \textit{fifo} (si
826 rammenti sez.~\ref{sec:file_file_types}) cui si accede però attraverso quella
827 medesima interfaccia; vale però la pena esaminare qui una modalità di uso dei
828 socket locali che li rende sostanzialmente identici ad una \textit{pipe}
829 bidirezionale.
830
831 La funzione di sistema \funcd{socketpair}, introdotta da BSD ma supportata in
832 genere da qualunque sistema che fornisca l'interfaccia dei socket ed inclusa
833 in POSIX.1-2001, consente infatti di creare una coppia di file descriptor
834 connessi fra loro (tramite un socket, appunto) senza dover ricorrere ad un
835 file speciale sul filesystem. I descrittori sono del tutto analoghi a quelli
836 che si avrebbero con una chiamata a \func{pipe}, con la sola differenza è che
837 in questo caso il flusso dei dati può essere effettuato in entrambe le
838 direzioni. Il prototipo della funzione è:
839
840 \begin{funcproto}{
841 \fhead{sys/types.h} 
842 \fhead{sys/socket.h}
843 \fdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
844 \fdesc{Crea una coppia di socket connessi fra loro.} 
845 }
846
847 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
848   caso \var{errno} assumerà uno dei valori: 
849   \begin{errlist}
850   \item[\errcode{EAFNOSUPPORT}] i socket locali non sono supportati.
851   \item[\errcode{EOPNOTSUPP}] il protocollo specificato non supporta la
852   creazione di coppie di socket.
853   \item[\errcode{EPROTONOSUPPORT}] il protocollo specificato non è supportato.
854   \end{errlist}
855   ed inoltre \errval{EFAULT}, \errval{EMFILE} e \errval{ENFILE} nel loro
856   significato generico.}
857 \end{funcproto}
858
859 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
860 loro: quello che si scrive su uno di essi sarà ripresentato in input
861 sull'altro e viceversa. Gli argomenti \param{domain}, \param{type} e
862 \param{protocol} derivano dall'interfaccia dei socket (vedi
863 sez.~\ref{sec:sock_creation}) che è quella che fornisce il substrato per
864 connettere i due descrittori, ma in questo caso i soli valori validi che
865 possono essere specificati sono rispettivamente \const{AF\_UNIX},
866 \const{SOCK\_STREAM} e \val{0}.  
867
868 A partire dal kernel 2.6.27 la funzione supporta nell'indicazione del tipo di
869 socket anche i due flag \const{SOCK\_NONBLOCK} e \const{SOCK\_CLOEXEC}
870 (trattati in sez.~\ref{sec:sock_type}), con effetto identico agli analoghi
871 \const{O\_CLOEXEC} e \const{O\_NONBLOCK} di una \func{open} (vedi
872 tab.~\ref{tab:open_operation_flag}).
873
874 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
875 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei socket
876 locali in generale) permette di trasmettere attraverso le linea non solo dei
877 dati, ma anche dei file descriptor: si può cioè passare da un processo ad un
878 altro un file descriptor, con una sorta di duplicazione dello stesso non
879 all'interno di uno stesso processo, ma fra processi distinti (torneremo su
880 questa funzionalità in sez.~\ref{sec:sock_fd_passing}).
881
882
883 \section{L'intercomunicazione fra processi di System V}
884 \label{sec:ipc_sysv}
885
886 Benché le \textit{pipe} e le \textit{fifo} siano ancora ampiamente usate, esse
887 scontano il limite fondamentale che il meccanismo di comunicazione che
888 forniscono è rigidamente sequenziale: una situazione in cui un processo scrive
889 qualcosa che molti altri devono poter leggere non può essere implementata con
890 una \textit{pipe}.
891
892 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
893 oggetti per la comunicazione fra processi ed una nuova interfaccia di
894 programmazione, poi inclusa anche in POSIX.1-2001, che fossero in grado di
895 garantire una maggiore flessibilità.  In questa sezione esamineremo come Linux
896 supporta quello che viene chiamato il \textsl{Sistema di comunicazione fra
897   processi} di System V, cui da qui in avanti faremo riferimento come
898 \textit{SysV-IPC} (dove IPC è la sigla di \textit{Inter-Process
899   Comunication}).
900
901
902
903 \subsection{Considerazioni generali}
904 \label{sec:ipc_sysv_generic}
905
906 La principale caratteristica del \textit{SysV-IPC} è quella di essere basato
907 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
908 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
909 non vengono cancellati dal sistema una volta che non sono più in uso.  Questo
910 comporta due problemi: il primo è che, al contrario di quanto avviene per
911 \textit{pipe} e \textit{fifo}, la memoria allocata per questi oggetti non
912 viene rilasciata automaticamente quando non c'è più nessuno che li utilizzi ed
913 essi devono essere cancellati esplicitamente, se non si vuole che restino
914 attivi fino al riavvio del sistema. Il secondo problema è, dato che non c'è
915 come per i file un contatore del numero di riferimenti che ne indichi l'essere
916 in uso, che essi possono essere cancellati anche se ci sono dei processi che
917 li stanno utilizzando, con tutte le conseguenze (ovviamente assai sgradevoli)
918 del caso.
919
920 Un'ulteriore caratteristica negativa è che gli oggetti usati nel
921 \textit{SysV-IPC} vengono creati direttamente dal kernel, e sono accessibili
922 solo specificando il relativo \textsl{identificatore}. Questo è un numero
923 progressivo (un po' come il \ids{PID} dei processi) che il kernel assegna a
924 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
925 torneremo in sez.~\ref{sec:ipc_sysv_id_use}). L'identificatore viene
926 restituito dalle funzioni che creano l'oggetto, ed è quindi locale al processo
927 che le ha eseguite. Dato che l'identificatore viene assegnato dinamicamente
928 dal kernel non è possibile prevedere quale sarà, né utilizzare un qualche
929 valore statico, si pone perciò il problema di come processi diversi possono
930 accedere allo stesso oggetto.
931
932 Per risolvere il problema nella struttura \struct{ipc\_perm} che il kernel
933 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
934 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
935 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
936 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
937   si sposta il problema dell'accesso dalla classificazione in base
938   all'identificatore alla classificazione in base alla chiave, una delle tante
939   complicazioni inutili presenti nel \textit{SysV-IPC}.} Oltre la chiave, la
940 struttura, la cui definizione è riportata in fig.~\ref{fig:ipc_ipc_perm},
941 mantiene varie proprietà ed informazioni associate all'oggetto.
942
943 \begin{figure}[!htb]
944   \footnotesize \centering
945   \begin{minipage}[c]{0.80\textwidth}
946     \includestruct{listati/ipc_perm.h}
947   \end{minipage} 
948   \normalsize 
949   \caption{La struttura \structd{ipc\_perm}, come definita in
950     \headfile{sys/ipc.h}.}
951   \label{fig:ipc_ipc_perm}
952 \end{figure}
953
954 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
955 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
956 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
957 sono \textsl{imparentati} la soluzione è relativamente semplice, in tal caso
958 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
959 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
960 disponibile in tutti i figli, e potrà essere passato come argomento attraverso
961 una \func{exec}.
962
963 Però quando i processi non sono \textsl{imparentati} (come capita tutte le
964 volte che si ha a che fare con un sistema client-server) tutto questo non è
965 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
966 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
967 alternativa più efficace è quella che i programmi usino un valore comune per
968 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
969 sempre il rischio che questa chiave possa essere stata già utilizzata da
970 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
971 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione
972 apposita, \funcd{ftok}, che permette di ottenere una chiave specificando il
973 nome di un file ed un numero di versione; il suo prototipo è:
974
975 \begin{funcproto}{
976 \fhead{sys/types.h} 
977 \fhead{sys/ipc.h} 
978 \fdecl{key\_t ftok(const char *pathname, int proj\_id)}
979 \fdesc{Restituisce una chiave per identificare un oggetto del \textit{SysV
980     IPC}.}}
981
982 {La funzione ritorna la chiave in caso di successo e $-1$ per un errore, nel
983   qual caso \var{errno} assumerà uno dei possibili codici di errore di
984   \func{stat}.}
985 \end{funcproto}
986
987 La funzione determina un valore della chiave sulla base di \param{pathname},
988 che deve specificare il \textit{pathname} di un file effettivamente esistente
989 e di un numero di progetto \param{proj\_id)}, che di norma viene specificato
990 come carattere, dato che ne vengono utilizzati solo gli 8 bit meno
991 significativi. Nelle \acr{libc4} e \acr{libc5}, come avviene in SunOS,
992 l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, la \acr{glibc} usa
993 il prototipo specificato da XPG4, ma vengono lo stesso utilizzati gli 8 bit
994 meno significativi.
995
996 Il problema è che anche così non c'è la sicurezza che il valore della chiave
997 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
998 con i 16 bit meno significativi \itindex{inode} dell'inode del file
999 \param{pathname} (che vengono ottenuti attraverso \func{stat}, da cui derivano
1000 i possibili errori), e gli 8 bit meno significativi del numero del dispositivo
1001 su cui è il file.  Diventa perciò relativamente facile ottenere delle
1002 collisioni, specie se i file sono su dispositivi con lo stesso \textit{minor
1003   number}, come \file{/dev/hda1} e \file{/dev/sda1}.
1004
1005 In genere quello che si fa è utilizzare un file comune usato dai programmi che
1006 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
1007 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
1008 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
1009 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
1010 bene in fase di creazione, le cose possono complicarsi per i programmi che
1011 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
1012 attributi di \struct{ipc\_perm}, non esiste una modalità semplice per essere
1013 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
1014 creato da chi ci si aspetta.
1015
1016 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
1017 contatore di riferimenti per la cancellazione automatica, il principale
1018 problema del \textit{SysV-IPC}. Non esiste infatti una modalità chiara per
1019 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
1020 file, e tutta l'interfaccia è inutilmente complessa.  Per questo se ne
1021 sconsiglia assolutamente l'uso nei nuovi programmi, considerato che è ormai
1022 disponibile una revisione completa dei meccanismi di IPC fatta secondo quanto
1023 indicato dallo standard POSIX.1b, che presenta una realizzazione più sicura ed
1024 una interfaccia più semplice, che tratteremo in sez.~\ref{sec:ipc_posix}.
1025
1026
1027 \subsection{Il controllo di accesso}
1028 \label{sec:ipc_sysv_access_control}
1029
1030 Oltre alle chiavi, abbiamo visto in fig.~\ref{fig:ipc_ipc_perm} che ad ogni
1031 oggetto sono associate in \struct{ipc\_perm} ulteriori informazioni, come gli
1032 identificatori del creatore (nei campi \var{cuid} e \var{cgid}) e del
1033 proprietario (nei campi \var{uid} e \var{gid}) dello stesso, e un insieme di
1034 permessi (nel campo \var{mode}). In questo modo è possibile definire un
1035 controllo di accesso sugli oggetti di IPC, simile a quello che si ha per i
1036 file (vedi sez.~\ref{sec:file_perm_overview}).
1037
1038 Benché questo controllo di accesso sia molto simile a quello dei file, restano
1039 delle importanti differenze. La prima è che il permesso di esecuzione non
1040 esiste (e se specificato viene ignorato), per cui si può parlare solo di
1041 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
1042 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
1043 ed hanno lo stesso significato di quelli riportati in
1044 tab.~\ref{tab:file_mode_flags} e come per i file definiscono gli accessi per
1045 il proprietario, il suo gruppo e tutti gli altri. 
1046
1047 Se però si vogliono usare le costanti simboliche di
1048 tab.~\ref{tab:file_mode_flags} occorrerà includere anche il file
1049 \headfile{sys/stat.h}; alcuni sistemi definiscono le costanti \const{MSG\_R}
1050 (il valore ottale \texttt{0400}) e \const{MSG\_W} (il valore ottale
1051 \texttt{0200}) per indicare i permessi base di lettura e scrittura per il
1052 proprietario, da utilizzare, con gli opportuni shift, pure per il gruppo e gli
1053 altri. In Linux, visto la loro scarsa utilità, queste costanti non sono
1054 definite.
1055
1056 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
1057 \struct{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono impostati
1058 rispettivamente al valore dell'\ids{UID} e del \ids{GID} effettivo del processo
1059 che ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
1060 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
1061
1062 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
1063 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
1064 specificano tutte un argomento \param{flag}, in tal caso quando viene
1065 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
1066 permessi, questi vengono controllati e l'identificatore viene restituito solo
1067 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
1068 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
1069 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
1070 nullo, nel qual caso l'identificatore sarà restituito comunque.
1071
1072 Il secondo livello di controllo è quello delle varie funzioni che accedono
1073 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
1074 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
1075 \begin{itemize*}
1076 \item se il processo ha i privilegi di amministratore (più precisamente la
1077   capacità \const{CAP\_IPC\_OWNER}) l'accesso è sempre consentito.
1078 \item se l'\ids{UID} effettivo del processo corrisponde o al valore del campo
1079   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
1080   in \var{mode} è appropriato\footnote{per appropriato si intende che è
1081     impostato il permesso di scrittura per le operazioni di scrittura e quello
1082     di lettura per le operazioni di lettura.} l'accesso è consentito.
1083 \item se il \ids{GID} effettivo del processo corrisponde o al
1084   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
1085   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
1086 \item se il permesso per gli altri è appropriato l'accesso è consentito.
1087 \end{itemize*}
1088 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
1089 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
1090 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
1091 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
1092 il valore di \itindex{umask} \textit{umask} (si ricordi quanto esposto in
1093 sez.~\ref{sec:file_perm_management}) non ha alcun significato.
1094
1095
1096 \subsection{Gli identificatori ed il loro utilizzo}
1097 \label{sec:ipc_sysv_id_use}
1098
1099 L'unico campo di \struct{ipc\_perm} del quale non abbiamo ancora parlato è
1100 \var{seq}, che in fig.~\ref{fig:ipc_ipc_perm} è qualificato con un criptico
1101 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
1102 strettamente attinente alle modalità con cui il kernel assegna gli
1103 identificatori degli oggetti del sistema di IPC.
1104
1105 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
1106 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
1107 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
1108 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
1109 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
1110 dimensioni (inferiori al numero massimo di oggetti disponibili).
1111
1112 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1113 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1114 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1115 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1116 relativo identificatore viene immediatamente assegnato a quelle di un altro
1117 server partito subito dopo, con la possibilità che i client del primo non
1118 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1119 con gli oggetti del secondo, con conseguenze imprevedibili.
1120
1121 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1122 \var{seq} per provvedere un meccanismo che porti gli identificatori ad
1123 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1124 un identificatore può venire riutilizzato.
1125
1126 Il sistema dispone sempre di un numero fisso di oggetti di IPC, fino al kernel
1127 2.2.x questi erano definiti dalle costanti \const{MSGMNI}, \const{SEMMNI} e
1128 \const{SHMMNI}, e potevano essere cambiati (come tutti gli altri limiti
1129 relativi al \textit{SysV-IPC}) solo con una ricompilazione del kernel.  A
1130 partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1131 scrivendo sui file \sysctlrelfile{kernel}{shmmni},
1132 \sysctlrelfile{kernel}{msgmni} e \sysctlrelfile{kernel}{sem} di
1133 \file{/proc/sys/kernel} o con l'uso di \func{sysctl}.
1134
1135 \begin{figure}[!htb]
1136   \footnotesize \centering
1137   \begin{minipage}[c]{\codesamplewidth}
1138     \includecodesample{listati/IPCTestId.c}
1139   \end{minipage} 
1140   \normalsize 
1141   \caption{Sezione principale del programma di test per l'assegnazione degli
1142     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1143   \label{fig:ipc_sysv_idtest}
1144 \end{figure}
1145
1146 Per ciascun tipo di oggetto di IPC viene mantenuto in \var{seq} un numero di
1147 sequenza progressivo che viene incrementato di uno ogni volta che l'oggetto
1148 viene cancellato. Quando l'oggetto viene creato usando uno spazio che era già
1149 stato utilizzato in precedenza, per restituire il nuovo identificatore al
1150 numero di oggetti presenti viene sommato il valore corrente del campo
1151 \var{seq}, moltiplicato per il numero massimo di oggetti di quel tipo.
1152
1153 Questo in realtà è quanto avveniva fino ai kernel della serie 2.2, dalla serie
1154 2.4 viene usato lo stesso fattore di moltiplicazione per qualunque tipo di
1155 oggetto, utilizzando il valore dalla costante \const{IPCMNI} (definita in
1156 \file{include/linux/ipc.h}), che indica il limite massimo complessivo per il
1157 numero di tutti gli oggetti presenti nel \textit{SysV-IPC}, ed il cui default
1158 è 32768.  Si evita così il riutilizzo degli stessi numeri, e si fa sì che
1159 l'identificatore assuma tutti i valori possibili.
1160
1161 In fig.~\ref{fig:ipc_sysv_idtest} è riportato il codice di un semplice
1162 programma di test che si limita a creare un oggetto di IPC (specificato con
1163 una opzione a riga di comando), stamparne il numero di identificatore, e
1164 cancellarlo, il tutto un numero di volte specificato tramite una seconda
1165 opzione.  La figura non riporta il codice di selezione delle opzioni, che
1166 permette di inizializzare i valori delle variabili \var{type} al tipo di
1167 oggetto voluto, e \var{n} al numero di volte che si vuole effettuare il ciclo
1168 di creazione, stampa, cancellazione.
1169
1170 I valori di default sono per l'uso delle code di messaggi e per 5 ripetizioni
1171 del ciclo. Per questo motivo se non si utilizzano opzioni verrà eseguito per
1172 cinque volte il ciclo (\texttt{\small 7-11}), in cui si crea una coda di
1173 messaggi (\texttt{\small 8}), se ne stampa l'identificativo (\texttt{\small
1174   9}) e la si rimuove (\texttt{\small 10}). Non stiamo ad approfondire adesso
1175 il significato delle funzioni utilizzate, che verranno esaminate nelle
1176 prossime sezioni.
1177
1178 Quello che ci interessa infatti è verificare l'allocazione degli
1179 identificativi associati agli oggetti; lanciando il comando si otterrà
1180 pertanto qualcosa del tipo:
1181 \begin{Console}
1182 piccardi@gont sources]$ \textbf{./ipctestid}
1183 Identifier Value 0 
1184 Identifier Value 32768 
1185 Identifier Value 65536 
1186 Identifier Value 98304 
1187 Identifier Value 131072
1188 \end{Console}
1189 %$
1190 il che ci mostra che stiamo lavorando con un kernel posteriore alla serie 2.2
1191 nel quale non avevamo ancora usato nessuna coda di messaggi (il valore nullo
1192 del primo identificativo indica che il campo \var{seq} era zero). Ripetendo il
1193 comando, e quindi eseguendolo in un processo diverso, in cui non può esistere
1194 nessuna traccia di quanto avvenuto in precedenza, otterremo come nuovo
1195 risultato:
1196 \begin{Console}
1197 [piccardi@gont sources]$ \textbf{./ipctestid}
1198 Identifier Value 163840
1199 Identifier Value 196608 
1200 Identifier Value 229376 
1201 Identifier Value 262144 
1202 Identifier Value 294912 
1203 \end{Console}
1204 %$
1205 in cui la sequenza numerica prosegue, cosa che ci mostra come il valore di
1206 \var{seq} continui ad essere incrementato e costituisca in effetti una
1207 quantità mantenuta all'interno del sistema ed indipendente dai processi.
1208
1209
1210 \subsection{Code di messaggi}
1211 \label{sec:ipc_sysv_mq}
1212
1213 Il primo oggetto introdotto dal \textit{SysV-IPC} è quello delle code di
1214 messaggi.  Le code di messaggi sono oggetti analoghi alle \textit{pipe} o alle
1215 \textit{fifo} ed il loro scopo principale è quello di fornire a processi
1216 diversi un meccanismo con cui scambiarsi dei dati in forma di messaggio. Dato
1217 che le \textit{pipe} e le \textit{fifo} costituiscono una ottima alternativa,
1218 ed in genere sono molto più semplici da usare, le code di messaggi sono il
1219 meno utilizzato degli oggetti introdotti dal \textit{SysV-IPC}.
1220
1221 La funzione di sistema che permette di ottenere l'identificativo di una coda
1222 di messaggi esistente per potervi accedere, oppure di creare una nuova coda
1223 qualora quella indicata non esista ancora, è \funcd{msgget}, e il suo
1224 prototipo è:
1225
1226 \begin{funcproto}{
1227 \fhead{sys/types.h}
1228 \fhead{sys/ipc.h} 
1229 \fhead{sys/msg.h} 
1230 \fdecl{int msgget(key\_t key, int flag)}
1231 \fdesc{Ottiene o crea una coda di messaggi.} 
1232 }
1233
1234 {La funzione ritorna l'identificatore (un intero positivo) in caso di successo
1235   e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
1236   \begin{errlist}
1237   \item[\errcode{EACCES}] il processo chiamante non ha i privilegi per
1238     accedere alla coda richiesta.
1239   \item[\errcode{EEXIST}] si è richiesta la creazione di una coda che già
1240     esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}.
1241   \item[\errcode{EIDRM}] la coda richiesta è marcata per essere cancellata
1242     (solo fino al kernel 2.3.20).
1243   \item[\errcode{ENOENT}] si è cercato di ottenere l'identificatore di una coda
1244     di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1245     non era specificato.
1246   \item[\errcode{ENOSPC}] si è cercato di creare una coda di messaggi quando è
1247     stato superato il limite massimo di code (\const{MSGMNI}).
1248  \end{errlist}
1249  ed inoltre \errval{ENOMEM} nel suo significato generico.}
1250 \end{funcproto}
1251
1252 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1253 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1254 nuova. L'argomento \param{key} specifica la chiave che è associata
1255 all'oggetto, eccetto il caso in cui si specifichi il valore
1256 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1257 associata alcuna chiave (per questo viene detta \textsl{privata}), ed il
1258 processo e i suoi eventuali figli potranno farvi riferimento solo attraverso
1259 l'identificatore.
1260
1261 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE} (in Linux
1262 questo significa un valore diverso da zero) l'effetto della funzione dipende
1263 dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1264 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1265 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1266 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1267 validi.
1268
1269 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1270 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1271 corrispondente al valore \const{IPC\_CREAT}. In questo caso i nove bit meno
1272 significativi di \param{flag} saranno usati come permessi per il nuovo
1273 oggetto, secondo quanto illustrato in sez.~\ref{sec:ipc_sysv_access_control}.
1274 Se si imposta anche il bit corrispondente a \const{IPC\_EXCL} la funzione avrà
1275 successo solo se l'oggetto non esiste già, fallendo con un errore di
1276 \errcode{EEXIST} altrimenti.
1277
1278 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1279 processi di accedere alla coda, se hanno privilegi sufficienti, una volta che
1280 questi possano indovinare o ricavare, ad esempio per tentativi,
1281 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1282 IPC infatti non esiste alcun modo in cui si possa garantire l'accesso
1283 esclusivo ad una coda di messaggi.  Usare \const{IPC\_PRIVATE} o
1284 \const{IPC\_CREAT} e \const{IPC\_EXCL} per \param{flag} comporta solo la
1285 creazione di una nuova coda.
1286
1287 \begin{table}[htb]
1288   \footnotesize
1289   \centering
1290   \begin{tabular}[c]{|c|r|l|l|}
1291     \hline
1292     \textbf{Costante} & \textbf{Valore} & \textbf{File in \file{/proc}}
1293     & \textbf{Significato} \\
1294     \hline
1295     \hline
1296     \const{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1297                                           messaggi.\\
1298     \const{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1299                                           messaggio.\\
1300     \const{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di 
1301                                           una coda.\\
1302     \hline
1303   \end{tabular}
1304   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1305   \label{tab:ipc_msg_limits}
1306 \end{table}
1307
1308 Le code di messaggi sono caratterizzate da tre limiti fondamentali, un tempo
1309 definiti staticamente e corrispondenti alle prime tre costanti riportate in
1310 tab.~\ref{tab:ipc_msg_limits}.  Come accennato però con tutte le versioni più
1311 recenti del kernel con Linux è possibile modificare questi limiti attraverso
1312 l'uso di \func{sysctl} o scrivendo nei file \sysctlrelfile{kernel}{msgmax},
1313 \sysctlrelfile{kernel}{msgmnb} e \sysctlrelfile{kernel}{msgmni} di
1314 \file{/proc/sys/kernel/}.
1315
1316 \itindbeg{linked~list}
1317
1318 Una coda di messaggi è costituita da una \textit{linked list}.\footnote{una
1319   \itindex{linked~list} \textit{linked list} è una tipica struttura di dati,
1320   organizzati in una lista in cui ciascun elemento contiene un puntatore al
1321   successivo. In questo modo la struttura è veloce nell'estrazione ed
1322   immissione dei dati dalle estremità dalla lista (basta aggiungere un
1323   elemento in testa o in coda ed aggiornare un puntatore), e relativamente
1324   veloce da attraversare in ordine sequenziale (seguendo i puntatori), è
1325   invece relativamente lenta nell'accesso casuale e nella ricerca.}  I nuovi
1326 messaggi vengono inseriti in coda alla lista e vengono letti dalla cima, in
1327 fig.~\ref{fig:ipc_mq_schema} si è riportato uno schema semplificato con cui
1328 queste strutture vengono mantenute dal kernel. Lo schema illustrato in realtà
1329 è una semplificazione di quello usato fino ai kernel della serie 2.2. A
1330 partire della serie 2.4 la gestione delle code di messaggi è effettuata in
1331 maniera diversa (e non esiste una struttura \struct{msqid\_ds} nel kernel), ma
1332 abbiamo mantenuto lo schema precedente dato che illustra in maniera più che
1333 adeguata i principi di funzionamento delle code di messaggi.
1334
1335 \itindend{linked~list}
1336
1337 \begin{figure}[!htb]
1338   \centering \includegraphics[width=13cm]{img/mqstruct}
1339   \caption{Schema della struttura di una coda messaggi.}
1340   \label{fig:ipc_mq_schema}
1341 \end{figure}
1342
1343
1344 A ciascuna coda è associata una struttura \struct{msqid\_ds} la cui
1345 definizione è riportata in fig.~\ref{fig:ipc_msqid_ds} ed a cui si accede
1346 includendo  \headfile{sys/msg.h};
1347 %
1348 % INFO: sotto materiale obsoleto e non interessante
1349 % In questa struttura il
1350 % kernel mantiene le principali informazioni riguardo lo stato corrente della
1351 % coda. Come accennato questo vale fino ai kernel della serie 2.2, essa viene
1352 % usata nei kernel della serie 2.4 solo per compatibilità in quanto è quella
1353 % restituita dalle funzioni dell'interfaccia; si noti come ci sia una differenza
1354 % con i campi mostrati nello schema di fig.~\ref{fig:ipc_mq_schema} che sono
1355 % presi dalla definizione di \file{include/linux/msg.h}, e fanno riferimento
1356 % alla definizione della omonima struttura usata nel kernel. 
1357 %In fig.~\ref{fig:ipc_msqid_ds} sono elencati i campi definiti in
1358 %\headfile{sys/msg.h};  
1359 si tenga presente che il campo \var{\_\_msg\_cbytes} non è previsto dallo
1360 standard POSIX.1-2001 e che alcuni campi fino al kernel 2.2 erano definiti
1361 come \ctyp{short}.
1362
1363 \begin{figure}[!htb]
1364   \footnotesize \centering
1365   \begin{minipage}[c]{.90\textwidth}
1366     \includestruct{listati/msqid_ds.h}
1367   \end{minipage} 
1368   \normalsize 
1369   \caption{La struttura \structd{msqid\_ds}, associata a ciascuna coda di
1370     messaggi.}
1371   \label{fig:ipc_msqid_ds}
1372 \end{figure}
1373
1374 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1375 inizializzata,\footnote{in realtà viene inizializzata una struttura interna al
1376   kernel, ma i dati citati sono gli stessi.} in particolare il campo
1377 \var{msg\_perm} che esprime i permessi di accesso viene inizializzato nella
1378 modalità illustrata in sez.~\ref{sec:ipc_sysv_access_control}. Per quanto
1379 riguarda gli altri campi invece:
1380 \begin{itemize*}
1381 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1382   sulla coda, viene inizializzato a 0.
1383 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1384   rispettivamente il \ids{PID} dell'ultimo processo che ha inviato o ricevuto
1385   un messaggio sulla coda, sono inizializzati a 0.
1386 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1387   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1388   messaggio sulla coda, sono inizializzati a 0.
1389 \item il campo \var{msg\_ctime}, che esprime il tempo di ultima modifica della
1390   coda, viene inizializzato al tempo corrente.
1391 \item il campo \var{msg\_qbytes}, che esprime la dimensione massima del
1392   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1393   del sistema (\const{MSGMNB}).
1394 \item il campo \var{\_\_msg\_cbytes}, che esprime la dimensione in byte dei
1395   messaggi presenti sulla coda, viene inizializzato a zero.
1396 % i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1397 %   primo e ultimo messaggio sono inizializzati a \val{NULL} e
1398 %   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1399 %   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1400 %   e non devono essere utilizzati da programmi in user space).
1401 \end{itemize*}
1402
1403 Una volta creata una coda di messaggi le operazioni di controllo vengono
1404 effettuate con la funzione di sistema \funcd{msgctl}, che, come le analoghe
1405 \func{semctl} e \func{shmctl}, fa le veci di quello che \func{ioctl} è per i
1406 file; il suo prototipo è:
1407
1408 \begin{funcproto}{
1409 \fhead{sys/types.h}
1410 \fhead{sys/ipc.h}
1411 \fhead{sys/msg.h}
1412 \fdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1413 \fdesc{Esegue una operazione su una coda.} 
1414 }
1415
1416 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1417   caso \var{errno} assumerà uno dei valori: 
1418   \begin{errlist}
1419   \item[\errcode{EACCES}] si è richiesto \const{IPC\_STAT} ma processo
1420     chiamante non ha i privilegi di lettura sulla coda.
1421   \item[\errcode{EIDRM}] la coda richiesta è stata cancellata.
1422   \item[\errcode{EPERM}] si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1423     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1424     \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1425     amministratore.
1426   \end{errlist}
1427   ed inoltre \errval{EFAULT} ed \errval{EINVAL} nel loro significato
1428   generico.}
1429 \end{funcproto}
1430
1431 La funzione permette di eseguire una operazione di controllo per la coda
1432 specificata dall'identificatore \param{msqid}, utilizzando i valori della
1433 struttura \struct{msqid\_ds}, mantenuta all'indirizzo \param{buf}. Il
1434 comportamento della funzione dipende dal valore dell'argomento \param{cmd},
1435 che specifica il tipo di azione da eseguire. I valori possibili
1436 per \param{cmd} sono:
1437 \begin{basedescript}{\desclabelwidth{1.6cm}\desclabelstyle{\nextlinelabel}}
1438 \item[\const{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1439   struttura \struct{msqid\_ds} indicata da \param{buf}. Occorre avere il
1440   permesso di lettura sulla coda.
1441 \item[\const{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1442   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1443   riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1444   funzioni di lettura o di scrittura sulla coda saranno svegliati ricevendo
1445   il medesimo errore. Questo comando può essere eseguito solo da un processo
1446   con \ids{UID} effettivo corrispondente al creatore o al proprietario della
1447   coda, o all'amministratore.
1448 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1449   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1450   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1451   struttura \struct{msqid\_ds} puntata da \param{buf}.  Per modificare i
1452   valori di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid}
1453   occorre essere il proprietario o il creatore della coda, oppure
1454   l'amministratore e lo stesso vale per \var{msg\_qbytes}. Infine solo
1455   l'amministratore (più precisamente un processo con la capacità
1456   \const{CAP\_IPC\_RESOURCE}) ha la facoltà di incrementarne il valore a
1457   limiti superiori a \const{MSGMNB}. Se eseguita con successo la funzione
1458   aggiorna anche il campo \var{msg\_ctime}.
1459 \end{basedescript}
1460
1461 A questi tre valori, che sono quelli previsti dallo standard, su Linux se ne
1462 affiancano altri tre (\const{IPC\_INFO}, \const{MSG\_STAT} e
1463 \const{MSG\_INFO}) introdotti ad uso del programma \cmd{ipcs} per ottenere le
1464 informazioni generali relative alle risorse usate dalle code di
1465 messaggi. Questi potranno essere modificati o rimossi in favore dell'uso di
1466 \texttt{/proc}, per cui non devono essere usati e non li tratteremo.
1467
1468 Una volta che si abbia a disposizione l'identificatore, per inviare un
1469 messaggio su una coda si utilizza la funzione di sistema \funcd{msgsnd}, il
1470 cui prototipo è:
1471
1472 \begin{funcproto}{
1473 \fhead{sys/types.h}
1474 \fhead{sys/ipc.h}
1475 \fhead{sys/msg.h}
1476 \fdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int msgflg)}
1477 \fdesc{Invia un messaggio su una coda.}
1478 }
1479
1480 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1481   caso \var{errno} assumerà uno dei valori: 
1482   \begin{errlist}
1483   \item[\errcode{EACCES}] non si hanno i privilegi di accesso sulla coda.
1484   \item[\errcode{EAGAIN}] il messaggio non può essere inviato perché si è
1485     superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1486     sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1487   \item[\errcode{EIDRM}] la coda è stata cancellata.
1488   \item[\errcode{EINVAL}] si è specificato un \param{msgid} invalido, o un
1489     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1490     maggiore di \const{MSGMAX}.
1491   \end{errlist}
1492   ed inoltre \errval{EFAULT}, \errval{EINTR} e \errval{ENOMEM} nel loro
1493   significato generico.}
1494 \end{funcproto}
1495
1496 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1497 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1498 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1499 puntatore ad una struttura \struct{msgbuf} analoga a quella riportata in
1500 fig.~\ref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1501 messaggio.  La dimensione massima per il testo di un messaggio non può
1502 comunque superare il limite \const{MSGMAX}.
1503
1504 \begin{figure}[!htb]
1505   \footnotesize \centering
1506   \begin{minipage}[c]{0.8\textwidth}
1507     \includestruct{listati/msgbuf.h}
1508   \end{minipage} 
1509   \normalsize 
1510   \caption{Schema della struttura \structd{msgbuf}, da utilizzare come
1511     argomento per inviare/ricevere messaggi.}
1512   \label{fig:ipc_msbuf}
1513 \end{figure}
1514
1515 La struttura di fig.~\ref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1516 la definizione contenuta in \headfile{sys/msg.h} usa esplicitamente per il
1517 secondo campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini
1518 pratici.  La sola cosa che conta è che la struttura abbia come primo membro un
1519 campo \var{mtype} come nell'esempio; esso infatti serve ad identificare il
1520 tipo di messaggio e deve essere sempre specificato come intero positivo di
1521 tipo \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1522 dimensione, e serve a contenere il testo del messaggio.
1523
1524 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1525 ridefinire una struttura simile a quella di fig.~\ref{fig:ipc_msbuf}, adattando
1526 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1527 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1528 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1529 indica il tipo.
1530
1531 Si tenga presente che la lunghezza che deve essere indicata in questo
1532 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1533 cioè \var{message} è una propria struttura che si passa alla funzione,
1534 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1535 consideriamo il caso dell'esempio in fig.~\ref{fig:ipc_msbuf}, \param{msgsz}
1536 dovrà essere pari a \const{LENGTH}).
1537
1538 Per capire meglio il funzionamento della funzione riprendiamo in
1539 considerazione la struttura della coda illustrata in
1540 fig.~\ref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1541 sarà aggiunto in fondo alla lista inserendo una nuova struttura \struct{msg},
1542 il puntatore \var{msg\_last} di \struct{msqid\_ds} verrà aggiornato, come pure
1543 il puntatore al messaggio successivo per quello che era il precedente ultimo
1544 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1545 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1546 all'indirizzo specificato da \var{msg\_spot}.
1547
1548 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1549 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1550 ritorna immediatamente a meno che si sia ecceduto il valore di
1551 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1552 caso si blocca.  Se si specifica per \param{flag} il valore
1553 \const{IPC\_NOWAIT} la funzione opera in modalità non-bloccante, ed in questi
1554 casi ritorna immediatamente con un errore di \errcode{EAGAIN}.
1555
1556 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1557 che non si liberano risorse sufficienti per poter inserire nella coda il
1558 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare con
1559 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1560 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1561 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1562
1563 Una volta completato con successo l'invio del messaggio sulla coda, la
1564 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1565 vengono modificati:
1566 \begin{itemize*}
1567 \item Il valore di \var{msg\_lspid}, che viene impostato al \ids{PID} del
1568   processo chiamante.
1569 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1570 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1571 \end{itemize*}
1572
1573 La funzione di sistema che viene utilizzata per estrarre un messaggio da una
1574 coda è \funcd{msgrcv}, ed il suo prototipo è:
1575
1576 \begin{funcproto}{
1577 \fhead{sys/types.h}
1578 \fhead{sys/ipc.h} 
1579 \fhead{sys/msg.h}
1580 \fdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1581     long msgtyp, int msgflg)}
1582 \fdesc{Legge un messaggio da una coda.} 
1583 }
1584
1585 {La funzione ritorna il numero di byte letti in caso di successo e $-1$ per un
1586   errore, nel qual caso \var{errno} assumerà uno dei valori:
1587   \begin{errlist}
1588   \item[\errcode{E2BIG}] il testo del messaggio è più lungo di \param{msgsz} e
1589     non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1590   \item[\errcode{EACCES}] non si hanno i privilegi di accesso sulla coda.
1591   \item[\errcode{EIDRM}] la coda è stata cancellata.
1592   \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale mentre
1593     era in attesa di ricevere un messaggio.
1594   \item[\errcode{EINVAL}] si è specificato un \param{msgid} invalido o un
1595     valore di \param{msgsz} negativo.
1596   \end{errlist}
1597   ed inoltre \errval{EFAULT} nel suo significato generico.}
1598 \end{funcproto}
1599
1600 La funzione legge un messaggio dalla coda specificata da \param{msqid},
1601 scrivendolo sulla struttura puntata da \param{msgp}, che dovrà avere un
1602 formato analogo a quello di fig.~\ref{fig:ipc_msbuf}.  Una volta estratto, il
1603 messaggio sarà rimosso dalla coda.  L'argomento \param{msgsz} indica la
1604 lunghezza massima del testo del messaggio (equivalente al valore del parametro
1605 \const{LENGTH} nell'esempio di fig.~\ref{fig:ipc_msbuf}).
1606
1607 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1608 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1609 \const{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1610 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1611 un errore di \errcode{E2BIG}.
1612
1613 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1614 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1615 una scansione della struttura mostrata in fig.~\ref{fig:ipc_mq_schema},
1616 restituendo il primo messaggio incontrato che corrisponde ai criteri
1617 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1618 coda, è quello meno recente); in particolare:
1619 \begin{itemize*}
1620 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1621   quello fra i presenti che è stato inserito per primo. 
1622 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1623   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1624   \param{msgtyp}.
1625 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1626   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1627   inferiore al valore assoluto di \param{msgtyp}.
1628 \end{itemize*}
1629
1630 Il valore di \param{msgflg} permette di controllare il comportamento della
1631 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1632 valori.  Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1633 valori: \const{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1634 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1635 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1636 ci sono messaggi sulla coda.
1637
1638 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1639 disponibili per la lettura, è di bloccare il processo. Nel caso però si sia
1640 specificato \const{IPC\_NOWAIT} la funzione ritorna immediatamente con un
1641 errore \errcode{ENOMSG}. Altrimenti la funzione ritorna normalmente non appena
1642 viene inserito un messaggio del tipo desiderato, oppure ritorna con errore
1643 qualora la coda sia rimossa (con \var{errno} impostata a \errcode{EIDRM}) o se
1644 il processo viene interrotto da un segnale (con \var{errno} impostata a
1645 \errcode{EINTR}).
1646
1647 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1648 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1649 vengono modificati:
1650 \begin{itemize*}
1651 \item Il valore di \var{msg\_lrpid}, che viene impostato al \ids{PID} del
1652   processo chiamante.
1653 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1654 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1655 \end{itemize*}
1656
1657 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1658 \textit{SysV-IPC} che essendo questi permanenti restano nel sistema occupando
1659 risorse anche quando un processo è terminato, al contrario delle \textit{pipe}
1660 per le quali tutte le risorse occupate vengono rilasciate quanto l'ultimo
1661 processo che le utilizzava termina. Questo comporta che in caso di errori si
1662 può saturare il sistema, e che devono comunque essere esplicitamente previste
1663 delle funzioni di rimozione in caso di interruzioni o uscite dal programma
1664 (come vedremo in fig.~\ref{fig:ipc_mq_fortune_server}).
1665
1666 L'altro problema è che non facendo uso di file descriptor le tecniche di
1667 \textit{I/O multiplexing} descritte in sez.~\ref{sec:file_multiplexing} non
1668 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1669 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1670 una di queste strutture alla volta; ad esempio non si può scrivere un server
1671 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1672 di \itindex{polling} \textit{polling} che esegua un ciclo di attesa su
1673 ciascuna di esse.
1674
1675 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1676 server di \textit{fortunes} usando queste al posto delle \textit{fifo}. In
1677 questo caso useremo una sola coda di messaggi, usando il tipo di messaggio per
1678 comunicare in maniera indipendente con client diversi.
1679
1680 \begin{figure}[!htbp]
1681   \footnotesize \centering
1682   \begin{minipage}[c]{\codesamplewidth}
1683     \includecodesample{listati/MQFortuneServer.c}
1684   \end{minipage} 
1685   \normalsize 
1686   \caption{Sezione principale del codice del server di \textit{fortunes}
1687     basato sulle \textit{message queue}.}
1688   \label{fig:ipc_mq_fortune_server}
1689 \end{figure}
1690
1691 In fig.~\ref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1692 principali del codice del nuovo server (il codice completo è nel file
1693 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1694 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1695 per permettere una comunicazione indipendente fra il server ed i vari client,
1696 usando il \ids{PID} di questi ultimi come identificativo. Questo è possibile
1697 in quanto, al contrario di una \textit{fifo}, la lettura di una coda di
1698 messaggi può non essere sequenziale, proprio grazie alla classificazione dei
1699 messaggi sulla base del loro tipo.
1700
1701 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1702 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1703 definisce due strutture appositamente per la comunicazione; con
1704 \var{msgbuf\_read} vengono passate (\texttt{\small 8-11}) le richieste mentre
1705 con \var{msgbuf\_write} vengono restituite (\texttt{\small 12-15}) le frasi.
1706
1707 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1708 nella variabile \var{n} il numero di frasi da leggere specificato a linea di
1709 comando ed in \var{fortunefilename} il file da cui leggerle. Dopo aver
1710 installato (\texttt{\small 19-21}) i gestori dei segnali per trattare
1711 l'uscita dal server, viene prima controllato (\texttt{\small 22}) il numero di
1712 frasi richieste abbia senso (cioè sia maggiore di zero), le quali poi vengono
1713 lette (\texttt{\small 23}) nel vettore in memoria con la stessa funzione
1714 \code{FortuneParse} usata anche per il server basato sulle \textit{fifo}.
1715
1716 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1717 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1718 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1719 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1720 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1721 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1722 programma (\texttt{\small 27-29}) in caso di errore.
1723
1724 Finita la fase di inizializzazione il server prima (\texttt{\small 32}) chiama
1725 la funzione \func{daemon} per andare in background e poi esegue in permanenza
1726 il ciclo principale (\texttt{\small 33-40}). Questo inizia (\texttt{\small
1727   34}) con il porsi in attesa di un messaggio di richiesta da parte di un
1728 client. Si noti infatti come \func{msgrcv} richieda un messaggio con
1729 \var{mtype} uguale a 1, questo è il valore usato per le richieste dato che
1730 corrisponde al \ids{PID} di \cmd{init}, che non può essere un client. L'uso
1731 del flag \const{MSG\_NOERROR} è solo per sicurezza, dato che i messaggi di
1732 richiesta sono di dimensione fissa (e contengono solo il \ids{PID} del
1733 client).
1734
1735 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1736 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1737 di richiesta da parte di un client, in tal caso il ciclo prosegue
1738 (\texttt{\small 35}) selezionando una frase a caso, copiandola (\texttt{\small
1739   36}) nella struttura \var{msgbuf\_write} usata per la risposta e
1740 calcolandone (\texttt{\small 37}) la dimensione.
1741
1742 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1743 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 38})
1744 al valore del \ids{PID} del client ricevuto nel messaggio di richiesta.
1745 L'ultimo passo del ciclo (\texttt{\small 39}) è inviare sulla coda il
1746 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1747 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1748
1749 Si noti che il programma può terminare solo grazie ad una interruzione da
1750 parte di un segnale; in tal caso verrà eseguito (\texttt{\small 45-48}) il
1751 gestore \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1752 (\texttt{\small 46}) ed ad uscire (\texttt{\small 47}).
1753
1754 \begin{figure}[!htbp]
1755   \footnotesize \centering
1756   \begin{minipage}[c]{\codesamplewidth}
1757     \includecodesample{listati/MQFortuneClient.c}
1758   \end{minipage} 
1759   \normalsize 
1760   \caption{Sezione principale del codice del client di \textit{fortunes}
1761     basato sulle \textit{message queue}.}
1762   \label{fig:ipc_mq_fortune_client}
1763 \end{figure}
1764
1765 In fig.~\ref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice
1766 del programma client.  Al solito il codice completo è con i sorgenti allegati,
1767 nel file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti
1768 relative alla gestione delle opzioni, ed in questo caso, anche la
1769 dichiarazione delle variabili, che, per la parte relative alle strutture usate
1770 per la comunicazione tramite le code, sono le stesse viste in
1771 fig.~\ref{fig:ipc_mq_fortune_server}.
1772
1773 Il client in questo caso è molto semplice; la prima parte del programma
1774 (\texttt{\small 4-9}) si occupa di accedere alla coda di messaggi, ed è
1775 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1776 non viene chiamata con il flag di creazione in quanto la coda deve essere
1777 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1778 il programma termina immediatamente. 
1779
1780 Una volta acquisito l'identificatore della coda il client compone
1781 (\texttt{\small 12-13}) il messaggio di richiesta in \var{msg\_read}, usando
1782 1 per il tipo ed inserendo il proprio \ids{PID} come dato da passare al
1783 server.  Calcolata (\texttt{\small 14}) la dimensione, provvede
1784 (\texttt{\small 15}) ad immettere la richiesta sulla coda.
1785
1786 A questo punto non resta che rileggere la risposta (\texttt{\small 16}) dalla
1787 coda del server richiedendo a \func{msgrcv} di selezionare i messaggi di tipo
1788 corrispondente al valore del \ids{PID} inviato nella richiesta. L'ultimo passo
1789 (\texttt{\small 17}) prima di uscire è quello di stampare a video il messaggio
1790 ricevuto.
1791  
1792 Proviamo allora il nostro nuovo sistema, al solito occorre definire
1793 \code{LD\_LIBRARY\_PATH} per accedere alla libreria \file{libgapil.so}, dopo
1794 di che, in maniera del tutto analoga a quanto fatto con il programma che usa
1795 le \textit{fifo}, potremo far partire il server con:
1796 \begin{Console}
1797 [piccardi@gont sources]$ \textbf{./mqfortuned -n10}
1798 \end{Console}
1799 %$
1800 come nel caso precedente, avendo eseguito il server in background, il comando
1801 ritornerà immediatamente; potremo però verificare con \cmd{ps} che il
1802 programma è effettivamente in esecuzione, e che ha creato una coda di
1803 messaggi:
1804 \begin{Console}
1805 [piccardi@gont sources]$ \textbf{ipcs}
1806
1807 ------ Shared Memory Segments --------
1808 key        shmid      owner      perms      bytes      nattch     status      
1809
1810 ------ Semaphore Arrays --------
1811 key        semid      owner      perms      nsems     
1812
1813 ------ Message Queues --------
1814 key        msqid      owner      perms      used-bytes   messages    
1815 0x0102dc6a 0          piccardi   666        0            0           
1816 \end{Console}
1817 %$
1818 a questo punto potremo usare il client per ottenere le nostre frasi:
1819 \begin{Console}
1820 [piccardi@gont sources]$ \textbf{./mqfortune}
1821 Linux ext2fs has been stable for a long time, now it's time to break it
1822         -- Linuxkongreß '95 in Berlin
1823 [piccardi@gont sources]$ \textbf{./mqfortune}
1824 Let's call it an accidental feature.
1825         --Larry Wall
1826 \end{Console} 
1827 con un risultato del tutto equivalente al precedente. Infine potremo chiudere
1828 il server inviando il segnale di terminazione con il comando \code{killall
1829   mqfortuned}, verificando che effettivamente la coda di messaggi venga
1830 rimossa.
1831
1832 Benché funzionante questa architettura risente dello stesso inconveniente
1833 visto anche nel caso del precedente server basato sulle \textit{fifo}; se il
1834 client viene interrotto dopo l'invio del messaggio di richiesta e prima della
1835 lettura della risposta, quest'ultima resta nella coda (così come per le
1836 \textit{fifo} si aveva il problema delle \textit{fifo} che restavano nel
1837 filesystem). In questo caso però il problemi sono maggiori, sia perché è molto
1838 più facile esaurire la memoria dedicata ad una coda di messaggi che gli
1839 \itindex{inode} \textit{inode} di un filesystem, sia perché, con il riutilizzo
1840 dei \ids{PID} da parte dei processi, un client eseguito in un momento
1841 successivo potrebbe ricevere un messaggio non indirizzato a lui.
1842
1843
1844 \subsection{I semafori}
1845 \label{sec:ipc_sysv_sem}
1846
1847 I semafori non sono propriamente meccanismi di intercomunicazione come
1848 \textit{pipe}, \textit{fifo} e code di messaggi, poiché non consentono di
1849 scambiare dati fra processi, ma servono piuttosto come meccanismi di
1850 sincronizzazione o di protezione per le \textsl{sezioni critiche} del codice
1851 (si ricordi quanto detto in sez.~\ref{sec:proc_race_cond}).  Un semaforo
1852 infatti non è altro che un contatore mantenuto nel kernel che determina se
1853 consentire o meno la prosecuzione dell'esecuzione di un programma. In questo
1854 modo si può controllare l'accesso ad una risorsa condivisa da più processi,
1855 associandovi un semaforo che assicuri che non possa essere usata da più di un
1856 processo alla volta.
1857
1858 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1859 assolutamente generico, così come del tutto generali sono modalità con cui lo
1860 si utilizza. Un processo che deve accedere ad una risorsa condivisa eseguirà
1861 un controllo del semaforo: se questo è positivo il suo valore sarà
1862 decrementato, indicando che si è consumato una unità della risorsa, ed il
1863 processo potrà proseguire nell'utilizzo di quest'ultima, provvedendo a
1864 rilasciarla, una volta completate le operazioni volute, reincrementando il
1865 semaforo.
1866
1867 Se al momento del controllo il valore del semaforo è nullo la risorsa viene
1868 considerata non disponibile, ed il processo si bloccherà fin quando chi la sta
1869 utilizzando non la rilascerà, incrementando il valore del semaforo. Non appena
1870 il semaforo diventa positivo, indicando che la risorsa è tornata disponibile,
1871 il processo bloccato in attesa riprenderà l'esecuzione, e potrà operare come
1872 nel caso precedente (decremento del semaforo, accesso alla risorsa, incremento
1873 del semaforo).
1874
1875 Per poter implementare questo tipo di logica le operazioni di controllo e
1876 decremento del contatore associato al semaforo devono essere atomiche,
1877 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1878 demandata al kernel. La forma più semplice di semaforo è quella del
1879 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1880 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1881 della risorsa. In generale però si possono usare semafori con valori interi,
1882 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1883 ancora disponibili.
1884
1885 Il sistema di intercomunicazione di \textit{SysV-IPC} prevede anche una
1886 implementazione dei semafori, ma gli oggetti utilizzati sono tuttavia non
1887 semafori singoli, ma gruppi (più propriamente \textsl{insiemi}) di semafori
1888 detti ``\textit{semaphore set}''. La funzione di sistema che permette di
1889 creare o ottenere l'identificatore di un insieme di semafori è \funcd{semget},
1890 ed il suo prototipo è:
1891
1892 \begin{funcproto}{
1893 \fhead{sys/types.h}
1894 \fhead{sys/ipc.h}
1895 \fhead{sys/sem.h}
1896 \fdecl{int semget(key\_t key, int nsems, int flag)}
1897 \fdesc{Restituisce l'identificatore di un insieme di semafori.} 
1898 }
1899
1900 {La funzione ritorna l'identificatore (un intero positivo) in caso di successo
1901   e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
1902   \begin{errlist}
1903   \item[\errcode{ENOSPC}] si è superato il limite di sistema per il numero
1904     totale di semafori (\const{SEMMNS}) o di insiemi (\const{SEMMNI}).
1905   \item[\errcode{EINVAL}] \param{nsems} è minore di zero o maggiore del limite
1906     sul numero di semafori di un insieme (\const{SEMMSL}), o se l'insieme già
1907     esiste, maggiore del numero di semafori che contiene.
1908   \item[\errcode{ENOMEM}] il sistema non ha abbastanza memoria per poter
1909     contenere le strutture per un nuovo insieme di semafori.
1910   \end{errlist}
1911   ed inoltre \errval{EACCES}, \errval{EEXIST}, \errval{EIDRM} e
1912   \errval{ENOENT} con lo stesso significato che hanno per \func{msgget}.}
1913 \end{funcproto}
1914
1915 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1916 restituisce l'identificatore di un insieme di semafori, in particolare è
1917 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1918 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
1919 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1920 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1921 richiesta dell'identificatore di un insieme già esistente.
1922
1923 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1924 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1925 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1926 complicazione inutile dell'interfaccia, il problema è che i semafori forniti
1927 dal \textit{SysV-IPC} soffrono di altri due difetti progettuali molto più
1928 gravi.
1929
1930 Il primo difetto è che non esiste una funzione che permetta di creare ed
1931 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1932 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1933 perde così ogni possibilità di eseguire l'operazione atomicamente. Eventuali
1934 accessi che possono avvenire fra la creazione e l'inizializzazione potranno
1935 avere effetti imprevisti.
1936
1937 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1938 \textit{SysV-IPC} di essere risorse globali di sistema, che non vengono
1939 cancellate quando nessuno le usa più. In questo caso il problema è più grave
1940 perché ci si a trova a dover affrontare esplicitamente il caso in cui un
1941 processo termina per un qualche errore lasciando un semaforo occupato, che
1942 resterà tale fino al successivo riavvio del sistema. Come vedremo esistono
1943 delle modalità per evitare tutto ciò, ma diventa necessario indicare
1944 esplicitamente che si vuole il ripristino del semaforo all'uscita del
1945 processo, e la gestione diventa più complicata.
1946
1947 \begin{figure}[!htb]
1948   \footnotesize \centering
1949   \begin{minipage}[c]{.80\textwidth}
1950     \includestruct{listati/semid_ds.h}
1951   \end{minipage} 
1952   \normalsize 
1953   \caption{La struttura \structd{semid\_ds}, associata a ciascun insieme di
1954     semafori.}
1955   \label{fig:ipc_semid_ds}
1956 \end{figure}
1957
1958 A ciascun insieme di semafori è associata una struttura \struct{semid\_ds},
1959 riportata in fig.~\ref{fig:ipc_semid_ds}.\footnote{anche in questo caso in
1960   realtà il kernel usa una sua specifica struttura interna, ma i dati
1961   significativi sono sempre quelli citati.}  Come nel caso delle code di
1962 messaggi quando si crea un nuovo insieme di semafori con \func{semget} questa
1963 struttura viene inizializzata. In particolare il campo \var{sem\_perm}, che
1964 esprime i permessi di accesso, viene inizializzato come illustrato in
1965 sez.~\ref{sec:ipc_sysv_access_control} (si ricordi che in questo caso il
1966 permesso di scrittura è in realtà permesso di alterare il semaforo), per
1967 quanto riguarda gli altri campi invece:
1968 \begin{itemize*}
1969 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
1970   nell'insieme, viene inizializzato al valore di \param{nsems}.
1971 \item il campo \var{sem\_ctime}, che esprime il tempo di ultimo cambiamento
1972   dell'insieme, viene inizializzato al tempo corrente.
1973 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
1974   effettuata, viene inizializzato a zero.
1975 \end{itemize*}
1976
1977 \begin{figure}[!htb]
1978   \footnotesize \centering
1979   \begin{minipage}[c]{.80\textwidth}
1980     \includestruct{listati/sem.h}
1981   \end{minipage} 
1982   \normalsize 
1983   \caption{La struttura \structd{sem}, che contiene i dati di un singolo
1984     semaforo.} 
1985   \label{fig:ipc_sem}
1986 \end{figure}
1987
1988 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
1989 \struct{sem} che ne contiene i dati essenziali, la cui definizione è riportata
1990 in fig.~\ref{fig:ipc_sem}.\footnote{in realtà in fig~\ref{fig:ipc_sem} si è
1991   riportata la definizione originaria del kernel 1.0, che contiene la prima
1992   realizzazione del \textit{SysV-IPC} in Linux; ormai questa struttura è
1993   ridotta ai soli due primi membri, e gli altri vengono calcolati
1994   dinamicamente, la si è usata solo a scopo di esempio, perché indica tutti i
1995   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
1996   citati dalle pagine di manuale.}  Questa struttura non è accessibile
1997 direttamente dallo \textit{user space}, ma i valori in essa specificati
1998 possono essere letti in maniera indiretta, attraverso l'uso delle opportune
1999 funzioni di controllo.  I dati mantenuti nella struttura, ed elencati in
2000 fig.~\ref{fig:ipc_sem}, indicano rispettivamente:
2001 \begin{basedescript}{\desclabelwidth{2cm}\desclabelstyle{\nextlinelabel}}
2002 \item[\var{semval}] il valore numerico del semaforo.
2003 \item[\var{sempid}] il \ids{PID} dell'ultimo processo che ha eseguito una
2004   operazione sul semaforo.
2005 \item[\var{semncnt}] il numero di processi in attesa che esso venga
2006   incrementato.
2007 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
2008 \end{basedescript}
2009
2010 Come per le code di messaggi anche per gli insiemi di semafori esistono una
2011 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
2012 sono riportate in tab.~\ref{tab:ipc_sem_limits}. Alcuni di questi limiti sono
2013 al solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
2014 direttamente nel file \sysctlfile{kernel/sem}.
2015
2016 \begin{table}[htb]
2017   \footnotesize
2018   \centering
2019   \begin{tabular}[c]{|c|r|p{8cm}|}
2020     \hline
2021     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
2022     \hline
2023     \hline
2024     \const{SEMMNI}&          128 & Numero massimo di insiemi di semafori.\\
2025     \const{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
2026     \const{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
2027                                    nel sistema.\\
2028     \const{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
2029     \const{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
2030                                    \func{semop}. \\
2031     \const{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
2032     \const{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
2033     \const{SEMAEM}&\const{SEMVMX}& Valore massimo per l'aggiustamento
2034                                    all'uscita. \\
2035     \hline
2036   \end{tabular}
2037   \caption{Valori delle costanti associate ai limiti degli insiemi di
2038     semafori, definite in \file{linux/sem.h}.} 
2039   \label{tab:ipc_sem_limits}
2040 \end{table}
2041
2042
2043 La funzione di sistema che permette di effettuare le varie operazioni di
2044 controllo sui semafori fra le quali, come accennato, è impropriamente compresa
2045 anche la loro inizializzazione, è \funcd{semctl}; il suo prototipo è:
2046
2047 \begin{funcproto}{
2048 \fhead{sys/types.h}
2049 \fhead{sys/ipc.h}
2050 \fhead{sys/sem.h}
2051 \fdecl{int semctl(int semid, int semnum, int cmd)}
2052 \fdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
2053 \fdesc{Esegue le operazioni di controllo su un semaforo o un insieme di
2054   semafori.}
2055 }
2056
2057 {La funzione ritorna in caso di successo un valore positivo quanto usata con
2058   tre argomenti ed un valore nullo quando usata con quattro e $-1$ per un
2059   errore, nel qual caso \var{errno} assumerà uno dei valori:
2060   \begin{errlist}
2061   \item[\errcode{EACCES}] i permessi assegnati al semaforo non consentono
2062     l'operazione di lettura o scrittura richiesta e non si hanno i privilegi
2063     di amministratore.
2064     \item[\errcode{EIDRM}] l'insieme di semafori è stato cancellato.
2065     \item[\errcode{EPERM}] si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
2066       ma il processo non è né il creatore né il proprietario del semaforo e
2067       non ha i privilegi di amministratore.
2068     \item[\errcode{ERANGE}] si è richiesto \const{SETALL} \const{SETVAL} ma il
2069       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
2070       di \const{SEMVMX}.
2071    \end{errlist}
2072    ed inoltre \errval{EFAULT} ed \errval{EINVAL} nel loro significato
2073    generico.}
2074 \end{funcproto}
2075
2076 La funzione può avere tre o quattro argomenti, a seconda dell'operazione
2077 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
2078 \param{semid} o sul singolo semaforo di un insieme, specificato da
2079 \param{semnum}. 
2080
2081 \begin{figure}[!htb]
2082   \footnotesize \centering
2083   \begin{minipage}[c]{0.80\textwidth}
2084     \includestruct{listati/semun.h}
2085   \end{minipage} 
2086   \normalsize 
2087   \caption{La definizione dei possibili valori di una \direct{union}
2088     \structd{semun}, usata come quarto argomento della funzione
2089     \func{semctl}.}
2090   \label{fig:ipc_semun}
2091 \end{figure}
2092
2093 Qualora la funzione operi con quattro argomenti \param{arg} è un argomento
2094 generico, che conterrà un dato diverso a seconda dell'azione richiesta; per
2095 unificare detto argomento esso deve essere passato come una unione
2096 \struct{semun}, la cui definizione, con i possibili valori che può assumere, è
2097 riportata in fig.~\ref{fig:ipc_semun}.
2098
2099 Nelle versioni più vecchie delle \acr{glibc} questa unione veniva definita in
2100 \file{sys/sem.h}, ma nelle versioni più recenti questo non avviene più in
2101 quanto lo standard POSIX.1-2001 richiede che sia sempre definita a cura del
2102 chiamante. In questa seconda evenienza le \acr{glibc} definiscono però la
2103 macro \macro{\_SEM\_SEMUN\_UNDEFINED} che può essere usata per controllare la
2104 situazione.
2105
2106 Come già accennato sia il comportamento della funzione che il numero di
2107 argomenti con cui deve essere invocata dipendono dal valore dell'argomento
2108 \param{cmd}, che specifica l'azione da intraprendere. Per questo argomento i
2109 valori validi, quelli cioè che non causano un errore di \errcode{EINVAL}, sono
2110 i seguenti:
2111 \begin{basedescript}{\desclabelwidth{1.6cm}\desclabelstyle{\nextlinelabel}}
2112 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiandone i
2113   valori nella struttura \struct{semid\_ds} posta all'indirizzo specificato
2114   con \var{arg.buf}. Occorre avere il permesso di lettura.
2115   L'argomento \param{semnum} viene ignorato.
2116 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
2117   dati, con effetto immediato. Tutti i processi che erano bloccati in attesa
2118   vengono svegliati, ritornando con un errore di \errcode{EIDRM}.  L'\ids{UID}
2119   effettivo del processo deve corrispondere o al creatore o al proprietario
2120   dell'insieme, o all'amministratore. L'argomento
2121   \param{semnum} viene ignorato.
2122 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2123   dell'insieme. I valori devono essere passati in una struttura
2124   \struct{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto
2125   i campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
2126   significativi di \var{sem\_perm.mode}. La funziona aggiorna anche il campo
2127   \var{sem\_ctime}.  L'\ids{UID} effettivo del processo deve corrispondere o
2128   al creatore o al proprietario dell'insieme, o all'amministratore.
2129   L'argomento \param{semnum} viene ignorato.
2130 \item[\const{GETALL}] Restituisce il valore corrente di ciascun semaforo
2131   dell'insieme (corrispondente al campo \var{semval} di \struct{sem}) nel
2132   vettore indicato da \param{arg.array}. Occorre avere il permesso di lettura.
2133   L'argomento \param{semnum} viene ignorato.
2134 \item[\const{GETNCNT}] Restituisce come valore di ritorno della funzione il
2135   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
2136   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
2137   \struct{sem}). Va invocata con tre argomenti.  Occorre avere il permesso di
2138   lettura.
2139 \item[\const{GETPID}] Restituisce come valore di ritorno della funzione il
2140   \ids{PID} dell'ultimo processo che ha compiuto una operazione sul semaforo
2141   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
2142   \var{sempid} di \struct{sem}). Va invocata con tre argomenti.  Occorre avere
2143   il permesso di lettura.
2144 \item[\const{GETVAL}] Restituisce come valore di ritorno della funzione il il
2145   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
2146   (corrispondente al campo \var{semval} di \struct{sem}). Va invocata con tre
2147   argomenti.  Occorre avere il permesso di lettura.
2148 \item[\const{GETZCNT}] Restituisce come valore di ritorno della funzione il
2149   numero di processi in attesa che il valore del semaforo \param{semnum}
2150   dell'insieme \param{semid} diventi nullo (corrispondente al campo
2151   \var{semncnt} di \struct{sem}). Va invocata con tre argomenti.  Occorre
2152   avere il permesso di lettura.
2153 \item[\const{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
2154   aggiornando il campo \var{sem\_ctime} di \struct{semid\_ds}. I valori devono
2155   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
2156   privilegi di scrittura.  L'argomento \param{semnum} viene ignorato.
2157 \item[\const{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
2158   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
2159   \struct{semid\_ds}.  Si devono avere i privilegi di scrittura.
2160 \end{basedescript}
2161
2162 Come per \func{msgctl} esistono tre ulteriori valori, \const{IPC\_INFO},
2163 \const{SEM\_STAT} e \const{SEM\_INFO}, specifici di Linux e fuori da ogni
2164 standard, creati specificamente ad uso del comando \cmd{ipcs}. Dato che anche
2165 questi potranno essere modificati o rimossi, non devono essere utilizzati e
2166 pertanto non li tratteremo.
2167
2168 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2169 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2170 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2171 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2172 tutti i semafori il cui valore viene modificato.
2173
2174 \begin{table}[htb]
2175   \footnotesize
2176   \centering
2177   \begin{tabular}[c]{|c|l|}
2178     \hline
2179     \textbf{Operazione}  & \textbf{Valore restituito} \\
2180     \hline
2181     \hline
2182     \const{GETNCNT}& Valore di \var{semncnt}.\\
2183     \const{GETPID} & Valore di \var{sempid}.\\
2184     \const{GETVAL} & Valore di \var{semval}.\\
2185     \const{GETZCNT}& Valore di \var{semzcnt}.\\
2186     \hline
2187   \end{tabular}
2188   \caption{Valori di ritorno della funzione \func{semctl}.} 
2189   \label{tab:ipc_semctl_returns}
2190 \end{table}
2191
2192 Il valore di ritorno della funzione in caso di successo dipende
2193 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2194 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2195 tab.~\ref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2196 corrispondente al campo della struttura \struct{sem} indicato nella seconda
2197 colonna della tabella.
2198
2199 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2200 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2201 vengono effettuate con la funzione di sistema \funcd{semop}, il cui prototipo
2202 è:
2203
2204 \begin{funcproto}{
2205 \fhead{sys/types.h}
2206 \fhead{sys/ipc.h}
2207 \fhead{sys/sem.h}
2208 \fdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2209 \fdesc{Esegue operazioni ordinarie su un semaforo o un insieme di semafori.} 
2210 }
2211
2212 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2213   caso \var{errno} assumerà uno dei valori: 
2214   \begin{errlist}
2215     \item[\errcode{E2BIG}] l'argomento \param{nsops} è maggiore del numero
2216       massimo di operazioni \const{SEMOPM}.
2217     \item[\errcode{EACCES}] il processo non ha i permessi per eseguire
2218       l'operazione richiesta e non ha i privilegi di amministratore.
2219     \item[\errcode{EAGAIN}] un'operazione comporterebbe il blocco del processo,
2220       ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2221     \item[\errcode{EFBIG}] il valore del campo \var{sem\_num} è negativo o
2222       maggiore o uguale al numero di semafori dell'insieme.
2223     \item[\errcode{EIDRM}] l'insieme di semafori è stato cancellato.
2224     \item[\errcode{EINTR}] la funzione, bloccata in attesa dell'esecuzione
2225       dell'operazione, viene interrotta da un segnale.
2226     \item[\errcode{ENOMEM}] si è richiesto un \const{SEM\_UNDO} ma il sistema
2227       non ha le risorse per allocare la struttura di ripristino.
2228     \item[\errcode{ERANGE}] per alcune operazioni il valore risultante del
2229       semaforo viene a superare il limite massimo \const{SEMVMX}.
2230   \end{errlist}
2231   ed inoltre \errval{EFAULT} ed \errval{EINVAL} nel loro significato
2232   generico.}
2233 \end{funcproto}
2234
2235 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2236 un insieme. La funzione richiede come primo argomento l'identificatore
2237 \param{semid} dell'insieme su cui si vuole operare, il numero di operazioni da
2238 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2239 contenuto viene passato con un puntatore ad un vettore di strutture
2240 \struct{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2241 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante,
2242 ed in tal caso vengono eseguite nella sequenza passata nel
2243 vettore \param{sops}.
2244
2245 Con lo standard POSIX.1-2001 è stata introdotta una variante di \func{semop}
2246 che consente di specificare anche un tempo massimo di attesa. La nuova
2247 funzione di sistema, disponibile a partire dal kernel 2.4.22 e dalle
2248 \acr{glibc} 2.3.3, ed utilizzabile solo dopo aver definito la macro
2249 \macro{\_GNU\_SOURCE}, è \funcd{semtimedop}, ed il suo prototipo è:
2250
2251 \begin{funcproto}{
2252 \fhead{sys/types.h}
2253 \fhead{sys/ipc.h}
2254 \fhead{sys/sem.h}
2255 \fdecl{int semtimedop(int semid, struct sembuf *sops, unsigned nsops,
2256                       struct timespec *timeout)}
2257 \fdesc{Esegue operazioni ordinarie su un semaforo o un insieme di semafori.} 
2258 }
2259
2260 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2261   caso \var{errno} assumerà uno dei valori: 
2262   \begin{errlist}
2263   \item[\errcode{EAGAIN}] l'operazione comporterebbe il blocco del processo,
2264     ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg} oppure si è
2265     atteso oltre quanto indicato da \param{timeout}.
2266   \end{errlist}
2267   e gli altri valori già visti per \func{semop}, con lo stesso significato.}
2268 \end{funcproto}
2269
2270 Rispetto a \func{semop} la funzione consente di specificare un tempo massimo
2271 di attesa, indicato con una struttura \struct{timespec} (vedi
2272 fig.~\ref{fig:sys_timespec_struct}), per le operazioni che verrebbero
2273 bloccate. Alla scadenza di detto tempo la funzione ritorna comunque con un
2274 errore di \errval{EAGAIN} senza che nessuna delle operazioni richieste venga
2275 eseguita. 
2276
2277 Si tenga presente che la precisione della temporizzazione è comunque limitata
2278 dalla risoluzione dell'orologio di sistema, per cui il tempo di attesa verrà
2279 arrotondato per eccesso. In caso si passi un valore \val{NULL}
2280 per \param{timeout} il comportamento di \func{semtimedop} è identico a quello
2281 di \func{semop}.
2282
2283
2284 \begin{figure}[!htb]
2285   \footnotesize \centering
2286   \begin{minipage}[c]{.80\textwidth}
2287     \includestruct{listati/sembuf.h}
2288   \end{minipage} 
2289   \normalsize 
2290   \caption{La struttura \structd{sembuf}, usata per le operazioni sui
2291     semafori.}
2292   \label{fig:ipc_sembuf}
2293 \end{figure}
2294
2295 Come indicato il contenuto di ciascuna operazione deve essere specificato
2296 attraverso una struttura \struct{sembuf} (la cui definizione è riportata in
2297 fig.~\ref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2298 allocare in un opportuno vettore. La struttura permette di indicare il
2299 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.  
2300
2301 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2302 riferimento l'operazione. Si ricordi che i semafori sono numerati come gli
2303 elementi di un vettore, per cui il primo semaforo di un insieme corrisponde ad
2304 un valore nullo di \var{sem\_num}.
2305
2306 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2307 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2308 \const{SEM\_UNDO}.  Impostando \const{IPC\_NOWAIT} si fa si che in tutti quei
2309 casi in cui l'esecuzione di una operazione richiederebbe di porre il processo
2310 vada nello stato di \textit{sleep}, invece di bloccarsi \func{semop} ritorni
2311 immediatamente (abortendo così le eventuali operazioni restanti) con un errore
2312 di \errcode{EAGAIN}.  Impostando \const{SEM\_UNDO} si richiede invece che
2313 l'operazione in questione venga registrata, in modo che il valore del semaforo
2314 possa essere ripristinato all'uscita del processo.
2315
2316 Infine \var{sem\_op} è il campo che controlla qual'è l'operazione che viene
2317 eseguita e determina in generale il comportamento della chiamata a
2318 \func{semop}. I casi possibili per il valore di questo campo sono tre:
2319 \begin{basedescript}{\desclabelwidth{1.8cm}}
2320 \item[\var{sem\_op} $>0$] In questo caso il valore viene aggiunto al valore
2321   corrente di \var{semval} per il semaforo indicato. Questa operazione non
2322   causa mai un blocco del processo, ed eventualmente \func{semop} ritorna
2323   immediatamente con un errore di \errcode{ERANGE} qualora si sia superato il
2324   limite \const{SEMVMX}. Se l'operazione ha successo si passa immediatamente
2325   alla successiva.  Specificando \const{SEM\_UNDO} si aggiorna il contatore
2326   per il ripristino del valore del semaforo. Al processo chiamante è richiesto
2327   il privilegio di alterazione (scrittura) sull'insieme di semafori.
2328   
2329 \item[\var{sem\_op} $=0$] Nel caso \var{semval} sia zero l'operazione ha
2330   successo immediato, e o si passa alla successiva o \func{semop} ritorna con
2331   successo se questa era l'ultima. Se \var{semval} è diverso da zero il
2332   comportamento è controllato da \var{sem\_flg}, se è stato impostato
2333   \const{IPC\_NOWAIT} \func{semop} ritorna immediatamente abortendo tutte le
2334   operazioni con un errore di \errcode{EAGAIN}, altrimenti viene incrementato
2335   \var{semzcnt} di uno ed il processo viene bloccato fintanto che non si
2336   verifica una delle condizioni seguenti:
2337   \begin{itemize*}
2338   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2339     decrementato di uno, l'operazione ha successo e si passa alla successiva,
2340     oppure \func{semop} ritorna con successo se questa era l'ultima.
2341   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2342     ritorna abortendo tutte le operazioni con un errore di \errcode{EIDRM}.
2343   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2344     viene decrementato di uno e \func{semop} ritorna abortendo tutte le
2345     operazioni con un errore di \errcode{EINTR}.
2346   \end{itemize*}
2347   Al processo chiamante è richiesto soltanto il privilegio di lettura
2348   dell'insieme dei semafori.
2349   
2350 \item[\var{sem\_op} $<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2351   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2352   positiva o nulla) i valori vengono sommati e l'operazione ha successo e si
2353   passa alla successiva, oppure \func{semop} ritorna con successo se questa
2354   era l'ultima. Qualora si sia impostato \const{SEM\_UNDO} viene anche
2355   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2356   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2357   negativo) se si è impostato \const{IPC\_NOWAIT} \func{semop} ritorna
2358   immediatamente abortendo tutte le operazioni con un errore di
2359   \errcode{EAGAIN}, altrimenti viene incrementato di uno \var{semncnt} ed il
2360   processo resta in stato di \textit{sleep} fintanto che non si ha una delle
2361   condizioni seguenti:
2362   \begin{itemize*}
2363   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2364     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2365     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2366     impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2367     ripristino del valore del semaforo.
2368   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2369     ritorna abortendo tutte le operazioni con un errore di \errcode{EIDRM}.
2370   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2371     viene decrementato di uno e \func{semop} ritorna abortendo tutte le
2372     operazioni con un errore di \errcode{EINTR}.
2373   \end{itemize*}    
2374   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2375   sull'insieme di semafori.
2376 \end{basedescript}
2377
2378 Qualora si sia usato \func{semtimedop} alle condizioni di errore precedenti si
2379 aggiunge anche quella di scadenza del tempo di attesa indicato
2380 con \param{timeout} che farà abortire la funzione, qualora resti bloccata
2381 troppo a lungo nell'esecuzione delle operazioni richieste, con un errore di
2382 \errcode{EAGAIN}.
2383
2384 In caso di successo (sia per \func{semop} che per \func{semtimedop}) per ogni
2385 semaforo modificato verrà aggiornato il campo \var{sempid} al valore del
2386 \ids{PID} del processo chiamante; inoltre verranno pure aggiornati al tempo
2387 corrente i campi \var{sem\_otime} e \var{sem\_ctime}.
2388
2389 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2390 semafori possono restare occupati, abbiamo visto come \func{semop} (e
2391 \func{semtimedop}) permetta di attivare un meccanismo di ripristino attraverso
2392 l'uso del flag \const{SEM\_UNDO}. Il meccanismo è implementato tramite una
2393 apposita struttura \kstruct{sem\_undo}, associata ad ogni processo per ciascun
2394 semaforo che esso ha modificato; all'uscita i semafori modificati vengono
2395 ripristinati, e le strutture disallocate.  Per mantenere coerente il
2396 comportamento queste strutture non vengono ereditate attraverso una
2397 \func{fork} (altrimenti si avrebbe un doppio ripristino), mentre passano
2398 inalterate nell'esecuzione di una \func{exec} (altrimenti non si avrebbe
2399 ripristino).
2400
2401 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2402 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2403 in maniera semplificata nello schema di fig.~\ref{fig:ipc_sem_schema}.  Si è
2404 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2405 semplice (ed illustrata in dettaglio in \cite{tlk}). Nel kernel 2.4.x la
2406 struttura del \textit{SysV-IPC} è stata modificata, ma le definizioni relative
2407 a queste strutture restano per compatibilità (in particolare con le vecchie
2408 versioni delle librerie del C, come le \acr{libc5}).
2409
2410 \begin{figure}[!htb]
2411   \centering \includegraphics[width=12cm]{img/semtruct}
2412   \caption{Schema della struttura di un insieme di semafori.}
2413   \label{fig:ipc_sem_schema}
2414 \end{figure}
2415
2416 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2417 \struct{semid\_ds} ed il relativo vettore di strutture \struct{sem}. Quando si
2418 richiede una operazione viene anzitutto verificato che tutte le operazioni
2419 possono avere successo; se una di esse comporta il blocco del processo il
2420 kernel crea una struttura \kstruct{sem\_queue} che viene aggiunta in fondo
2421 alla coda di attesa associata a ciascun insieme di semafori, che viene
2422 referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last} di
2423 \struct{semid\_ds}.  Nella struttura viene memorizzato il riferimento alle
2424 operazioni richieste (nel campo \var{sops}, che è un puntatore ad una
2425 struttura \struct{sembuf}) e al processo corrente (nel campo \var{sleeper})
2426 poi quest'ultimo viene messo stato di attesa e viene invocato lo
2427 \textit{scheduler} per passare all'esecuzione di un altro processo.
2428
2429 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2430 immediatamente, dopo di che il kernel esegue una scansione della coda di
2431 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2432 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2433 struttura \kstruct{sem\_queue} viene rimossa e lo stato del processo associato
2434 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2435 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2436 svuotata la coda.  Per gestire il meccanismo del ripristino tutte le volte che
2437 per un'operazione si è specificato il flag \const{SEM\_UNDO} viene mantenuta
2438 per ciascun insieme di semafori una apposita struttura \kstruct{sem\_undo} che
2439 contiene (nel vettore puntato dal campo \var{semadj}) un valore di
2440 aggiustamento per ogni semaforo cui viene sommato l'opposto del valore usato
2441 per l'operazione.
2442
2443 Queste strutture sono mantenute in due liste (rispettivamente attraverso i due
2444 campi \var{id\_next} e \var{proc\_next}) una associata all'insieme di cui fa
2445 parte il semaforo, che viene usata per invalidare le strutture se questo viene
2446 cancellato o per azzerarle se si è eseguita una operazione con \func{semctl},
2447 l'altra associata al processo che ha eseguito l'operazione, attraverso il
2448 campo \var{semundo} di \kstruct{task\_struct}, come mostrato in
2449 \ref{fig:ipc_sem_schema}. Quando un processo termina, la lista ad esso
2450 associata viene scandita e le operazioni applicate al semaforo.  Siccome un
2451 processo può accumulare delle richieste di ripristino per semafori differenti
2452 attraverso diverse chiamate a \func{semop}, si pone il problema di come
2453 eseguire il ripristino dei semafori all'uscita del processo, ed in particolare
2454 se questo può essere fatto atomicamente.
2455
2456 Il punto è cosa succede quando una delle operazioni previste per il ripristino
2457 non può essere eseguita immediatamente perché ad esempio il semaforo è
2458 occupato; in tal caso infatti, se si pone il processo in stato di
2459 \textit{sleep} aspettando la disponibilità del semaforo (come faceva
2460 l'implementazione originaria) si perde l'atomicità dell'operazione. La scelta
2461 fatta dal kernel è pertanto quella di effettuare subito le operazioni che non
2462 prevedono un blocco del processo e di ignorare silenziosamente le altre;
2463 questo però comporta il fatto che il ripristino non è comunque garantito in
2464 tutte le occasioni.
2465
2466 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2467 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2468 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2469 riportato in fig.~\ref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2470 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2471 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2472 nullo per segnalarne l'indisponibilità. 
2473
2474 \begin{figure}[!htbp]
2475   \footnotesize \centering
2476   \begin{minipage}[c]{\codesamplewidth}
2477     \includecodesample{listati/Mutex.c}
2478   \end{minipage} 
2479   \normalsize 
2480   \caption{Il codice delle funzioni che permettono di creare o recuperare
2481     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2482   \label{fig:ipc_mutex_create}
2483 \end{figure}
2484
2485 La prima funzione (\texttt{\small 2-15}) è \func{MutexCreate} che data una
2486 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2487 l'identificatore. Il primo passo (\texttt{\small 6}) è chiamare \func{semget}
2488 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2489 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2490 (\texttt{\small 7-9}) si ritorna subito il risultato di \func{semget},
2491 altrimenti (\texttt{\small 10}) si inizializza il semaforo chiamando
2492 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2493 \struct{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 4})
2494 ad 1 per significare che risorsa è libera. In caso di errore (\texttt{\small
2495   11-13}) si restituisce il valore di ritorno di \func{semctl}, altrimenti
2496 (\texttt{\small 14}) si ritorna l'identificatore del semaforo.
2497
2498 La seconda funzione (\texttt{\small 17-20}) è \func{MutexFind}, che, data una
2499 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2500 comprensione del suo funzionamento è immediata in quanto essa è soltanto un
2501 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2502   \textsl{involucro} alla chiamata di un altra, usata in genere per
2503   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2504   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2505   stesse funzionalità.} di una chiamata a \func{semget} per cercare
2506 l'identificatore associato alla chiave, il valore di ritorno di quest'ultima
2507 viene passato all'indietro al chiamante.
2508
2509 La terza funzione (\texttt{\small 22-25}) è \func{MutexRead} che, dato un
2510 identificatore, restituisce il valore del semaforo associato al mutex. Anche
2511 in questo caso la funzione è un \textit{wrapper} per una chiamata a
2512 \func{semctl} con il comando \const{GETVAL}, che permette di restituire il
2513 valore del semaforo.
2514
2515 La quarta e la quinta funzione (\texttt{\small 36-44}) sono \func{MutexLock},
2516 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2517 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2518 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2519 (\texttt{\small 27-34}). Si noti come per queste ultime si sia fatto uso
2520 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2521 caso di terminazione imprevista del processo.
2522
2523 L'ultima funzione (\texttt{\small 46-49}) della serie, è \func{MutexRemove},
2524 che rimuove il mutex. Anche in questo caso si ha un wrapper per una chiamata a
2525 \func{semctl} con il comando \const{IPC\_RMID}, che permette di cancellare il
2526 semaforo; il valore di ritorno di quest'ultima viene passato all'indietro.
2527
2528 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2529 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2530 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2531 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2532 incrementato di uno, sbloccandolo qualora fosse bloccato.  
2533
2534 Si noti che occorre eseguire sempre prima \func{MutexLock} e poi
2535 \func{MutexUnlock}, perché se per un qualche errore si esegue più volte
2536 quest'ultima il valore del semaforo crescerebbe oltre 1, e \func{MutexLock}
2537 non avrebbe più l'effetto aspettato (bloccare la risorsa quando questa è
2538 considerata libera).  Infine si tenga presente che usare \func{MutexRead} per
2539 controllare il valore dei mutex prima di proseguire in una operazione di
2540 sblocco non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2541 Vedremo in sez.~\ref{sec:ipc_lock_file} come sia possibile ottenere
2542 un'interfaccia analoga a quella appena illustrata, senza incorrere in questi
2543 problemi, usando il \itindex{file~locking} \textit{file locking}.
2544
2545
2546 \subsection{Memoria condivisa}
2547 \label{sec:ipc_sysv_shm}
2548
2549 Il terzo oggetto introdotto dal \textit{SysV-IPC} è quello dei segmenti di
2550 memoria condivisa. La funzione di sistema che permette di ottenerne uno è
2551 \funcd{shmget}, ed il suo prototipo è:
2552
2553 \begin{funcproto}{
2554 \fhead{sys/types.h}
2555 \fhead{sys/ipc.h}
2556 \fhead{sys/shm.h}
2557 \fdecl{int shmget(key\_t key, int size, int flag)}
2558 \fdesc{Ottiene o crea una memoria condivisa.} 
2559 }
2560
2561 {La funzione ritorna l'identificatore (un intero positivo) in caso di successo
2562   e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2563   \begin{errlist}
2564     \item[\errcode{ENOSPC}] si è superato il limite (\const{SHMMNI}) sul numero
2565       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2566       cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2567       la memoria ad essi riservata.
2568     \item[\errcode{EINVAL}] si è richiesta una dimensione per un nuovo segmento
2569       maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2570       già esiste \param{size} è maggiore delle sue dimensioni.
2571     \item[\errcode{ENOMEM}] il sistema non ha abbastanza memoria per poter
2572       contenere le strutture per un nuovo segmento di memoria condivisa.
2573     \item[\errcode{ENOMEM}] si è specificato \const{IPC\_HUGETLB} ma non si
2574       hanno i privilegi di amministratore.
2575    \end{errlist}
2576    ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2577    \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2578 \end{funcproto}
2579
2580
2581 La funzione, come \func{semget}, è analoga a \func{msgget}, ed identico è
2582 l'uso degli argomenti \param{key} e \param{flag} per cui non ripeteremo quanto
2583 detto al proposito in sez.~\ref{sec:ipc_sysv_mq}.  A partire dal kernel 2.6
2584 però sono stati introdotti degli ulteriori bit di controllo per
2585 l'argomento \param{flag}, specifici di \func{shmget}, attinenti alle modalità
2586 di gestione del segmento di memoria condivisa in relazione al sistema della
2587 memoria virtuale.
2588
2589 Il primo dei due flag è \const{SHM\_HUGETLB} che consente di richiedere la
2590 creazione del segmento usando una \textit{huge page}, le pagine di memoria di
2591 grandi dimensioni introdotte con il kernel 2.6 per ottimizzare le prestazioni
2592 nei sistemi più recenti che hanno grandi quantità di memoria. L'operazione è
2593 privilegiata e richiede che il processo abbia la \textit{capability}
2594 \const{CAP\_IPC\_LOCK}. Questa funzionalità è specifica di Linux e non è
2595 portabile.
2596
2597 Il secondo flag aggiuntivo, introdotto a partire dal kernel 2.6.15, è
2598 \const{SHM\_NORESERVE}, ed ha lo stesso scopo del flag \const{MAP\_NORESERVE}
2599 di \func{mmap} (vedi sez.~\ref{sec:file_memory_map}): non vengono riservate
2600 delle pagine di swap ad uso del meccanismo del \textit{copy on write} per
2601 mantenere le modifiche fatte sul segmento. Questo significa che caso di
2602 scrittura sul segmento quando non c'è più memoria disponibile, si avrà
2603 l'emissione di un \signal{SIGSEGV}.
2604
2605 Infine l'argomento \param{size} specifica la dimensione del segmento di
2606 memoria condivisa; il valore deve essere specificato in byte, ma verrà
2607 comunque arrotondato al multiplo superiore di \const{PAGE\_SIZE}. Il valore
2608 deve essere specificato quando si crea un nuovo segmento di memoria con
2609 \const{IPC\_CREAT} o \const{IPC\_PRIVATE}, se invece si accede ad un segmento
2610 di memoria condivisa esistente non può essere maggiore del valore con cui esso
2611 è stato creato.
2612
2613 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2614 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2615 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2616 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2617 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2618 dati in memoria.
2619
2620 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2621 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2622 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2623 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2624 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2625 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2626 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2627 altro processo. Per questo in genere la memoria condivisa viene sempre
2628 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2629 norma, significa insieme a dei semafori.
2630
2631 \begin{figure}[!htb]
2632   \footnotesize \centering
2633   \begin{minipage}[c]{0.80\textwidth}
2634     \includestruct{listati/shmid_ds.h}
2635   \end{minipage} 
2636   \normalsize 
2637   \caption{La struttura \structd{shmid\_ds}, associata a ciascun segmento di
2638     memoria condivisa.}
2639   \label{fig:ipc_shmid_ds}
2640 \end{figure}
2641
2642 A ciascun segmento di memoria condivisa è associata una struttura
2643 \struct{shmid\_ds}, riportata in fig.~\ref{fig:ipc_shmid_ds}.  Come nel caso
2644 delle code di messaggi quando si crea un nuovo segmento di memoria condivisa
2645 con \func{shmget} questa struttura viene inizializzata, in particolare il
2646 campo \var{shm\_perm} viene inizializzato come illustrato in
2647 sez.~\ref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2648 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2649 invece:
2650 \begin{itemize*}
2651 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2652   inizializzato al valore di \param{size}.
2653 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2654   segmento, viene inizializzato al tempo corrente.
2655 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2656   rispettivamente il tempo dell'ultima volta che il segmento è stato
2657   agganciato o sganciato da un processo, vengono inizializzati a zero.
2658 \item il campo \var{shm\_lpid}, che esprime il \ids{PID} del processo che ha
2659   eseguito l'ultima operazione, viene inizializzato a zero.
2660 \item il campo \var{shm\_cpid}, che esprime il \ids{PID} del processo che ha
2661   creato il segmento, viene inizializzato al \ids{PID} del processo chiamante.
2662 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2663   al segmento viene inizializzato a zero.
2664 \end{itemize*}
2665
2666 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2667 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2668 di questi limiti sono al solito accessibili e modificabili attraverso
2669 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2670 \file{/proc/sys/kernel/}. 
2671
2672 In tab.~\ref{tab:ipc_shm_limits} si sono riportate le
2673 costanti simboliche associate a ciascuno di essi, il loro significato, i
2674 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2675 che permettono di cambiarne il valore. 
2676
2677
2678 \begin{table}[htb]
2679   \footnotesize
2680   \centering
2681   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2682     \hline
2683     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2684     & \textbf{Significato} \\
2685     \hline
2686     \hline
2687     \const{SHMALL}& 0x200000&\sysctlrelfile{kernel}{shmall}
2688                             & Numero massimo di pagine che 
2689                               possono essere usate per i segmenti di
2690                               memoria condivisa.\\
2691     \const{SHMMAX}&0x2000000&\sysctlrelfile{kernel}{shmmax} 
2692                             & Dimensione massima di un segmento di memoria
2693                               condivisa.\\ 
2694     \const{SHMMNI}&     4096&\sysctlrelfile{kernel}{msgmni}
2695                             & Numero massimo di segmenti di memoria condivisa
2696                               presenti nel kernel.\\ 
2697     \const{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2698                                             memoria condivisa.\\
2699     \const{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2700                                             minime di un segmento (deve essere
2701                                             allineato alle dimensioni di una
2702                                             pagina di memoria).\\
2703     \const{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2704                                             memoria condivisa per ciascun
2705                                             processo (l'implementazione non
2706                                             prevede l'esistenza di questo
2707                                             limite).\\
2708
2709
2710     \hline
2711   \end{tabular}
2712   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2713     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2714     valore preimpostato presente nel sistema.} 
2715   \label{tab:ipc_shm_limits}
2716 \end{table}
2717
2718 Al solito la funzione di sistema che permette di effettuare le operazioni di
2719 controllo su un segmento di memoria condivisa è \funcd{shmctl}; il suo
2720 prototipo è:
2721
2722 \begin{funcproto}{
2723 \fhead{sys/ipc.h}
2724 \fhead{sys/shm.h}
2725 \fdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2726
2727 \fdesc{Esegue le operazioni di controllo su un segmento di memoria condivisa.}
2728 }
2729
2730 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2731   caso \var{errno} assumerà uno dei valori:
2732   \begin{errlist}
2733     \item[\errcode{EACCES}] si è richiesto \const{IPC\_STAT} ma i permessi non
2734       consentono l'accesso in lettura al segmento.
2735     \item[\errcode{EFAULT}] l'indirizzo specificato con \param{buf} non è
2736       valido.
2737     \item[\errcode{EIDRM}] l'argomento \param{shmid} fa riferimento ad un
2738       segmento che è stato cancellato.
2739     \item[\errcode{EINVAL}] o \param{shmid} non è un identificatore valido o
2740       \param{cmd} non è un comando valido.
2741     \item[\errcode{ENOMEM}] si è richiesto un \textit{memory lock} di
2742       dimensioni superiori al massimo consentito.
2743     \item[\errcode{EOVERFLOW}] si è tentato il comando \const{IPC\_STAT} ma il
2744       valore del \ids{GID} o dell'\ids{UID} è troppo grande per essere
2745       memorizzato nella struttura puntata da \param{buf}.
2746     \item[\errcode{EPERM}] si è specificato un comando con \const{IPC\_SET} o
2747       \const{IPC\_RMID} senza i permessi necessari.
2748   \end{errlist}
2749 }  
2750 \end{funcproto}
2751
2752 Il comando specificato attraverso l'argomento \param{cmd} determina i diversi
2753 effetti della funzione. Nello standard POSIX.1-2001 i valori che esso può
2754 assumere, ed il corrispondente comportamento della funzione, sono i seguenti:
2755
2756 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2757 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2758   condivisa nella struttura \struct{shmid\_ds} puntata da \param{buf}. Occorre
2759   che il processo chiamante abbia il permesso di lettura sulla segmento.
2760 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2761   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2762   processo ad esso agganciato si sarà staccato. Questo comando può essere
2763   eseguito solo da un processo con \ids{UID} effettivo corrispondente o al
2764   creatore del segmento, o al proprietario del segmento, o all'amministratore.
2765 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2766   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2767   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2768   il creatore del segmento, oppure l'amministratore. Compiuta l'operazione
2769   aggiorna anche il valore del campo \var{shm\_ctime}.
2770 \end{basedescript}
2771
2772 Oltre ai precedenti su Linux sono definiti anche degli ulteriori comandi, che
2773 consentono di estendere le funzionalità, ovviamente non devono essere usati se
2774 si ha a cuore la portabilità. Questi comandi aggiuntivi sono:
2775
2776 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2777 \item[\const{SHM\_LOCK}] Abilita il \textit{memory locking} sul segmento di
2778   memoria condivisa, impedendo che la memoria usata per il segmento venga
2779   salvata su disco dal meccanismo della memoria virtuale. Come illustrato in
2780   sez.~\ref{sec:proc_mem_lock} fino al kernel 2.6.9 solo l'amministratore
2781   poteva utilizzare questa capacità,\footnote{che richiedeva la
2782     \textit{capability} \const{CAP\_IPC\_LOCK}.} a partire dal dal kernel
2783   2.6.10 anche gli utenti normali possono farlo fino al limite massimo
2784   determinato da \const{RLIMIT\_MEMLOCK} (vedi
2785   sez.~\ref{sec:sys_resource_limit}).
2786 \item[\const{SHM\_UNLOCK}] Disabilita il \textit{memory locking} sul segmento
2787   di memoria condivisa.  Fino al kernel 2.6.9 solo l'amministratore poteva
2788   utilizzare questo comando in corrispondenza di un segmento da lui bloccato.
2789 \end{basedescript}
2790
2791 A questi due, come per \func{msgctl} e \func{semctl}, si aggiungono tre
2792 ulteriori valori, \const{IPC\_INFO}, \const{MSG\_STAT} e \const{MSG\_INFO},
2793 introdotti ad uso del programma \cmd{ipcs} per ottenere le informazioni
2794 generali relative alle risorse usate dai segmenti di memoria condivisa. Dato
2795 che potranno essere modificati o rimossi in favore dell'uso di \texttt{/proc},
2796 non devono essere usati e non li tratteremo.
2797
2798 L'argomento \param{buf} viene utilizzato solo con i comandi \const{IPC\_STAT}
2799 e \const{IPC\_SET} nel qual caso esso dovrà puntare ad una struttura
2800 \struct{shmid\_ds} precedentemente allocata, in cui nel primo caso saranno
2801 scritti i dati del segmento di memoria restituiti dalla funzione e da cui, nel
2802 secondo caso, verranno letti i dati da impostare sul segmento.
2803
2804 Una volta che lo si è creato, per utilizzare un segmento di memoria condivisa
2805 l'interfaccia prevede due funzioni, \funcd{shmat} e \func{shmdt}. La prima di
2806 queste serve ad agganciare un segmento al processo chiamante, in modo che
2807 quest'ultimo possa inserirlo nel suo spazio di indirizzi per potervi accedere;
2808 il suo prototipo è:
2809
2810 \begin{funcproto}{
2811 \fhead{sys/types.h} 
2812 \fhead{sys/shm.h}
2813 \fdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2814
2815 \fdesc{Aggancia un segmento di memoria condivisa al processo chiamante.}
2816 }
2817
2818 {La funzione ritorna l'indirizzo del segmento in caso di successo e $-1$ (in
2819   un cast a \ctyp{void *}) per un errore, nel qual caso \var{errno} assumerà
2820   uno dei valori:
2821   \begin{errlist}
2822     \item[\errcode{EACCES}] il processo non ha i privilegi per accedere al
2823       segmento nella modalità richiesta.
2824     \item[\errcode{EINVAL}] si è specificato un identificatore invalido per
2825       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2826       per \param{shmaddr} o il valore \val{NULL} indicando \const{SHM\_REMAP}.
2827   \end{errlist}
2828   ed inoltre \errval{ENOMEM} nel suo significato generico.
2829 }  
2830 \end{funcproto}
2831
2832 La funzione inserisce un segmento di memoria condivisa all'interno dello
2833 spazio di indirizzi del processo, in modo che questo possa accedervi
2834 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2835 fig.~\ref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2836 ricordi quanto illustrato al proposito in sez.~\ref{sec:proc_mem_layout}). In
2837 particolare l'indirizzo finale del segmento dati (quello impostato da
2838 \func{brk}, vedi sez.~\ref{sec:proc_mem_alloc}) non viene influenzato.
2839 Si tenga presente infine che la funzione ha successo anche se il segmento è
2840 stato marcato per la cancellazione.
2841
2842 \begin{figure}[!htb]
2843   \centering \includegraphics[height=10cm]{img/sh_memory_layout}
2844   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2845     agganciato un segmento di memoria condivisa.}
2846   \label{fig:ipc_shmem_layout}
2847 \end{figure}
2848
2849 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{lo standard
2850   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2851   come il valore di ritorno della funzione; in Linux è stato così con le
2852   \acr{libc4} e le \acr{libc5}, con il passaggio alla \acr{glibc} il tipo di
2853   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2854   ritorno un \ctyp{void *} seguendo POSIX.1-2001.} deve essere associato il
2855 segmento, se il valore specificato è \val{NULL} è il sistema a scegliere
2856 opportunamente un'area di memoria libera (questo è il modo più portabile e
2857 sicuro di usare la funzione).  Altrimenti il kernel aggancia il segmento
2858 all'indirizzo specificato da \param{shmaddr}; questo però può avvenire solo se
2859 l'indirizzo coincide con il limite di una pagina, cioè se è un multiplo esatto
2860 del parametro di sistema \const{SHMLBA}, che in Linux è sempre uguale
2861 \const{PAGE\_SIZE}.
2862
2863 Si tenga presente però che quando si usa \val{NULL} come valore di
2864 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2865 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2866 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2867 riferiti all'indirizzo di partenza del segmento).
2868
2869 L'argomento \param{shmflg} permette di cambiare il comportamento della
2870 funzione; esso va specificato come maschera binaria, i bit utilizzati al
2871 momento sono sono tre e sono identificati dalle costanti \const{SHM\_RND},
2872 \const{SHM\_RDONLY} e \const{SHM\_REMAP} che vanno combinate con un OR
2873 aritmetico.  
2874
2875 Specificando \const{SHM\_RND} si evita che \func{shmat} ritorni un errore
2876 quando \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi
2877 usare un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2878 agganciato, ma al più vicino multiplo di \const{SHMLBA}; il nome della
2879 costante sta infatti per \textit{rounded}, e serve per specificare un
2880 indirizzo come arrotondamento.
2881
2882 L'uso di \const{SHM\_RDONLY} permette di agganciare il segmento in sola
2883 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2884 caso un tentativo di scrivere sul segmento comporterà una violazione di
2885 accesso con l'emissione di un segnale di \signal{SIGSEGV}. Il comportamento
2886 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2887 lettura e scrittura (ed il processo deve aver questi permessi in
2888 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2889 sola scrittura.
2890
2891 Infine \const{SHM\_REMAP} è una estensione specifica di Linux (quindi non
2892 portabile) che indica che la mappatura del segmento deve rimpiazzare ogni
2893 precedente mappatura esistente nell'intervallo iniziante
2894 all'indirizzo \param{shmaddr} e di dimensione pari alla lunghezza del
2895 segmento. In condizioni normali questo tipo di richiesta fallirebbe con un
2896 errore di \errval{EINVAL}. Ovviamente usando \const{SHM\_REMAP}
2897 l'argomento  \param{shmaddr} non può essere nullo. 
2898
2899 In caso di successo la funzione \func{shmat} aggiorna anche i seguenti campi
2900 della struttura \struct{shmid\_ds}:
2901 \begin{itemize*}
2902 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2903   impostato al tempo corrente.
2904 \item il \ids{PID} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2905   segmento viene impostato a quello del processo corrente.
2906 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2907   aumentato di uno.
2908 \end{itemize*}
2909
2910 Come accennato in sez.~\ref{sec:proc_fork} un segmento di memoria condivisa
2911 agganciato ad un processo viene ereditato da un figlio attraverso una
2912 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2913 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2914 eseguito un diverso programma con uno spazio di indirizzi completamente
2915 diverso, tutti i segmenti agganciati al processo originario vengono
2916 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2917 attraverso una \func{exit}.
2918
2919 Una volta che un segmento di memoria condivisa non serve più, si può
2920 sganciarlo esplicitamente dal processo usando l'altra funzione
2921 dell'interfaccia, \funcd{shmdt}, il cui prototipo è:
2922
2923 \begin{funcproto}{
2924 \fhead{sys/types.h} 
2925 \fhead{sys/shm.h}
2926 \fdecl{int shmdt(const void *shmaddr)}
2927
2928 \fdesc{Sgancia dal processo un segmento di memoria condivisa.}
2929 }
2930
2931 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, la funzione
2932   fallisce solo quando non c'è un segmento agganciato
2933   all'indirizzo \param{shmaddr}, con \var{errno} che assume il valore
2934   \errval{EINVAL}.  
2935 }  
2936 \end{funcproto}
2937
2938 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2939 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2940 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2941 agganciato al processo.
2942
2943 In caso di successo la funzione aggiorna anche i seguenti campi di
2944 \struct{shmid\_ds}:
2945 \begin{itemize*}
2946 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2947   impostato al tempo corrente.
2948 \item il \ids{PID} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2949   segmento viene impostato a quello del processo corrente.
2950 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2951   decrementato di uno.
2952 \end{itemize*} 
2953 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2954 viene tolta dallo spazio di indirizzi del processo.
2955
2956 \begin{figure}[!htbp]
2957   \footnotesize \centering
2958   \begin{minipage}[c]{\codesamplewidth}
2959     \includecodesample{listati/SharedMem.c}
2960   \end{minipage} 
2961   \normalsize 
2962   \caption{Il codice delle funzioni che permettono di creare, trovare e
2963     rimuovere un segmento di memoria condivisa.}
2964   \label{fig:ipc_sysv_shm_func}
2965 \end{figure}
2966
2967 Come esempio di uso di queste funzioni vediamo come implementare una serie di
2968 funzioni di libreria che ne semplifichino l'uso, automatizzando le operazioni
2969 più comuni; il codice, contenuto nel file \file{SharedMem.c}, è riportato in
2970 fig.~\ref{fig:ipc_sysv_shm_func}.
2971
2972 La prima funzione (\texttt{\small 1-16}) è \func{ShmCreate} che, data una
2973 chiave, crea il segmento di memoria condivisa restituendo il puntatore allo
2974 stesso. La funzione comincia (\texttt{\small 6}) con il chiamare
2975 \func{shmget}, usando il flag \const{IPC\_CREATE} per creare il segmento
2976 qualora non esista, ed assegnandogli i privilegi specificati dall'argomento
2977 \var{perm} e la dimensione specificata dall'argomento \var{shm\_size}.  In
2978 caso di errore (\texttt{\small 7-9}) si ritorna immediatamente un puntatore
2979 nullo, altrimenti (\texttt{\small 10}) si prosegue agganciando il segmento di
2980 memoria condivisa al processo con \func{shmat}. In caso di errore
2981 (\texttt{\small 11-13}) si restituisce di nuovo un puntatore nullo, infine
2982 (\texttt{\small 14}) si inizializza con \func{memset} il contenuto del
2983 segmento al valore costante specificato dall'argomento \var{fill}, e poi si
2984 ritorna il puntatore al segmento stesso.
2985
2986 La seconda funzione (\texttt{\small 17-31}) è \func{ShmFind}, che, data una
2987 chiave, restituisce l'indirizzo del segmento ad essa associato. Anzitutto
2988 (\texttt{\small 22}) si richiede l'identificatore del segmento con
2989 \func{shmget}, ritornando (\texttt{\small 23-25}) un puntatore nullo in caso
2990 di errore. Poi si prosegue (\texttt{\small 26}) agganciando il segmento al
2991 processo con \func{shmat}, restituendo (\texttt{\small 27-29}) di nuovo un
2992 puntatore nullo in caso di errore, se invece non ci sono errori si restituisce
2993 il puntatore ottenuto da \func{shmat}.
2994
2995 La terza funzione (\texttt{\small 32-51}) è \func{ShmRemove} che, data la
2996 chiave ed il puntatore associati al segmento di memoria condivisa, prima lo
2997 sgancia dal processo e poi lo rimuove. Il primo passo (\texttt{\small 37}) è
2998 la chiamata a \func{shmdt} per sganciare il segmento, restituendo
2999 (\texttt{\small 38-39}) un valore -1 in caso di errore. Il passo successivo
3000 (\texttt{\small 41}) è utilizzare \func{shmget} per ottenere l'identificatore
3001 associato al segmento data la chiave \var{key}. Al solito si restituisce un
3002 valore di -1 (\texttt{\small 42-45}) in caso di errore, mentre se tutto va
3003 bene si conclude restituendo un valore nullo.
3004
3005 Benché la memoria condivisa costituisca il meccanismo di intercomunicazione
3006 fra processi più veloce, essa non è sempre il più appropriato, dato che, come
3007 abbiamo visto, si avrà comunque la necessità di una sincronizzazione degli
3008 accessi.  Per questo motivo, quando la comunicazione fra processi è
3009 sequenziale, altri meccanismi come le \textit{pipe}, le \textit{fifo} o i
3010 socket, che non necessitano di sincronizzazione esplicita, sono da
3011 preferire. Essa diventa l'unico meccanismo possibile quando la comunicazione
3012 non è sequenziale\footnote{come accennato in sez.~\ref{sec:ipc_sysv_mq} per la
3013   comunicazione non sequenziale si possono usare le code di messaggi,
3014   attraverso l'uso del campo \var{mtype}, ma solo se quest'ultima può essere
3015   effettuata in forma di messaggio.} o quando non può avvenire secondo una
3016 modalità predefinita.
3017
3018 Un esempio classico di uso della memoria condivisa è quello del
3019 ``\textit{monitor}'', in cui viene per scambiare informazioni fra un processo
3020 server, che vi scrive dei dati di interesse generale che ha ottenuto, e i
3021 processi client interessati agli stessi dati che così possono leggerli in
3022 maniera completamente asincrona.  Con questo schema di funzionamento da una
3023 parte si evita che ciascun processo client debba compiere l'operazione,
3024 potenzialmente onerosa, di ricavare e trattare i dati, e dall'altra si evita
3025 al processo server di dover gestire l'invio a tutti i client di tutti i dati
3026 (non potendo il server sapere quali di essi servono effettivamente al singolo
3027 client).
3028
3029 Nel nostro caso implementeremo un ``\textsl{monitor}'' di una directory: un
3030 processo si incaricherà di tenere sotto controllo alcuni parametri relativi ad
3031 una directory (il numero dei file contenuti, la dimensione totale, quante
3032 directory, link simbolici, file normali, ecc.) che saranno salvati in un
3033 segmento di memoria condivisa cui altri processi potranno accedere per
3034 ricavare la parte di informazione che interessa.
3035
3036 In fig.~\ref{fig:ipc_dirmonitor_main} si è riportata la sezione principale del
3037 corpo del programma server, insieme alle definizioni delle altre funzioni
3038 usate nel programma e delle variabili globali, omettendo tutto quello che
3039 riguarda la gestione delle opzioni e la stampa delle istruzioni di uso a
3040 video; al solito il codice completo si trova con i sorgenti allegati nel file
3041 \file{DirMonitor.c}.
3042
3043 \begin{figure}[!htbp]
3044   \footnotesize \centering
3045   \begin{minipage}[c]{\codesamplewidth}
3046     \includecodesample{listati/DirMonitor.c}
3047   \end{minipage} 
3048   \normalsize 
3049   \caption{Codice della funzione principale del programma \file{DirMonitor.c}.}
3050   \label{fig:ipc_dirmonitor_main}
3051 \end{figure}
3052
3053 Il programma usa delle variabili globali (\texttt{\small 2-14}) per mantenere
3054 i valori relativi agli oggetti usati per la comunicazione inter-processo; si è
3055 definita inoltre una apposita struttura \struct{DirProp} che contiene i dati
3056 relativi alle proprietà che si vogliono mantenere nella memoria condivisa, per
3057 l'accesso da parte dei client.
3058
3059 Il programma, dopo la sezione, omessa, relativa alla gestione delle opzioni da
3060 riga di comando (che si limitano alla eventuale stampa di un messaggio di
3061 aiuto a video ed all'impostazione della durata dell'intervallo con cui viene
3062 ripetuto il calcolo delle proprietà della directory) controlla (\texttt{\small
3063   20-23}) che sia stato specificato l'argomento necessario contenente il nome
3064 della directory da tenere sotto controllo, senza il quale esce immediatamente
3065 con un messaggio di errore.
3066
3067 Poi, per verificare che l'argomento specifichi effettivamente una directory,
3068 si esegue (\texttt{\small 24-26}) su di esso una \func{chdir}, uscendo
3069 immediatamente in caso di errore.  Questa funzione serve anche per impostare
3070 la directory di lavoro del programma nella directory da tenere sotto
3071 controllo, in vista del successivo uso della funzione \func{daemon}. Si noti
3072 come si è potuta fare questa scelta, nonostante le indicazioni illustrate in
3073 sez.~\ref{sec:sess_daemon}, per il particolare scopo del programma, che
3074 necessita comunque di restare all'interno di una directory.
3075
3076 Infine (\texttt{\small 27-29}) si installano i gestori per i vari segnali di
3077 terminazione che, avendo a che fare con un programma che deve essere eseguito
3078 come server, sono il solo strumento disponibile per concluderne l'esecuzione.
3079
3080 Il passo successivo (\texttt{\small 30-39}) è quello di creare gli oggetti di
3081 intercomunicazione necessari. Si inizia costruendo (\texttt{\small 30}) la
3082 chiave da usare come riferimento con il nome del programma,\footnote{si è
3083   usato un riferimento relativo alla home dell'utente, supposto che i sorgenti
3084   di GaPiL siano stati installati direttamente in essa; qualora si effettui
3085   una installazione diversa si dovrà correggere il programma.} dopo di che si
3086 richiede (\texttt{\small 31}) la creazione di un segmento di memoria condivisa
3087 con usando la funzione \func{ShmCreate} illustrata in precedenza (una pagina
3088 di memoria è sufficiente per i dati che useremo), uscendo (\texttt{\small
3089   32-35}) qualora la creazione ed il successivo agganciamento al processo non
3090 abbia successo. Con l'indirizzo \var{shmptr} così ottenuto potremo poi
3091 accedere alla memoria condivisa, che, per come abbiamo lo abbiamo definito,
3092 sarà vista nella forma data da \struct{DirProp}. Infine (\texttt{\small
3093   36-39}) utilizzando sempre la stessa chiave, si crea, tramite le funzioni
3094 di interfaccia già descritte in sez.~\ref{sec:ipc_sysv_sem}, anche un mutex,
3095 che utilizzeremo per regolare l'accesso alla memoria condivisa.
3096
3097 Completata l'inizializzazione e la creazione degli oggetti di
3098 intercomunicazione il programma entra nel ciclo principale (\texttt{\small
3099   40-49}) dove vengono eseguite indefinitamente le attività di monitoraggio.
3100 Il primo passo (\texttt{\small 41}) è eseguire \func{daemon} per proseguire
3101 con l'esecuzione in background come si conviene ad un programma demone; si
3102 noti che si è mantenuta, usando un valore non nullo del primo argomento, la
3103 directory di lavoro corrente.  Una volta che il programma è andato in
3104 background l'esecuzione prosegue all'interno di un ciclo infinito
3105 (\texttt{\small 42-48}).
3106
3107 Si inizia (\texttt{\small 43}) bloccando il mutex con \func{MutexLock} per
3108 poter accedere alla memoria condivisa (la funzione si bloccherà
3109 automaticamente se qualche client sta leggendo), poi (\texttt{\small 44}) si
3110 cancellano i valori precedentemente immagazzinati nella memoria condivisa con
3111 \func{memset}, e si esegue (\texttt{\small 45}) un nuovo calcolo degli stessi
3112 utilizzando la funzione \myfunc{dir\_scan}; infine (\texttt{\small 46}) si
3113 sblocca il mutex con \func{MutexUnlock}, e si attende (\texttt{\small 47}) per
3114 il periodo di tempo specificato a riga di comando con l'opzione \code{-p}
3115 usando una \func{sleep}.
3116
3117 Si noti come per il calcolo dei valori da mantenere nella memoria condivisa si
3118 sia usata ancora una volta la funzione \myfunc{dir\_scan}, già utilizzata (e
3119 descritta in dettaglio) in sez.~\ref{sec:file_dir_read}, che ci permette di
3120 effettuare la scansione delle voci della directory, chiamando per ciascuna di
3121 esse la funzione \func{ComputeValues}, che esegue tutti i calcoli necessari.
3122
3123 \begin{figure}[!htbp]
3124   \footnotesize \centering
3125   \begin{minipage}[c]{\codesamplewidth}
3126     \includecodesample{listati/ComputeValues.c}
3127   \end{minipage} 
3128   \normalsize 
3129   \caption{Codice delle funzioni ausiliarie usate da \file{DirMonitor.c}.}
3130   \label{fig:ipc_dirmonitor_sub}
3131 \end{figure}
3132
3133
3134 Il codice di quest'ultima è riportato in fig.~\ref{fig:ipc_dirmonitor_sub}.
3135 Come si vede la funzione (\texttt{\small 2-16}) è molto semplice e si limita a
3136 chiamare (\texttt{\small 5}) la funzione \func{stat} sul file indicato da
3137 ciascuna voce, per ottenerne i dati, che poi utilizza per incrementare i vari
3138 contatori nella memoria condivisa, cui accede grazie alla variabile globale
3139 \var{shmptr}.
3140
3141 Dato che la funzione è chiamata da \myfunc{dir\_scan}, si è all'interno del
3142 ciclo principale del programma, con un mutex acquisito, perciò non è
3143 necessario effettuare nessun controllo e si può accedere direttamente alla
3144 memoria condivisa usando \var{shmptr} per riempire i campi della struttura
3145 \struct{DirProp}; così prima (\texttt{\small 6-7}) si sommano le dimensioni
3146 dei file ed il loro numero, poi, utilizzando le macro di
3147 tab.~\ref{tab:file_type_macro}, si contano (\texttt{\small 8-14}) quanti ce
3148 ne sono per ciascun tipo.
3149
3150 In fig.~\ref{fig:ipc_dirmonitor_sub} è riportato anche il codice
3151 (\texttt{\small 17-23}) del gestore dei segnali di terminazione, usato per
3152 chiudere il programma. Esso, oltre a provocare l'uscita del programma, si
3153 incarica anche di cancellare tutti gli oggetti di intercomunicazione non più
3154 necessari.  Per questo anzitutto (\texttt{\small 19}) acquisisce il mutex con
3155 \func{MutexLock}, per evitare di operare mentre un client sta ancora leggendo
3156 i dati, dopo di che (\texttt{\small 20}) distacca e rimuove il segmento di
3157 memoria condivisa usando \func{ShmRemove}.  Infine (\texttt{\small 21})
3158 rimuove il mutex con \func{MutexRemove} ed esce (\texttt{\small 22}).
3159
3160 \begin{figure}[!htbp]
3161   \footnotesize \centering
3162   \begin{minipage}[c]{\codesamplewidth}
3163     \includecodesample{listati/ReadMonitor.c}
3164   \end{minipage} 
3165   \normalsize 
3166   \caption{Codice del programma client del monitor delle proprietà di una
3167     directory, \file{ReadMonitor.c}.}
3168   \label{fig:ipc_dirmonitor_client}
3169 \end{figure}
3170
3171 Il codice del client usato per leggere le informazioni mantenute nella memoria
3172 condivisa è riportato in fig.~\ref{fig:ipc_dirmonitor_client}. Al solito si è
3173 omessa la sezione di gestione delle opzioni e la funzione che stampa a video
3174 le istruzioni; il codice completo è nei sorgenti allegati, nel file
3175 \file{ReadMonitor.c}.
3176
3177 Una volta conclusa la gestione delle opzioni a riga di comando il programma
3178 rigenera (\texttt{\small 7}) con \func{ftok} la stessa chiave usata dal server
3179 per identificare il segmento di memoria condivisa ed il mutex, poi
3180 (\texttt{\small 8}) richiede con \func{ShmFind} l'indirizzo della memoria
3181 condivisa agganciando al contempo il segmento al processo, Infine
3182 (\texttt{\small 17-20}) con \func{MutexFind} si richiede l'identificatore del
3183 mutex.  Completata l'inizializzazione ed ottenuti i riferimenti agli oggetti
3184 di intercomunicazione necessari viene eseguito il corpo principale del
3185 programma (\texttt{\small 21-33}); si comincia (\texttt{\small 22})
3186 acquisendo il mutex con \func{MutexLock}; qui avviene il blocco del processo
3187 se la memoria condivisa non è disponibile.  Poi (\texttt{\small 23-31}) si
3188 stampano i vari valori mantenuti nella memoria condivisa attraverso l'uso di
3189 \var{shmptr}.  Infine (\texttt{\small 41}) con \func{MutexUnlock} si rilascia
3190 il mutex, prima di uscire.
3191
3192 Verifichiamo allora il funzionamento dei nostri programmi; al solito, usando
3193 le funzioni di libreria occorre definire opportunamente
3194 \code{LD\_LIBRARY\_PATH}; poi si potrà lanciare il server con:
3195 \begin{Console}
3196 [piccardi@gont sources]$ \textbf{./dirmonitor ./}
3197 \end{Console}
3198 %$
3199 ed avendo usato \func{daemon} il comando ritornerà immediatamente. Una volta
3200 che il server è in esecuzione, possiamo passare ad invocare il client per
3201 verificarne i risultati, in tal caso otterremo:
3202 \begin{Console}
3203 [piccardi@gont sources]$ \textbf{./readmon} 
3204 Ci sono 68 file dati
3205 Ci sono 3 directory
3206 Ci sono 0 link
3207 Ci sono 0 fifo
3208 Ci sono 0 socket
3209 Ci sono 0 device a caratteri
3210 Ci sono 0 device a blocchi
3211 Totale  71 file, per 489831 byte
3212 \end{Console}
3213 %$
3214 ed un rapido calcolo (ad esempio con \code{ls -a | wc} per contare i file) ci
3215 permette di verificare che il totale dei file è giusto. Un controllo con
3216 \cmd{ipcs} ci permette inoltre di verificare la presenza di un segmento di
3217 memoria condivisa e di un semaforo:
3218 \begin{Console}
3219 [piccardi@gont sources]$ \textbf{ipcs}
3220 ------ Shared Memory Segments --------
3221 key        shmid      owner      perms      bytes      nattch     status      
3222 0xffffffff 54067205   piccardi  666        4096       1                       
3223
3224 ------ Semaphore Arrays --------
3225 key        semid      owner      perms      nsems     
3226 0xffffffff 229376     piccardi  666        1         
3227
3228 ------ Message Queues --------
3229 key        msqid      owner      perms      used-bytes   messages    
3230 \end{Console}
3231 %$
3232
3233 Se a questo punto aggiungiamo un file, ad esempio con \code{touch prova},
3234 potremo verificare che, passati nel peggiore dei casi almeno 10 secondi (o
3235 l'eventuale altro intervallo impostato per la rilettura dei dati) avremo:
3236 \begin{Console}
3237 [piccardi@gont sources]$ \textbf{./readmon} 
3238 Ci sono 69 file dati
3239 Ci sono 3 directory
3240 Ci sono 0 link
3241 Ci sono 0 fifo
3242 Ci sono 0 socket
3243 Ci sono 0 device a caratteri
3244 Ci sono 0 device a blocchi
3245 Totale  72 file, per 489887 byte
3246 \end{Console}
3247 %$
3248
3249 A questo punto possiamo far uscire il server inviandogli un segnale di
3250 \signal{SIGTERM} con il comando \code{killall dirmonitor}, a questo punto
3251 ripetendo la lettura, otterremo un errore:
3252 \begin{Console}
3253 [piccardi@gont sources]$ \textbf{./readmon} 
3254 Cannot find shared memory: No such file or directory
3255 \end{Console}
3256 %$
3257 e inoltre potremo anche verificare che anche gli oggetti di intercomunicazione
3258 visti in precedenza sono stati regolarmente  cancellati:
3259 \begin{Console}
3260 [piccardi@gont sources]$ \textbf{ipcs}
3261 ------ Shared Memory Segments --------
3262 key        shmid      owner      perms      bytes      nattch     status      
3263
3264 ------ Semaphore Arrays --------
3265 key        semid      owner      perms      nsems     
3266
3267 ------ Message Queues --------
3268 key        msqid      owner      perms      used-bytes   messages    
3269 \end{Console}
3270 %$
3271
3272
3273 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
3274 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
3275 %% condivisa; uno schema semplificato della struttura è illustrato in
3276 %% fig.~\ref{fig:ipc_shm_struct}. 
3277
3278 %% \begin{figure}[!htb]
3279 %%   \centering
3280 %%   \includegraphics[width=10cm]{img/shmstruct}
3281 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
3282 %%     Linux.}
3283 %%   \label{fig:ipc_shm_struct}
3284 %% \end{figure}
3285
3286
3287
3288
3289 \section{Tecniche alternative}
3290 \label{sec:ipc_alternatives}
3291
3292 Come abbiamo detto in sez.~\ref{sec:ipc_sysv_generic}, e ripreso nella
3293 descrizione dei singoli oggetti che ne fan parte, il \textit{SysV-IPC}
3294 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
3295   capitolo 14.}  Stevens ne effettua una accurata analisi (alcuni dei concetti
3296 sono già stati accennati in precedenza) ed elenca alcune possibili tecniche
3297 alternative, che vogliamo riprendere in questa sezione.
3298
3299
3300 \subsection{Alternative alle code di messaggi}
3301 \label{sec:ipc_mq_alternative}
3302  
3303 Le code di messaggi sono probabilmente il meno usato degli oggetti del
3304 \textit{SysV-IPC}; esse infatti nacquero principalmente come meccanismo di
3305 comunicazione bidirezionale quando ancora le \textit{pipe} erano
3306 unidirezionali; con la disponibilità di \func{socketpair} (vedi
3307 sez.~\ref{sec:ipc_socketpair}) o utilizzando una coppia di \textit{pipe}, si
3308 può ottenere questo risultato senza incorrere nelle complicazioni introdotte
3309 dal \textit{SysV-IPC}.
3310
3311 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
3312 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
3313 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
3314 sono impossibili da ottenere con le \textit{pipe} e i socket di
3315 \func{socketpair}.  A queste esigenze però si può comunque ovviare in maniera
3316 diversa con un uso combinato della memoria condivisa e dei meccanismi di
3317 sincronizzazione, per cui alla fine l'uso delle code di messaggi classiche è
3318 relativamente poco diffuso.
3319
3320 % TODO: trattare qui, se non si trova posto migliore, copy_from_process e
3321 % copy_to_process, introdotte con il kernel 3.2. Vedi
3322 % http://lwn.net/Articles/405346/ e
3323 % http://ozlabs.org/~cyeoh/cma/process_vm_readv.txt 
3324
3325
3326 \subsection{I \textsl{file di lock}}
3327 \label{sec:ipc_file_lock}
3328
3329 \index{file!di~lock|(}
3330
3331 Come illustrato in sez.~\ref{sec:ipc_sysv_sem} i semafori del \textit{SysV-IPC}
3332 presentano una interfaccia inutilmente complessa e con alcuni difetti
3333 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
3334 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
3335 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
3336 necessità di un contatore come i semafori, si possono utilizzare metodi
3337 alternativi.
3338
3339 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
3340 dei \textsl{file di lock} (per i quali è stata anche riservata una opportuna
3341 directory, \file{/var/lock}, nella standardizzazione del \textit{Filesystem
3342   Hierarchy Standard}). Per questo si usa la caratteristica della funzione
3343 \func{open} (illustrata in sez.~\ref{sec:file_open_close}) che
3344 prevede\footnote{questo è quanto dettato dallo standard POSIX.1, ciò non
3345   toglie che in alcune implementazioni questa tecnica possa non funzionare; in
3346   particolare per Linux, nel caso di NFS, si è comunque soggetti alla
3347   possibilità di una \textit{race condition}.} che essa ritorni un errore
3348 quando usata con i flag di \const{O\_CREAT} e \const{O\_EXCL}. In tal modo la
3349 creazione di un \textsl{file di lock} può essere eseguita atomicamente, il
3350 processo che crea il file con successo si può considerare come titolare del
3351 lock (e della risorsa ad esso associata) mentre il rilascio si può eseguire
3352 con una chiamata ad \func{unlink}.
3353
3354 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3355 \func{LockFile} ed \func{UnlockFile} riportate in fig.~\ref{fig:ipc_file_lock}
3356 (sono contenute in \file{LockFile.c}, un altro dei sorgenti allegati alla
3357 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3358   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3359 (\texttt{\small 4-10}) si limita ad aprire il file di lock (\texttt{\small
3360   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11-17}) lo
3361 cancella con \func{unlink}.
3362
3363 \begin{figure}[!htbp]
3364   \footnotesize \centering
3365   \begin{minipage}[c]{\codesamplewidth}
3366     \includecodesample{listati/LockFile.c}
3367   \end{minipage} 
3368   \normalsize 
3369   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3370     permettono di creare e rimuovere un \textsl{file di lock}.}
3371   \label{fig:ipc_file_lock}
3372 \end{figure}
3373
3374 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3375 sez.~\ref{sec:file_open_close}, questo comportamento di \func{open} può non
3376 funzionare (la funzione viene eseguita, ma non è garantita l'atomicità
3377 dell'operazione) se il filesystem su cui si va ad operare è su NFS; in tal
3378 caso si può adottare una tecnica alternativa che prevede l'uso della
3379 \func{link} per creare come \textsl{file di lock} un hard link ad un file
3380 esistente; se il link esiste già e la funzione fallisce, significa che la
3381 risorsa è bloccata e potrà essere sbloccata solo con un \func{unlink},
3382 altrimenti il link è creato ed il lock acquisito; il controllo e l'eventuale
3383 acquisizione sono atomici; la soluzione funziona anche su NFS, ma ha un altro
3384 difetto è che è quello di poterla usare solo se si opera all'interno di uno
3385 stesso filesystem.
3386
3387 In generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3388 problemi che non lo rendono una alternativa praticabile per la
3389 sincronizzazione: anzitutto in caso di terminazione imprevista del processo,
3390 si lascia allocata la risorsa (il \textsl{file di lock}) e questa deve essere
3391 sempre cancellata esplicitamente.  Inoltre il controllo della disponibilità
3392 può essere eseguito solo con una tecnica di \itindex{polling}
3393 \textit{polling}, ed è quindi molto inefficiente.
3394
3395 La tecnica dei file di lock ha comunque una sua utilità, e può essere usata
3396 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3397 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3398 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3399 più programmi: qualora si trovi un file di lock il programma che cerca di
3400 accedere alla seriale si limita a segnalare che la risorsa non è disponibile.
3401
3402 \index{file!di~lock|)}
3403
3404
3405 \subsection{La sincronizzazione con il \textit{file locking}}
3406 \label{sec:ipc_lock_file}
3407
3408 Dato che i file di lock presentano gli inconvenienti illustrati in precedenza,
3409 la tecnica alternativa di sincronizzazione più comune è quella di fare ricorso
3410 al \itindex{file~locking} \textit{file locking} (trattato in
3411 sez.~\ref{sec:file_locking}) usando \func{fcntl} su un file creato per
3412 l'occasione per ottenere un write lock. In questo modo potremo usare il lock
3413 come un \textit{mutex}: per bloccare la risorsa basterà acquisire il lock, per
3414 sbloccarla basterà rilasciare il lock. Una richiesta fatta con un write lock
3415 metterà automaticamente il processo in stato di attesa, senza necessità di
3416 ricorrere al \itindex{polling} \textit{polling} per determinare la
3417 disponibilità della risorsa, e al rilascio della stessa da parte del processo
3418 che la occupava si otterrà il nuovo lock atomicamente.
3419
3420 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3421 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3422 chiusura dei relativi file) e non ci si deve preoccupare di niente; inoltre
3423 non consuma risorse permanentemente allocate nel sistema. Lo svantaggio è che,
3424 dovendo fare ricorso a delle operazioni sul filesystem, esso è in genere
3425 leggermente più lento.
3426
3427 \begin{figure}[!htbp]
3428   \footnotesize \centering
3429   \begin{minipage}[c]{\codesamplewidth}
3430     \includecodesample{listati/MutexLocking.c}
3431   \end{minipage} 
3432   \normalsize 
3433   \caption{Il codice delle funzioni che permettono per la gestione dei 
3434     \textit{mutex} con il \itindex{file~locking} \textit{file locking}.}
3435   \label{fig:ipc_flock_mutex}
3436 \end{figure}
3437
3438 Il codice delle varie funzioni usate per implementare un mutex utilizzando il
3439 \textit{file locking} \itindex{file~locking} è riportato in
3440 fig.~\ref{fig:ipc_flock_mutex}; si è mantenuta volutamente una struttura
3441 analoga alle precedenti funzioni che usano i semafori, anche se le due
3442 interfacce non possono essere completamente equivalenti, specie per quanto
3443 riguarda la rimozione del mutex.
3444
3445 La prima funzione (\texttt{\small 1-5}) è \func{CreateMutex}, e serve a
3446 creare il mutex; la funzione è estremamente semplice, e si limita
3447 (\texttt{\small 4}) a creare, con una opportuna chiamata ad \func{open}, il
3448 file che sarà usato per il successivo \textit{file locking}, assicurandosi che
3449 non esista già (nel qual caso segnala un errore); poi restituisce il file
3450 descriptor che sarà usato dalle altre funzioni per acquisire e rilasciare il
3451 mutex.
3452
3453 La seconda funzione (\texttt{\small 6-10}) è \func{FindMutex}, che, come la
3454 precedente, è stata definita per mantenere una analogia con la corrispondente
3455 funzione basata sui semafori. Anch'essa si limita (\texttt{\small 9}) ad
3456 aprire il file da usare per il \itindex{file~locking} \textit{file locking},
3457 solo che in questo caso le opzioni di \func{open} sono tali che il file in
3458 questione deve esistere di già.
3459
3460 La terza funzione (\texttt{\small 11-22}) è \func{LockMutex} e serve per
3461 acquisire il mutex. La funzione definisce (\texttt{\small 14}) e inizializza
3462 (\texttt{\small 16-19}) la struttura \var{lock} da usare per acquisire un
3463 write lock sul file, che poi (\texttt{\small 21}) viene richiesto con
3464 \func{fcntl}, restituendo il valore di ritorno di quest'ultima. Se il file è
3465 libero il lock viene acquisito e la funzione ritorna immediatamente;
3466 altrimenti \func{fcntl} si bloccherà (si noti che la si è chiamata con
3467 \const{F\_SETLKW}) fino al rilascio del lock.
3468
3469 La quarta funzione (\texttt{\small 24-34}) è \func{UnlockMutex} e serve a
3470 rilasciare il mutex. La funzione è analoga alla precedente, solo che in questo
3471 caso si inizializza (\texttt{\small 28-31}) la struttura \var{lock} per il
3472 rilascio del lock, che viene effettuato (\texttt{\small 33}) con la opportuna
3473 chiamata a \func{fcntl}. Avendo usato il \itindex{file~locking} \textit{file
3474   locking} in semantica POSIX (si riveda quanto detto
3475 sez.~\ref{sec:file_posix_lock}) solo il processo che ha precedentemente
3476 eseguito il lock può sbloccare il mutex.
3477
3478 La quinta funzione (\texttt{\small 36-39}) è \func{RemoveMutex} e serve a
3479 cancellare il mutex. Anche questa funzione è stata definita per mantenere una
3480 analogia con le funzioni basate sui semafori, e si limita a cancellare
3481 (\texttt{\small 38}) il file con una chiamata ad \func{unlink}. Si noti che in
3482 questo caso la funzione non ha effetto sui mutex già ottenuti con precedenti
3483 chiamate a \func{FindMutex} o \func{CreateMutex}, che continueranno ad essere
3484 disponibili fintanto che i relativi file descriptor restano aperti. Pertanto
3485 per rilasciare un mutex occorrerà prima chiamare \func{UnlockMutex} oppure
3486 chiudere il file usato per il lock.
3487
3488 La sesta funzione (\texttt{\small 41-55}) è \func{ReadMutex} e serve a
3489 leggere lo stato del mutex. In questo caso si prepara (\texttt{\small 46-49})
3490 la solita struttura \var{lock} come l'acquisizione del lock, ma si effettua
3491 (\texttt{\small 51}) la chiamata a \func{fcntl} usando il comando
3492 \const{F\_GETLK} per ottenere lo stato del lock, e si restituisce
3493 (\texttt{\small 52}) il valore di ritorno in caso di errore, ed il valore del
3494 campo \var{l\_type} (che descrive lo stato del lock) altrimenti
3495 (\texttt{\small 54}). Per questo motivo la funzione restituirà -1 in caso di
3496 errore e uno dei due valori \const{F\_UNLCK} o \const{F\_WRLCK}\footnote{non
3497   si dovrebbe mai avere il terzo valore possibile, \const{F\_RDLCK}, dato che
3498   la nostra interfaccia usa solo i write lock. Però è sempre possibile che
3499   siano richiesti altri lock sul file al di fuori dell'interfaccia, nel qual
3500   caso si potranno avere, ovviamente, interferenze indesiderate.} in caso di
3501 successo, ad indicare che il mutex è, rispettivamente, libero o occupato.
3502
3503 Basandosi sulla semantica dei file lock POSIX valgono tutte le considerazioni
3504 relative al comportamento di questi ultimi fatte in
3505 sez.~\ref{sec:file_posix_lock}; questo significa ad esempio che, al contrario
3506 di quanto avveniva con l'interfaccia basata sui semafori, chiamate multiple a
3507 \func{UnlockMutex} o \func{LockMutex} non si cumulano e non danno perciò
3508 nessun inconveniente.
3509
3510
3511 \subsection{Il \textit{memory mapping} anonimo}
3512 \label{sec:ipc_mmap_anonymous}
3513
3514 \itindbeg{memory~mapping} Abbiamo già visto che quando i processi sono
3515 \textsl{correlati}, se cioè hanno almeno un progenitore comune, l'uso delle
3516 \textit{pipe} può costituire una valida alternativa alle code di messaggi;
3517 nella stessa situazione si può evitare l'uso di una memoria condivisa facendo
3518 ricorso al cosiddetto \textit{memory mapping} anonimo.
3519
3520 In sez.~\ref{sec:file_memory_map} abbiamo visto come sia possibile mappare il
3521 contenuto di un file nella memoria di un processo, e che, quando viene usato
3522 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3523 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3524 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3525 inefficiente, in quanto occorre passare attraverso il disco. 
3526
3527 Però abbiamo visto anche che se si esegue la mappatura con il flag
3528 \const{MAP\_ANONYMOUS} la regione mappata non viene associata a nessun file,
3529 anche se quanto scritto rimane in memoria e può essere riletto; allora, dato
3530 che un processo figlio mantiene nel suo spazio degli indirizzi anche le
3531 regioni mappate, esso sarà anche in grado di accedere a quanto in esse è
3532 contenuto.
3533
3534 In questo modo diventa possibile creare una memoria condivisa fra processi
3535 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3536 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3537   funzionalità simile a questa viene implementata mappando il file speciale
3538   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3539   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3540   restano in memoria e possono essere riletti secondo le stesse modalità usate
3541   nel \textit{memory mapping} anonimo.} Vedremo come utilizzare questa tecnica
3542 più avanti, quando realizzeremo una nuova versione del monitor visto in
3543 sez.~\ref{sec:ipc_sysv_shm} che possa restituisca i risultati via rete.
3544 \itindend{memory~mapping}
3545
3546 % TODO: fare esempio di mmap anonima
3547
3548 % TODO: con il kernel 3.2 è stata introdotta un nuovo meccanismo di
3549 % intercomunicazione veloce chiamato Cross Memory Attach, da capire se e come
3550 % trattarlo qui, vedi http://lwn.net/Articles/405346/
3551 % https://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commitdiff;h=fcf634098c00dd9cd247447368495f0b79be12d1
3552
3553 % TODO: con il kernel 3.17 è stata introdotta una fuunzionalità di
3554 % sigillatura dei file mappati in memoria e la system call memfd
3555 % (capire se va messo qui o altrove) vedi: http://lwn.net/Articles/593918/
3556
3557
3558 \section{L'intercomunicazione fra processi di POSIX}
3559 \label{sec:ipc_posix}
3560
3561 Per superare i numerosi problemi del \textit{SysV-IPC}, evidenziati per i suoi
3562 aspetti generali in coda a sez.~\ref{sec:ipc_sysv_generic} e per i singoli
3563 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3564 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3565 una interfaccia completamente nuova, che tratteremo in questa sezione.
3566
3567
3568 \subsection{Considerazioni generali}
3569 \label{sec:ipc_posix_generic}
3570
3571 Oggi Linux supporta tutti gli oggetti definito nello standard POSIX per l'IPC,
3572 ma a lungo non è stato così; la memoria condivisa è presente a partire dal
3573 kernel 2.4.x, i semafori sono forniti dalla \acr{glibc} nella sezione che
3574 implementa i \itindex{thread} \textit{thread} POSIX di nuova generazione che
3575 richiedono il kernel 2.6, le code di messaggi sono supportate a partire dal
3576 kernel 2.6.6.
3577
3578 La caratteristica fondamentale dell'interfaccia POSIX è l'abbandono dell'uso
3579 degli identificatori e delle chiavi visti nel \textit{SysV-IPC}, per passare ai
3580 \itindex{POSIX~IPC~names} \textit{POSIX IPC names}, che sono sostanzialmente
3581 equivalenti ai nomi dei file. Tutte le funzioni che creano un oggetto di IPC
3582 POSIX prendono come primo argomento una stringa che indica uno di questi nomi;
3583 lo standard è molto generico riguardo l'implementazione, ed i nomi stessi
3584 possono avere o meno una corrispondenza sul filesystem; tutto quello che è
3585 richiesto è che:
3586 \begin{itemize*}
3587 \item i nomi devono essere conformi alle regole che caratterizzano i
3588   \textit{pathname}, in particolare non essere più lunghi di \const{PATH\_MAX}
3589   byte e terminati da un carattere nullo.
3590 \item se il nome inizia per una \texttt{/} chiamate differenti allo stesso
3591   nome fanno riferimento allo stesso oggetto, altrimenti l'interpretazione del
3592   nome dipende dall'implementazione.
3593 \item l'interpretazione di ulteriori \texttt{/} presenti nel nome dipende
3594   dall'implementazione.
3595 \end{itemize*}
3596
3597 Data la assoluta genericità delle specifiche, il comportamento delle funzioni
3598 è subordinato in maniera quasi completa alla relativa implementazione, tanto
3599 che Stevens in \cite{UNP2} cita questo caso come un esempio della maniera
3600 standard usata dallo standard POSIX per consentire implementazioni non
3601 standardizzabili. 
3602
3603 Nel caso di Linux, sia per quanto riguarda la memoria condivisa ed i semafori,
3604 che per le code di messaggi, tutto viene creato usando come radici delle
3605 opportune directory (rispettivamente \file{/dev/shm} e \file{/dev/mqueue}, per
3606 i dettagli si faccia riferimento a sez.~\ref{sec:ipc_posix_shm},
3607 sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq}).  I nomi
3608 specificati nelle relative funzioni devono essere nella forma di un
3609 \textit{pathname} assoluto (devono cioè iniziare con ``\texttt{/}'') e
3610 corrisponderanno ad altrettanti file creati all'interno di queste directory;
3611 per questo motivo detti nomi non possono contenere altre ``\texttt{/}'' oltre
3612 quella iniziale.
3613
3614 Il vantaggio degli oggetti di IPC POSIX è comunque che essi vengono inseriti
3615 nell'albero dei file, e possono essere maneggiati con le usuali funzioni e
3616 comandi di accesso ai file, che funzionano come su dei file normali. Questo
3617 però è vero nel caso di Linux, che usa una implementazione che lo consente,
3618 non è detto che altrettanto valga per altri kernel. In particolare, come si
3619 può facilmente verificare con il comando \cmd{strace}, sia per la memoria
3620 condivisa che per le code di messaggi varie \textit{system call} utilizzate da
3621 Linux corrispondono in realtà a quelle ordinarie dei file, essendo detti
3622 oggetti realizzati come tali usando degli specifici filesystem.
3623
3624 In particolare i permessi associati agli oggetti di IPC POSIX sono identici ai
3625 permessi dei file, ed il controllo di accesso segue esattamente la stessa
3626 semantica (quella illustrata in sez.~\ref{sec:file_access_control}), e non
3627 quella particolare (si ricordi quanto visto in
3628 sez.~\ref{sec:ipc_sysv_access_control}) che viene usata per gli oggetti del
3629 SysV-IPC. Per quanto riguarda l'attribuzione dell'utente e del gruppo
3630 proprietari dell'oggetto alla creazione di quest'ultimo essa viene effettuata
3631 secondo la semantica SysV: corrispondono cioè a \ids{UID} e \ids{GID} effettivi
3632 del processo che esegue la creazione.
3633
3634
3635 \subsection{Code di messaggi Posix}
3636 \label{sec:ipc_posix_mq}
3637
3638 Le code di messaggi POSIX sono supportate da Linux a partire dalla versione
3639 2.6.6 del kernel. In generale, come le corrispettive del \textit{SysV-IPC}, le
3640 code di messaggi sono poco usate, dato che i socket, nei casi in cui sono
3641 sufficienti, sono più comodi, e che in casi più complessi la comunicazione può
3642 essere gestita direttamente con mutex (o semafori) e memoria condivisa con
3643 tutta la flessibilità che occorre.
3644
3645 Per poter utilizzare le code di messaggi, oltre ad utilizzare un kernel
3646 superiore al 2.6.6 occorre utilizzare la libreria \file{librt} che contiene le
3647 funzioni dell'interfaccia POSIX ed i programmi che usano le code di messaggi
3648 devono essere compilati aggiungendo l'opzione \code{-lrt} al comando
3649 \cmd{gcc}. In corrispondenza all'inclusione del supporto nel kernel ufficiale
3650 le funzioni di libreria sono state inserite nella \acr{glibc}, e sono
3651 disponibili a partire dalla versione 2.3.4 delle medesime.
3652
3653 La libreria inoltre richiede la presenza dell'apposito filesystem di tipo
3654 \texttt{mqueue} montato sulla directory \file{/dev/mqueue}; questo può essere
3655 fatto aggiungendo ad \conffile{/etc/fstab} una riga come:
3656 \begin{FileExample}[label=/etc/fstab]
3657 mqueue   /dev/mqueue       mqueue    defaults        0      0
3658 \end{FileExample}
3659 ed esso sarà utilizzato come radice sulla quale vengono risolti i nomi delle
3660 code di messaggi che iniziano con una ``\texttt{/}''. Le opzioni di mount
3661 accettate sono \texttt{uid}, \texttt{gid} e \texttt{mode} che permettono
3662 rispettivamente di impostare l'utente, il gruppo ed i permessi associati al
3663 filesystem.
3664
3665
3666 La funzione di sistema che permette di aprire (e crearla se non esiste ancora)
3667 una coda di messaggi POSIX è \funcd{mq\_open}, ed il suo prototipo è:
3668
3669 \begin{funcproto}{
3670 \fhead{fcntl.h}
3671 \fhead{sys/stat.h}
3672 \fhead{mqueue.h}
3673 \fdecl{mqd\_t mq\_open(const char *name, int oflag)}
3674 \fdecl{mqd\_t mq\_open(const char *name, int oflag, unsigned long mode,
3675     struct mq\_attr *attr)}
3676
3677 \fdesc{Apre una coda di messaggi POSIX impostandone le caratteristiche.}
3678 }
3679
3680 {La funzione ritorna il descrittore associato alla coda in caso di successo e
3681   $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
3682   \begin{errlist}
3683   \item[\errcode{EACCES}] il processo non ha i privilegi per accedere alla
3684     coda secondo quanto specificato da \param{oflag} oppure \const{name}
3685     contiene più di una ``\texttt{/}''.
3686   \item[\errcode{EEXIST}] si è specificato \const{O\_CREAT} e \const{O\_EXCL}
3687     ma la coda già esiste.
3688   \item[\errcode{EINVAL}] il file non supporta la funzione, o si è specificato
3689     \const{O\_CREAT} con una valore non nullo di \param{attr} e valori non
3690     validi dei campi \var{mq\_maxmsg} e \var{mq\_msgsize}; questi valori
3691     devono essere positivi ed inferiori ai limiti di sistema se il processo
3692     non ha privilegi amministrativi, inoltre \var{mq\_maxmsg} non può comunque
3693     superare \const{HARD\_MAX}.
3694   \item[\errcode{ENOENT}] non si è specificato \const{O\_CREAT} ma la coda non
3695     esiste o si è usato il nome ``\texttt{/}''.
3696   \item[\errcode{ENOSPC}] lo spazio è insufficiente, probabilmente per aver
3697     superato il limite di \texttt{queues\_max}.
3698   \end{errlist}
3699   ed inoltre \errval{EMFILE}, \errval{ENAMETOOLONG}, \errval{ENFILE},
3700   \errval{ENOMEM} ed nel loro significato generico.  }
3701 \end{funcproto}
3702
3703 La funzione apre la coda di messaggi identificata dall'argomento \param{name}
3704 restituendo il descrittore ad essa associato, del tutto analogo ad un file
3705 descriptor, con l'unica differenza che lo standard prevede un apposito tipo
3706 \type{mqd\_t}. Nel caso di Linux si tratta in effetti proprio di un normale
3707 file descriptor; pertanto, anche se questo comportamento non è portabile, lo
3708 si può tenere sotto osservazione con le funzioni dell'I/O multiplexing (vedi
3709 sez.~\ref{sec:file_multiplexing}) come possibile alternativa all'uso
3710 dell'interfaccia di notifica di \func{mq\_notify} (che vedremo a breve).
3711
3712 Se il nome indicato fa riferimento ad una coda di messaggi già esistente, il
3713 descrittore ottenuto farà riferimento allo stesso oggetto, pertanto tutti i
3714 processi che hanno usato \func{mq\_open} su quel nome otterranno un
3715 riferimento alla stessa coda. Diventa così immediato costruire un canale di
3716 comunicazione fra detti processi.
3717
3718 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3719 possono essere specificati per \param{oflag}, che deve essere specificato come
3720 maschera binaria; i valori possibili per i vari bit sono quelli visti in
3721 sez.~\ref{sec:file_open_close} (per questo occorre includere \texttt{fcntl.h})
3722 dei quali però \func{mq\_open} riconosce solo i seguenti:
3723 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
3724 \item[\const{O\_RDONLY}] Apre la coda solo per la ricezione di messaggi. Il
3725   processo potrà usare il descrittore con \func{mq\_receive} ma non con
3726   \func{mq\_send}.
3727 \item[\const{O\_WRONLY}] Apre la coda solo per la trasmissione di messaggi. Il
3728   processo potrà usare il descrittore con \func{mq\_send} ma non con
3729   \func{mq\_receive}.
3730 \item[\const{O\_RDWR}] Apre la coda solo sia per la trasmissione che per la
3731   ricezione. 
3732 \item[\const{O\_CREAT}] Necessario qualora si debba creare la coda; la
3733   presenza di questo bit richiede la presenza degli ulteriori argomenti
3734   \param{mode} e \param{attr}.
3735 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3736   chiamata se la coda esiste già, altrimenti esegue la creazione atomicamente.
3737 \item[\const{O\_NONBLOCK}] Imposta la coda in modalità non bloccante, le
3738   funzioni di ricezione e trasmissione non si bloccano quando non ci sono le
3739   risorse richieste, ma ritornano immediatamente con un errore di
3740   \errcode{EAGAIN}.
3741 \end{basedescript}
3742
3743 I primi tre bit specificano la modalità di apertura della coda, e sono fra
3744 loro esclusivi. Ma qualunque sia la modalità in cui si è aperta una coda,
3745 questa potrà essere riaperta più volte in una modalità diversa, e vi si potrà
3746 sempre accedere attraverso descrittori diversi, esattamente come si può fare
3747 per i file normali.
3748
3749 Se la coda non esiste e la si vuole creare si deve specificare
3750 \const{O\_CREAT}, in tal caso occorre anche specificare i permessi di
3751 creazione con l'argomento \param{mode};\footnote{fino al 2.6.14 per un bug i
3752   valori della \textit{umask} del processo non venivano applicati a questi
3753   permessi.} i valori di quest'ultimo sono identici a quelli usati per
3754 \func{open} (per questo occorre includere \texttt{sys/stat.h}), anche se per
3755 le code di messaggi han senso solo i permessi di lettura e scrittura.
3756
3757 Oltre ai permessi di creazione possono essere specificati anche gli attributi
3758 specifici della coda tramite l'argomento \param{attr}; quest'ultimo è un
3759 puntatore ad una apposita struttura \struct{mq\_attr}, la cui definizione è
3760 riportata in fig.~\ref{fig:ipc_mq_attr}.
3761
3762 \begin{figure}[!htb]
3763   \footnotesize \centering
3764   \begin{minipage}[c]{0.90\textwidth}
3765     \includestruct{listati/mq_attr.h}
3766   \end{minipage} 
3767   \normalsize
3768   \caption{La struttura \structd{mq\_attr}, contenente gli attributi di una
3769     coda di messaggi POSIX.}
3770   \label{fig:ipc_mq_attr}
3771 \end{figure}
3772
3773 Per la creazione della coda i campi della struttura che devono essere
3774 specificati sono \var{mq\_maxmsg} e \var{mq\_msgsize}, che indicano
3775 rispettivamente il numero massimo di messaggi che può contenere e la
3776 dimensione massima di un messaggio. Il valore dovrà essere positivo e minore
3777 dei rispettivi limiti di sistema altrimenti la funzione fallirà con un errore
3778 di \errcode{EINVAL}.  Se \param{attr} è un puntatore nullo gli attributi della
3779 coda saranno impostati ai valori predefiniti.
3780
3781 I suddetti limiti di sistema sono impostati attraverso altrettanti file in
3782 \texttt{/proc/sys/fs/mqueue}, in particolare i file che controllano i valori
3783 dei limiti sono:
3784 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
3785 \item[\sysctlfile{fs/mqueue/msg\_max}] Indica il valore massimo del numero di
3786   messaggi in una coda e agisce come limite superiore per il valore di
3787   \var{attr->mq\_maxmsg} in \func{mq\_open}. Il suo valore di default è 10. Il
3788   valore massimo è \const{HARD\_MAX} che vale \code{(131072/sizeof(void *))},
3789   ed il valore minimo 1 (ma era 10 per i kernel precedenti il 2.6.28). Questo
3790   limite viene ignorato per i processi con privilegi amministrativi (più
3791   precisamente con la \textit{capability} \const{CAP\_SYS\_RESOURCE}) ma
3792   \const{HARD\_MAX} resta comunque non superabile.
3793
3794 \item[\sysctlfile{fs/mqueue/msgsize\_max}] Indica il valore massimo della
3795   dimensione in byte di un messaggio sulla coda ed agisce come limite
3796   superiore per il valore di \var{attr->mq\_msgsize} in \func{mq\_open}. Il
3797   suo valore di default è 8192.  Il valore massimo è 1048576 ed il valore
3798   minimo 128 (ma per i kernel precedenti il 2.6.28 detti limiti erano
3799   rispettivamente \const{INT\_MAX} e 8192). Questo limite viene ignorato dai
3800   processi con privilegi amministrativi (con la \textit{capability}
3801   \const{CAP\_SYS\_RESOURCE}).
3802
3803 \item[\sysctlfile{fs/mqueue/queues\_max}] Indica il numero massimo di code di
3804   messaggi creabili in totale sul sistema, il valore di default è 256 ma si
3805   può usare un valore qualunque fra $0$ e \const{INT\_MAX}. Il limite non
3806   viene applicato ai processi con privilegi amministrativi (cioè con la
3807   \textit{capability} \const{CAP\_SYS\_RESOURCE}).
3808
3809 \end{basedescript}
3810
3811 Infine sulle code di messaggi si applica il limite imposto sulla risorsa
3812 \const{RLIMIT\_MSGQUEUE} (vedi sez.~\ref{sec:sys_resource_limit}) che indica
3813 lo spazio massimo (in byte) occupabile dall'insieme di tutte le code di
3814 messaggi appartenenti ai processi di uno stesso utente, che viene identificato
3815 in base al \textit{real user ID} degli stessi.
3816
3817 Quando l'accesso alla coda non è più necessario si può chiudere il relativo
3818 descrittore con la funzione \funcd{mq\_close}, il cui prototipo è:
3819
3820 \begin{funcproto}{
3821 \fhead{mqueue.h}
3822 \fdecl{int mq\_close(mqd\_t mqdes)}
3823
3824 \fdesc{Chiude una coda di messaggi.}
3825 }
3826
3827 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3828   caso \var{errno} assumerà uno dei valori \errval{EBADF} o \errval{EINTR} nel
3829   loro significato generico.
3830 }  
3831 \end{funcproto}
3832
3833 La funzione è analoga a \func{close},\footnote{su Linux, dove le code sono
3834   implementate come file su un filesystem dedicato, è esattamente la stessa
3835   funzione, per cui non esiste una \textit{system call} autonoma e la funzione
3836   viene rimappata su \func{close} dalle \acr{glibc}.}  dopo la sua esecuzione
3837 il processo non sarà più in grado di usare il descrittore della coda, ma
3838 quest'ultima continuerà ad esistere nel sistema e potrà essere acceduta con
3839 un'altra chiamata a \func{mq\_open}. All'uscita di un processo tutte le code
3840 aperte, così come i file, vengono chiuse automaticamente. Inoltre se il
3841 processo aveva agganciato una richiesta di notifica sul descrittore che viene
3842 chiuso, questa sarà rilasciata e potrà essere richiesta da qualche altro
3843 processo.
3844
3845 Quando si vuole effettivamente rimuovere una coda dal sistema occorre usare la
3846 funzione di sistema \funcd{mq\_unlink}, il cui prototipo è:
3847
3848 \begin{funcproto}{
3849 \fhead{mqueue.h}
3850 \fdecl{int mq\_unlink(const char *name)}
3851
3852 \fdesc{Rimuove una coda di messaggi.}
3853 }
3854
3855 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
3856   caso \var{errno} assumerà gli uno dei valori:
3857   \begin{errlist}
3858     \item[\errcode{EACCES}] non si hanno i permessi per cancellare la coda.
3859     \item[\errcode{ENAMETOOLONG}] il nome indicato è troppo lungo.
3860     \item[\errcode{ENOENT}] non esiste una coda con il nome indicato.
3861   \end{errlist}
3862 }  
3863 \end{funcproto}
3864
3865 Anche in questo caso il comportamento della funzione è analogo a quello di
3866 \func{unlink} per i file, la funzione rimuove la coda \param{name} (ed il
3867 relativo file sotto \texttt{/dev/mqueue}), così che una successiva chiamata a
3868 \func{mq\_open} fallisce o crea una coda diversa.
3869
3870 % TODO, verificare se mq_unlink è davvero una system call indipendente.
3871
3872 Come per i file ogni coda di messaggi ha un contatore di riferimenti, per cui
3873 la coda non viene effettivamente rimossa dal sistema fin quando questo non si
3874 annulla. Pertanto anche dopo aver eseguito con successo \func{mq\_unlink} la
3875 coda resterà accessibile a tutti i processi che hanno un descrittore aperto su
3876 di essa.  Allo stesso modo una coda ed i suoi contenuti resteranno disponibili
3877 all'interno del sistema anche quando quest'ultima non è aperta da nessun
3878 processo (questa è una delle differenze più rilevanti nei confronti di
3879 \textit{pipe} e \textit{fifo}).  La sola differenza fra code di messaggi POSIX
3880 e file normali è che, essendo il filesystem delle code di messaggi virtuale, e
3881 basato su oggetti interni al kernel, il suo contenuto viene perduto con il
3882 riavvio del sistema.
3883
3884 Come accennato ad ogni coda di messaggi è associata una struttura
3885 \struct{mq\_attr}, che può essere letta e modificata attraverso le due
3886 funzioni \funcd{mq\_getattr} e \funcd{mq\_setattr}, i cui prototipi sono:
3887
3888 \begin{funcproto}{
3889 \fhead{mqueue.h}
3890 \fdecl{int mq\_getattr(mqd\_t mqdes, struct mq\_attr *mqstat)}
3891 \fdesc{Legge gli attributi di una coda di messaggi POSIX.}
3892 \fdecl{int mq\_setattr(mqd\_t mqdes, const struct mq\_attr *mqstat,
3893     struct mq\_attr *omqstat)}
3894 \fdesc{Modifica gli attributi di una coda di messaggi POSIX.}
3895 }
3896 {
3897 Entrambe le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
3898   nel qual caso \var{errno} assumerà i valori \errval{EBADF}
3899     o \errval{EINVAL} nel loro significato generico.
3900 }  
3901 \end{funcproto}
3902
3903 La funzione \func{mq\_getattr} legge i valori correnti degli attributi della
3904 coda \param{mqdes} nella struttura \struct{mq\_attr} puntata
3905 da \param{mqstat}; di questi l'unico relativo allo stato corrente della coda è
3906 \var{mq\_curmsgs} che indica il numero di messaggi da essa contenuti, gli
3907 altri indicano le caratteristiche generali della stessa impostate in fase di
3908 apertura.
3909
3910 La funzione \func{mq\_setattr} permette di modificare gli attributi di una
3911 coda (indicata da \param{mqdes}) tramite i valori contenuti nella struttura
3912 \struct{mq\_attr} puntata da \param{mqstat}, ma può essere modificato solo il
3913 campo \var{mq\_flags}, gli altri campi vengono comunque ignorati.
3914
3915 In particolare i valori di \var{mq\_maxmsg} e \var{mq\_msgsize} possono essere
3916 specificati solo in fase ci creazione della coda.  Inoltre i soli valori
3917 possibili per \var{mq\_flags} sono 0 e \const{O\_NONBLOCK}, per cui alla fine
3918 la funzione può essere utilizzata solo per abilitare o disabilitare la
3919 modalità non bloccante. L'argomento \param{omqstat} viene usato, quando
3920 diverso da \val{NULL}, per specificare l'indirizzo di una struttura su cui
3921 salvare i valori degli attributi precedenti alla chiamata della funzione.
3922
3923 Per inserire messaggi su di una coda sono previste due funzioni di sistema,
3924 \funcd{mq\_send} e \funcd{mq\_timedsend}. In realtà su Linux la \textit{system
3925   call} è soltanto \func{mq\_timedsend}, mentre \func{mq\_send} viene
3926 implementata come funzione di libreria che si appoggia alla
3927 precedente. Inoltre \func{mq\_timedsend} richiede che sia definita la macro
3928 \macro{\_XOPEN\_SOURCE} ad un valore pari ad almeno \texttt{600} o la macro
3929 \macro{\_POSIX\_C\_SOURCE} ad un valore uguale o maggiore di \texttt{200112L}.
3930 I rispettivi prototipi sono:
3931
3932 \begin{funcproto}{
3933 \fhead{mqueue.h}
3934 \fdecl{int mq\_send(mqd\_t mqdes, const char *msg\_ptr, size\_t msg\_len,
3935     unsigned int msg\_prio)}
3936 \fdesc{Esegue l'inserimento di un messaggio su una coda.}
3937 \fhead{mqueue.h}
3938 \fhead{time.h}
3939 \fdecl{int mq\_timedsend(mqd\_t mqdes, const char *msg\_ptr, size\_t
3940     msg\_len, \\ 
3941 \phantom{int mq\_timedsend(}unsigned int msg\_prio, const struct timespec *abs\_timeout)}
3942 \fdesc{Esegue l'inserimento di un messaggio su una coda entro un tempo
3943   specificato}
3944 }
3945
3946 {Entrambe le funzioni ritornano $0$ in caso di successo e $-1$ per un errore,
3947   nel qual caso \var{errno} assumerà uno dei valori:
3948   \begin{errlist}
3949     \item[\errcode{EAGAIN}] si è aperta la coda con \const{O\_NONBLOCK}, e la
3950       coda è piena.
3951     \item[\errcode{EBADF}] si specificato un file descriptor non valido.
3952     \item[\errcode{EINVAL}] si è specificato un valore nullo per
3953       \param{msg\_len}, o un valore di \param{msg\_prio} fuori dai limiti, o
3954       un valore non valido per \param{abs\_timeout}.
3955     \item[\errcode{EMSGSIZE}] la lunghezza del messaggio \param{msg\_len}
3956       eccede il limite impostato per la coda.
3957     \item[\errcode{ETIMEDOUT}] l'inserimento del messaggio non è stato
3958       effettuato entro il tempo stabilito (solo \func{mq\_timedsend}).
3959   \end{errlist}
3960   ed inoltre \errval{EBADF} e \errval{EINTR} nel loro significato generico.
3961 }
3962 \end{funcproto}
3963
3964 Entrambe le funzioni richiedono un puntatore ad un buffer in memoria
3965 contenente il testo del messaggio da inserire nella coda \param{mqdes}
3966 nell'argomento \param{msg\_ptr}, e la relativa lunghezza in \param{msg\_len}.
3967 Se quest'ultima eccede la dimensione massima specificata da \var{mq\_msgsize}
3968 le funzioni ritornano immediatamente con un errore di \errcode{EMSGSIZE}.
3969
3970 L'argomento \param{msg\_prio} indica la priorità dell'argomento, che, essendo
3971 definito come \ctyp{unsigned int}, è sempre un intero positivo. I messaggi di
3972 priorità maggiore vengono inseriti davanti a quelli di priorità inferiore, e
3973 quindi saranno riletti per primi. A parità del valore della priorità il
3974 messaggio sarà inserito in coda a tutti quelli che hanno la stessa priorità
3975 che quindi saranno letti con la politica di una \textit{fifo}. Il valore della
3976 priorità non può eccedere il limite di sistema \const{MQ\_PRIO\_MAX}, che al
3977 momento è pari a 32768.
3978
3979 Qualora la coda sia piena, entrambe le funzioni si bloccano, a meno che non
3980 sia stata selezionata in fase di apertura della stessa la modalità non
3981 bloccante o non si sia impostato il flag \const{O\_NONBLOCK} sul file
3982 descriptor della coda, nel qual caso entrambe ritornano con un codice di
3983 errore di \errcode{EAGAIN}.
3984
3985 La sola differenza fra le due funzioni è che \func{mq\_timedsend}, passato il
3986 tempo massimo impostato con l'argomento \param{abs\_timeout}, ritorna con un
3987 errore di \errcode{ETIMEDOUT}, se invece il tempo è già scaduto al momento
3988 della chiamata e la coda è piena la funzione ritorna immediatamente. Il valore
3989 di \param{abs\_timeout} deve essere specificato come tempo assoluto tramite
3990 una struttura \struct{timespec} (vedi fig.~\ref{fig:sys_timespec_struct})
3991 indicato in numero di secondi e nanosecondi a partire dal 1 gennaio 1970.
3992
3993 Come per l'inserimento, anche per l'estrazione dei messaggi da una coda sono
3994 previste due funzioni di sistema, \funcd{mq\_receive} e
3995 \funcd{mq\_timedreceive}. Anche in questo caso su Linux soltanto
3996 \func{mq\_timedreceive} è effettivamente, una \textit{system call} e per
3997 usarla devono essere definite le opportune macro come per
3998 \func{mq\_timedsend}. I rispettivi prototipi sono:
3999
4000 \begin{funcproto}{
4001 \fhead{mqueue.h} 
4002 \fdecl{ssize\_t mq\_receive(mqd\_t mqdes, char *msg\_ptr, size\_t
4003     msg\_len, unsigned int *msg\_prio)} 
4004 \fdesc{Effettua la ricezione di un messaggio da una coda.}
4005 \fhead{mqueue.h} 
4006 \fhead{time.h} 
4007 \fdecl{ssize\_t mq\_timedreceive(mqd\_t mqdes, char *msg\_ptr, size\_t
4008     msg\_len,\\ 
4009 \phantom{ssize\_t  mq\_timedreceive(}unsigned int *msg\_prio, const struct timespec
4010 *abs\_timeout)} 
4011 \fdesc{Riceve un messaggio da una coda entro un limite di tempo.}
4012 }
4013 {Entrambe le funzioni ritornano il numero di byte del messaggio in caso di
4014   successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei
4015   valori:
4016   \begin{errlist}
4017     \item[\errcode{EAGAIN}] si è aperta la coda con \const{O\_NONBLOCK}, e la
4018       coda è vuota.
4019     \item[\errcode{EINVAL}] si è specificato un valore nullo per
4020       \param{msg\_ptr}, o un valore non valido per \param{abs\_timeout}.
4021     \item[\errcode{EMSGSIZE}] la lunghezza del messaggio sulla coda eccede il
4022       valore \param{msg\_len} specificato per la ricezione.
4023     \item[\errcode{ETIMEDOUT}] la ricezione del messaggio non è stata
4024       effettuata entro il tempo stabilito.
4025   \end{errlist}
4026   ed inoltre \errval{EBADF} o \errval{EINTR} nel loro significato generico.  }
4027 \end{funcproto}
4028
4029 La funzione estrae dalla coda \param{mqdes} il messaggio a priorità più alta,
4030 o il più vecchio fra quelli della stessa priorità. Una volta ricevuto il
4031 messaggio viene tolto dalla coda e la sua dimensione viene restituita come
4032 valore di ritorno; si tenga presente che 0 è una dimensione valida e che la
4033 condizione di errore è indicata soltanto da un valore di
4034 $-1$.\footnote{Stevens in \cite{UNP2} fa notare che questo è uno dei casi in
4035   cui vale ciò che lo standard \textsl{non} dice, una dimensione nulla
4036   infatti, pur non essendo citata, non viene proibita.}
4037
4038 Se la dimensione specificata da \param{msg\_len} non è sufficiente a contenere
4039 il messaggio, entrambe le funzioni, al contrario di quanto avveniva nelle code
4040 di messaggi di SysV, ritornano un errore di \errcode{EMSGSIZE} senza estrarre
4041 il messaggio.  È pertanto opportuno eseguire sempre una chiamata a
4042 \func{mq\_getattr} prima di eseguire una ricezione, in modo da ottenere la
4043 dimensione massima dei messaggi sulla coda, per poter essere in grado di
4044 allocare dei buffer sufficientemente ampi per la lettura.
4045
4046 Se si specifica un puntatore per l'argomento \param{msg\_prio} il valore della
4047 priorità del messaggio viene memorizzato all'indirizzo da esso indicato.
4048 Qualora non interessi usare la priorità dei messaggi si può specificare
4049 \var{NULL}, ed usare un valore nullo della priorità nelle chiamate a
4050 \func{mq\_send}.
4051
4052 Si noti che con le code di messaggi POSIX non si ha la possibilità di
4053 selezionare quale messaggio estrarre con delle condizioni sulla priorità, a
4054 differenza di quanto avveniva con le code di messaggi di SysV che permettono
4055 invece la selezione in base al valore del campo \var{mtype}. 
4056
4057 Qualora la coda sia vuota entrambe le funzioni si bloccano, a meno che non si
4058 sia selezionata la modalità non bloccante; in tal caso entrambe ritornano
4059 immediatamente con l'errore \errcode{EAGAIN}. Anche in questo caso la sola
4060 differenza fra le due funzioni è che la seconda non attende indefinitamente e
4061 passato il tempo massimo \param{abs\_timeout} ritorna comunque con un errore
4062 di \errcode{ETIMEDOUT}.
4063
4064 Uno dei problemi sottolineati da Stevens in \cite{UNP2}, comuni ad entrambe le
4065 tipologie di code messaggi, è che non è possibile per chi riceve identificare
4066 chi è che ha inviato il messaggio, in particolare non è possibile sapere da
4067 quale utente esso provenga. Infatti, in mancanza di un meccanismo interno al
4068 kernel, anche se si possono inserire delle informazioni nel messaggio, queste
4069 non possono essere credute, essendo completamente dipendenti da chi lo invia.
4070 Vedremo però come, attraverso l'uso del meccanismo di notifica, sia possibile
4071 superare in parte questo problema.
4072
4073 Una caratteristica specifica delle code di messaggi POSIX è la possibilità di
4074 usufruire di un meccanismo di notifica asincrono; questo può essere attivato
4075 usando la funzione \funcd{mq\_notify}, il cui prototipo è:
4076
4077 \begin{funcproto}{
4078 \fhead{mqueue.h}
4079 \fdecl{int mq\_notify(mqd\_t mqdes, const struct sigevent *notification)}
4080
4081 \fdesc{Attiva il meccanismo di notifica per una coda.}
4082 }
4083
4084 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4085   caso \var{errno} assumerà uno dei valori:
4086   \begin{errlist}
4087     \item[\errcode{EBADF}] il descrittore non fa riferimento ad una coda di
4088       messaggi.
4089     \item[\errcode{EBUSY}] c'è già un processo registrato per la notifica.
4090     \item[\errcode{EINVAL}] si è richiesto un meccanismo di notifica invalido
4091       o specificato nella notifica con i segnali il valore di un segnale non
4092       esistente.
4093   \end{errlist}
4094   ed inoltre \errval{ENOMEM} nel suo significato generico.
4095 }  
4096 \end{funcproto}
4097
4098 Il meccanismo di notifica permette di segnalare in maniera asincrona ad un
4099 processo la presenza di dati sulla coda indicata da \param{mqdes}, in modo da
4100 evitare la necessità di bloccarsi nell'attesa. Per far questo un processo deve
4101 registrarsi con la funzione \func{mq\_notify}, ed il meccanismo è disponibile
4102 per un solo processo alla volta per ciascuna coda.
4103
4104 Il comportamento di \func{mq\_notify} dipende dai valori passati con
4105 l'argomento \param{notification}, che è un puntatore ad una apposita struttura
4106 \struct{sigevent}, (definita in fig.~\ref{fig:struct_sigevent}) introdotta
4107 dallo standard POSIX.1b per gestire la notifica di eventi; per altri dettagli
4108 su di essa si può rivedere quanto detto in sez.~\ref{sec:sig_timer_adv} a
4109 proposito dell'uso della stessa struttura per la notifica delle scadenze dei
4110 \textit{timer}.
4111
4112 Attraverso questa struttura si possono impostare le modalità con cui viene
4113 effettuata la notifica nel campo \var{sigev\_notify}, che può assumere i
4114 valori di tab.~\ref{tab:sigevent_sigev_notify}; fra questi la pagina di
4115 manuale riporta soltanto i primi tre, ed inizialmente era possibile solo
4116 \const{SIGEV\_SIGNAL}. Il metodo consigliato è quello di usare
4117 \const{SIGEV\_SIGNAL} usando il campo \var{sigev\_signo} per indicare il quale
4118 segnale deve essere inviato al processo. Inoltre il campo \var{sigev\_value} è
4119 un puntatore ad una struttura \struct{sigval} (definita in
4120 fig.~\ref{fig:sig_sigval}) che permette di restituire al gestore del segnale
4121 un valore numerico o un indirizzo,\footnote{per il suo uso si riveda la
4122   trattazione fatta in sez.~\ref{sec:sig_real_time} a proposito dei segnali
4123   \textit{real-time}.} posto che questo sia installato nella forma estesa
4124 vista in sez.~\ref{sec:sig_sigaction}.
4125
4126 La funzione registra il processo chiamante per la notifica se
4127 \param{notification} punta ad una struttura \struct{sigevent} opportunamente
4128 inizializzata, o cancella una precedente registrazione se è \val{NULL}. Dato
4129 che un solo processo alla volta può essere registrato, la funzione fallisce
4130 con \errcode{EBUSY} se c'è un altro processo già registrato. Questo significa
4131 anche che se si registra una notifica con \const{SIGEV\_NONE} il processo non
4132 la riceverà, ma impedirà anche che altri possano registrarsi per poterlo fare.
4133 Si tenga presente inoltre che alla chiusura del descrittore associato alla
4134 coda (e quindi anche all'uscita del processo) ogni eventuale registrazione di
4135 notifica presente viene cancellata.
4136
4137 La notifica del segnale avviene all'arrivo di un messaggio in una coda vuota
4138 (cioè solo se sulla coda non ci sono messaggi) e se non c'è nessun processo
4139 bloccato in una chiamata a \func{mq\_receive}, in questo caso infatti il
4140 processo bloccato ha la precedenza ed il messaggio gli viene immediatamente
4141 inviato, mentre per il meccanismo di notifica tutto funziona come se la coda
4142 fosse rimasta vuota.
4143
4144 Quando un messaggio arriva su una coda vuota al processo che si era registrato
4145 viene inviato il segnale specificato da \code{notification->sigev\_signo}, e
4146 la coda diventa disponibile per una ulteriore registrazione.  Questo comporta
4147 che se si vuole mantenere il meccanismo di notifica occorre ripetere la
4148 registrazione chiamando nuovamente \func{mq\_notify} all'interno del gestore
4149 del segnale di notifica. A differenza della situazione simile che si aveva con
4150 i segnali non affidabili (l'argomento è stato affrontato in
4151 \ref{sec:sig_semantics}) questa caratteristica non configura una \textit{race
4152   condition} perché l'invio di un segnale avviene solo se la coda è vuota;
4153 pertanto se si vuole evitare di correre il rischio di perdere eventuali
4154 ulteriori segnali inviati nel lasso di tempo che occorre per ripetere la
4155 richiesta di notifica basta avere cura di eseguire questa operazione prima di
4156 estrarre i messaggi presenti dalla coda.
4157
4158 L'invio del segnale di notifica avvalora alcuni campi di informazione
4159 restituiti al gestore attraverso la struttura \struct{siginfo\_t} (definita in
4160 fig.~\ref{fig:sig_siginfo_t}). In particolare \var{si\_pid} viene impostato al
4161 valore del \ids{PID} del processo che ha emesso il segnale, \var{si\_uid}
4162 all'\textsl{user-ID} effettivo, \var{si\_code} a \const{SI\_MESGQ}, e
4163 \var{si\_errno} a 0. Questo ci dice che, se si effettua la ricezione dei
4164 messaggi usando esclusivamente il meccanismo di notifica, è possibile ottenere
4165 le informazioni sul processo che ha inserito un messaggio usando un gestore
4166 per il segnale in forma estesa, di nuovo si faccia riferimento a quanto detto
4167 al proposito in sez.~\ref{sec:sig_sigaction} e sez.~\ref{sec:sig_real_time}.
4168
4169
4170 \subsection{Memoria condivisa}
4171 \label{sec:ipc_posix_shm}
4172
4173 La memoria condivisa è stato il primo degli oggetti di IPC POSIX inserito nel
4174 kernel ufficiale; il supporto a questo tipo di oggetti è realizzato attraverso
4175 il filesystem \texttt{tmpfs}, uno speciale filesystem che mantiene tutti i
4176 suoi contenuti in memoria, che viene attivato abilitando l'opzione
4177 \texttt{CONFIG\_TMPFS} in fase di compilazione del kernel.
4178
4179 Per potere utilizzare l'interfaccia POSIX per la memoria condivisa la
4180 \acr{glibc} (le funzioni sono state introdotte con la versione 2.2) richiede
4181 di compilare i programmi con l'opzione \code{-lrt}; inoltre è necessario che
4182 in \file{/dev/shm} sia montato un filesystem \texttt{tmpfs}; questo di norma
4183 viene fatto aggiungendo una riga del tipo di:
4184 \begin{FileExample}[label=/etc/fstab]
4185 tmpfs   /dev/shm        tmpfs   defaults        0      0
4186 \end{FileExample}
4187 ad \conffile{/etc/fstab}. In realtà si può montare un filesystem
4188 \texttt{tmpfs} dove si vuole, per usarlo come RAM disk, con un comando del
4189 tipo:
4190 \begin{Example}
4191 mount -t tmpfs -o size=128M,nr_inodes=10k,mode=700 tmpfs /mytmpfs
4192 \end{Example}
4193
4194 Il filesystem riconosce, oltre quelle mostrate, le opzioni \texttt{uid} e
4195 \texttt{gid} che identificano rispettivamente utente e gruppo cui assegnarne
4196 la titolarità, e \texttt{nr\_blocks} che permette di specificarne la
4197 dimensione in blocchi, cioè in multipli di \const{PAGECACHE\_SIZE} che in
4198 questo caso è l'unità di allocazione elementare.
4199
4200 La funzione che permette di aprire un segmento di memoria condivisa POSIX, ed
4201 eventualmente di crearlo se non esiste ancora, è \funcd{shm\_open}; il suo
4202 prototipo è:
4203
4204 \begin{funcproto}{
4205 \fhead{sys/mman.h}
4206 \fhead{sys/stat.h}
4207 \fhead{fcntl.h}
4208 \fdecl{int shm\_open(const char *name, int oflag, mode\_t mode)}
4209
4210 \fdesc{Apre un segmento di memoria condivisa.}
4211 }
4212
4213 {La funzione ritorna un file descriptor in caso di successo e $-1$ per un
4214   errore, nel qual caso \var{errno} assumerà uno dei valori:
4215   \begin{errlist}
4216   \item[\errcode{EACCES}] non si hanno i permessi di aprire il segmento nella
4217     modalità scelta o si richiesto \const{O\_TRUNC} per un segmento su cui non
4218     si ha il permesso di scrittura.
4219   \item[\errcode{EINVAL}] si è utilizzato un nome non valido.
4220   \end{errlist}
4221   ed inoltre \errval{EEXIST}, \errval{EMFILE}, \errval{ENAMETOOLONG},
4222   \errval{ENFILE} e \errval{ENOENT} nello stesso significato che hanno per
4223   \func{open}.
4224 }  
4225 \end{funcproto}
4226
4227
4228 La funzione apre un segmento di memoria condivisa identificato dal nome
4229 \param{name}. Come già spiegato in sez.~\ref{sec:ipc_posix_generic} questo
4230 nome può essere specificato in forma standard solo facendolo iniziare per
4231 ``\texttt{/}'' e senza ulteriori ``\texttt{/}''. Linux supporta comunque nomi
4232 generici, che verranno interpretati prendendo come radice
4233 \file{/dev/shm}.\footnote{occorre pertanto evitare di specificare qualcosa del
4234   tipo \file{/dev/shm/nome} all'interno di \param{name}, perché questo
4235   comporta, da parte delle funzioni di libreria, il tentativo di accedere a
4236   \file{/dev/shm/dev/shm/nome}.}
4237
4238 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
4239 possono essere specificati per \param{oflag}, che deve essere specificato come
4240 maschera binaria comprendente almeno uno dei due valori \const{O\_RDONLY} e
4241 \const{O\_RDWR}; i valori possibili per i vari bit sono quelli visti in
4242 sez.~\ref{sec:file_open_close} dei quali però \func{shm\_open} riconosce solo
4243 i seguenti:
4244 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
4245 \item[\const{O\_RDONLY}] Apre il file descriptor associato al segmento di
4246   memoria condivisa per l'accesso in sola lettura.
4247 \item[\const{O\_RDWR}] Apre il file descriptor associato al segmento di
4248   memoria condivisa per l'accesso in lettura e scrittura.
4249 \item[\const{O\_CREAT}] Necessario qualora si debba creare il segmento di
4250   memoria condivisa se esso non esiste; in questo caso viene usato il valore
4251   di \param{mode} per impostare i permessi, che devono essere compatibili con
4252   le modalità con cui si è aperto il file.
4253 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
4254   chiamata a \func{shm\_open} se il segmento esiste già, altrimenti esegue la
4255   creazione atomicamente.
4256 \item[\const{O\_TRUNC}] Se il segmento di memoria condivisa esiste già, ne
4257   tronca le dimensioni a 0 byte.
4258 \end{basedescript}
4259
4260 In caso di successo la funzione restituisce un file descriptor associato al
4261 segmento di memoria condiviso con le stesse modalità di \func{open} viste in
4262 sez.~\ref{sec:file_open_close}. Inoltre sul file descriptor viene sempre
4263 impostato il flag \const{FD\_CLOEXEC}.  Chiamate effettuate da diversi
4264 processi usando lo stesso nome restituiranno file descriptor associati allo
4265 stesso segmento, così come, nel caso di file ordinari, essi sono associati
4266 allo stesso \itindex{inode} inode. In questo modo è possibile effettuare una
4267 chiamata ad \func{mmap} sul file descriptor restituito da \func{shm\_open} ed
4268 i processi vedranno lo stesso segmento di memoria condivisa.
4269
4270 Quando il nome non esiste si può creare un nuovo segmento specificando
4271 \const{O\_CREAT}; in tal caso il segmento avrà (così come i nuovi file)
4272 lunghezza nulla. Il nuovo segmento verrà creato con i permessi indicati
4273 da \param{mode} (di cui vengono usati solo i 9 bit meno significativi, non si
4274 applicano pertanto i permessi speciali di sez.~\ref{sec:file_special_perm})
4275 filtrati dal valore dell'\textit{umask} del processo. Come gruppo ed utente
4276 proprietario del segmento saranno presi quelli facenti parte del gruppo
4277 \textit{effective} del processo chiamante.
4278
4279 Dato che un segmento di lunghezza nulla è di scarsa utilità, una vola che lo
4280 si è creato per impostarne la dimensione si dovrà poi usare \func{ftruncate}
4281 (vedi sez.~\ref{sec:file_file_size}) prima di mapparlo in memoria con
4282 \func{mmap}.  Si tenga presente che una volta chiamata \func{mmap} si può
4283 chiudere il file descriptor ad esso associato (semplicemente con
4284 \func{close}), senza che la mappatura ne risenta, e che questa può essere
4285 rimossa usando \func{munmap}.
4286
4287 Come per i file, quando si vuole rimuovere completamente un segmento di
4288 memoria condivisa occorre usare la funzione \funcd{shm\_unlink}, il cui
4289 prototipo è:
4290
4291 \begin{funcproto}{
4292 \fhead{sys/mman.h}
4293 \fdecl{int shm\_unlink(const char *name)}
4294
4295 \fdesc{Rimuove un segmento di memoria condivisa.}
4296 }
4297
4298 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4299   caso \var{errno} assumerà uno dei valori:
4300   \begin{errlist}
4301   \item[\errcode{EACCES}] non si è proprietari del segmento.
4302   \end{errlist}
4303   ed inoltre \errval{ENAMETOOLONG} e \errval{ENOENT}, nel loro significato
4304   generico.
4305 }  
4306 \end{funcproto}
4307
4308 La funzione è del tutto analoga ad \func{unlink}, e si limita a cancellare il
4309 nome del segmento da \file{/dev/shm}, senza nessun effetto né sui file
4310 descriptor precedentemente aperti con \func{shm\_open}, né sui segmenti già
4311 mappati in memoria; questi verranno cancellati automaticamente dal sistema
4312 solo con le rispettive chiamate a \func{close} e \func{munmap}.  Una volta
4313 eseguita questa funzione però, qualora si richieda l'apertura di un segmento
4314 con lo stesso nome, la chiamata a \func{shm\_open} fallirà, a meno di non aver
4315 usato \const{O\_CREAT}, in quest'ultimo caso comunque si otterrà un file
4316 descriptor che fa riferimento ad un segmento distinto da eventuali precedenti.
4317
4318 Dato che i segmenti di memoria condivisa sono trattati come file del
4319 filesystem \texttt{tmpfs}, si possono usare su di essi, con lo stesso
4320 significato che assumono sui file ordinari, anche funzioni come quelle delle
4321 famiglie \func{fstat}, \func{fchown} e \func{fchmod}. Inoltre a partire dal
4322 kernel 2.6.19 per i permessi sono supportate anche le ACL illustrate in
4323 sez.~\ref{sec:file_ACL}.
4324
4325 Come esempio dell'uso delle funzioni attinenti ai segmenti di memoria
4326 condivisa POSIX, vediamo come è possibile riscrivere una interfaccia
4327 semplificata analoga a quella vista in fig.~\ref{fig:ipc_sysv_shm_func} per la
4328 memoria condivisa in stile SysV. Il codice completo, di cui si sono riportate
4329 le parti essenziali in fig.~\ref{fig:ipc_posix_shmmem}, è contenuto nel file
4330 \file{SharedMem.c} dei sorgenti allegati.
4331
4332 \begin{figure}[!htb]
4333   \footnotesize \centering
4334   \begin{minipage}[c]{\codesamplewidth}
4335     \includecodesample{listati/MemShared.c}
4336   \end{minipage} 
4337   \normalsize 
4338   \caption{Il codice delle funzioni di gestione dei segmenti di memoria
4339     condivisa POSIX.}
4340   \label{fig:ipc_posix_shmmem}
4341 \end{figure}
4342
4343 La prima funzione (\texttt{\small 1-24}) è \func{CreateShm} che, dato un nome
4344 nell'argomento \var{name} crea un nuovo segmento di memoria condivisa,
4345 accessibile in lettura e scrittura, e ne restituisce l'indirizzo. Anzitutto si
4346 definiscono (\texttt{\small 8}) i flag per la successiva (\texttt{\small 9})
4347 chiamata a \func{shm\_open}, che apre il segmento in lettura e scrittura
4348 (creandolo se non esiste, ed uscendo in caso contrario) assegnandogli sul
4349 filesystem i permessi specificati dall'argomento \var{perm}. 
4350
4351 In caso di errore (\texttt{\small 10-12}) si restituisce un puntatore nullo,
4352 altrimenti si prosegue impostando (\texttt{\small 14}) la dimensione del
4353 segmento con \func{ftruncate}. Di nuovo (\texttt{\small 15-16}) si esce
4354 immediatamente restituendo un puntatore nullo in caso di errore. Poi si passa
4355 (\texttt{\small 18}) a mappare in memoria il segmento con \func{mmap}
4356 specificando dei diritti di accesso corrispondenti alla modalità di apertura.
4357 Di nuovo si restituisce (\texttt{\small 19-21}) un puntatore nullo in caso di
4358 errore, altrimenti si inizializza (\texttt{\small 22}) il contenuto del
4359 segmento al valore specificato dall'argomento \var{fill} con \func{memset}, e
4360 se ne restituisce (\texttt{\small 23}) l'indirizzo.
4361
4362 La seconda funzione (\texttt{\small 25-40}) è \func{FindShm} che trova un
4363 segmento di memoria condiviso esistente, restituendone l'indirizzo. In questo
4364 caso si apre (\texttt{\small 31}) il segmento con \func{shm\_open} richiedendo
4365 che il segmento sia già esistente, in caso di errore (\texttt{\small 31-33})
4366 si ritorna immediatamente un puntatore nullo.  Ottenuto il file descriptor del
4367 segmento lo si mappa (\texttt{\small 35}) in memoria con \func{mmap},
4368 restituendo (\texttt{\small 36-38}) un puntatore nullo in caso di errore, o
4369 l'indirizzo (\texttt{\small 39}) dello stesso in caso di successo.
4370
4371 La terza funzione (\texttt{\small 40-45}) è \func{RemoveShm}, e serve a
4372 cancellare un segmento di memoria condivisa. Dato che al contrario di quanto
4373 avveniva con i segmenti del \textit{SysV-IPC} gli oggetti allocati nel kernel
4374 vengono rilasciati automaticamente quando nessuna li usa più, tutto quello che
4375 c'è da fare (\texttt{\small 44}) in questo caso è chiamare \func{shm\_unlink},
4376 restituendo al chiamante il valore di ritorno.
4377
4378
4379
4380
4381 \subsection{Semafori}
4382 \label{sec:ipc_posix_sem}
4383
4384 Fino alla serie 2.4.x del kernel esisteva solo una implementazione parziale
4385 dei semafori POSIX che li realizzava solo a livello di \itindex{thread}
4386 \textit{thread} e non di processi,\footnote{questo significava che i semafori
4387   erano visibili solo all'interno dei \itindex{thread} \textit{thread} creati
4388   da un singolo processo, e non potevano essere usati come meccanismo di
4389   sincronizzazione fra processi diversi.} fornita attraverso la sezione delle
4390 estensioni \textit{real-time} della \acr{glibc} (quelle che si accedono
4391 collegandosi alla libreria \texttt{librt}). Esisteva inoltre una libreria che
4392 realizzava (parzialmente) l'interfaccia POSIX usando le funzioni dei semafori
4393 di \textit{SysV-IPC} (mantenendo così tutti i problemi sottolineati in
4394 sez.~\ref{sec:ipc_sysv_sem}).
4395
4396 A partire dal kernel 2.5.7 è stato introdotto un meccanismo di
4397 sincronizzazione completamente nuovo, basato sui cosiddetti \textit{futex} (la
4398 sigla sta per \textit{fast user mode mutex}) con il quale è stato possibile
4399 implementare una versione nativa dei semafori POSIX.  Grazie a questo con i
4400 kernel della serie 2.6 e le nuove versioni della \acr{glibc} che usano questa
4401 nuova infrastruttura per quella che viene che viene chiamata \textit{New Posix
4402   Thread Library}, sono state implementate anche tutte le funzioni
4403 dell'interfaccia dei semafori POSIX.
4404
4405 Anche in questo caso è necessario appoggiarsi alla libreria per le estensioni
4406 \textit{real-time} \texttt{librt}, questo significa che se si vuole utilizzare
4407 questa interfaccia, oltre ad utilizzare gli opportuni file di definizione,
4408 occorrerà compilare i programmi con l'opzione \texttt{-lrt} o con
4409 \texttt{-lpthread} se si usano questi ultimi. 
4410
4411 La funzione che permette di creare un nuovo semaforo POSIX, creando il
4412 relativo file, o di accedere ad uno esistente, è \funcd{sem\_open}, questa
4413 prevede due forme diverse a seconda che sia utilizzata per aprire un semaforo
4414 esistente o per crearne uno nuovi, i relativi prototipi sono:
4415
4416 \begin{funcproto}{
4417 \fhead{semaphore.h}
4418 \fhead{sys/stat.h}
4419 \fhead{fcntl.h}
4420 \fdecl{sem\_t *sem\_open(const char *name, int oflag)}
4421 \fdecl{sem\_t *sem\_open(const char *name, int oflag, mode\_t mode,
4422     unsigned int value)} 
4423
4424 \fdesc{Crea un semaforo o ne apre uno esistente.}
4425 }
4426 {La funzione ritorna l'indirizzo del semaforo in caso di successo e
4427   \const{SEM\_FAILED} per un errore, nel qual caso \var{errno} assumerà uno
4428   dei valori:
4429   \begin{errlist}
4430     \item[\errcode{EACCES}] il semaforo esiste ma non si hanno permessi
4431       sufficienti per accedervi.
4432     \item[\errcode{EEXIST}] si sono specificati \const{O\_CREAT} e
4433       \const{O\_EXCL} ma il semaforo esiste.
4434     \item[\errcode{EINVAL}] il valore di \param{value} eccede
4435       \const{SEM\_VALUE\_MAX} o il nome è solo ``\texttt{/}''.
4436     \item[\errcode{ENAMETOOLONG}] si è utilizzato un nome troppo lungo.
4437     \item[\errcode{ENOENT}] non si è usato \const{O\_CREAT} ed il nome
4438       specificato non esiste.
4439   \end{errlist}
4440   ed inoltre \errval{EMFILE}, \errval{ENFILE} ed \errval{ENOMEM} nel loro
4441   significato generico.
4442
4443 }
4444 \end{funcproto}
4445
4446 L'argomento \param{name} definisce il nome del semaforo che si vuole
4447 utilizzare, ed è quello che permette a processi diversi di accedere allo
4448 stesso semaforo. Questo deve essere specificato nella stessa forma utilizzata
4449 per i segmenti di memoria condivisa, con un nome che inizia con ``\texttt{/}''
4450 e senza ulteriori ``\texttt{/}'', vale a dire nella forma
4451 \texttt{/nome-semaforo}.
4452
4453 Con Linux i file associati ai semafori sono mantenuti nel filesystem virtuale
4454 \texttt{/dev/shm}, e gli viene assegnato automaticamente un nome nella forma
4455 \texttt{sem.nome-semaforo}, si ha cioè una corrispondenza per cui
4456 \texttt{/nome-semaforo} viene rimappato, nella creazione tramite
4457 \func{sem\_open}, su \texttt{/dev/shm/sem.nome-semaforo}. Per questo motivo la
4458 dimensione massima per il nome di un semaforo, a differenza di quanto avviene
4459 per i segmenti di memoria condivisa, è pari a \const{NAME\_MAX}$ - 4$.
4460
4461 L'argomento \param{oflag} è quello che controlla le modalità con cui opera la
4462 funzione, ed è passato come maschera binaria; i bit corrispondono a quelli
4463 utilizzati per l'analogo argomento di \func{open}, anche se dei possibili
4464 valori visti in sez.~\ref{sec:file_open_close} sono utilizzati soltanto
4465 \const{O\_CREAT} e \const{O\_EXCL}.
4466
4467 Se si usa \const{O\_CREAT} si richiede la creazione del semaforo qualora
4468 questo non esista, ed in tal caso occorre utilizzare la seconda forma della
4469 funzione, in cui si devono specificare sia un valore iniziale con l'argomento
4470 \param{value},\footnote{e si noti come così diventa possibile, differenza di
4471   quanto avviene per i semafori del \textit{SysV-IPC}, effettuare in maniera
4472   atomica creazione ed inizializzazione di un semaforo usando una unica
4473   funzione.} che una maschera dei permessi con l'argomento
4474 \param{mode}; se il semaforo esiste già questi saranno semplicemente
4475 ignorati. Usando il flag \const{O\_EXCL} si richiede invece la verifica che il
4476 semaforo non esista, ed usandolo insieme ad \const{O\_CREAT} la funzione
4477 fallisce qualora un semaforo con lo stesso nome sia già presente.
4478
4479 Si tenga presente che, come accennato in sez.~\ref{sec:ipc_posix_generic}, i
4480 semafori usano la semantica standard dei file per quanto riguarda i controlli
4481 di accesso, questo significa che un nuovo semaforo viene sempre creato con
4482 l'\ids{UID} ed il \ids{GID} effettivo del processo chiamante, e che i permessi
4483 indicati con \param{mode} vengono filtrati dal valore della \itindex{umask}
4484 \textit{umask} del processo.  Inoltre per poter aprire un semaforo è
4485 necessario avere su di esso sia il permesso di lettura che quello di
4486 scrittura.
4487
4488 La funzione restituisce in caso di successo un puntatore all'indirizzo del
4489 semaforo con un valore di tipo \ctyp{sem\_t *}, è questo valore che dovrà
4490 essere passato alle altre funzioni per operare sul semaforo stesso, e non sarà
4491 più necessario fare riferimento al nome, che potrebbe anche essere rimosso con
4492 \func{sem\_unlink}.
4493
4494 Una volta che si sia ottenuto l'indirizzo di un semaforo, sarà possibile
4495 utilizzarlo; se si ricorda quanto detto all'inizio di
4496 sez.~\ref{sec:ipc_sysv_sem}, dove si sono introdotti i concetti generali
4497 relativi ai semafori, le operazioni principali sono due, quella che richiede
4498 l'uso di una risorsa bloccando il semaforo e quella che rilascia la risorsa
4499 liberando il semaforo. La prima operazione è effettuata dalla funzione
4500 \funcd{sem\_wait}, il cui prototipo è:
4501
4502 \begin{funcproto}{
4503 \fhead{semaphore.h}
4504 \fdecl{int sem\_wait(sem\_t *sem)}
4505
4506 \fdesc{Blocca un semaforo.}
4507 }
4508
4509 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4510   caso \var{errno} assumerà uno dei valori:
4511   \begin{errlist}
4512     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
4513     \item[\errcode{EINVAL}] il semaforo \param{sem} non esiste.
4514   \end{errlist}
4515 }  
4516 \end{funcproto}
4517
4518 La funzione cerca di decrementare il valore del semaforo indicato dal
4519 puntatore \param{sem}, se questo ha un valore positivo, cosa che significa che
4520 la risorsa è disponibile, la funzione ha successo, il valore del semaforo
4521 viene diminuito di 1 ed essa ritorna immediatamente consentendo la
4522 prosecuzione del processo.
4523
4524 Se invece il valore è nullo la funzione si blocca (fermando l'esecuzione del
4525 processo) fintanto che il valore del semaforo non ritorna positivo (cosa che a
4526 questo punto può avvenire solo per opera di altro processo che rilascia il
4527 semaforo con una chiamata a \func{sem\_post}) così che poi essa possa
4528 decrementarlo con successo e proseguire.
4529
4530 Si tenga presente che la funzione può sempre essere interrotta da un segnale,
4531 nel qual caso si avrà un errore di \const{EINTR}; inoltre questo avverrà
4532 comunque, anche qualora si fosse richiesta la gestione con la semantica BSD,
4533 installando il gestore del suddetto segnale con l'opzione \const{SA\_RESTART}
4534 (vedi sez.~\ref{sec:sig_sigaction}) per riavviare le \textit{system call}
4535 interrotte.
4536
4537 Della funzione \func{sem\_wait} esistono due varianti che consentono di
4538 gestire diversamente le modalità di attesa in caso di risorsa occupata, la
4539 prima di queste è \funcd{sem\_trywait}, che serve ad effettuare un tentativo
4540 di acquisizione senza bloccarsi; il suo prototipo è:
4541
4542 \begin{funcproto}{
4543 \fhead{semaphore.h} 
4544 \fdecl{int sem\_trywait(sem\_t *sem)}
4545
4546 \fdesc{Tenta di bloccare un semaforo.}
4547 }
4548 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4549   caso \var{errno} assumerà uno dei valori:
4550   \begin{errlist}
4551     \item[\errcode{EAGAIN}] il semaforo non può essere acquisito senza
4552       bloccarsi. 
4553     \item[\errcode{EINVAL}] l'argomento \param{sem} non indica un semaforo
4554       valido.
4555   \end{errlist}
4556 }
4557 \end{funcproto}
4558
4559 La funzione è identica a \func{sem\_wait} ed se la risorsa è libera ha lo
4560 stesso effetto, vale a dire che in caso di semaforo diverso da zero la
4561 funzione lo decrementa e ritorna immediatamente; la differenza è che nel caso
4562 in cui il semaforo è occupato essa non si blocca e di nuovo ritorna
4563 immediatamente, restituendo però un errore di \errval{EAGAIN}, così che il
4564 programma possa proseguire.
4565
4566 La seconda variante di \func{sem\_wait} è una estensione specifica che può
4567 essere utilizzata soltanto se viene definita la macro \macro{\_XOPEN\_SOURCE}
4568 ad un valore di almeno 600 o la macro \macro{\_POSIX\_C\_SOURCE} ad un valore
4569 uguale o maggiore di \texttt{200112L} prima di includere
4570 \headfile{semaphore.h}, la funzione è \funcd{sem\_timedwait}, ed il suo
4571 prototipo è:
4572
4573 \begin{funcproto}{
4574 \fhead{semaphore.h}
4575 \fdecl{int sem\_timedwait(sem\_t *sem, const struct timespec
4576     *abs\_timeout)}
4577
4578 \fdesc{Blocca un semaforo.}
4579 }
4580
4581 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4582   caso \var{errno} assumerà uno dei valori:
4583   \begin{errlist}
4584     \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale.
4585     \item[\errcode{EINVAL}] l'argomento \param{sem} non indica un semaforo
4586       valido.
4587     \item[\errcode{ETIMEDOUT}] è scaduto il tempo massimo di attesa. 
4588   \end{errlist}
4589 }  
4590 \end{funcproto}
4591
4592 Anche in questo caso il comportamento della funzione è identico a quello di
4593 \func{sem\_wait}, ma è possibile impostare un tempo limite per l'attesa
4594 tramite la struttura \struct{timespec} (vedi
4595 fig.~\ref{fig:sys_timespec_struct}) puntata
4596 dall'argomento \param{abs\_timeout}, indicato in secondi e nanosecondi a
4597 partire dalla cosiddetta \textit{Epoch} (00:00:00, 1 January 1970
4598 UTC). Scaduto il limite la funzione ritorna anche se non è possibile acquisire
4599 il semaforo fallendo con un errore di \errval{ETIMEDOUT}.
4600
4601 La seconda funzione principale utilizzata per l'uso dei semafori è quella che
4602 viene usata per rilasciare un semaforo occupato o, in generale, per aumentare
4603 di una unità il valore dello stesso anche qualora non fosse occupato (si
4604 ricordi che in generale un semaforo viene usato come indicatore di un numero
4605 di risorse disponibili). Detta funzione è \funcd{sem\_post} ed il suo
4606 prototipo è:
4607
4608 \begin{funcproto}{
4609 \fhead{semaphore.h}
4610 \fdecl{int sem\_post(sem\_t *sem)}
4611
4612 \fdesc{Rilascia un semaforo.}
4613 }
4614
4615 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4616   caso \var{errno} assumerà uno dei valori:
4617   \begin{errlist}
4618     \item[\errcode{EINVAL}] l'argomento \param{sem} non indica un semaforo
4619       valido.
4620     \item[\errcode{EOVERFLOW}] si superato il massimo valore di un semaforo.
4621   \end{errlist}
4622 }  
4623 \end{funcproto}
4624
4625 La funzione incrementa di uno il valore corrente del semaforo indicato
4626 dall'argomento \param{sem}, se questo era nullo la relativa risorsa risulterà
4627 sbloccata, cosicché un altro processo (o \itindex{thread} \textit{thread})
4628 eventualmente bloccato in una \func{sem\_wait} sul semaforo possa essere
4629 svegliato e rimesso in esecuzione.  Si tenga presente che la funzione è sicura
4630 \index{funzioni!sicure} per l'uso all'interno di un gestore di segnali (si
4631 ricordi quanto detto in sez.~\ref{sec:sig_signal_handler}).
4632
4633 Se invece di operare su un semaforo se ne volesse semplicemente leggere il
4634 valore, si potrà usare la funzione \funcd{sem\_getvalue}, il cui prototipo è:
4635
4636 \begin{funcproto}{
4637 \fhead{semaphore.h}
4638 \fdecl{int sem\_getvalue(sem\_t *sem, int *sval)}
4639
4640 \fdesc{Richiede il valore di un semaforo.}
4641 }
4642 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4643   caso \var{errno} assumerà uno dei valori:
4644   \begin{errlist}
4645     \item[\errcode{EINVAL}] l'argomento \param{sem} non indica un semaforo
4646       valido.
4647   \end{errlist}
4648 }  
4649 \end{funcproto}
4650
4651 La funzione legge il valore del semaforo indicato dall'argomento \param{sem} e
4652 lo restituisce nella variabile intera puntata dall'argomento
4653 \param{sval}. Qualora ci siano uno o più processi bloccati in attesa sul
4654 semaforo lo standard prevede che la funzione possa restituire un valore nullo
4655 oppure il numero di processi bloccati in una \func{sem\_wait} sul suddetto
4656 semaforo; nel caso di Linux vale la prima opzione.
4657
4658 Questa funzione può essere utilizzata per avere un suggerimento sullo stato di
4659 un semaforo, ovviamente non si può prendere il risultato riportato in
4660 \param{sval} che come indicazione, il valore del semaforo infatti potrebbe
4661 essere già stato modificato al ritorno della funzione.
4662
4663 % TODO verificare comportamento sem_getvalue
4664
4665 Una volta che non ci sia più la necessità di operare su un semaforo se ne può
4666 terminare l'uso con la funzione \funcd{sem\_close}, il cui prototipo è:
4667
4668 \begin{funcproto}{
4669 \fhead{semaphore.h}
4670 \fdecl{int sem\_close(sem\_t *sem)}
4671
4672 \fdesc{Chiude un semaforo.}
4673 }
4674
4675 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4676   caso \var{errno} assumerà uno dei valori:
4677   \begin{errlist}
4678     \item[\errcode{EINVAL}] l'argomento \param{sem} non indica un semaforo
4679       valido.
4680   \end{errlist}
4681 }  
4682 \end{funcproto}
4683
4684 La funzione chiude il semaforo indicato dall'argomento \param{sem}, che non
4685 potrà più essere utilizzato nelle altre funzioni. La chiusura comporta anche
4686 che tutte le risorse che il sistema poteva avere assegnato al processo
4687 nell'uso del semaforo vengono immediatamente rilasciate. Questo significa che
4688 un eventuale altro processo bloccato sul semaforo a causa della acquisizione
4689 dello stesso da parte del processo che chiama \func{sem\_close} potrà essere
4690 immediatamente riavviato.
4691
4692 Si tenga presente poi che come avviene per i file, all'uscita di un processo
4693 anche tutti i semafori che questo aveva aperto vengono automaticamente chiusi.
4694 Questo comportamento risolve il problema che si aveva con i semafori del
4695 \textit{SysV IPC} (di cui si è parlato in sez.~\ref{sec:ipc_sysv_sem}) per i
4696 quali le risorse possono restare bloccate. Si tenga infine presente che, a
4697 differenza di quanto avviene per i file, in caso di una chiamata ad
4698 \func{execve} tutti i semafori vengono chiusi automaticamente.
4699
4700 Come per i semafori del \textit{SysV-IPC} anche quelli POSIX hanno una
4701 persistenza di sistema; questo significa che una volta che si è creato un
4702 semaforo con \func{sem\_open} questo continuerà ad esistere fintanto che il
4703 kernel resta attivo (vale a dire fino ad un successivo riavvio) a meno che non
4704 lo si cancelli esplicitamente. Per far questo si può utilizzare la funzione
4705 \funcd{sem\_unlink}, il cui prototipo è:
4706
4707 \begin{funcproto}{
4708 \fhead{semaphore.h}
4709 \fdecl{int sem\_unlink(const char *name)}
4710
4711 \fdesc{Rimuove un semaforo.}
4712 }
4713
4714 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4715   caso \var{errno} assumerà uno dei valori:
4716   \begin{errlist}
4717     \item[\errcode{EACCES}] non si hanno i permessi necessari a cancellare il
4718       semaforo.
4719     \item[\errcode{ENAMETOOLONG}] il nome indicato è troppo lungo.
4720     \item[\errcode{ENOENT}] il semaforo \param{name} non esiste.
4721   \end{errlist}
4722 }  
4723 \end{funcproto}
4724
4725 La funzione rimuove il semaforo indicato dall'argomento \param{name}, che
4726 prende un valore identico a quello usato per creare il semaforo stesso con
4727 \func{sem\_open}. Il semaforo viene rimosso dal filesystem immediatamente; ma
4728 il semaforo viene effettivamente cancellato dal sistema soltanto quando tutti
4729 i processi che lo avevano aperto lo chiudono. Si segue cioè la stessa
4730 semantica usata con \func{unlink} per i file, trattata in dettaglio in
4731 sez.~\ref{sec:link_symlink_rename}.
4732
4733 Una delle caratteristiche peculiari dei semafori POSIX è che questi possono
4734 anche essere utilizzati anche in forma anonima, senza necessità di fare
4735 ricorso ad un nome sul filesystem o ad altri indicativi.  In questo caso si
4736 dovrà porre la variabile che contiene l'indirizzo del semaforo in un tratto di
4737 memoria che sia accessibile a tutti i processi in gioco.  La funzione che
4738 consente di inizializzare un semaforo anonimo è \funcd{sem\_init}, il cui
4739 prototipo è:
4740
4741 \begin{funcproto}{
4742 \fhead{semaphore.h}
4743 \fdecl{int sem\_init(sem\_t *sem, int pshared, unsigned int value)}
4744 \fdesc{Inizializza un semaforo anonimo.}
4745 }
4746
4747 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4748   caso \var{errno} assumerà uno dei valori:
4749   \begin{errlist}
4750     \item[\errcode{EINVAL}] il valore di \param{value} eccede
4751       \const{SEM\_VALUE\_MAX}.
4752     \item[\errcode{ENOSYS}] il valore di \param{pshared} non è nullo ed il
4753       sistema non supporta i semafori per i processi.
4754   \end{errlist}
4755 }  
4756 \end{funcproto}
4757
4758 La funzione inizializza un semaforo all'indirizzo puntato dall'argomento
4759 \param{sem}, e come per \func{sem\_open} consente di impostare un valore
4760 iniziale con \param{value}. L'argomento \param{pshared} serve ad indicare se
4761 il semaforo deve essere utilizzato dai \itindex{thread} \textit{thread} di uno
4762 stesso processo (con un valore nullo) o condiviso fra processi diversi (con un
4763 valore non nullo).
4764
4765 Qualora il semaforo debba essere condiviso dai \textit{thread} di uno stesso
4766 processo (nel qual caso si parla di \textit{thread-shared semaphore}),
4767 occorrerà che \param{sem} sia l'indirizzo di una variabile visibile da tutti i
4768 \textit{thread}, si dovrà usare cioè una variabile globale o una variabile
4769 allocata dinamicamente nello \textit{heap}.
4770
4771 Qualora il semaforo debba essere condiviso fra più processi (nel qual caso si
4772 parla di \textit{process-shared semaphore}) la sola scelta possibile per
4773 renderlo visibile a tutti è di porlo in un tratto di memoria condivisa. Questo
4774 potrà essere ottenuto direttamente sia con \func{shmget} (vedi
4775 sez.~\ref{sec:ipc_sysv_shm}) che con \func{shm\_open} (vedi
4776 sez.~\ref{sec:ipc_posix_shm}), oppure, nel caso che tutti i processi in gioco
4777 abbiano un genitore comune, con una mappatura anonima con \func{mmap} (vedi
4778 sez.~\ref{sec:file_memory_map}) a cui essi poi potranno accedere (si ricordi
4779 che i tratti di memoria condivisa vengono mantenuti nei processi figli
4780 attraverso la funzione \func{fork}).
4781
4782 Una volta inizializzato il semaforo anonimo con \func{sem\_init} lo si potrà
4783 utilizzare nello stesso modo dei semafori normali con \func{sem\_wait} e
4784 \func{sem\_post}. Si tenga presente però che inizializzare due volte lo stesso
4785 semaforo può dar luogo ad un comportamento indefinito. 
4786
4787 Qualora non si intenda più utilizzare un semaforo anonimo questo può essere
4788 eliminato dal sistema; per far questo di deve utilizzare una apposita
4789 funzione, \funcd{sem\_destroy}, il cui prototipo è:
4790
4791 \begin{funcproto}{
4792 \fhead{semaphore.h}
4793 \fdecl{int sem\_destroy(sem\_t *sem)}
4794 \fdesc{Elimina un semaforo anonimo.}
4795 }
4796 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
4797   caso \var{errno} assumerà uno dei valori:
4798   \begin{errlist}
4799     \item[\errcode{EINVAL}] l'argomento \param{sem} non indica un semaforo
4800       valido.
4801   \end{errlist}
4802 }  
4803 \end{funcproto}
4804
4805 La funzione prende come unico argomento l'indirizzo di un semaforo che deve
4806 essere stato inizializzato con \func{sem\_init}; non deve quindi essere
4807 applicata a semafori creati con \func{sem\_open}. Inoltre si deve essere
4808 sicuri che il semaforo sia effettivamente inutilizzato, la distruzione di un
4809 semaforo su cui sono presenti processi (o \itindex{thread} \textit{thread}) in
4810 attesa (cioè bloccati in una \func{sem\_wait}) provoca un comportamento
4811 indefinito.
4812
4813 Si tenga presente infine che utilizzare un semaforo che è stato distrutto con
4814 \func{sem\_destroy} di nuovo può dare esito a comportamenti indefiniti.  Nel
4815 caso ci si trovi in una tale evenienza occorre reinizializzare il semaforo una
4816 seconda volta con \func{sem\_init}.
4817
4818 Come esempio di uso sia della memoria condivisa che dei semafori POSIX si sono
4819 scritti due semplici programmi con i quali è possibile rispettivamente
4820 monitorare il contenuto di un segmento di memoria condivisa e modificarne il
4821 contenuto. 
4822
4823 \begin{figure}[!htbp]
4824   \footnotesize \centering
4825   \begin{minipage}[c]{\codesamplewidth}
4826     \includecodesample{listati/message_getter.c}
4827   \end{minipage} 
4828   \normalsize 
4829   \caption{Sezione principale del codice del programma
4830     \file{message\_getter.c}.}
4831   \label{fig:ipc_posix_sem_shm_message_server}
4832 \end{figure}
4833
4834 Il corpo principale del primo dei due, il cui codice completo è nel file
4835 \file{message\_getter.c} dei sorgenti allegati, è riportato in
4836 fig.~\ref{fig:ipc_posix_sem_shm_message_server}; si è tralasciata la parte che
4837 tratta la gestione delle opzioni a riga di comando (che consentono di
4838 impostare un nome diverso per il semaforo e il segmento di memoria condivisa)
4839 ed il controllo che al programma venga fornito almeno un argomento, contenente
4840 la stringa iniziale da inserire nel segmento di memoria condivisa.
4841
4842 Lo scopo del programma è quello di creare un segmento di memoria condivisa su
4843 cui registrare una stringa, e tenerlo sotto osservazione stampando la stessa
4844 una volta al secondo. Si utilizzerà un semaforo per proteggere l'accesso in
4845 lettura alla stringa, in modo che questa non possa essere modificata
4846 dall'altro programma prima di averla finita di stampare.
4847
4848 La parte iniziale del programma contiene le definizioni (\texttt{\small 1-8})
4849 del gestore del segnale usato per liberare le risorse utilizzate, delle
4850 variabili globali contenenti i nomi di default del segmento di memoria
4851 condivisa e del semaforo (il default scelto è \texttt{messages}), e delle
4852 altre variabili utilizzate dal programma.
4853
4854 Come prima istruzione (\texttt{\small 10}) si è provveduto ad installare un
4855 gestore di segnale che consentirà di effettuare le operazioni di pulizia
4856 (usando la funzione \func{Signal} illustrata in
4857 fig.~\ref{fig:sig_Signal_code}), dopo di che (\texttt{\small 12-16}) si è
4858 creato il segmento di memoria condivisa con la funzione \func{CreateShm} che
4859 abbiamo appena trattato in sez.~\ref{sec:ipc_posix_shm}, uscendo con un
4860 messaggio in caso di errore. 
4861
4862 Si tenga presente che la funzione \func{CreateShm} richiede che il segmento
4863 non sia già presente e fallirà qualora un'altra istanza, o un altro programma
4864 abbia già allocato un segmento con quello stesso nome. Per semplicità di
4865 gestione si è usata una dimensione fissa pari a 256 byte, definita tramite la
4866 costante \texttt{MSGMAXSIZE}.
4867
4868 Il passo successivo (\texttt{\small 17-21}) è quello della creazione del
4869 semaforo che regola l'accesso al segmento di memoria condivisa con
4870 \func{sem\_open}; anche in questo caso si gestisce l'uscita con stampa di un
4871 messaggio in caso di errore. Anche per il semaforo, avendo specificato la
4872 combinazione di flag \code{O\_CREAT|O\_EXCL} come secondo argomento, si esce
4873 qualora fosse già esistente; altrimenti esso verrà creato con gli opportuni
4874 permessi specificati dal terzo argomento, (indicante lettura e scrittura in
4875 notazione ottale). Infine il semaforo verrà inizializzato ad un valore nullo
4876 (il quarto argomento), corrispondete allo stato in cui risulta bloccato.
4877
4878 A questo punto (\texttt{\small 22}) si potrà inizializzare il messaggio posto
4879 nel segmento di memoria condivisa usando la stringa passata come argomento al
4880 programma. Essendo il semaforo stato creato già bloccato non ci si dovrà
4881 preoccupare di eventuali \textit{race condition} qualora il programma di
4882 modifica del messaggio venisse lanciato proprio in questo momento.  Una volta
4883 inizializzato il messaggio occorrerà però rilasciare il semaforo
4884 (\texttt{\small 24-27}) per consentirne l'uso; in tutte queste operazioni si
4885 provvederà ad uscire dal programma con un opportuno messaggio in caso di
4886 errore.
4887
4888 Una volta completate le inizializzazioni il ciclo principale del programma
4889 (\texttt{\small 29-47}) viene ripetuto indefinitamente (\texttt{\small 29})
4890 per stampare sia il contenuto del messaggio che una serie di informazioni di
4891 controllo. Il primo passo (\texttt{\small 30-34}) è quello di acquisire (con
4892 \func{sem\_getvalue}, con uscita in caso di errore) e stampare il valore del
4893 semaforo ad inizio del ciclo; seguito (\texttt{\small 35-36}) dal tempo
4894 corrente.
4895
4896 \begin{figure}[!htb]
4897   \footnotesize \centering
4898   \begin{minipage}[c]{\codesamplewidth}
4899     \includecodesample{listati/HandSigInt.c}
4900   \end{minipage} 
4901   \normalsize 
4902   \caption{Codice del gestore di segnale del programma
4903     \file{message\_getter.c}.}
4904   \label{fig:ipc_posix_sem_shm_message_server_handler}
4905 \end{figure}
4906
4907 Prima della stampa del messaggio invece si deve acquisire il semaforo
4908 (\texttt{\small 30-33}) per evitare accessi concorrenti alla stringa da parte
4909 del programma di modifica. Una volta eseguita la stampa (\texttt{\small 41})
4910 il semaforo dovrà essere rilasciato (\texttt{\small 42-45}). Il passo finale
4911 (\texttt{\small 46}) è attendere per un secondo prima di eseguire da capo il
4912 ciclo. 
4913
4914 Per uscire in maniera corretta dal programma sarà necessario fermarlo con una
4915 interruzione da tastiera (\texttt{C-c}), che corrisponde all'invio del segnale
4916 \signal{SIGINT}, per il quale si è installato (\texttt{\small 10}) una
4917 opportuna funzione di gestione, riportata in
4918 fig.~\ref{fig:ipc_posix_sem_shm_message_server_handler}. La funzione è molto
4919 semplice e richiama le funzioni di rimozione sia per il segmento di memoria
4920 condivisa che per il semaforo, garantendo così che possa essere riaperto
4921 ex-novo senza errori in un futuro riutilizzo del comando.
4922
4923 \begin{figure}[!htb]
4924   \footnotesize \centering
4925   \begin{minipage}[c]{\codesamplewidth}
4926     \includecodesample{listati/message_setter.c}
4927   \end{minipage} 
4928   \normalsize 
4929   \caption{Sezione principale del codice del programma
4930     \file{message\_setter.c}.}
4931   \label{fig:ipc_posix_sem_shm_message_setter}
4932 \end{figure}
4933
4934 Il secondo programma di esempio è \file{message\_setter.c}, di cui si è
4935 riportato il corpo principale in
4936 fig.~\ref{fig:ipc_posix_sem_shm_message_setter},\footnote{al solito il codice
4937   completo è nel file dei sorgenti allegati.} dove si è tralasciata, non
4938 essendo significativa per quanto si sta trattando, la parte relativa alla
4939 gestione delle opzioni a riga di comando e degli argomenti, che sono identici
4940 a quelli usati da \file{message\_getter}, con l'unica aggiunta di un'opzione
4941 ``\texttt{-t}'' che consente di indicare un tempo di attesa (in secondi) in
4942 cui il programma si ferma tenendo bloccato il semaforo.
4943
4944 Una volta completata la gestione delle opzioni e degli argomenti (ne deve
4945 essere presente uno solo, contenente la nuova stringa da usare come
4946 messaggio), il programma procede (\texttt{\small 10-14}) con l'acquisizione
4947 del segmento di memoria condivisa usando la funzione \func{FindShm} (trattata
4948 in sez.~\ref{sec:ipc_posix_shm}) che stavolta deve già esistere.  Il passo
4949 successivo (\texttt{\small 16-19}) è quello di aprire il semaforo, e a
4950 differenza di \file{message\_getter}, in questo caso si richiede a
4951 \func{sem\_open} che questo esista, passando uno zero come secondo ed unico
4952 argomento.
4953
4954 Una volta completate con successo le precedenti inizializzazioni, il passo
4955 seguente (\texttt{\small 21-24}) è quello di acquisire il semaforo, dopo di
4956 che sarà possibile eseguire la sostituzione del messaggio (\texttt{\small 25})
4957 senza incorrere in possibili \textit{race condition} con la stampa dello
4958 stesso da parte di \file{message\_getter}.
4959
4960 Una volta effettuata la modifica viene stampato (\texttt{\small 26}) il tempo
4961 di attesa impostato con l'opzione ``\texttt{-t}'' dopo di che (\texttt{\small
4962   27}) viene eseguita la stessa, senza rilasciare il semaforo che resterà
4963 quindi bloccato (causando a questo punto una interruzione delle stampe
4964 eseguite da \file{message\_getter}). Terminato il tempo di attesa si rilascerà
4965 (\texttt{\small 29-32}) il semaforo per poi uscire.
4966
4967 Per verificare il funzionamento dei programmi occorrerà lanciare per primo
4968 \file{message\_getter}\footnote{lanciare per primo \file{message\_setter} darà
4969   luogo ad un errore, non essendo stati creati il semaforo ed il segmento di
4970   memoria condivisa.} che inizierà a stampare una volta al secondo il
4971 contenuto del messaggio ed i suoi dati, con qualcosa del tipo:
4972 \begin{Console}
4973 piccardi@hain:~/gapil/sources$  \textbf{./message_getter messaggio}
4974 sem=1, Fri Dec 31 14:12:41 2010
4975 message: messaggio
4976 sem=1, Fri Dec 31 14:12:42 2010
4977 message: messaggio
4978 ...
4979 \end{Console}
4980 %$
4981 proseguendo indefinitamente fintanto che non si prema \texttt{C-c} per farlo
4982 uscire. Si noti come il valore del semaforo risulti sempre pari ad 1 (in
4983 quanto al momento esso sarà sempre libero). 
4984
4985 A questo punto si potrà lanciare \file{message\_setter} per cambiare il
4986 messaggio, nel nostro caso per rendere evidente il funzionamento del blocco
4987 richiederemo anche una attesa di 3 secondi, ed otterremo qualcosa del tipo:
4988 \begin{Console}
4989 piccardi@hain:~/gapil/sources$ \textbf{./message_setter -t 3 ciao}
4990 Sleeping for 3 seconds
4991 \end{Console}
4992 %$
4993 dove il programma si fermerà per 3 secondi prima di rilasciare il semaforo e
4994 terminare. 
4995
4996 L'effetto di questo programma si potrà però apprezzare meglio nell'uscita di
4997 \file{message\_getter}, che verrà interrotta per questo stesso tempo, prima di
4998 ricominciare con il nuovo testo:
4999 \begin{Console}
5000 ...
5001 sem=1, Fri Dec 31 14:16:27 2010
5002 message: messaggio
5003 sem=1, Fri Dec 31 14:16:28 2010
5004 message: messaggio
5005 sem=0, Fri Dec 31 14:16:29 2010
5006 message: ciao
5007 sem=1, Fri Dec 31 14:16:32 2010
5008 message: ciao
5009 sem=1, Fri Dec 31 14:16:33 2010
5010 message: ciao
5011 ...
5012 \end{Console}
5013 %$
5014
5015 E si noterà come nel momento in cui si lancia \file{message\_setter} le stampe
5016 di \file{message\_getter} si bloccheranno, come corretto, dopo aver registrato
5017 un valore nullo per il semaforo.  Il programma infatti resterà bloccato nella
5018 \func{sem\_wait} (quella di riga (\texttt{\small 37}) in
5019 fig.~\ref{fig:ipc_posix_sem_shm_message_server}) fino alla scadenza
5020 dell'attesa di \file{message\_setter} (con l'esecuzione della \func{sem\_post}
5021 della riga (\texttt{\small 29}) di
5022 fig.~\ref{fig:ipc_posix_sem_shm_message_setter}), e riprenderanno con il nuovo
5023 testo alla terminazione di quest'ultimo.
5024
5025
5026 % LocalWords:  like fifo System POSIX RPC Calls Common Object Request Brocker
5027 % LocalWords:  Architecture descriptor kernel unistd int filedes errno EMFILE
5028 % LocalWords:  ENFILE EFAULT BUF sez fig fork Stevens siblings EOF read SIGPIPE
5029 % LocalWords:  EPIPE shell CGI Gateway Interface HTML JPEG URL mime type gs dup
5030 % LocalWords:  barcode PostScript race condition stream BarCodePage WriteMess
5031 % LocalWords:  size PS switch wait popen pclose stdio const char command NULL
5032 % LocalWords:  EINVAL cap fully buffered Ghostscript l'Encapsulated epstopsf of
5033 % LocalWords:  PDF EPS lseek ESPIPE PPM Portable PixMap format pnmcrop PNG pnm
5034 % LocalWords:  pnmmargin png BarCode inode filesystem l'inode mknod mkfifo RDWR
5035 % LocalWords:  ENXIO deadlock client reinviate fortunes fortunefilename daemon
5036 % LocalWords:  FortuneServer FortuneParse FortuneClient pid libgapil  LD librt
5037 % LocalWords:  PATH linker pathname ps tmp killall fortuned crash socket domain
5038 % LocalWords:  socketpair BSD sys protocol sv EAFNOSUPPORT EPROTONOSUPPORT AF
5039 % LocalWords:  EOPNOTSUPP SOCK Process Comunication ipc perm key exec pipefd SZ
5040 % LocalWords:  header ftok proj stat libc SunOS glibc XPG dell'inode number uid
5041 % LocalWords:  cuid cgid gid tab MSG shift group umask seq MSGMNI SEMMNI SHMMNI
5042 % LocalWords:  shmmni msgmni sem sysctl IPCMNI IPCTestId msgget EACCES EEXIST
5043 % LocalWords:  CREAT EXCL EIDRM ENOENT ENOSPC ENOMEM novo proc MSGMAX msgmax ds
5044 % LocalWords:  MSGMNB msgmnb linked list msqid msgid linux msg qnum lspid lrpid
5045 % LocalWords:  rtime ctime qbytes first last cbytes msgctl semctl shmctl ioctl
5046 % LocalWords:  cmd struct buf EPERM RMID msgsnd msgbuf msgp msgsz msgflg EAGAIN
5047 % LocalWords:  NOWAIT EINTR mtype mtext long message sizeof LENGTH ts sleep BIG
5048 % LocalWords:  msgrcv ssize msgtyp NOERROR EXCEPT ENOMSG multiplexing select ls
5049 % LocalWords:  poll polling queue MQFortuneServer write init HandSIGTERM  l'IPC
5050 % LocalWords:  MQFortuneClient mqfortuned mutex risorse' inter semaphore semget
5051 % LocalWords:  nsems SEMMNS SEMMSL semid otime semval sempid semncnt semzcnt nr
5052 % LocalWords:  SEMVMX SEMOPM semop SEMMNU SEMUME SEMAEM semnum union semun arg
5053 % LocalWords:  ERANGE SETALL SETVAL GETALL array GETNCNT GETPID GETVAL GETZCNT
5054 % LocalWords:  sembuf sops unsigned nsops UNDO flg nsop num undo pending semadj
5055 % LocalWords:  sleeper scheduler running next semundo MutexCreate semunion lock
5056 % LocalWords:  MutexFind wrapper MutexRead MutexLock MutexUnlock unlock locking
5057 % LocalWords:  MutexRemove shmget SHMALL SHMMAX SHMMIN shmid shm segsz atime FD
5058 % LocalWords:  dtime lpid cpid nattac shmall shmmax SHMLBA SHMSEG EOVERFLOW brk
5059 % LocalWords:  memory shmat shmdt void shmaddr shmflg SVID RND RDONLY rounded
5060 % LocalWords:  SIGSEGV nattch exit SharedMem ShmCreate memset fill ShmFind home
5061 % LocalWords:  ShmRemove DirMonitor DirProp chdir GaPiL shmptr ipcs NFS SETPIPE
5062 % LocalWords:  ComputeValues ReadMonitor touch SIGTERM dirmonitor unlink fcntl
5063 % LocalWords:  LockFile UnlockFile CreateMutex FindMutex LockMutex SETLKW GETLK
5064 % LocalWords:  UnlockMutex RemoveMutex ReadMutex UNLCK WRLCK RDLCK mapping MAP
5065 % LocalWords:  SHARED ANONYMOUS thread patch names strace system call userid Di
5066 % LocalWords:  groupid Michal Wronski Krzysztof Benedyczak wrona posix mqueue
5067 % LocalWords:  lmqueue gcc mount mqd name oflag attr maxmsg msgsize receive ptr
5068 % LocalWords:  send WRONLY NONBLOCK close mqdes EBADF getattr setattr mqstat to
5069 % LocalWords:  omqstat curmsgs flags timedsend len prio timespec abs EMSGSIZE
5070 % LocalWords:  ETIMEDOUT timedreceive getaddr notify sigevent notification l'I
5071 % LocalWords:  EBUSY sigev SIGNAL signo value sigval siginfo all'userid MESGQ
5072 % LocalWords:  Konstantin Knizhnik futex tmpfs ramfs cache shared swap CONFIG
5073 % LocalWords:  lrt blocks PAGECACHE TRUNC CLOEXEC mmap ftruncate munmap FindShm
5074 % LocalWords:  CreateShm RemoveShm LIBRARY Library libmqueue FAILED has fclose
5075 % LocalWords:  ENAMETOOLONG qualchenome RESTART trywait XOPEN SOURCE timedwait
5076 % LocalWords:  process getvalue sval execve pshared ENOSYS heap PAGE destroy it
5077 % LocalWords:  xffffffff Arrays owner perms Queues used bytes messages device
5078 % LocalWords:  Cannot find such Segments getter Signal MSGMAXSIZE been stable
5079 % LocalWords:  for now it's break Berlin sources Let's an accidental feature fs
5080 % LocalWords:  Larry Wall Escape the Hell William ipctestid Identifier segment
5081 % LocalWords:  violation dell'I SIGINT setter Fri Dec Sleeping seconds ECHILD
5082 % LocalWords:  SysV capability short RESOURCE INFO UNDEFINED EFBIG semtimedop
5083 % LocalWords:  scan HUGETLB huge page NORESERVE copy RLIMIT MEMLOCK REMAP UTC
5084 % LocalWords:  readmon Hierarchy defaults queues MSGQUEUE effective fstat
5085 % LocalWords:  fchown fchmod Epoch January
5086
5087
5088 %%% Local Variables: 
5089 %%% mode: latex
5090 %%% TeX-master: "gapil"
5091 %%% End: