Tolti dei rimasugli di un bruttissimo anglicismo
[gapil.git] / ipc.tex
1 %% ipc.tex
2 %%
3 %% Copyright (C) 2000-2005 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11 \chapter{La comunicazione fra processi}
12 \label{cha:IPC}
13
14
15 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
16 la comunicazione fra processi. In questo capitolo affronteremo solo i
17 meccanismi più elementari che permettono di mettere in comunicazione processi
18 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
19 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
20
21 Tralasceremo invece tutte le problematiche relative alla comunicazione
22 attraverso la rete (e le relative interfacce) che saranno affrontate in
23 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
24 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) e CORBA
25 (\textit{Common Object Request Brocker Architecture}) che in genere sono
26 implementati con un ulteriore livello sopra i meccanismi elementari.
27
28
29 \section{La comunicazione fra processi tradizionale}
30 \label{sec:ipc_unix}
31
32 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
33 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
34 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
35 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
36 ne gestiscono l'uso e le varie forme in cui si è evoluto.
37
38
39 \subsection{Le \textit{pipe} standard}
40 \label{sec:ipc_pipes}
41
42 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
43 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
44 sostanza di una coppia di file descriptor\footnote{si tenga presente che
45   le pipe sono oggetti creati dal kernel e non risiedono su disco.} connessi
46 fra di loro in modo che se quanto scrive su di uno si può rileggere
47 dall'altro. Si viene così a costituire un canale di comunicazione tramite i
48 due file descriptor, nella forma di un \textsl{tubo} (da cui il nome)
49 attraverso cui fluiscono i dati.
50
51 La funzione che permette di creare questa speciale coppia di file descriptor
52 associati ad una \textit{pipe} è appunto \funcd{pipe}, ed il suo prototipo è:
53 \begin{prototype}{unistd.h}
54 {int pipe(int filedes[2])} 
55   
56 Crea una coppia di file descriptor associati ad una \textit{pipe}.
57   
58   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
59     errore, nel qual caso \var{errno} potrà assumere i valori \errval{EMFILE},
60     \errval{ENFILE} e \errval{EFAULT}.}
61 \end{prototype}
62
63 La funzione restituisce la coppia di file descriptor nel vettore
64 \param{filedes}; il primo è aperto in lettura ed il secondo in scrittura. Come
65 accennato concetto di funzionamento di una pipe è semplice: quello che si
66 scrive nel file descriptor aperto in scrittura viene ripresentato tale e quale
67 nel file descriptor aperto in lettura. I file descriptor infatti non sono
68 connessi a nessun file reale, ma ad un buffer nel kernel, la cui dimensione è
69 specificata dal parametro di sistema \const{PIPE\_BUF}, (vedi
70 sez.~\ref{sec:sys_file_limits}). Lo schema di funzionamento di una pipe è
71 illustrato in fig.~\ref{fig:ipc_pipe_singular}, in cui sono illustrati i due
72 capi della pipe, associati a ciascun file descriptor, con le frecce che
73 indicano la direzione del flusso dei dati.
74
75 \begin{figure}[htb]
76   \centering
77   \includegraphics[height=5cm]{img/pipe}
78   \caption{Schema della struttura di una pipe.}
79   \label{fig:ipc_pipe_singular}
80 \end{figure}
81
82 Chiaramente creare una pipe all'interno di un singolo processo non serve a
83 niente; se però ricordiamo quanto esposto in sez.~\ref{sec:file_sharing}
84 riguardo al comportamento dei file descriptor nei processi figli, è immediato
85 capire come una pipe possa diventare un meccanismo di intercomunicazione. Un
86 processo figlio infatti condivide gli stessi file descriptor del padre,
87 compresi quelli associati ad una pipe (secondo la situazione illustrata in
88 fig.~\ref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
89 capo della pipe, l'altro può leggere.
90
91 \begin{figure}[htb]
92   \centering
93   \includegraphics[height=5cm]{img/pipefork}
94   \caption{Schema dei collegamenti ad una pipe, condivisi fra processo padre e
95     figlio dopo l'esecuzione \func{fork}.}
96   \label{fig:ipc_pipe_fork}
97 \end{figure}
98
99 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
100 comunicazione fra processi attraverso una pipe, utilizzando le proprietà
101 ordinarie dei file, ma ci mostra anche qual è il principale\footnote{Stevens
102   in \cite{APUE} riporta come limite anche il fatto che la comunicazione è
103   unidirezionale, ma in realtà questo è un limite facilmente superabile usando
104   una coppia di pipe.} limite nell'uso delle pipe. È necessario infatti che i
105 processi possano condividere i file descriptor della pipe, e per questo essi
106 devono comunque essere \textsl{parenti} (dall'inglese \textit{siblings}), cioè
107 o derivare da uno stesso processo padre in cui è avvenuta la creazione della
108 pipe, o, più comunemente, essere nella relazione padre/figlio.
109
110 A differenza di quanto avviene con i file normali, la lettura da una pipe può
111 essere bloccante (qualora non siano presenti dati), inoltre se si legge da una
112 pipe il cui capo in scrittura è stato chiuso, si avrà la ricezione di un EOF
113 (vale a dire che la funzione \func{read} ritornerà restituendo 0).  Se invece
114 si esegue una scrittura su una pipe il cui capo in lettura non è aperto il
115 processo riceverà il segnale \const{SIGPIPE}, e la funzione di scrittura
116 restituirà un errore di \errcode{EPIPE} (al ritorno del gestore, o qualora il
117 segnale sia ignorato o bloccato).
118
119 La dimensione del buffer della pipe (\const{PIPE\_BUF}) ci dà inoltre un'altra
120 importante informazione riguardo il comportamento delle operazioni di lettura
121 e scrittura su di una pipe; esse infatti sono atomiche fintanto che la
122 quantità di dati da scrivere non supera questa dimensione. Qualora ad esempio
123 si effettui una scrittura di una quantità di dati superiore l'operazione verrà
124 effettuata in più riprese, consentendo l'intromissione di scritture effettuate
125 da altri processi.
126
127
128 \subsection{Un esempio dell'uso delle pipe}
129 \label{sec:ipc_pipe_use}
130
131 Per capire meglio il funzionamento delle pipe faremo un esempio di quello che
132 è il loro uso più comune, analogo a quello effettuato della shell, e che
133 consiste nell'inviare l'output di un processo (lo standard output) sull'input
134 di un'altro. Realizzeremo il programma di esempio nella forma di un
135 \textit{CGI}\footnote{Un CGI (\textit{Common Gateway Interface}) è un
136   programma che permette la creazione dinamica di un oggetto da inserire
137   all'interno di una pagina HTML.}  per Apache, che genera una immagine JPEG
138 di un codice a barre, specificato come argomento in ingresso.
139
140 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
141 delle caratteristiche specifiche, esso infatti non viene lanciato da una
142 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
143 solito ha la forma:
144 \begin{verbatim}
145     http://www.sito.it/cgi-bin/programma?argomento
146 \end{verbatim}
147 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
148 che ne descrive il mime-type) sullo standard output, in modo che il web-server
149 possa reinviarlo al browser che ha effettuato la richiesta, che in questo modo
150 è in grado di visualizzarlo opportunamente.
151
152 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
153 \cmd{gs}, il primo infatti è in grado di generare immagini PostScript di
154 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
155 serve per poter effettuare la conversione della stessa immagine in formato
156 JPEG. Usando una pipe potremo inviare l'output del primo sull'input del
157 secondo, secondo lo schema mostrato in fig.~\ref{fig:ipc_pipe_use}, in cui la
158 direzione del flusso dei dati è data dalle frecce continue.
159
160 \begin{figure}[htb]
161   \centering
162   \includegraphics[height=5cm]{img/pipeuse}
163   \caption{Schema dell'uso di una pipe come mezzo di comunicazione fra
164     due processi attraverso l'esecuzione una \func{fork} e la chiusura dei
165     capi non utilizzati.}
166   \label{fig:ipc_pipe_use}
167 \end{figure}
168
169 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
170 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
171 \textit{CGI} deve poter gestire più richieste in concorrenza, e si avrebbe una
172 evidente \textit{race condition}\itindex{race~condition} in caso di accesso
173 simultaneo a detto file.\footnote{il problema potrebbe essere superato
174   determinando in anticipo un nome appropriato per il file temporaneo, che
175   verrebbe utilizzato dai vari sotto-processi, e cancellato alla fine della
176   loro esecuzione; ma a questo le cose non sarebbero più tanto semplici.}
177 L'uso di una pipe invece permette di risolvere il problema in maniera semplice
178 ed elegante, oltre ad essere molto più efficiente, dato che non si deve
179 scrivere su disco.
180
181 Il programma ci servirà anche come esempio dell'uso delle funzioni di
182 duplicazione dei file descriptor che abbiamo trattato in
183 sez.~\ref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
184 funzioni infatti che è possibile dirottare gli stream standard dei processi
185 (che abbiamo visto in sez.~\ref{sec:file_std_descr} e
186 sez.~\ref{sec:file_std_stream}) sulla pipe. In
187 fig.~\ref{fig:ipc_barcodepage_code} abbiamo riportato il corpo del programma,
188 il cui codice completo è disponibile nel file \file{BarCodePage.c} che si
189 trova nella directory dei sorgenti.
190
191
192 \begin{figure}[!htb]
193   \footnotesize \centering
194   \begin{minipage}[c]{15cm}
195     \includecodesample{listati/BarCodePage.c}
196   \end{minipage} 
197   \normalsize 
198   \caption{Sezione principale del codice del \textit{CGI} 
199     \file{BarCodePage.c}.}
200   \label{fig:ipc_barcodepage_code}
201 \end{figure}
202
203 La prima operazione del programma (\texttt{\small 4--12}) è quella di creare
204 le due pipe che serviranno per la comunicazione fra i due comandi utilizzati
205 per produrre il codice a barre; si ha cura di controllare la riuscita della
206 chiamata, inviando in caso di errore un messaggio invece dell'immagine
207 richiesta.\footnote{la funzione \func{WriteMess} non è riportata in
208   fig.~\ref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
209   formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
210   \textit{mime type}, e formattando il messaggio in HTML, in modo che
211   quest'ultimo possa essere visualizzato correttamente da un browser.}
212
213 Una volta create le pipe, il programma può creare (\texttt{\small 13-17}) il
214 primo processo figlio, che si incaricherà (\texttt{\small 19--25}) di eseguire
215 \cmd{barcode}. Quest'ultimo legge dallo standard input una stringa di
216 caratteri, la converte nell'immagine PostScript del codice a barre ad essa
217 corrispondente, e poi scrive il risultato direttamente sullo standard output.
218
219 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
220 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima pipe, e se
221 ne collega (\texttt{\small 21}) il capo in lettura allo standard input, usando
222 \func{dup2}. Si ricordi che invocando \func{dup2} il secondo file, qualora
223 risulti aperto, viene, come nel caso corrente, chiuso prima di effettuare la
224 duplicazione. Allo stesso modo, dato che \cmd{barcode} scrive l'immagine
225 PostScript del codice a barre sullo standard output, per poter effettuare una
226 ulteriore redirezione il capo in lettura della seconda pipe viene chiuso
227 (\texttt{\small 22}) mentre il capo in scrittura viene collegato allo standard
228 output (\texttt{\small 23}).
229
230 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
231 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
232 leggerà dalla prima pipe la stringa da codificare che gli sarà inviata dal
233 padre, e scriverà l'immagine PostScript del codice a barre sulla seconda.
234
235 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
236 (\texttt{\small 26}) il capo inutilizzato della prima pipe (quello in input) e
237 poi scrive (\texttt{\small 27}) la stringa da convertire sul capo in output,
238 così che \cmd{barcode} possa riceverla dallo standard input. A questo punto
239 l'uso della prima pipe da parte del padre è finito ed essa può essere
240 definitivamente chiusa (\texttt{\small 28}), si attende poi (\texttt{\small
241   29}) che l'esecuzione di \cmd{barcode} sia completata.
242
243 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
244 PostScript del codice a barre sul capo in scrittura della seconda pipe; a
245 questo punto si può eseguire la seconda conversione, da PS a JPEG, usando il
246 programma \cmd{gs}. Per questo si crea (\texttt{\small 30--34}) un secondo
247 processo figlio, che poi (\texttt{\small 35--42}) eseguirà questo programma
248 leggendo l'immagine PostScript creata da \cmd{barcode} dallo standard input,
249 per convertirla in JPEG.
250
251 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
252 scrittura della seconda pipe, e se ne collega (\texttt{\small 38}) il capo in
253 lettura allo standard input. Per poter formattare l'output del programma in
254 maniera utilizzabile da un browser, si provvede anche \texttt{\small 40}) alla
255 scrittura dell'apposita stringa di identificazione del mime-type in testa allo
256 standard output. A questo punto si può invocare \texttt{\small 41}) \cmd{gs},
257 provvedendo gli appositi switch che consentono di leggere il file da
258 convertire dallo standard input e di inviare la conversione sullo standard
259 output.
260
261 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
262 capo in scrittura della seconda pipe, e attende la conclusione del figlio
263 (\texttt{\small 45}); a questo punto può (\texttt{\small 46}) uscire. Si tenga
264 conto che l'operazione di chiudere il capo in scrittura della seconda pipe è
265 necessaria, infatti, se non venisse chiusa, \cmd{gs}, che legge il suo
266 standard input da detta pipe, resterebbe bloccato in attesa di ulteriori dati
267 in ingresso (l'unico modo che un programma ha per sapere che l'input è
268 terminato è rilevare che lo standard input è stato chiuso), e la \func{wait}
269 non ritornerebbe.
270
271
272 \subsection{Le funzioni \func{popen} e \func{pclose}}
273 \label{sec:ipc_popen}
274
275 Come si è visto la modalità più comune di utilizzo di una pipe è quella di
276 utilizzarla per fare da tramite fra output ed input di due programmi invocati
277 in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due funzioni
278 che permettono di sintetizzare queste operazioni. La prima di esse si chiama
279 \funcd{popen} ed il suo prototipo è:
280 \begin{prototype}{stdio.h}
281 {FILE *popen(const char *command, const char *type)}
282
283 Esegue il programma \param{command}, di cui, a seconda di \param{type},
284 restituisce, lo standard input o lo standard output nella pipe collegata allo
285 stream restituito come valore di ritorno.
286   
287 \bodydesc{La funzione restituisce l'indirizzo dello stream associato alla pipe
288   in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
289   potrà assumere i valori relativi alle sottostanti invocazioni di \func{pipe}
290   e \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
291 \end{prototype}
292
293 La funzione crea una pipe, esegue una \func{fork}, ed invoca il programma
294 \param{command} attraverso la shell (in sostanza esegue \file{/bin/sh} con il
295 flag \code{-c}); l'argomento \param{type} deve essere una delle due stringhe
296 \verb|"w"| o \verb|"r"|, per indicare se la pipe sarà collegata allo standard
297 input o allo standard output del comando invocato.
298
299 La funzione restituisce il puntatore allo stream associato alla pipe creata,
300 che sarà aperto in sola lettura (e quindi associato allo standard output del
301 programma indicato) in caso si sia indicato \code{"r"}, o in sola scrittura (e
302 quindi associato allo standard input) in caso di \code{"w"}.
303
304 Lo stream restituito da \func{popen} è identico a tutti gli effetti ai file
305 stream visti in cap.~\ref{cha:files_std_interface}, anche se è collegato ad
306 una pipe e non ad un file, e viene sempre aperto in modalità
307 \textit{fully-buffered} (vedi sez.~\ref{sec:file_buffering}); l'unica
308 differenza con gli usuali stream è che dovrà essere chiuso dalla seconda delle
309 due nuove funzioni, \funcd{pclose}, il cui prototipo è:
310 \begin{prototype}{stdio.h}
311 {int pclose(FILE *stream)}
312
313 Chiude il file \param{stream}, restituito da una precedente \func{popen}
314 attendendo la terminazione del processo ad essa associato.
315   
316 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
317   errore; nel quel caso il valore di \var{errno} deriva dalle sottostanti
318   chiamate.}
319 \end{prototype}
320 \noindent che oltre alla chiusura dello stream si incarica anche di attendere
321 (tramite \func{wait4}) la conclusione del processo creato dalla precedente
322 \func{popen}.
323
324 Per illustrare l'uso di queste due funzioni riprendiamo il problema
325 precedente: il programma mostrato in fig.~\ref{fig:ipc_barcodepage_code} per
326 quanto funzionante, è (volutamente) codificato in maniera piuttosto complessa,
327 inoltre nella pratica sconta un problema di \cmd{gs} che non è in
328 grado\footnote{nella versione GNU Ghostscript 6.53 (2002-02-13).} di
329 riconoscere correttamente l'Encapsulated PostScript, per cui deve essere usato
330 il PostScript e tutte le volte viene generata una pagina intera, invece che
331 una immagine delle dimensioni corrispondenti al codice a barre.
332
333 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
334 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
335 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
336 generato da \cmd{barcode} utilizzando lo switch \cmd{-E}).  Utilizzando un PDF
337 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
338 originarie del codice a barre e produce un JPEG di dimensioni corrette.
339
340 Questo approccio però non funziona, per via di una delle caratteristiche
341 principali delle pipe. Per poter effettuare la conversione di un PDF infatti è
342 necessario, per la struttura del formato, potersi spostare (con \func{lseek})
343 all'interno del file da convertire; se si esegue la conversione con \cmd{gs}
344 su un file regolare non ci sono problemi, una pipe però è rigidamente
345 sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre con un errore
346 di \errcode{ESPIPE}, rendendo impossibile la conversione.  Questo ci dice che
347 in generale la concatenazione di vari programmi funzionerà soltanto quando
348 tutti prevedono una lettura sequenziale del loro input.
349
350 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
351 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
352 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
353   formato usato spesso come formato intermedio per effettuare conversioni, è
354   infatti molto facile da manipolare, dato che usa caratteri ASCII per
355   memorizzare le immagini, anche se per questo è estremamente inefficiente.}
356 dal quale poi si può ottenere un'immagine di dimensioni corrette attraverso
357 vari programmi di manipolazione (\cmd{pnmcrop}, \cmd{pnmmargin}) che può
358 essere infine trasformata in PNG (con \cmd{pnm2png}).
359
360 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
361 inviando l'output di ciascuno all'input del successivo, per poi ottenere il
362 risultato finale sullo standard output: un caso classico di utilizzazione
363 delle pipe, in cui l'uso di \func{popen} e \func{pclose} permette di
364 semplificare notevolmente la stesura del codice.
365
366 Nel nostro caso, dato che ciascun processo deve scrivere il suo output sullo
367 standard input del successivo, occorrerà usare \func{popen} aprendo la pipe in
368 scrittura. Il codice del nuovo programma è riportato in
369 fig.~\ref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione
370 dei programmi è l'inverso di quello in cui ci si aspetta che vengano
371 effettivamente eseguiti. Questo non comporta nessun problema dato che la
372 lettura su una pipe è bloccante, per cui ciascun processo, per quanto lanciato
373 per primo, si bloccherà in attesa di ricevere sullo standard input il
374 risultato dell'elaborazione del precedente, benché quest'ultimo venga invocato
375 dopo.
376
377 \begin{figure}[!htb]
378   \footnotesize \centering
379   \begin{minipage}[c]{15cm}
380     \includecodesample{listati/BarCode.c}
381   \end{minipage} 
382   \normalsize 
383   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
384   \label{fig:ipc_barcode_code}
385 \end{figure}
386
387 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il mime-type
388 sullo standard output; a questo punto il processo padre non necessita più di
389 eseguire ulteriori operazioni sullo standard output e può tranquillamente
390 provvedere alla redirezione.
391
392 Dato che i vari programmi devono essere lanciati in successione, si è
393 approntato un ciclo (\texttt{\small 15--19}) che esegue le operazioni in
394 sequenza: prima crea una pipe (\texttt{\small 17}) per la scrittura eseguendo
395 il programma con \func{popen}, in modo che essa sia collegata allo standard
396 input, e poi redirige (\texttt{\small 18}) lo standard output su detta pipe.
397
398 In questo modo il primo processo ad essere invocato (che è l'ultimo della
399 catena) scriverà ancora sullo standard output del processo padre, ma i
400 successivi, a causa di questa redirezione, scriveranno sulla pipe associata
401 allo standard input del processo invocato nel ciclo precedente.
402
403 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
404 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
405 (\texttt{\small 23}) la stringa del codice a barre sulla pipe, che è collegata
406 al suo standard input, infine si può eseguire (\texttt{\small 24--27}) un
407 ciclo che chiuda, nell'ordine inverso rispetto a quello in cui le si sono
408 create, tutte le pipe create con \func{pclose}.
409
410
411 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
412 \label{sec:ipc_named_pipe}
413
414 Come accennato in sez.~\ref{sec:ipc_pipes} il problema delle \textit{pipe} è
415 che esse possono essere utilizzate solo da processi con un progenitore comune
416 o nella relazione padre/figlio; per superare questo problema lo standard
417 POSIX.1 ha definito dei nuovi oggetti, le \textit{fifo}, che hanno le stesse
418 caratteristiche delle pipe, ma che invece di essere strutture interne del
419 kernel, visibili solo attraverso un file descriptor, sono accessibili
420 attraverso un inode\index{inode} che risiede sul filesystem, così che i
421 processi le possono usare senza dovere per forza essere in una relazione di
422 \textsl{parentela}.
423
424 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le pipe,
425 attraverso un apposito buffer nel kernel, senza transitare dal filesystem;
426 l'inode\index{inode} allocato sul filesystem serve infatti solo a fornire un
427 punto di riferimento per i processi, che permetta loro di accedere alla stessa
428 fifo; il comportamento delle funzioni di lettura e scrittura è identico a
429 quello illustrato per le pipe in sez.~\ref{sec:ipc_pipes}.
430
431 Abbiamo già visto in sez.~\ref{sec:file_mknod} le funzioni \func{mknod} e
432 \func{mkfifo} che permettono di creare una fifo; per utilizzarne una un
433 processo non avrà che da aprire il relativo file speciale o in lettura o
434 scrittura; nel primo caso sarà collegato al capo di uscita della fifo, e dovrà
435 leggere, nel secondo al capo di ingresso, e dovrà scrivere.
436
437 Il kernel crea una singola pipe per ciascuna fifo che sia stata aperta, che può
438 essere acceduta contemporaneamente da più processi, sia in lettura che in
439 scrittura. Dato che per funzionare deve essere aperta in entrambe le
440 direzioni, per una fifo di norma la funzione \func{open} si blocca se viene
441 eseguita quando l'altro capo non è aperto.
442
443 Le fifo però possono essere anche aperte in modalità \textsl{non-bloccante},
444 nel qual caso l'apertura del capo in lettura avrà successo solo quando anche
445 l'altro capo è aperto, mentre l'apertura del capo in scrittura restituirà
446 l'errore di \errcode{ENXIO} fintanto che non verrà aperto il capo in lettura.
447
448 In Linux è possibile aprire le fifo anche in lettura/scrittura,\footnote{lo
449   standard POSIX lascia indefinito il comportamento in questo caso.}
450 operazione che avrà sempre successo immediato qualunque sia la modalità di
451 apertura (bloccante e non bloccante); questo può essere utilizzato per aprire
452 comunque una fifo in scrittura anche se non ci sono ancora processi il
453 lettura; è possibile anche usare la fifo all'interno di un solo processo, nel
454 qual caso però occorre stare molto attenti alla possibili situazioni di
455 stallo.\footnote{se si cerca di leggere da una fifo che non contiene dati si
456   avrà un deadlock\itindex{deadlock} immediato, dato che il processo si blocca
457   e non potrà quindi mai eseguire le funzioni di scrittura.}
458
459 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
460 piuttosto frequente l'utilizzo di una fifo come canale di comunicazione nelle
461 situazioni un processo deve ricevere informazioni da altri. In questo caso è
462 fondamentale che le operazioni di scrittura siano atomiche; per questo si deve
463 sempre tenere presente che questo è vero soltanto fintanto che non si supera
464 il limite delle dimensioni di \const{PIPE\_BUF} (si ricordi quanto detto in
465 sez.~\ref{sec:ipc_pipes}).
466
467 A parte il caso precedente, che resta probabilmente il più comune, Stevens
468 riporta in \cite{APUE} altre due casistiche principali per l'uso delle fifo:
469 \begin{itemize}
470 \item Da parte dei comandi di shell, per evitare la creazione di file
471   temporanei quando si devono inviare i dati di uscita di un processo
472   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
473   
474 \item Come canale di comunicazione fra client ed server (il modello
475   \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}).
476 \end{itemize}
477
478 Nel primo caso quello che si fa è creare tante fifo, da usare come standard
479 input, quanti sono i processi a cui i vogliono inviare i dati, questi ultimi
480 saranno stati posti in esecuzione ridirigendo lo standard input dalle fifo, si
481 potrà poi eseguire il processo che fornisce l'output replicando quest'ultimo,
482 con il comando \cmd{tee}, sulle varie fifo.
483
484 Il secondo caso è relativamente semplice qualora si debba comunicare con un
485 processo alla volta (nel qual caso basta usare due fifo, una per leggere ed
486 una per scrivere), le cose diventano invece molto più complesse quando si
487 vuole effettuare una comunicazione fra il server ed un numero imprecisato di
488 client; se il primo infatti può ricevere le richieste attraverso una fifo
489 ``\textsl{nota}'', per le risposte non si può fare altrettanto, dato che, per
490 la struttura sequenziale delle fifo, i client dovrebbero sapere, prima di
491 leggerli, quando i dati inviati sono destinati a loro.
492
493 Per risolvere questo problema, si può usare un'architettura come quella
494 illustrata in fig.~\ref{fig:ipc_fifo_server_arch} in cui i client inviano le
495 richieste al server su una fifo nota mentre le risposte vengono reinviate dal
496 server a ciascuno di essi su una fifo temporanea creata per l'occasione.
497
498 \begin{figure}[htb]
499   \centering
500   \includegraphics[height=9cm]{img/fifoserver}
501   \caption{Schema dell'utilizzo delle fifo nella realizzazione di una
502   architettura di comunicazione client/server.}
503   \label{fig:ipc_fifo_server_arch}
504 \end{figure}
505
506 Come esempio di uso questa architettura e dell'uso delle fifo, abbiamo scritto
507 un server di \textit{fortunes}, che restituisce, alle richieste di un client,
508 un detto a caso estratto da un insieme di frasi; sia il numero delle frasi
509 dell'insieme, che i file da cui esse vengono lette all'avvio, sono importabili
510 da riga di comando. Il corpo principale del server è riportato in
511 fig.~\ref{fig:ipc_fifo_server}, dove si è tralasciata la parte che tratta la
512 gestione delle opzioni a riga di comando, che effettua il settaggio delle
513 variabili \var{fortunefilename}, che indica il file da cui leggere le frasi,
514 ed \var{n}, che indica il numero di frasi tenute in memoria, ad un valore
515 diverso da quelli preimpostati. Il codice completo è nel file
516 \file{FortuneServer.c}.
517
518 \begin{figure}[!htb]
519   \footnotesize \centering
520   \begin{minipage}[c]{15cm}
521     \includecodesample{listati/FortuneServer.c}
522   \end{minipage} 
523   \normalsize 
524   \caption{Sezione principale del codice del server di \textit{fortunes}
525     basato sulle fifo.}
526   \label{fig:ipc_fifo_server}
527 \end{figure}
528
529 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
530 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
531 \var{fortune} avviene solo quando questa dimensione viene specificata, la
532 presenza di un valore nullo provoca l'uscita dal programma attraverso la
533 routine (non riportata) che ne stampa le modalità d'uso.  Dopo di che installa
534 (\texttt{\small 13--15}) la funzione che gestisce i segnali di interruzione
535 (anche questa non è riportata in fig.~\ref{fig:ipc_fifo_server}) che si limita
536 a rimuovere dal filesystem la fifo usata dal server per comunicare.
537
538 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
539 funzione \code{FortuneParse} che legge dal file specificato in
540 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
541 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
542 Anche il codice della funzione non è riportato, in quanto non direttamente
543 attinente allo scopo dell'esempio.
544
545 Il passo successivo (\texttt{\small 17--22}) è quello di creare con
546 \func{mkfifo} la fifo nota sulla quale il server ascolterà le richieste,
547 qualora si riscontri un errore il server uscirà (escludendo ovviamente il caso
548 in cui la funzione \func{mkfifo} fallisce per la precedente esistenza della
549 fifo).
550
551 Una volta che si è certi che la fifo di ascolto esiste la procedura di
552 inizializzazione è completata. A questo punto si può chiamare (\texttt{\small
553   23}) la funzione \func{daemon} per far proseguire l'esecuzione del programma
554 in background come demone.  Si può quindi procedere (\texttt{\small 24--33})
555 alla apertura della fifo: si noti che questo viene fatto due volte, prima in
556 lettura e poi in scrittura, per evitare di dover gestire all'interno del ciclo
557 principale il caso in cui il server è in ascolto ma non ci sono client che
558 effettuano richieste.  Si ricordi infatti che quando una fifo è aperta solo
559 dal capo in lettura, l'esecuzione di \func{read} ritorna con zero byte (si ha
560 cioè una condizione di end-of-file).
561
562 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
563 client non apre a sua volta la fifo nota in scrittura per effettuare la sua
564 richiesta. Pertanto all'inizio non ci sono problemi, il client però, una volta
565 ricevuta la risposta, uscirà, chiudendo tutti i file aperti, compresa la fifo.
566 A questo punto il server resta (se non ci sono altri client che stanno
567 effettuando richieste) con la fifo chiusa sul lato in lettura, ed in questo
568 stato la funzione \func{read} non si bloccherà in attesa di input, ma
569 ritornerà in continuazione, restituendo un end-of-file.\footnote{Si è usata
570   questa tecnica per compatibilità, Linux infatti supporta l'apertura delle
571   fifo in lettura/scrittura, per cui si sarebbe potuto effettuare una singola
572   apertura con \const{O\_RDWR}, la doppia apertura comunque ha il vantaggio
573   che non si può scrivere per errore sul capo aperto in sola lettura.}
574
575 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
576   24--28}),\footnote{di solito si effettua l'apertura del capo in lettura di
577   una fifo in modalità non bloccante, per evitare il rischio di uno stallo: se
578   infatti nessuno apre la fifo in scrittura il processo non ritornerà mai
579   dalla \func{open}. Nel nostro caso questo rischio non esiste, mentre è
580   necessario potersi bloccare in lettura in attesa di una richiesta.} si
581 esegue una seconda apertura in scrittura (\texttt{\small 29--32}), scartando
582 il relativo file descriptor, che non sarà mai usato, in questo modo però la
583 fifo resta comunque aperta anche in scrittura, cosicché le successive chiamate
584 a \func{read} possono bloccarsi.
585
586 A questo punto si può entrare nel ciclo principale del programma che fornisce
587 le risposte ai client (\texttt{\small 34--50}); questo viene eseguito
588 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
589 modo da passare attraverso la routine di chiusura che cancella la fifo).
590
591 Il server è progettato per accettare come richieste dai client delle stringhe
592 che contengono il nome della fifo sulla quale deve essere inviata la risposta.
593 Per cui prima (\texttt{\small 35--39}) si esegue la lettura dalla stringa di
594 richiesta dalla fifo nota (che a questo punto si bloccherà tutte le volte che
595 non ci sono richieste). Dopo di che, una volta terminata la stringa
596 (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero casuale per
597 ricavare la frase da inviare, si procederà (\texttt{\small 42--46})
598 all'apertura della fifo per la risposta, che poi \texttt{\small 47--48}) vi
599 sarà scritta. Infine (\texttt{\small 49}) si chiude la fifo di risposta che
600 non serve più.
601
602 Il codice del client è invece riportato in fig.~\ref{fig:ipc_fifo_client},
603 anche in questo caso si è omessa la gestione delle opzioni e la funzione che
604 stampa a video le informazioni di utilizzo ed esce, riportando solo la sezione
605 principale del programma e le definizioni delle variabili. Il codice completo
606 è nel file \file{FortuneClient.c} dei sorgenti allegati.
607
608 \begin{figure}[!htb]
609   \footnotesize \centering
610   \begin{minipage}[c]{15cm}
611     \includecodesample{listati/FortuneClient.c}
612   \end{minipage} 
613   \normalsize 
614   \caption{Sezione principale del codice del client di \textit{fortunes}
615     basato sulle fifo.}
616   \label{fig:ipc_fifo_client}
617 \end{figure}
618
619 La prima istruzione (\texttt{\small 12}) compone il nome della fifo che dovrà
620 essere utilizzata per ricevere la risposta dal server.  Si usa il \acr{pid}
621 del processo per essere sicuri di avere un nome univoco; dopo di che
622 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
623 in caso di errore (a meno che il file non sia già presente sul filesystem).
624
625 A questo punto il client può effettuare l'interrogazione del server, per
626 questo prima si apre la fifo nota (\texttt{\small 19--23}), e poi ci si scrive
627 (\texttt{\small 24}) la stringa composta in precedenza, che contiene il nome
628 della fifo da utilizzare per la risposta. Infine si richiude la fifo del
629 server che a questo punto non serve più (\texttt{\small 25}).
630
631 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
632 si apre (\texttt{\small 26--30}) la fifo appena creata, da cui si deve
633 riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
634 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
635 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
636 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
637 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
638 fifo e si cancella (\texttt{\small 34}) il relativo file.
639 Si noti come la fifo per la risposta sia stata aperta solo dopo aver inviato
640 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
641 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
642 scrittura e l'apertura si sarebbe bloccata indefinitamente.
643
644 Verifichiamo allora il comportamento dei nostri programmi, in questo, come in
645 altri esempi precedenti, si fa uso delle varie funzioni di servizio, che sono
646 state raccolte nella libreria \file{libgapil.so}, per poter usare quest'ultima
647 occorrerà definire la speciale variabile di ambiente \code{LD\_LIBRARY\_PATH}
648 in modo che il linker dinamico possa accedervi.
649
650 In generale questa variabile indica il \itindex{pathname}\textit{pathname}
651 della directory contenente la libreria. Nell'ipotesi (che daremo sempre per
652 verificata) che si facciano le prove direttamente nella directory dei sorgenti
653 (dove di norma vengono creati sia i programmi che la libreria), il comando da
654 dare sarà \code{export LD\_LIBRARY\_PATH=./}; a questo punto potremo lanciare
655 il server, facendogli leggere una decina di frasi, con:
656 \begin{verbatim}
657 [piccardi@gont sources]$ ./fortuned -n10
658 \end{verbatim}
659
660 Avendo usato \func{daemon} per eseguire il server in background il comando
661 ritornerà immediatamente, ma potremo verificare con \cmd{ps} che in effetti il
662 programma resta un esecuzione in background, e senza avere associato un
663 terminale di controllo (si ricordi quanto detto in sez.~\ref{sec:sess_daemon}):
664 \begin{verbatim}
665 [piccardi@gont sources]$ ps aux
666 ...
667 piccardi 27489  0.0  0.0  1204  356 ?        S    01:06   0:00 ./fortuned -n10
668 piccardi 27492  3.0  0.1  2492  764 pts/2    R    01:08   0:00 ps aux
669 \end{verbatim}%$
670 e si potrà verificare anche che in \file{/tmp} è stata creata la fifo di
671 ascolto \file{fortune.fifo}. A questo punto potremo interrogare il server con
672 il programma client; otterremo così:
673 \begin{verbatim}
674 [piccardi@gont sources]$ ./fortune
675 Linux ext2fs has been stable for a long time, now it's time to break it
676         -- Linuxkongreß '95 in Berlin
677 [piccardi@gont sources]$ ./fortune
678 Let's call it an accidental feature.
679         --Larry Wall
680 [piccardi@gont sources]$ ./fortune
681 .........    Escape the 'Gates' of Hell
682   `:::'                  .......  ......
683    :::  *                  `::.    ::'
684    ::: .::  .:.::.  .:: .::  `::. :'
685    :::  ::   ::  ::  ::  ::    :::.
686    ::: .::. .::  ::.  `::::. .:'  ::.
687 ...:::.....................::'   .::::..
688         -- William E. Roadcap
689 [piccardi@gont sources]$ ./fortune
690 Linux ext2fs has been stable for a long time, now it's time to break it
691         -- Linuxkongreß '95 in Berlin
692 \end{verbatim}%$
693 e ripetendo varie volte il comando otterremo, in ordine casuale, le dieci
694 frasi tenute in memoria dal server.
695
696 Infine per chiudere il server basterà inviare un segnale di terminazione con
697 \code{killall fortuned} e potremo verificare che il gestore del segnale ha
698 anche correttamente cancellato la fifo di ascolto da \file{/tmp}.
699
700 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
701 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
702   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
703   per il server sapere se un client è andato in crash, con la possibilità di
704   far restare le fifo temporanee sul filesystem, di come sia necessario
705   intercettare \const{SIGPIPE} dato che un client può terminare dopo aver
706   fatto una richiesta, ma prima che la risposta sia inviata (cosa che nel
707   nostro esempio non è stata fatta).}; in generale infatti l'interfaccia delle
708 fifo non è adatta a risolvere questo tipo di problemi, che possono essere
709 affrontati in maniera più semplice ed efficace o usando i
710 \textit{socket}\index{socket} (che tratteremo in dettaglio a partire da
711 cap.~\ref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione
712 diversi, come quelli che esamineremo in seguito.
713
714
715
716 \subsection{La funzione \func{socketpair}}
717 \label{sec:ipc_socketpair}
718
719 Un meccanismo di comunicazione molto simile alle pipe, ma che non presenta il
720 problema della unidirezionalità del flusso dei dati, è quello dei cosiddetti
721 \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo l'argomento
722 dei \textit{socket}\index{socket} in cap.~\ref{cha:socket_intro},\footnote{si
723   tratta comunque di oggetti di comunicazione che, come le pipe, sono
724   utilizzati attraverso dei file descriptor.} nell'ambito dell'interfaccia
725 generale che essi forniscono per la programmazione di rete; e vedremo anche
726 (in~sez.~\ref{sec:sock_sa_local}) come si possono definire dei file speciali
727 (di tipo \textit{socket}, analoghi a quello associati alle fifo) cui si accede
728 però attraverso quella medesima interfaccia; vale però la pena esaminare qui
729 una modalità di uso dei socket locali\footnote{la funzione \func{socketpair} è
730   stata introdotta in BSD4.4, ma è supportata in genere da qualunque sistema
731   che fornisca l'interfaccia dei socket.} che li rende sostanzialmente
732 identici ad una pipe bidirezionale.
733
734 La funzione \funcd{socketpair} infatti consente di creare una coppia di file
735 descriptor connessi fra di loro (tramite un socket\index{socket}, appunto),
736 senza dover ricorrere ad un file speciale sul filesystem, i descrittori sono
737 del tutto analoghi a quelli che si avrebbero con una chiamata a \func{pipe},
738 con la sola differenza è che in questo caso il flusso dei dati può essere
739 effettuato in entrambe le direzioni. Il prototipo della funzione è:
740 \begin{functions}
741   \headdecl{sys/types.h} 
742   \headdecl{sys/socket.h} 
743   
744   \funcdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
745   
746   Crea una coppia di socket\index{socket} connessi fra loro.
747   
748   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
749     errore, nel qual caso \var{errno} assumerà uno dei valori:
750   \begin{errlist}
751   \item[\errcode{EAFNOSUPPORT}] I socket\index{socket} locali non sono
752     supportati.
753   \item[\errcode{EPROTONOSUPPORT}] Il protocollo specificato non è supportato.
754   \item[\errcode{EOPNOTSUPP}] Il protocollo specificato non supporta la
755   creazione di coppie di socket\index{socket}.
756   \end{errlist}
757   ed inoltre \errval{EMFILE},  \errval{EFAULT}.
758 }
759 \end{functions}
760
761 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
762 loro: quello che si scrive su uno di essi sarà ripresentato in input
763 sull'altro e viceversa. Gli argomenti \param{domain}, \param{type} e
764 \param{protocol} derivano dall'interfaccia dei socket\index{socket} (vedi
765 sez.~\ref{sec:sock_creation}) che è quella che fornisce il substrato per
766 connettere i due descrittori, ma in questo caso i soli valori validi che
767 possono essere specificati sono rispettivamente \const{AF\_UNIX},
768 \const{SOCK\_STREAM} e \val{0}.
769
770 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
771 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei
772 socket\index{socket} locali in generale) permette di trasmettere attraverso le
773 linea non solo dei dati, ma anche dei file descriptor: si può cioè passare da
774 un processo ad un altro un file descriptor, con una sorta di duplicazione
775 dello stesso non all'interno di uno stesso processo, ma fra processi distinti
776 (torneremo su questa funzionalità in sez.~\ref{sec:xxx_fd_passing}).
777
778
779 \section{Il sistema di comunicazione fra processi di System V}
780 \label{sec:ipc_sysv}
781
782 Benché le pipe e le fifo siano ancora ampiamente usate, esse scontano il
783 limite fondamentale che il meccanismo di comunicazione che forniscono è
784 rigidamente sequenziale: una situazione in cui un processo scrive qualcosa che
785 molti altri devono poter leggere non può essere implementata con una pipe.
786
787 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
788 oggetti per la comunicazione fra processi ed una nuova interfaccia di
789 programmazione, che fossero in grado di garantire una maggiore flessibilità.
790 In questa sezione esamineremo come Linux supporta quello che viene chiamato il
791 \textsl{Sistema di comunicazione fra processi} di System V, cui da qui in
792 avanti faremo riferimento come \textit{SysV IPC} (dove IPC è la sigla di
793 \textit{Inter-Process Comunication}).
794
795
796
797 \subsection{Considerazioni generali}
798 \label{sec:ipc_sysv_generic}
799
800 La principale caratteristica del \textit{SysV IPC} è quella di essere basato
801 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
802 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
803 non vengono cancellati dal sistema una volta che non sono più in uso.
804
805 Questo comporta due problemi: il primo è che, al contrario di quanto avviene
806 per pipe e fifo, la memoria allocata per questi oggetti non viene rilasciata
807 automaticamente quando non c'è più nessuno che li utilizzi, ed essi devono
808 essere cancellati esplicitamente, se non si vuole che restino attivi fino al
809 riavvio del sistema. Il secondo problema è che, dato che non c'è, come per i
810 file, un contatore del numero di riferimenti che ne indichi l'essere in uso,
811 essi possono essere cancellati anche se ci sono dei processi che li stanno
812 utilizzando, con tutte le conseguenze (negative) del caso.
813
814 Un'ulteriore caratteristica negativa è che gli oggetti usati nel \textit{SysV
815   IPC} vengono creati direttamente dal kernel, e sono accessibili solo
816 specificando il relativo \textsl{identificatore}. Questo è un numero
817 progressivo (un po' come il \acr{pid} dei processi) che il kernel assegna a
818 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
819 torneremo in sez.~\ref{sec:ipc_sysv_id_use}). L'identificatore viene restituito
820 dalle funzioni che creano l'oggetto, ed è quindi locale al processo che le ha
821 eseguite. Dato che l'identificatore viene assegnato dinamicamente dal kernel
822 non è possibile prevedere quale sarà, né utilizzare un qualche valore statico,
823 si pone perciò il problema di come processi diversi possono accedere allo
824 stesso oggetto.
825
826 Per risolvere il problema nella struttura \struct{ipc\_perm} che il kernel
827 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
828 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
829 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
830 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
831   si sposta il problema dell'accesso dalla classificazione in base
832   all'identificatore alla classificazione in base alla chiave, una delle tante
833   complicazioni inutili presenti nel \textit{SysV IPC}.} Oltre la chiave, la
834 struttura, la cui definizione è riportata in fig.~\ref{fig:ipc_ipc_perm},
835 mantiene varie proprietà ed informazioni associate all'oggetto.
836
837 \begin{figure}[!htb]
838   \footnotesize \centering
839   \begin{minipage}[c]{15cm}
840     \includestruct{listati/ipc_perm.h}
841   \end{minipage} 
842   \normalsize 
843   \caption{La struttura \structd{ipc\_perm}, come definita in
844     \file{sys/ipc.h}.}
845   \label{fig:ipc_ipc_perm}
846 \end{figure}
847
848 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
849 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
850 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
851 sono \textsl{imparentati} la soluzione è relativamente semplice, in tal caso
852 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
853 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
854 disponibile in tutti i figli, e potrà essere passato come argomento attraverso
855 una \func{exec}.
856
857 Però quando i processi non sono \textsl{imparentati} (come capita tutte le
858 volte che si ha a che fare con un sistema client-server) tutto questo non è
859 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
860 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
861 alternativa più efficace è quella che i programmi usino un valore comune per
862 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
863 sempre il rischio che questa chiave possa essere stata già utilizzata da
864 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
865 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione
866 apposita, \funcd{ftok}, che permette di ottenere una chiave specificando il
867 nome di un file ed un numero di versione; il suo prototipo è:
868 \begin{functions}
869   \headdecl{sys/types.h} 
870   \headdecl{sys/ipc.h} 
871   
872   \funcdecl{key\_t ftok(const char *pathname, int proj\_id)}
873   
874   Restituisce una chiave per identificare un oggetto del \textit{SysV IPC}.
875   
876   \bodydesc{La funzione restituisce la chiave in caso di successo e -1
877     altrimenti, nel qual caso \var{errno} sarà uno dei possibili codici di
878     errore di \func{stat}.}
879 \end{functions}
880
881 La funzione determina un valore della chiave sulla base di \param{pathname},
882 che deve specificare il \itindex{pathname}\textit{pathname} di un file
883 effettivamente esistente e di un numero di progetto \param{proj\_id)}, che di
884 norma viene specificato come carattere, dato che ne vengono utilizzati solo
885 gli 8 bit meno significativi.\footnote{nelle libc4 e libc5, come avviene in
886   SunOS, l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, le
887   \acr{glibc} usano il prototipo specificato da XPG4, ma vengono lo stesso
888   utilizzati gli 8 bit meno significativi.}
889
890 Il problema è che anche così non c'è la sicurezza che il valore della chiave
891 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
892 con i 16 bit meno significativi dell'inode\index{inode} del file
893 \param{pathname} (che vengono ottenuti attraverso \func{stat}, da cui derivano
894 i possibili errori), e gli 8 bit meno significativi del numero del dispositivo
895 su cui è il file.  Diventa perciò relativamente facile ottenere delle
896 collisioni, specie se i file sono su dispositivi con lo stesso \textit{minor
897   number}, come \file{/dev/hda1} e \file{/dev/sda1}.
898
899 In genere quello che si fa è utilizzare un file comune usato dai programmi che
900 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
901 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
902 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
903 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
904 bene in fase di creazione, le cose possono complicarsi per i programmi che
905 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
906 attributi di \struct{ipc\_perm}, non esiste una modalità semplice per essere
907 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
908 creato da chi ci si aspetta.
909
910 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
911 contatore di riferimenti per la cancellazione automatica, il principale
912 problema del \textit{SysV IPC}. Non esiste infatti una modalità chiara per
913 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
914 file, e tutta l'interfaccia è inutilmente complessa.  Per questo ne è stata
915 effettuata una revisione completa nello standard POSIX.1b, che tratteremo in
916 sez.~\ref{sec:ipc_posix}.
917
918
919 \subsection{Il controllo di accesso}
920 \label{sec:ipc_sysv_access_control}
921
922 Oltre alle chiavi, abbiamo visto che ad ogni oggetto sono associate in
923 \struct{ipc\_perm} ulteriori informazioni, come gli identificatori del creatore
924 (nei campi \var{cuid} e \var{cgid}) e del proprietario (nei campi \var{uid} e
925 \var{gid}) dello stesso, e un insieme di permessi (nel campo \var{mode}). In
926 questo modo è possibile definire un controllo di accesso sugli oggetti di IPC,
927 simile a quello che si ha per i file (vedi sez.~\ref{sec:file_perm_overview}).
928
929 Benché questo controllo di accesso sia molto simile a quello dei file, restano
930 delle importanti differenze. La prima è che il permesso di esecuzione non
931 esiste (e se specificato viene ignorato), per cui si può parlare solo di
932 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
933 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
934 ed hanno lo stesso significato di quelli riportati in
935 tab.~\ref{tab:file_mode_flags}\footnote{se però si vogliono usare le costanti
936   simboliche ivi definite occorrerà includere il file \file{sys/stat.h},
937   alcuni sistemi definiscono le costanti \const{MSG\_R} (\texttt{0400}) e
938   \const{MSG\_W} (\texttt{0200}) per indicare i permessi base di lettura e
939   scrittura per il proprietario, da utilizzare, con gli opportuni shift, pure
940   per il gruppo e gli altri, in Linux, visto la loro scarsa utilità, queste
941   costanti non sono definite.} e come per i file definiscono gli accessi per
942 il proprietario, il suo gruppo e tutti gli altri.
943
944 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
945 \struct{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono impostati
946 rispettivamente al valore dell'user-ID e del group-ID effettivo del processo
947 che ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
948 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
949
950 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
951 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
952 specificano tutte un argomento \param{flag}, in tal caso quando viene
953 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
954 permessi, questi vengono controllati e l'identificatore viene restituito solo
955 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
956 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
957 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
958 nullo, nel qual caso l'identificatore sarà restituito comunque.
959
960 Il secondo livello di controllo è quello delle varie funzioni che accedono
961 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
962 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
963 \begin{itemize}
964 \item se il processo ha i privilegi di amministratore l'accesso è sempre
965   consentito. 
966 \item se l'user-ID effettivo del processo corrisponde o al valore del campo
967   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
968   in \var{mode} è appropriato\footnote{per appropriato si intende che è
969     impostato il permesso di scrittura per le operazioni di scrittura e quello
970     di lettura per le operazioni di lettura.} l'accesso è consentito.
971 \item se il group-ID effettivo del processo corrisponde o al
972   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
973   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
974 \item se il permesso per gli altri è appropriato l'accesso è consentito.
975 \end{itemize}
976 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
977 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
978 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
979 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
980 il valore di \var{umask} (si ricordi quanto esposto in
981 sez.~\ref{sec:file_umask}) non ha alcun significato.
982
983
984 \subsection{Gli identificatori ed il loro utilizzo}
985 \label{sec:ipc_sysv_id_use}
986
987 L'unico campo di \struct{ipc\_perm} del quale non abbiamo ancora parlato è
988 \var{seq}, che in fig.~\ref{fig:ipc_ipc_perm} è qualificato con un criptico
989 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
990 strettamente attinente alle modalità con cui il kernel assegna gli
991 identificatori degli oggetti del sistema di IPC.
992
993 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
994 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
995 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
996 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
997 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
998 dimensioni (inferiori al numero massimo di oggetti disponibili).
999
1000 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1001 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1002 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1003 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1004 relativo identificatore viene immediatamente assegnato a quelle di un altro
1005 server partito subito dopo, con la possibilità che i client del primo non
1006 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1007 con gli oggetti del secondo, con conseguenze imprevedibili.
1008
1009 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1010 \var{seq} per provvedere un meccanismo che porti gli identificatori ad
1011 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1012 un identificatore può venire riutilizzato.
1013
1014 Il sistema dispone sempre di un numero fisso di oggetti di IPC,\footnote{fino
1015   al kernel 2.2.x questi valori, definiti dalle costanti \const{MSGMNI},
1016   \const{SEMMNI} e \const{SHMMNI}, potevano essere cambiati (come tutti gli
1017   altri limiti relativi al \textit{SysV IPC}) solo con una ricompilazione del
1018   kernel, andando a modificarne la definizione nei relativi header file.  A
1019   partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1020   scrivendo sui file \file{shmmni}, \file{msgmni} e \file{sem} di
1021   \file{/proc/sys/kernel} o con l'uso di \func{sysctl}.} e per ciascuno di
1022 essi viene mantenuto in \var{seq} un numero di sequenza progressivo che viene
1023 incrementato di uno ogni volta che l'oggetto viene cancellato. Quando
1024 l'oggetto viene creato usando uno spazio che era già stato utilizzato in
1025 precedenza per restituire l'identificatore al numero di oggetti presenti viene
1026 sommato il valore di \var{seq} moltiplicato per il numero massimo di oggetti
1027 di quel tipo,\footnote{questo vale fino ai kernel della serie 2.2.x, dalla
1028   serie 2.4.x viene usato lo stesso fattore per tutti gli oggetti, esso è dato
1029   dalla costante \const{IPCMNI}, definita in \file{include/linux/ipc.h}, che
1030   indica il limite massimo per il numero di tutti oggetti di IPC, ed il cui
1031   valore è 32768.}  si evita così il riutilizzo degli stessi numeri, e si fa
1032 sì che l'identificatore assuma tutti i valori possibili.
1033
1034 \begin{figure}[!htb]
1035   \footnotesize \centering
1036   \begin{minipage}[c]{15cm}
1037     \includecodesample{listati/IPCTestId.c}
1038   \end{minipage} 
1039   \normalsize 
1040   \caption{Sezione principale del programma di test per l'assegnazione degli
1041     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1042   \label{fig:ipc_sysv_idtest}
1043 \end{figure}
1044
1045 In fig.~\ref{fig:ipc_sysv_idtest} è riportato il codice di un semplice
1046 programma di test che si limita a creare un oggetto (specificato a riga di
1047 comando), stamparne il numero di identificatore e cancellarlo per un numero
1048 specificato di volte. Al solito non si è riportato il codice della gestione
1049 delle opzioni a riga di comando, che permette di specificare quante volte
1050 effettuare il ciclo \var{n}, e su quale tipo di oggetto eseguirlo.
1051
1052 La figura non riporta il codice di selezione delle opzioni, che permette di
1053 inizializzare i valori delle variabili \var{type} al tipo di oggetto voluto, e
1054 \var{n} al numero di volte che si vuole effettuare il ciclo di creazione,
1055 stampa, cancellazione. I valori di default sono per l'uso delle code di
1056 messaggi e un ciclo di 5 volte. Se si lancia il comando si otterrà qualcosa
1057 del tipo:
1058 \begin{verbatim}
1059 piccardi@gont sources]$ ./ipctestid
1060 Identifier Value 0 
1061 Identifier Value 32768 
1062 Identifier Value 65536 
1063 Identifier Value 98304 
1064 Identifier Value 131072 
1065 \end{verbatim}%$
1066 il che ci mostra che abbiamo un kernel della serie 2.4.x nel quale non avevamo
1067 ancora usato nessuna coda di messaggi. Se ripetiamo il comando otterremo
1068 ancora:
1069 \begin{verbatim}
1070 [piccardi@gont sources]$ ./ipctestid
1071 Identifier Value 163840 
1072 Identifier Value 196608 
1073 Identifier Value 229376 
1074 Identifier Value 262144 
1075 Identifier Value 294912 
1076 \end{verbatim}%$
1077 che ci mostra come il valore di \var{seq} sia in effetti una quantità
1078 mantenuta staticamente all'interno del sistema.
1079
1080
1081 \subsection{Code di messaggi}
1082 \label{sec:ipc_sysv_mq}
1083
1084 Il primo oggetto introdotto dal \textit{SysV IPC} è quello delle code di
1085 messaggi.  Le code di messaggi sono oggetti analoghi alle pipe o alle fifo,
1086 anche se la loro struttura è diversa, ed il loro scopo principale è appunto
1087 quello di permettere a processi diversi di scambiarsi dei dati.
1088
1089 La funzione che permette di richiedere al sistema l'identificatore di una coda
1090 di messaggi esistente (o di crearne una se questa non esiste) è
1091 \funcd{msgget}; il suo prototipo è:
1092 \begin{functions}
1093   \headdecl{sys/types.h} 
1094   \headdecl{sys/ipc.h} 
1095   \headdecl{sys/msg.h} 
1096   
1097   \funcdecl{int msgget(key\_t key, int flag)}
1098   
1099   Restituisce l'identificatore di una coda di messaggi.
1100   
1101   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1102     in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1103   \begin{errlist}
1104   \item[\errcode{EACCES}] Il processo chiamante non ha i privilegi per accedere
1105   alla coda richiesta.  
1106   \item[\errcode{EEXIST}] Si è richiesta la creazione di una coda che già
1107   esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}. 
1108   \item[\errcode{EIDRM}] La coda richiesta è marcata per essere cancellata.
1109   \item[\errcode{ENOENT}] Si è cercato di ottenere l'identificatore di una coda
1110     di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1111     non era specificato.
1112   \item[\errcode{ENOSPC}] Si è cercato di creare una coda di messaggi quando è
1113     stato superato il limite massimo di code (\const{MSGMNI}).
1114   \end{errlist}
1115   ed inoltre \errval{ENOMEM}.
1116 }
1117 \end{functions}
1118
1119 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1120 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1121 nuova. L'argomento \param{key} specifica la chiave che è associata
1122 all'oggetto, eccetto il caso in cui si specifichi il valore
1123 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1124 associata alcuna chiave, il processo (ed i suoi eventuali figli) potranno
1125 farvi riferimento solo attraverso l'identificatore.
1126
1127 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE}\footnote{in
1128   Linux questo significa un valore diverso da zero.} l'effetto della funzione
1129 dipende dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1130 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1131 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1132 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1133 validi.
1134
1135 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1136 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1137 corrispondente al valore \const{IPC\_CREAT}. In questo caso i nove bit meno
1138 significativi di \param{flag} saranno usati come permessi per il nuovo
1139 oggetto, secondo quanto illustrato in sez.~\ref{sec:ipc_sysv_access_control}.
1140 Se si imposta anche il bit corrispondente a \const{IPC\_EXCL} la funzione avrà
1141 successo solo se l'oggetto non esiste già, fallendo con un errore di
1142 \errcode{EEXIST} altrimenti.
1143
1144 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1145 processi di accedere alla coda (se hanno privilegi sufficienti) una volta che
1146 questi possano indovinare o ricavare (ad esempio per tentativi)
1147 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1148 IPC infatti non esiste una maniera che  garantisca l'accesso esclusivo ad una
1149 coda di messaggi.  Usare \const{IPC\_PRIVATE} o const{IPC\_CREAT} e
1150 \const{IPC\_EXCL} per \param{flag} comporta solo la creazione di una nuova
1151 coda.
1152
1153 \begin{table}[htb]
1154   \footnotesize
1155   \centering
1156   \begin{tabular}[c]{|c|r|l|l|}
1157     \hline
1158     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
1159     & \textbf{Significato} \\
1160     \hline
1161     \hline
1162     \const{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1163                                           messaggi. \\
1164     \const{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1165                                           messaggio.\\
1166     \const{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di 
1167                                           una coda.\\
1168     \hline
1169   \end{tabular}
1170   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1171   \label{tab:ipc_msg_limits}
1172 \end{table}
1173
1174 Le code di messaggi sono caratterizzate da tre limiti fondamentali, definiti
1175 negli header e corrispondenti alle prime tre costanti riportate in
1176 tab.~\ref{tab:ipc_msg_limits}, come accennato però in Linux è possibile
1177 modificare questi limiti attraverso l'uso di \func{sysctl} o scrivendo nei
1178 file \file{msgmax}, \file{msgmnb} e \file{msgmni} di \file{/proc/sys/kernel/}.
1179
1180
1181 \begin{figure}[htb]
1182   \centering \includegraphics[width=15cm]{img/mqstruct}
1183   \caption{Schema della struttura di una coda messaggi.}
1184   \label{fig:ipc_mq_schema}
1185 \end{figure}
1186
1187
1188 Una coda di messaggi è costituita da una \itindex{linked~list}\textit{linked
1189   list};\footnote{una \textit{linked list} è una tipica struttura di dati,
1190   organizzati in una lista in cui ciascun elemento contiene un puntatore al
1191   successivo. In questo modo la struttura è veloce nell'estrazione ed
1192   immissione dei dati dalle estremità dalla lista (basta aggiungere un
1193   elemento in testa o in coda ed aggiornare un puntatore), e relativamente
1194   veloce da attraversare in ordine sequenziale (seguendo i puntatori), è
1195   invece relativamente lenta nell'accesso casuale e nella ricerca.}  i nuovi
1196 messaggi vengono inseriti in coda alla lista e vengono letti dalla cima, in
1197 fig.~\ref{fig:ipc_mq_schema} si è riportato lo schema con cui queste strutture
1198 vengono mantenute dal kernel.\footnote{lo schema illustrato in
1199   fig.~\ref{fig:ipc_mq_schema} è in realtà una semplificazione di quello usato
1200   effettivamente fino ai kernel della serie 2.2.x, nei kernel della serie
1201   2.4.x la gestione delle code di messaggi è stata modificata ed è effettuata
1202   in maniera diversa; abbiamo mantenuto lo schema precedente in quanto
1203   illustra comunque in maniera più che adeguata i principi di funzionamento
1204   delle code di messaggi.}
1205
1206 \begin{figure}[!htb]
1207   \footnotesize \centering
1208   \begin{minipage}[c]{15cm}
1209     \includestruct{listati/msqid_ds.h}
1210   \end{minipage} 
1211   \normalsize 
1212   \caption{La struttura \structd{msqid\_ds}, associata a ciascuna coda di
1213     messaggi.}
1214   \label{fig:ipc_msqid_ds}
1215 \end{figure}
1216
1217 A ciascuna coda è associata una struttura \struct{msgid\_ds}, la cui
1218 definizione, è riportata in fig.~\ref{fig:ipc_msqid_ds}. In questa struttura il
1219 kernel mantiene le principali informazioni riguardo lo stato corrente della
1220 coda.\footnote{come accennato questo vale fino ai kernel della serie 2.2.x,
1221   essa viene usata nei kernel della serie 2.4.x solo per compatibilità in
1222   quanto è quella restituita dalle funzioni dell'interfaccia.  Si noti come ci
1223   sia una differenza con i campi mostrati nello schema di
1224   fig.~\ref{fig:ipc_mq_schema} che sono presi dalla definizione di
1225   \file{linux/msg.h}, e fanno riferimento alla definizione della omonima
1226   struttura usata nel kernel.} In fig.~\ref{fig:ipc_msqid_ds} sono elencati i
1227 campi significativi definiti in \file{sys/msg.h}, a cui si sono aggiunti gli
1228 ultimi tre campi che sono previsti dalla implementazione originale di System
1229 V, ma non dallo standard Unix98.
1230
1231 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1232 inizializzata, in particolare il campo \var{msg\_perm} viene inizializzato
1233 come illustrato in sez.~\ref{sec:ipc_sysv_access_control}, per quanto riguarda
1234 gli altri campi invece:
1235 \begin{itemize*}
1236 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1237   sulla coda, viene inizializzato a 0.
1238 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1239   rispettivamente il \acr{pid} dell'ultimo processo che ha inviato o ricevuto
1240   un messaggio sulla coda, sono inizializzati a 0.
1241 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1242   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1243   messaggio sulla coda, sono inizializzati a 0.
1244 \item il campo \var{msg\_ctime}, che esprime il tempo di creazione della coda,
1245   viene inizializzato al tempo corrente.
1246 \item il campo \var{msg\_qbytes} che esprime la dimensione massima del
1247   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1248   del sistema (\const{MSGMNB}).
1249 \item i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1250   primo e ultimo messaggio sono inizializzati a \val{NULL} e
1251   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1252   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1253   e non devono essere utilizzati da programmi in user space).
1254 \end{itemize*}
1255
1256 Una volta creata una coda di messaggi le operazioni di controllo vengono
1257 effettuate con la funzione \funcd{msgctl}, che (come le analoghe \func{semctl}
1258 e \func{shmctl}) fa le veci di quello che \func{ioctl} è per i file; il suo
1259 prototipo è:
1260 \begin{functions}
1261   \headdecl{sys/types.h} 
1262   \headdecl{sys/ipc.h} 
1263   \headdecl{sys/msg.h} 
1264   
1265   \funcdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1266   
1267   Esegue l'operazione specificata da \param{cmd} sulla coda \param{msqid}.
1268   
1269   \bodydesc{La funzione restituisce 0 in caso di successo o -1 in caso di
1270     errore, nel qual caso \var{errno} assumerà uno dei valori:
1271   \begin{errlist}
1272   \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma processo
1273     chiamante non ha i privilegi di lettura sulla coda.
1274   \item[\errcode{EIDRM}] La coda richiesta è stata cancellata.
1275   \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1276     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1277     \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1278     amministratore.
1279   \end{errlist}
1280   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1281 }
1282 \end{functions}
1283
1284 La funzione permette di accedere ai valori della struttura \struct{msqid\_ds},
1285 mantenuta all'indirizzo \param{buf}, per la coda specificata
1286 dall'identificatore \param{msqid}. Il comportamento della funzione dipende dal
1287 valore dell'argomento \param{cmd}, che specifica il tipo di azione da
1288 eseguire; i valori possibili sono:
1289 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1290 \item[\const{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1291   struttura indicata da \param{buf}. Occorre avere il permesso di lettura
1292   sulla coda.
1293 \item[\const{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1294   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1295   riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1296   funzioni di lettura o di scrittura sulla coda saranno svegliati ricevendo
1297   il medesimo errore. Questo comando può essere eseguito solo da un processo
1298   con user-ID effettivo corrispondente al creatore o al proprietario della
1299   coda, o all'amministratore.
1300 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1301   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1302   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1303   struttura \struct{msqid\_ds} puntata da \param{buf}.  Per modificare i valori
1304   di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid} occorre
1305   essere il proprietario o il creatore della coda, oppure l'amministratore; lo
1306   stesso vale per \var{msg\_qbytes}, ma l'amministratore ha la facoltà di
1307   incrementarne il valore a limiti superiori a \const{MSGMNB}.
1308 \end{basedescript}
1309
1310
1311 Una volta che si abbia a disposizione l'identificatore, per inviare un
1312 messaggio su una coda si utilizza la funzione \funcd{msgsnd}; il suo prototipo
1313 è:
1314 \begin{functions}
1315   \headdecl{sys/types.h} 
1316   \headdecl{sys/ipc.h} 
1317   \headdecl{sys/msg.h} 
1318   
1319   \funcdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int
1320     msgflg)} 
1321
1322   Invia un messaggio sulla coda \param{msqid}.
1323   
1324   \bodydesc{La funzione restituisce 0, e -1 in caso di errore, nel qual caso
1325     \var{errno} assumerà uno dei valori:
1326   \begin{errlist}
1327   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1328   \item[\errcode{EIDRM}] La coda è stata cancellata.
1329   \item[\errcode{EAGAIN}] Il messaggio non può essere inviato perché si è
1330   superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1331   sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1332   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
1333   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido, o un
1334     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1335     maggiore di \const{MSGMAX}.
1336   \end{errlist}
1337   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}.
1338 }
1339 \end{functions}
1340
1341 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1342 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1343 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1344 puntatore ad una struttura \struct{msgbuf} analoga a quella riportata in
1345 fig.~\ref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1346 messaggio.  La dimensione massima per il testo di un messaggio non può
1347 comunque superare il limite \const{MSGMAX}.
1348
1349 La struttura di fig.~\ref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1350 la definizione contenuta in \file{sys/msg.h} usa esplicitamente per il secondo
1351 campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini pratici.
1352 La sola cosa che conta è che la struttura abbia come primo membro un campo
1353 \var{mtype} come nell'esempio; esso infatti serve ad identificare il tipo di
1354 messaggio e deve essere sempre specificato come intero positivo di tipo
1355 \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1356 dimensione, e serve a contenere il testo del messaggio.
1357
1358 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1359 ridefinire una struttura simile a quella di fig.~\ref{fig:ipc_msbuf}, adattando
1360 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1361 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1362 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1363 indica il tipo.
1364
1365 Si tenga presente che la lunghezza che deve essere indicata in questo
1366 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1367 cioè \var{message} è una propria struttura che si passa alla funzione,
1368 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1369 consideriamo il caso dell'esempio in fig.~\ref{fig:ipc_msbuf}, \param{msgsz}
1370 dovrà essere pari a \const{LENGTH}).
1371
1372 \begin{figure}[!htb]
1373   \footnotesize \centering
1374   \begin{minipage}[c]{15cm}
1375     \includestruct{listati/msgbuf.h}
1376   \end{minipage} 
1377   \normalsize 
1378   \caption{Schema della struttura \structd{msgbuf}, da utilizzare come
1379     argomento per inviare/ricevere messaggi.}
1380   \label{fig:ipc_msbuf}
1381 \end{figure}
1382
1383 Per capire meglio il funzionamento della funzione riprendiamo in
1384 considerazione la struttura della coda illustrata in
1385 fig.~\ref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1386 sarà aggiunto in fondo alla lista inserendo una nuova struttura \struct{msg},
1387 il puntatore \var{msg\_last} di \struct{msqid\_ds} verrà aggiornato, come pure
1388 il puntatore al messaggio successivo per quello che era il precedente ultimo
1389 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1390 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1391 all'indirizzo specificato da \var{msg\_spot}.
1392
1393 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1394 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1395 ritorna immediatamente a meno che si sia ecceduto il valore di
1396 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1397 caso si blocca mandando il processo in stato di \textit{sleep}.  Se si
1398 specifica per \param{flag} il valore \const{IPC\_NOWAIT} la funzione opera in
1399 modalità non bloccante, ed in questi casi ritorna immediatamente con un errore
1400 di \errcode{EAGAIN}.
1401
1402 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1403 che non si liberano risorse sufficienti per poter inserire nella coda il
1404 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare, con
1405 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1406 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1407 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1408
1409 Una volta completato con successo l'invio del messaggio sulla coda, la
1410 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1411 vengono modificati:
1412 \begin{itemize*}
1413 \item Il valore di \var{msg\_lspid}, che viene impostato al \acr{pid} del
1414   processo chiamante.
1415 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1416 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1417 \end{itemize*}
1418
1419 La funzione che viene utilizzata per estrarre un messaggio da una coda è
1420 \funcd{msgrcv}; il suo prototipo è:
1421 \begin{functions}
1422   \headdecl{sys/types.h} 
1423   \headdecl{sys/ipc.h} 
1424   \headdecl{sys/msg.h} 
1425
1426   \funcdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1427     long msgtyp, int msgflg)}
1428   
1429   Legge un messaggio dalla coda \param{msqid}.
1430   
1431   \bodydesc{La funzione restituisce il numero di byte letti in caso di
1432     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà uno
1433     dei valori:
1434   \begin{errlist}
1435   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1436   \item[\errcode{EIDRM}] La coda è stata cancellata.
1437   \item[\errcode{E2BIG}] Il testo del messaggio è più lungo di \param{msgsz} e
1438     non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1439   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale mentre
1440     era in attesa di ricevere un messaggio.
1441   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido o un
1442     valore di \param{msgsz} negativo.
1443   \end{errlist}
1444   ed inoltre \errval{EFAULT}.
1445 }
1446 \end{functions}
1447
1448 La funzione legge un messaggio dalla coda specificata, scrivendolo sulla
1449 struttura puntata da \param{msgp}, che dovrà avere un formato analogo a quello
1450 di fig.~\ref{fig:ipc_msbuf}.  Una volta estratto, il messaggio sarà rimosso
1451 dalla coda.  L'argomento \param{msgsz} indica la lunghezza massima del testo
1452 del messaggio (equivalente al valore del parametro \const{LENGTH} nell'esempio
1453 di fig.~\ref{fig:ipc_msbuf}).
1454
1455 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1456 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1457 \const{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1458 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1459 un errore di \errcode{E2BIG}.
1460
1461 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1462 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1463 una scansione della struttura mostrata in fig.~\ref{fig:ipc_mq_schema},
1464 restituendo il primo messaggio incontrato che corrisponde ai criteri
1465 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1466 coda, è quello meno recente); in particolare:
1467 \begin{itemize}
1468 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1469   quello fra i presenti che è stato inserito per primo. 
1470 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1471   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1472   \param{msgtyp}.
1473 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1474   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1475   inferiore al valore assoluto di \param{msgtyp}.
1476 \end{itemize}
1477
1478 Il valore di \param{msgflg} permette di controllare il comportamento della
1479 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1480 valori.  Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1481 valori: \const{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1482 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1483 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1484 ci sono messaggi sulla coda.
1485
1486 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1487 disponibili per la lettura, è di bloccare il processo in stato di
1488 \textit{sleep}. Nel caso però si sia specificato \const{IPC\_NOWAIT} la
1489 funzione ritorna immediatamente con un errore \errcode{ENOMSG}. Altrimenti la
1490 funzione ritorna normalmente non appena viene inserito un messaggio del tipo
1491 desiderato, oppure ritorna con errore qualora la coda sia rimossa (con
1492 \var{errno} impostata a \errcode{EIDRM}) o se il processo viene interrotto da
1493 un segnale (con \var{errno} impostata a \errcode{EINTR}).
1494
1495 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1496 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1497 vengono modificati:
1498 \begin{itemize*}
1499 \item Il valore di \var{msg\_lrpid}, che viene impostato al \acr{pid} del
1500   processo chiamante.
1501 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1502 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1503 \end{itemize*}
1504
1505 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1506 SysV IPC; essendo questi permanenti restano nel sistema occupando risorse
1507 anche quando un processo è terminato, al contrario delle pipe per le quali
1508 tutte le risorse occupate vengono rilasciate quanto l'ultimo processo che le
1509 utilizzava termina. Questo comporta che in caso di errori si può saturare il
1510 sistema, e che devono comunque essere esplicitamente previste delle funzioni
1511 di rimozione in caso di interruzioni o uscite dal programma (come vedremo in
1512 fig.~\ref{fig:ipc_mq_fortune_server}).
1513
1514 L'altro problema è non facendo uso di file descriptor le tecniche di
1515 \textit{I/O multiplexing} descritte in sez.~\ref{sec:file_multiplexing} non
1516 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1517 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1518 una di queste strutture alla volta; ad esempio non si può scrivere un server
1519 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1520 di \textit{polling}\itindex{polling} che esegua un ciclo di attesa su
1521 ciascuna di esse.
1522
1523 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1524 server di \textit{fortunes} usando queste al posto delle fifo. In questo caso
1525 useremo una sola coda di messaggi, usando il tipo di messaggio per comunicare
1526 in maniera indipendente con client diversi.
1527
1528 \begin{figure}[!bht]
1529   \footnotesize \centering
1530   \begin{minipage}[c]{15.6cm}
1531     \includecodesample{listati/MQFortuneServer.c}
1532   \end{minipage} 
1533   \normalsize 
1534   \caption{Sezione principale del codice del server di \textit{fortunes}
1535     basato sulle \textit{message queue}.}
1536   \label{fig:ipc_mq_fortune_server}
1537 \end{figure}
1538
1539 In fig.~\ref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1540 principali del codice del nuovo server (il codice completo è nel file
1541 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1542 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1543 per permettere una comunicazione indipendente fra il server ed i vari client,
1544 usando il \acr{pid} di questi ultimi come identificativo. Questo è possibile
1545 in quanto, al contrario di una fifo, la lettura di una coda di messaggi può
1546 non essere sequenziale, proprio grazie alla classificazione dei messaggi sulla
1547 base del loro tipo.
1548
1549 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1550 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1551 definisce due strutture appositamente per la comunicazione; con
1552 \var{msgbuf\_read} (\texttt{\small 8--11}) vengono passate le richieste mentre
1553 con \var{msgbuf\_write} (\texttt{\small 12--15}) vengono restituite le frasi.
1554
1555 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1556 in \var{n} il numero di frasi da leggere specificato a linea di comando ed in
1557 \var{fortunefilename} il file da cui leggerle; dopo aver installato
1558 (\texttt{\small 19--21}) i gestori dei segnali per trattare l'uscita dal
1559 server, viene prima controllato (\texttt{\small 22}) il numero di frasi
1560 richieste abbia senso (cioè sia maggiore di zero), le quali poi
1561 (\texttt{\small 23}) vengono lette nel vettore in memoria con la stessa
1562 funzione \code{FortuneParse} usata anche per il server basato sulle fifo.
1563
1564 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1565 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1566 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1567 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1568 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1569 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1570 programma (\texttt{\small 27--29}) in caso di errore.
1571
1572 Finita la fase di inizializzazione il server prima (\texttt{\small 32}) chiama
1573 la funzione \func{daemon} per andare in background e poi esegue in permanenza
1574 il ciclo principale (\texttt{\small 33--40}). Questo inizia (\texttt{\small
1575   34}) con il porsi in attesa di un messaggio di richiesta da parte di un
1576 client; si noti infatti come \func{msgrcv} richieda un messaggio con
1577 \var{mtype} uguale a 1: questo è il valore usato per le richieste dato che
1578 corrisponde al \acr{pid} di \cmd{init}, che non può essere un client. L'uso
1579 del flag \const{MSG\_NOERROR} è solo per sicurezza, dato che i messaggi di
1580 richiesta sono di dimensione fissa (e contengono solo il \acr{pid} del
1581 client).
1582
1583 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1584 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1585 di richiesta da parte di un client, in tal caso il ciclo prosegue
1586 (\texttt{\small 35}) selezionando una frase a caso, copiandola (\texttt{\small
1587   36}) nella struttura \var{msgbuf\_write} usata per la risposta e
1588 calcolandone (\texttt{\small 37}) la dimensione.
1589
1590 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1591 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 38})
1592 al valore del \acr{pid} del client ricevuto nel messaggio di richiesta.
1593 L'ultimo passo del ciclo (\texttt{\small 39}) è inviare sulla coda il
1594 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1595 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1596
1597 Si noti che il programma può terminare solo grazie ad una interruzione da
1598 parte di un segnale; in tal caso verrà eseguito (\texttt{\small 45--48}) il
1599 gestore \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1600 (\texttt{\small 46}) ed ad uscire (\texttt{\small 47}).
1601
1602 \begin{figure}[!bht]
1603   \footnotesize \centering
1604   \begin{minipage}[c]{15.6cm}
1605     \includecodesample{listati/MQFortuneClient.c}
1606   \end{minipage} 
1607   \normalsize 
1608   \caption{Sezione principale del codice del client di \textit{fortunes}
1609     basato sulle \textit{message queue}.}
1610   \label{fig:ipc_mq_fortune_client}
1611 \end{figure}
1612
1613 In fig.~\ref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice
1614 del programma client.  Al solito il codice completo è con i sorgenti allegati,
1615 nel file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti
1616 relative alla gestione delle opzioni, ed in questo caso, anche la
1617 dichiarazione delle variabili, che, per la parte relative alle strutture usate
1618 per la comunicazione tramite le code, sono le stesse viste in
1619 fig.~\ref{fig:ipc_mq_fortune_server}.
1620
1621 Il client in questo caso è molto semplice; la prima parte del programma
1622 (\texttt{\small 4--9}) si occupa di accedere alla coda di messaggi, ed è
1623 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1624 non viene chiamata con il flag di creazione in quanto la coda deve essere
1625 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1626 il programma termina immediatamente. 
1627
1628 Una volta acquisito l'identificatore della coda il client compone il
1629 messaggio di richiesta (\texttt{\small 12--13}) in \var{msg\_read}, usando 1
1630 per il tipo ed inserendo il proprio \acr{pid} come dato da passare al server.
1631 Calcolata (\texttt{\small 14}) la dimensione, provvede (\texttt{\small 15}) ad
1632 immettere la richiesta sulla coda. 
1633
1634 A questo punto non resta che (\texttt{\small 16}) rileggere dalla coda la
1635 risposta del server richiedendo a \func{msgrcv} di selezionare i messaggi di
1636 tipo corrispondente al valore del \acr{pid} inviato nella richiesta. L'ultimo
1637 passo (\texttt{\small 17}) prima di uscire è quello di stampare a video il
1638 messaggio ricevuto.
1639  
1640 Proviamo allora il nostro nuovo sistema, al solito occorre definire
1641 \code{LD\_LIBRAY\_PATH} per accedere alla libreria \file{libgapil.so}, dopo di
1642 che, in maniera del tutto analoga a quanto fatto con il programma che usa le
1643 fifo, potremo far partire il server con:
1644 \begin{verbatim}
1645 [piccardi@gont sources]$ ./mqfortuned -n10
1646 \end{verbatim}%$
1647 come nel caso precedente, avendo eseguito il server in background, il comando
1648 ritornerà immediatamente; potremo però verificare con \cmd{ps} che il
1649 programma è effettivamente in esecuzione, e che ha creato una coda di
1650 messaggi:
1651 \begin{verbatim}
1652 [piccardi@gont sources]$ ipcs
1653
1654 ------ Shared Memory Segments --------
1655 key        shmid      owner      perms      bytes      nattch     status      
1656
1657 ------ Semaphore Arrays --------
1658 key        semid      owner      perms      nsems     
1659
1660 ------ Message Queues --------
1661 key        msqid      owner      perms      used-bytes   messages    
1662 0x0102dc6a 0          piccardi   666        0            0           
1663 \end{verbatim}
1664 a questo punto potremo usare il client per ottenere le nostre frasi:
1665 \begin{verbatim}
1666 [piccardi@gont sources]$ ./mqfortune
1667 Linux ext2fs has been stable for a long time, now it's time to break it
1668         -- Linuxkongreß '95 in Berlin
1669 [piccardi@gont sources]$ ./mqfortune
1670 Let's call it an accidental feature.
1671         --Larry Wall
1672 \end{verbatim}
1673 con un risultato del tutto equivalente al precedente. Infine potremo chiudere
1674 il server inviando il segnale di terminazione con il comando \code{killall
1675   mqfortuned} verificando che effettivamente la coda di messaggi viene rimossa.
1676
1677 Benché funzionante questa architettura risente dello stesso inconveniente
1678 visto anche nel caso del precedente server basato sulle fifo; se il client
1679 viene interrotto dopo l'invio del messaggio di richiesta e prima della lettura
1680 della risposta, quest'ultima resta nella coda (così come per le fifo si aveva
1681 il problema delle fifo che restavano nel filesystem). In questo caso però il
1682 problemi sono maggiori, sia perché è molto più facile esaurire la memoria
1683 dedicata ad una coda di messaggi che gli inode\index{inode} di un filesystem,
1684 sia perché, con il riutilizzo dei \acr{pid} da parte dei processi, un client
1685 eseguito in un momento successivo potrebbe ricevere un messaggio non
1686 indirizzato a lui.
1687
1688
1689
1690 \subsection{Semafori}
1691 \label{sec:ipc_sysv_sem}
1692
1693 I semafori non sono meccanismi di intercomunicazione diretta come quelli
1694 (pipe, fifo e code di messaggi) visti finora, e non consentono di scambiare
1695 dati fra processi, ma servono piuttosto come meccanismi di sincronizzazione o
1696 di protezione per le \textsl{sezioni critiche}\index{sezioni~critiche} del
1697 codice (si ricordi quanto detto in sez.~\ref{sec:proc_race_cond}). 
1698
1699 Un semaforo è uno speciale contatore, mantenuto nel kernel, che permette, a
1700 seconda del suo valore, di consentire o meno la prosecuzione dell'esecuzione
1701 di un programma. In questo modo l'accesso ad una risorsa condivisa da più
1702 processi può essere controllato, associando ad essa un semaforo che consente
1703 di assicurare che non più di un processo alla volta possa usarla.
1704
1705 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1706 assolutamente generico, così come del tutto generali sono modalità con cui lo
1707 si utilizza. Un processo che deve accedere ad una risorsa eseguirà un
1708 controllo del semaforo: se questo è positivo il suo valore sarà decrementato,
1709 indicando che si è consumato una unità della risorsa, ed il processo potrà
1710 proseguire nell'utilizzo di quest'ultima, provvedendo a rilasciarla, una volta
1711 completate le operazioni volute, reincrementando il semaforo.
1712
1713 Se al momento del controllo il valore del semaforo è nullo, siamo invece in
1714 una situazione in cui la risorsa non è disponibile, ed il processo si
1715 bloccherà in stato di \textit{sleep} fin quando chi la sta utilizzando non la
1716 rilascerà, incrementando il valore del semaforo. Non appena il semaforo torna
1717 positivo, indicando che la risorsa è disponibile, il processo sarà svegliato,
1718 e si potrà operare come nel caso precedente (decremento del semaforo, accesso
1719 alla risorsa, incremento del semaforo).
1720
1721 Per poter implementare questo tipo di logica le operazioni di controllo e
1722 decremento del contatore associato al semaforo devono essere atomiche,
1723 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1724 demandata al kernel. La forma più semplice di semaforo è quella del
1725 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1726 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1727 della risorsa; in generale però si possono usare semafori con valori interi,
1728 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1729 ancora disponibili.
1730
1731 Il sistema di comunicazione inter-processo di \textit{SysV IPC} prevede anche i
1732 semafori, ma gli oggetti utilizzati non sono semafori singoli, ma gruppi di
1733 semafori detti \textsl{insiemi} (o \textit{semaphore set}); la funzione che
1734 permette di creare o ottenere l'identificatore di un insieme di semafori è
1735 \funcd{semget}, ed il suo prototipo è:
1736 \begin{functions}
1737   \headdecl{sys/types.h} 
1738   \headdecl{sys/ipc.h} 
1739   \headdecl{sys/sem.h} 
1740   
1741   \funcdecl{int semget(key\_t key, int nsems, int flag)}
1742   
1743   Restituisce l'identificatore di un insieme di semafori.
1744   
1745   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1746     in caso di errore, nel qual caso \var{errno} assumerà i valori:
1747     \begin{errlist}
1748     \item[\errcode{ENOSPC}] Si è cercato di creare una insieme di semafori
1749       quando è stato superato o il limite per il numero totale di semafori
1750       (\const{SEMMNS}) o quello per il numero totale degli insiemi
1751       (\const{SEMMNI}) nel sistema.
1752     \item[\errcode{EINVAL}] L'argomento \param{nsems} è minore di zero o
1753       maggiore del limite sul numero di semafori per ciascun insieme
1754       (\const{SEMMSL}), o se l'insieme già esiste, maggiore del numero di
1755       semafori che contiene.
1756     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
1757       contenere le strutture per un nuovo insieme di semafori.
1758     \end{errlist}
1759     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
1760     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
1761 \end{functions}
1762
1763 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1764 restituisce l'identificatore di un insieme di semafori, in particolare è
1765 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1766 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
1767 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1768 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1769 richiesta dell'identificatore di un insieme già esistente.
1770
1771 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1772 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1773 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1774 complicazione inutile, il problema è che i semafori del \textit{SysV IPC}
1775 soffrono di altri due, ben più gravi, difetti.
1776
1777 Il primo difetto è che non esiste una funzione che permetta di creare ed
1778 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1779 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1780 perde così ogni possibilità di eseguire l'operazione atomicamente.
1781
1782 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1783 \textit{SysV IPC} di essere risorse globali di sistema, che non vengono
1784 cancellate quando nessuno le usa più; ci si così a trova a dover affrontare
1785 esplicitamente il caso in cui un processo termina per un qualche errore,
1786 lasciando un semaforo occupato, che resterà tale fino al successivo riavvio
1787 del sistema. Come vedremo esistono delle modalità per evitare tutto ciò, ma
1788 diventa necessario indicare esplicitamente che si vuole il ripristino del
1789 semaforo all'uscita del processo.
1790
1791
1792 \begin{figure}[!htb]
1793   \footnotesize \centering
1794   \begin{minipage}[c]{15cm}
1795     \includestruct{listati/semid_ds.h}
1796   \end{minipage} 
1797   \normalsize 
1798   \caption{La struttura \structd{semid\_ds}, associata a ciascun insieme di
1799     semafori.}
1800   \label{fig:ipc_semid_ds}
1801 \end{figure}
1802
1803 A ciascun insieme di semafori è associata una struttura \struct{semid\_ds},
1804 riportata in fig.~\ref{fig:ipc_semid_ds}.\footnote{non si sono riportati i
1805   campi ad uso interno del kernel, che vedremo in
1806   fig.~\ref{fig:ipc_sem_schema}, che dipendono dall'implementazione.} Come nel
1807 caso delle code di messaggi quando si crea un nuovo insieme di semafori con
1808 \func{semget} questa struttura viene inizializzata, in particolare il campo
1809 \var{sem\_perm} viene inizializzato come illustrato in
1810 sez.~\ref{sec:ipc_sysv_access_control} (si ricordi che in questo caso il
1811 permesso di scrittura è in realtà permesso di alterare il semaforo), per
1812 quanto riguarda gli altri campi invece:
1813 \begin{itemize*}
1814 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
1815   nell'insieme, viene inizializzato al valore di \param{nsems}.
1816 \item il campo \var{sem\_ctime}, che esprime il tempo di creazione
1817   dell'insieme, viene inizializzato al tempo corrente.
1818 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
1819   effettuata, viene inizializzato a zero.
1820 \end{itemize*}
1821
1822
1823 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
1824 \struct{sem} che ne contiene i dati essenziali, la sua definizione\footnote{si
1825   è riportata la definizione originaria del kernel 1.0, che contiene la prima
1826   realizzazione del \textit{SysV IPC} in Linux. In realtà questa struttura
1827   ormai è ridotta ai soli due primi membri, e gli altri vengono calcolati
1828   dinamicamente. La si è utilizzata a scopo di esempio, perché indica tutti i
1829   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
1830   citati dalle pagine di manuale.} è riportata in fig.~\ref{fig:ipc_sem}.
1831 Questa struttura, non è accessibile in user space, ma i valori in essa
1832 specificati possono essere letti in maniera indiretta, attraverso l'uso delle
1833 funzioni di controllo.
1834
1835 \begin{figure}[!htb]
1836   \footnotesize \centering
1837   \begin{minipage}[c]{15cm}
1838     \includestruct{listati/sem.h}
1839   \end{minipage} 
1840   \normalsize 
1841   \caption{La struttura \structd{sem}, che contiene i dati di un singolo
1842     semaforo.} 
1843   \label{fig:ipc_sem}
1844 \end{figure}
1845
1846 I dati mantenuti nella struttura, ed elencati in fig.~\ref{fig:ipc_sem},
1847 indicano rispettivamente:
1848 \begin{description*}
1849 \item[\var{semval}] il valore numerico del semaforo.
1850 \item[\var{sempid}] il \acr{pid} dell'ultimo processo che ha eseguito una
1851   operazione sul semaforo.
1852 \item[\var{semncnt}] il numero di processi in attesa che esso venga
1853   incrementato.
1854 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
1855 \end{description*}
1856
1857 \begin{table}[htb]
1858   \footnotesize
1859   \centering
1860   \begin{tabular}[c]{|c|r|p{8cm}|}
1861     \hline
1862     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
1863     \hline
1864     \hline
1865     \const{SEMMNI}&          128 & Numero massimo di insiemi di semafori. \\
1866     \const{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
1867     \const{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
1868                                    nel sistema .\\
1869     \const{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
1870     \const{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
1871                                    \func{semop}. \\
1872     \const{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
1873     \const{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
1874     \const{SEMAEM}&\const{SEMVMX}& valore massimo per l'aggiustamento
1875                                    all'uscita. \\
1876     \hline
1877   \end{tabular}
1878   \caption{Valori delle costanti associate ai limiti degli insiemi di
1879     semafori, definite in \file{linux/sem.h}.} 
1880   \label{tab:ipc_sem_limits}
1881 \end{table}
1882
1883 Come per le code di messaggi anche per gli insiemi di semafori esistono una
1884 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
1885 sono riportate in tab.~\ref{tab:ipc_sem_limits}. Alcuni di questi limiti sono
1886 al solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
1887 direttamente nel file \file{/proc/sys/kernel/sem}.
1888
1889 La funzione che permette di effettuare le varie operazioni di controllo sui
1890 semafori (fra le quali, come accennato, è impropriamente compresa anche la
1891 loro inizializzazione) è \funcd{semctl}; il suo prototipo è:
1892 \begin{functions}
1893   \headdecl{sys/types.h} 
1894   \headdecl{sys/ipc.h} 
1895   \headdecl{sys/sem.h} 
1896   
1897   \funcdecl{int semctl(int semid, int semnum, int cmd)}
1898   \funcdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
1899   
1900   Esegue le operazioni di controllo su un semaforo o un insieme di semafori.
1901   
1902   \bodydesc{La funzione restituisce in caso di successo un valore positivo
1903     quanto usata con tre argomenti ed un valore nullo quando usata con
1904     quattro. In caso di errore restituisce -1, ed \var{errno} assumerà uno dei
1905     valori:
1906     \begin{errlist}
1907     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
1908       l'operazione richiesta.
1909     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
1910     \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
1911       ma il processo non ha privilegi sufficienti ad eseguire l'operazione.
1912     \item[\errcode{ERANGE}] Si è richiesto \const{SETALL} \const{SETVAL} ma il
1913       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
1914       di \const{SEMVMX}.
1915   \end{errlist}
1916   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1917 }
1918 \end{functions}
1919
1920 La funzione può avere tre o quattro argomenti, a seconda dell'operazione
1921 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
1922 \param{semid} o sul singolo semaforo di un insieme, specificato da
1923 \param{semnum}. 
1924
1925 \begin{figure}[!htb]
1926   \footnotesize \centering
1927   \begin{minipage}[c]{15cm}
1928     \includestruct{listati/semun.h}
1929   \end{minipage} 
1930   \normalsize 
1931   \caption{La definizione dei possibili valori di una \direct{union}
1932     \structd{semun}, usata come quarto argomento della funzione
1933     \func{semctl}.}
1934   \label{fig:ipc_semun}
1935 \end{figure}
1936
1937 Qualora la funzione operi con quattro argomenti \param{arg} è un argomento
1938 generico, che conterrà un dato diverso a seconda dell'azione richiesta; per
1939 unificare l'argomento esso deve essere passato come una \struct{semun}, la cui
1940 definizione, con i possibili valori che può assumere, è riportata in
1941 fig.~\ref{fig:ipc_semun}.
1942
1943 Come già accennato sia il comportamento della funzione che il numero di
1944 argomenti con cui deve essere invocata dipendono dal valore dell'argomento
1945 \param{cmd}, che specifica l'azione da intraprendere; i valori validi (che
1946 cioè non causano un errore di \errcode{EINVAL}) per questo argomento sono i
1947 seguenti:
1948 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1949 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiando il
1950   contenuto della relativa struttura \struct{semid\_ds} all'indirizzo
1951   specificato con \var{arg.buf}. Occorre avere il permesso di lettura.
1952   L'argomento \param{semnum} viene ignorato.
1953 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
1954   dati, con effetto immediato. Tutti i processi che erano stato di
1955   \textit{sleep} vengono svegliati, ritornando con un errore di
1956   \errcode{EIDRM}.  L'user-ID effettivo del processo deve corrispondere o al
1957   creatore o al proprietario dell'insieme, o all'amministratore. L'argomento
1958   \param{semnum} viene ignorato.
1959 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1960   dell'insieme. I valori devono essere passati in una struttura
1961   \struct{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto i
1962   campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
1963   significativi di \var{sem\_perm.mode}. L'user-ID effettivo del processo deve
1964   corrispondere o al creatore o al proprietario dell'insieme, o
1965   all'amministratore.  L'argomento \param{semnum} viene ignorato.
1966 \item[\const{GETALL}] Restituisce il valore corrente di ciascun semaforo
1967   dell'insieme (corrispondente al campo \var{semval} di \struct{sem}) nel
1968   vettore indicato da \param{arg.array}. Occorre avere il permesso di lettura.
1969   L'argomento \param{semnum} viene ignorato.
1970 \item[\const{GETNCNT}] Restituisce come valore di ritorno della funzione il
1971   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
1972   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
1973   \struct{sem}); va invocata con tre argomenti.  Occorre avere il permesso di
1974   lettura.
1975 \item[\const{GETPID}] Restituisce come valore di ritorno della funzione il
1976   \acr{pid} dell'ultimo processo che ha compiuto una operazione sul semaforo
1977   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
1978   \var{sempid} di \struct{sem}); va invocata con tre argomenti.  Occorre avere
1979   il permesso di lettura.
1980 \item[\const{GETVAL}] Restituisce come valore di ritorno della funzione il il
1981   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
1982   (corrispondente al campo \var{semval} di \struct{sem}); va invocata con tre
1983   argomenti.  Occorre avere il permesso di lettura.
1984 \item[\const{GETZCNT}] Restituisce come valore di ritorno della funzione il
1985   numero di processi in attesa che il valore del semaforo \param{semnum}
1986   dell'insieme \param{semid} diventi nullo (corrispondente al campo
1987   \var{semncnt} di \struct{sem}); va invocata con tre argomenti.  Occorre avere
1988   il permesso di lettura.
1989 \item[\const{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
1990   aggiornando il campo \var{sem\_ctime} di \struct{semid\_ds}. I valori devono
1991   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
1992   privilegi di scrittura sul semaforo.  L'argomento \param{semnum} viene
1993   ignorato.
1994 \item[\const{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
1995   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
1996   \struct{semid\_ds}.  Si devono avere i privilegi di scrittura sul semaforo.
1997 \end{basedescript}
1998
1999 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2000 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2001 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2002 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2003 tutti i semafori il cui valore viene modificato.
2004
2005 \begin{table}[htb]
2006   \footnotesize
2007   \centering
2008   \begin{tabular}[c]{|c|l|}
2009     \hline
2010     \textbf{Operazione}  & \textbf{Valore restituito} \\
2011     \hline
2012     \hline
2013     \const{GETNCNT}& valore di \var{semncnt}.\\
2014     \const{GETPID} & valore di \var{sempid}.\\
2015     \const{GETVAL} & valore di \var{semval}.\\
2016     \const{GETZCNT}& valore di \var{semzcnt}.\\
2017     \hline
2018   \end{tabular}
2019   \caption{Valori di ritorno della funzione \func{semctl}.} 
2020   \label{tab:ipc_semctl_returns}
2021 \end{table}
2022
2023 Il valore di ritorno della funzione in caso di successo dipende
2024 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2025 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2026 tab.~\ref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2027 corrispondente al campo della struttura \struct{sem} indicato nella seconda
2028 colonna della tabella.
2029
2030 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2031 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2032 vengono effettuate con la funzione \funcd{semop}, il cui prototipo è:
2033 \begin{functions}
2034   \headdecl{sys/types.h} 
2035   \headdecl{sys/ipc.h} 
2036   \headdecl{sys/sem.h} 
2037   
2038   \funcdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2039   
2040   Esegue le operazioni ordinarie su un semaforo o un insieme di semafori.
2041   
2042   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2043     errore, nel qual caso \var{errno} assumerà uno dei valori:
2044     \begin{errlist}
2045     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
2046       l'operazione richiesta.
2047     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
2048     \item[\errcode{ENOMEM}] Si è richiesto un \const{SEM\_UNDO} ma il sistema
2049       non ha le risorse per allocare la struttura di ripristino.
2050     \item[\errcode{EAGAIN}] Un'operazione comporterebbe il blocco del processo,
2051       ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2052     \item[\errcode{EINTR}] La funzione, bloccata in attesa dell'esecuzione
2053       dell'operazione, viene interrotta da un segnale.
2054     \item[\errcode{E2BIG}] L'argomento \param{nsops} è maggiore del numero
2055       massimo di operazioni \const{SEMOPM}.
2056     \item[\errcode{ERANGE}] Per alcune operazioni il valore risultante del
2057       semaforo viene a superare il limite massimo \const{SEMVMX}.
2058   \end{errlist}
2059   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2060 }
2061 \end{functions}
2062
2063 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2064 un insieme. La funzione richiede come primo argomento l'identificatore
2065 \param{semid} dell'insieme su cui si vuole operare. Il numero di operazioni da
2066 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2067 contenuto viene passato con un puntatore ad un vettore di strutture
2068 \struct{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2069 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante.
2070
2071 \begin{figure}[!htb]
2072   \footnotesize \centering
2073   \begin{minipage}[c]{15cm}
2074     \includestruct{listati/sembuf.h}
2075   \end{minipage} 
2076   \normalsize 
2077   \caption{La struttura \structd{sembuf}, usata per le operazioni sui
2078     semafori.}
2079   \label{fig:ipc_sembuf}
2080 \end{figure}
2081
2082 Il contenuto di ciascuna operazione deve essere specificato attraverso una
2083 opportuna struttura \struct{sembuf} (la cui definizione è riportata in
2084 fig.~\ref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2085 allocare in un opportuno vettore. La struttura permette di indicare il
2086 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2087 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2088 riferimento l'operazione; si ricordi che i semafori sono numerati come in un
2089 vettore, per cui il primo semaforo corrisponde ad un valore nullo di
2090 \var{sem\_num}.
2091
2092 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2093 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2094 \const{SEM\_UNDO}.  Impostando \const{IPC\_NOWAIT} si fa si che, invece di
2095 bloccarsi (in tutti quei casi in cui l'esecuzione di una operazione richiede
2096 che il processo vada in stato di \textit{sleep}), \func{semop} ritorni
2097 immediatamente con un errore di \errcode{EAGAIN}.  Impostando \const{SEM\_UNDO}
2098 si richiede invece che l'operazione venga registrata in modo che il valore del
2099 semaforo possa essere ripristinato all'uscita del processo.
2100
2101 Infine \var{sem\_op} è il campo che controlla l'operazione che viene eseguita
2102 e determina il comportamento della chiamata a \func{semop}; tre sono i casi
2103 possibili:
2104 \begin{basedescript}{\desclabelwidth{2.0cm}}
2105 \item[\var{sem\_op}$>0$] In questo caso il valore di \var{sem\_op} viene
2106   aggiunto al valore corrente di \var{semval}. La funzione ritorna
2107   immediatamente (con un errore di \errcode{ERANGE} qualora si sia superato il
2108   limite \const{SEMVMX}) ed il processo non viene bloccato in nessun caso.
2109   Specificando \const{SEM\_UNDO} si aggiorna il contatore per il ripristino
2110   del valore del semaforo. Al processo chiamante è richiesto il privilegio di
2111   alterazione (scrittura) sull'insieme di semafori.
2112   
2113 \item[\var{sem\_op}$=0$] Nel caso \var{semval} sia zero l'esecuzione procede
2114   immediatamente. Se \var{semval} è diverso da zero il comportamento è
2115   controllato da \var{sem\_flg}, se è stato impostato \const{IPC\_NOWAIT} la
2116   funzione ritorna con un errore di \errcode{EAGAIN}, altrimenti viene
2117   incrementato \var{semzcnt} di uno ed il processo resta in stato di
2118   \textit{sleep} fintanto che non si ha una delle condizioni seguenti:
2119   \begin{itemize*}
2120   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2121     decrementato di uno.
2122   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2123     un errore di \errcode{EIDRM}.
2124   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2125     viene decrementato di uno e \func{semop} ritorna un errore di
2126     \errcode{EINTR}.
2127   \end{itemize*}
2128   Al processo chiamante è richiesto il privilegio di lettura dell'insieme dei
2129   semafori.
2130   
2131 \item[\var{sem\_op}$<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2132   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2133   positiva o nulla) i valori vengono sommati e la funzione ritorna
2134   immediatamente; qualora si sia impostato \const{SEM\_UNDO} viene anche
2135   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2136   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2137   negativo) se si è impostato \const{IPC\_NOWAIT} la funzione ritorna con un
2138   errore di \errcode{EAGAIN}, altrimenti viene incrementato di uno
2139   \var{semncnt} ed il processo resta in stato di \textit{sleep} fintanto che
2140   non si ha una delle condizioni seguenti:
2141   \begin{itemize*}
2142   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2143     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2144     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2145     impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2146     ripristino del valore del semaforo.
2147   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2148     ritorna un errore di \errcode{EIDRM}.
2149   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2150     viene decrementato di uno e \func{semop} ritorna un errore di
2151     \errcode{EINTR}.
2152   \end{itemize*}    
2153   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2154   sull'insieme di semafori.
2155 \end{basedescript}
2156
2157 In caso di successo della funzione viene aggiornato il campo \var{sempid} per
2158 ogni semaforo modificato al valore del \acr{pid} del processo chiamante;
2159 inoltre vengono pure aggiornati al tempo corrente i campi \var{sem\_otime} e
2160 \var{sem\_ctime}.
2161
2162 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2163 semafori possono restare occupati, abbiamo visto come \func{semop} permetta di
2164 attivare un meccanismo di ripristino attraverso l'uso del flag
2165 \const{SEM\_UNDO}. Il meccanismo è implementato tramite una apposita struttura
2166 \struct{sem\_undo}, associata ad ogni processo per ciascun semaforo che esso
2167 ha modificato; all'uscita i semafori modificati vengono ripristinati, e le
2168 strutture disallocate.  Per mantenere coerente il comportamento queste
2169 strutture non vengono ereditate attraverso una \func{fork} (altrimenti si
2170 avrebbe un doppio ripristino), mentre passano inalterate nell'esecuzione di
2171 una \func{exec} (altrimenti non si avrebbe ripristino).
2172
2173 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2174 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2175 in maniera semplificata nello schema di fig.~\ref{fig:ipc_sem_schema}.  Si è
2176 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2177 semplice (ed illustrata in dettaglio in \cite{tlk}); nel kernel 2.4.x la
2178 struttura del \textit{SysV IPC} è stata modificata, ma le definizioni relative
2179 a queste strutture restano per compatibilità.\footnote{in particolare con le
2180   vecchie versioni delle librerie del C, come le libc5.}
2181
2182 \begin{figure}[htb]
2183   \centering \includegraphics[width=13cm]{img/semtruct}
2184   \caption{Schema della struttura di un insieme di semafori.}
2185   \label{fig:ipc_sem_schema}
2186 \end{figure}
2187
2188 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2189 \struct{semid\_ds} ed il relativo vettore di strutture \struct{sem}. Quando si
2190 richiede una operazione viene anzitutto verificato che tutte le operazioni
2191 possono avere successo; se una di esse comporta il blocco del processo il
2192 kernel crea una struttura \struct{sem\_queue} che viene aggiunta in fondo alla
2193 coda di attesa associata a ciascun insieme di semafori\footnote{che viene
2194   referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last}
2195   di \struct{semid\_ds}.}. 
2196
2197 Nella struttura viene memorizzato il riferimento alle operazioni richieste
2198 (nel campo \var{sops}, che è un puntatore ad una struttura \struct{sembuf}) e
2199 al processo corrente (nel campo \var{sleeper}) poi quest'ultimo viene messo
2200 stato di attesa e viene invocato lo scheduler\itindex{scheduler} per passare
2201 all'esecuzione di un altro processo.
2202
2203 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2204 immediatamente, dopo di che il kernel esegue una scansione della coda di
2205 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2206 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2207 struttura \struct{sem\_queue} viene rimossa e lo stato del processo associato
2208 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2209 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2210 svuotata la coda.  Per gestire il meccanismo del ripristino tutte le volte che
2211 per un'operazione si è specificato il flag \const{SEM\_UNDO} viene mantenuta
2212 per ciascun insieme di semafori una apposita struttura \struct{sem\_undo} che
2213 contiene (nel vettore puntato dal campo \var{semadj}) un valore di
2214 aggiustamento per ogni semaforo cui viene sommato l'opposto del valore usato
2215 per l'operazione.
2216
2217 Queste strutture sono mantenute in due liste,\footnote{rispettivamente
2218   attraverso i due campi \var{id\_next} e \var{proc\_next}.} una associata
2219 all'insieme di cui fa parte il semaforo, che viene usata per invalidare le
2220 strutture se questo viene cancellato o per azzerarle se si è eseguita una
2221 operazione con \func{semctl}; l'altra associata al processo che ha eseguito
2222 l'operazione;\footnote{attraverso il campo \var{semundo} di
2223   \struct{task\_struct}, come mostrato in \ref{fig:ipc_sem_schema}.} quando un
2224 processo termina, la lista ad esso associata viene scandita e le operazioni
2225 applicate al semaforo.  Siccome un processo può accumulare delle richieste di
2226 ripristino per semafori differenti chiamate attraverso diverse chiamate a
2227 \func{semop}, si pone il problema di come eseguire il ripristino dei semafori
2228 all'uscita del processo, ed in particolare se questo può essere fatto
2229 atomicamente.
2230
2231 Il punto è cosa succede quando una delle operazioni previste per il ripristino
2232 non può essere eseguita immediatamente perché ad esempio il semaforo è
2233 occupato; in tal caso infatti, se si pone il processo in stato di
2234 \textit{sleep} aspettando la disponibilità del semaforo (come faceva
2235 l'implementazione originaria) si perde l'atomicità dell'operazione. La scelta
2236 fatta dal kernel è pertanto quella di effettuare subito le operazioni che non
2237 prevedono un blocco del processo e di ignorare silenziosamente le altre;
2238 questo però comporta il fatto che il ripristino non è comunque garantito in
2239 tutte le occasioni.
2240
2241 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2242 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2243 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2244 riportato in fig.~\ref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2245 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2246 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2247 nullo per segnalarne l'indisponibilità. 
2248
2249 \begin{figure}[!bht]
2250   \footnotesize \centering
2251   \begin{minipage}[c]{15cm}
2252     \includecodesample{listati/Mutex.c}
2253   \end{minipage} 
2254   \normalsize 
2255   \caption{Il codice delle funzioni che permettono di creare o recuperare
2256     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2257   \label{fig:ipc_mutex_create}
2258 \end{figure}
2259
2260 La prima funzione (\texttt{\small 2--15}) è \func{MutexCreate} che data una
2261 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2262 l'identificatore. Il primo passo (\texttt{\small 6}) è chiamare \func{semget}
2263 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2264 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2265 (\texttt{\small 7--9}) si ritorna subito il risultato di \func{semget},
2266 altrimenti (\texttt{\small 10}) si inizializza il semaforo chiamando
2267 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2268 \struct{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 4})
2269 ad 1 per significare che risorsa è libera. In caso di errore (\texttt{\small
2270   11--13}) si restituisce il valore di ritorno di \func{semctl}, altrimenti
2271 (\texttt{\small 14}) si ritorna l'identificatore del semaforo.
2272
2273 La seconda funzione (\texttt{\small 17--20}) è \func{MutexFind}, che, data una
2274 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2275 comprensione del suo funzionamento è immediata in quanto essa è soltanto un
2276 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2277   \textsl{involucro} alla chiamata di un altra, usata in genere per
2278   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2279   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2280   stesse funzionalità.} di una chiamata a \func{semget} per cercare
2281 l'identificatore associato alla chiave, il valore di ritorno di quest'ultima
2282 viene passato all'indietro al chiamante.
2283
2284 La terza funzione (\texttt{\small 22--25}) è \func{MutexRead} che, dato un
2285 identificatore, restituisce il valore del semaforo associato al mutex. Anche
2286 in questo caso la funzione è un \textit{wrapper} per una chiamata a
2287 \func{semctl} con il comando \const{GETVAL}, che permette di restituire il
2288 valore del semaforo.
2289
2290 La quarta e la quinta funzione (\texttt{\small 36--44}) sono \func{MutexLock},
2291 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2292 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2293 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2294 (\texttt{\small 27--34}). Si noti come per queste ultime si sia fatto uso
2295 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2296 caso di terminazione imprevista del processo.
2297
2298 L'ultima funzione (\texttt{\small 46--49}) della serie, è \func{MutexRemove},
2299 che rimuove il mutex. Anche in questo caso si ha un wrapper per una chiamata a
2300 \func{semctl} con il comando \const{IPC\_RMID}, che permette di cancellare il
2301 semaforo; il valore di ritorno di quest'ultima viene passato all'indietro.
2302
2303 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2304 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2305 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2306 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2307 incrementato di uno, sbloccandolo qualora fosse bloccato.  
2308
2309 Si noti che occorre eseguire sempre prima \func{MutexLock} e poi
2310 \func{MutexUnlock}, perché se per un qualche errore si esegue più volte
2311 quest'ultima il valore del semaforo crescerebbe oltre 1, e \func{MutexLock}
2312 non avrebbe più l'effetto aspettato (bloccare la risorsa quando questa è
2313 considerata libera).  Infine si tenga presente che usare \func{MutexRead} per
2314 controllare il valore dei mutex prima di proseguire in una operazione di
2315 sblocco non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2316 Vedremo in sez.~\ref{sec:ipc_lock_file} come sia possibile ottenere
2317 un'interfaccia analoga a quella appena illustrata, senza incorrere in questi
2318 problemi, usando il file locking\index{file!locking}.
2319
2320
2321 \subsection{Memoria condivisa}
2322 \label{sec:ipc_sysv_shm}
2323
2324 Il terzo oggetto introdotto dal \textit{SysV IPC} è quello dei segmenti di
2325 memoria condivisa. La funzione che permette di ottenerne uno è \funcd{shmget},
2326 ed il suo prototipo è:
2327 \begin{functions}
2328   \headdecl{sys/types.h} 
2329   \headdecl{sys/ipc.h} 
2330   \headdecl{sys/shm.h}
2331   
2332   \funcdecl{int shmget(key\_t key, int size, int flag)}
2333   
2334   Restituisce l'identificatore di una memoria condivisa.
2335   
2336   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
2337     in caso di errore, nel qual caso \var{errno} assumerà i valori:
2338     \begin{errlist}
2339     \item[\errcode{ENOSPC}] Si è superato il limite (\const{SHMMNI}) sul numero
2340       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2341       cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2342       la memoria ad essi riservata.
2343     \item[\errcode{EINVAL}] Si è richiesta una dimensione per un nuovo segmento
2344       maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2345       già esiste \param{size} è maggiore delle sue dimensioni.
2346     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
2347       contenere le strutture per un nuovo segmento di memoria condivisa.
2348     \end{errlist}
2349     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2350     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2351 \end{functions}
2352
2353 La funzione, come \func{semget}, è del tutto analoga a \func{msgget}, ed
2354 identico è l'uso degli argomenti \param{key} e \param{flag} per cui non
2355 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
2356 \param{size} specifica invece la dimensione, in byte, del segmento, che viene
2357 comunque arrotondata al multiplo superiore di \const{PAGE\_SIZE}.
2358
2359 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2360 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2361 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2362 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2363 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2364 dati in memoria.
2365
2366 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2367 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2368 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2369 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2370 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2371 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2372 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2373 altro processo. Per questo in genere la memoria condivisa viene sempre
2374 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2375 norma, significa insieme a dei semafori.
2376
2377 \begin{figure}[!htb]
2378   \footnotesize \centering
2379   \begin{minipage}[c]{15cm}
2380     \includestruct{listati/shmid_ds.h}
2381   \end{minipage} 
2382   \normalsize 
2383   \caption{La struttura \structd{shmid\_ds}, associata a ciascun segmento di
2384     memoria condivisa.}
2385   \label{fig:ipc_shmid_ds}
2386 \end{figure}
2387
2388 A ciascun segmento di memoria condivisa è associata una struttura
2389 \struct{shmid\_ds}, riportata in fig.~\ref{fig:ipc_shmid_ds}.  Come nel caso
2390 delle code di messaggi quando si crea un nuovo segmento di memoria condivisa
2391 con \func{shmget} questa struttura viene inizializzata, in particolare il
2392 campo \var{shm\_perm} viene inizializzato come illustrato in
2393 sez.~\ref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2394 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2395 invece:
2396 \begin{itemize}
2397 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2398   inizializzato al valore di \param{size}.
2399 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2400   segmento, viene inizializzato al tempo corrente.
2401 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2402   rispettivamente il tempo dell'ultima volta che il segmento è stato
2403   agganciato o sganciato da un processo, vengono inizializzati a zero.
2404 \item il campo \var{shm\_lpid}, che esprime il \acr{pid} del processo che ha
2405   eseguito l'ultima operazione, viene inizializzato a zero.
2406 \item il campo \var{shm\_cpid}, che esprime il \acr{pid} del processo che ha
2407   creato il segmento, viene inizializzato al \acr{pid} del processo chiamante.
2408 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2409   al segmento viene inizializzato a zero.
2410 \end{itemize}
2411
2412 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2413 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2414 di questi limiti sono al solito accessibili e modificabili attraverso
2415 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2416 \file{/proc/sys/kernel/}. 
2417
2418 In tab.~\ref{tab:ipc_shm_limits} si sono riportate le
2419 costanti simboliche associate a ciascuno di essi, il loro significato, i
2420 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2421 che permettono di cambiarne il valore. 
2422
2423
2424 \begin{table}[htb]
2425   \footnotesize
2426   \centering
2427   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2428     \hline
2429     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2430     & \textbf{Significato} \\
2431     \hline
2432     \hline
2433     \const{SHMALL}& 0x200000&\file{shmall}& Numero massimo di pagine che 
2434                                        possono essere usate per i segmenti di
2435                                        memoria condivisa. \\
2436     \const{SHMMAX}&0x2000000&\file{shmmax}& Dimensione massima di un segmento 
2437                                             di memoria condivisa.\\
2438     \const{SHMMNI}&     4096&\file{msgmni}& Numero massimo di segmenti di 
2439                                             memoria condivisa presenti nel
2440                                             kernel.\\ 
2441     \const{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2442                                             memoria condivisa. \\
2443     \const{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2444                                             minime di un segmento (deve essere
2445                                             allineato alle dimensioni di una
2446                                             pagina di memoria). \\
2447     \const{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2448                                             memoria condivisa 
2449                                             per ciascun processo.\\
2450
2451
2452     \hline
2453   \end{tabular}
2454   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2455     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2456     valore preimpostato presente nel sistema.} 
2457   \label{tab:ipc_shm_limits}
2458 \end{table}
2459
2460 Al solito la funzione che permette di effettuare le operazioni di controllo su
2461 un segmento di memoria condivisa è \funcd{shmctl}; il suo prototipo è:
2462 \begin{functions}
2463   \headdecl{sys/ipc.h} 
2464   \headdecl{sys/shm.h}
2465   
2466   \funcdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2467   
2468   Esegue le operazioni di controllo su un segmento di memoria condivisa.
2469   
2470   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2471     errore, nel qual caso \var{errno} assumerà i valori:
2472     \begin{errlist}
2473     \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma i permessi non
2474       consentono l'accesso in lettura al segmento.
2475     \item[\errcode{EINVAL}] O \param{shmid} non è un identificatore valido o
2476       \param{cmd} non è un comando valido.
2477     \item[\errcode{EIDRM}] L'argomento \param{shmid} fa riferimento ad un
2478       segmento che è stato cancellato.
2479     \item[\errcode{EPERM}] Si è specificato un comando con \const{IPC\_SET} o
2480       \const{IPC\_RMID} senza i permessi necessari.
2481     \item[\errcode{EOVERFLOW}] Si è tentato il comando \const{IPC\_STAT} ma il
2482       valore del group-ID o dell'user-ID è troppo grande per essere
2483       memorizzato nella struttura puntata dal \param{buf}.  
2484     \item[\errcode{EFAULT}] L'indirizzo specificato con \param{buf} non è
2485       valido.
2486     \end{errlist}
2487 }
2488 \end{functions}
2489
2490 Il comando specificato attraverso l'argomento \param{cmd} determina i diversi
2491 effetti della funzione; i possibili valori che esso può assumere, ed il
2492 corrispondente comportamento della funzione, sono i seguenti:
2493
2494 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2495 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2496   condivisa nella struttura \struct{shmid\_ds} puntata da \param{buf}. Occorre
2497   che il processo chiamante abbia il permesso di lettura sulla segmento.
2498 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2499   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2500   processo ad esso agganciato si sarà staccato. Questo comando può essere
2501   eseguito solo da un processo con user-ID effettivo corrispondente o al
2502   creatore del segmento, o al proprietario del segmento, o all'amministratore.
2503 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2504   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2505   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2506   il creatore del segmento, oppure l'amministratore. Compiuta l'operazione
2507   aggiorna anche il valore del campo \var{shm\_ctime}.
2508 \item[\const{SHM\_LOCK}] Abilita il \textit{memory
2509     locking}\itindex{memory~locking}\footnote{impedisce cioè che la memoria
2510     usata per il segmento venga salvata su disco dal meccanismo della memoria
2511     virtuale\index{memoria~virtuale}; si ricordi quanto trattato in
2512     sez.~\ref{sec:proc_mem_lock}.} sul segmento di memoria condivisa. Solo
2513   l'amministratore può utilizzare questo comando.
2514 \item[\const{SHM\_UNLOCK}] Disabilita il \textit{memory
2515     locking}\itindex{memory~locking} sul segmento di memoria condivisa.  Solo
2516   l'amministratore può utilizzare questo comando.
2517 \end{basedescript}
2518 i primi tre comandi sono gli stessi già visti anche per le code di messaggi e
2519 gli insiemi di semafori, gli ultimi due sono delle estensioni specifiche
2520 previste da Linux, che permettono di abilitare e disabilitare il meccanismo
2521 della memoria virtuale\index{memoria~virtuale} per il segmento.
2522
2523 L'argomento \param{buf} viene utilizzato solo con i comandi \const{IPC\_STAT}
2524 e \const{IPC\_SET} nel qual caso esso dovrà puntare ad una struttura
2525 \struct{shmid\_ds} precedentemente allocata, in cui nel primo caso saranno
2526 scritti i dati del segmento di memoria restituiti dalla funzione e da cui, nel
2527 secondo caso, verranno letti i dati da impostare sul segmento.
2528
2529 Una volta che lo si è creato, per utilizzare un segmento di memoria condivisa
2530 l'interfaccia prevede due funzioni, \funcd{shmat} e \func{shmdt}. La prima di
2531 queste serve ad agganciare un segmento al processo chiamante, in modo che
2532 quest'ultimo possa inserirlo nel suo spazio di indirizzi per potervi accedere;
2533 il suo prototipo è:
2534 \begin{functions}
2535   \headdecl{sys/types.h} 
2536   \headdecl{sys/shm.h}
2537   
2538   \funcdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2539   Aggancia al processo un segmento di memoria condivisa.
2540   
2541   \bodydesc{La funzione restituisce l'indirizzo del segmento in caso di
2542     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà i
2543     valori:
2544     \begin{errlist}
2545     \item[\errcode{EACCES}] Il processo non ha i privilegi per accedere al
2546       segmento nella modalità richiesta.
2547     \item[\errcode{EINVAL}] Si è specificato un identificatore invalido per
2548       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2549       per \param{shmaddr}.
2550     \end{errlist}
2551     ed inoltre \errval{ENOMEM}.}
2552 \end{functions}
2553
2554 La funzione inserisce un segmento di memoria condivisa all'interno dello
2555 spazio di indirizzi del processo, in modo che questo possa accedervi
2556 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2557 fig.~\ref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2558 ricordi quanto illustrato al proposito in sez.~\ref{sec:proc_mem_layout}). In
2559 particolare l'indirizzo finale del segmento dati (quello impostato da
2560 \func{brk}, vedi sez.~\ref{sec:proc_mem_sbrk_alloca}) non viene influenzato.
2561 Si tenga presente infine che la funzione ha successo anche se il segmento è
2562 stato marcato per la cancellazione.
2563
2564 \begin{figure}[htb]
2565   \centering
2566   \includegraphics[height=10cm]{img/sh_memory_layout}
2567   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2568     agganciato un segmento di memoria condivisa.}
2569   \label{fig:ipc_shmem_layout}
2570 \end{figure}
2571
2572 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{Lo standard
2573   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2574   come il valore di ritorno della funzione. In Linux è stato così con le
2575   \acr{libc4} e le \acr{libc5}, con il passaggio alle \acr{glibc} il tipo di
2576   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2577   ritorno un \ctyp{void *}.} deve essere associato il segmento, se il valore
2578 specificato è \val{NULL} è il sistema a scegliere opportunamente un'area di
2579 memoria libera (questo è il modo più portabile e sicuro di usare la funzione).
2580 Altrimenti il kernel aggancia il segmento all'indirizzo specificato da
2581 \param{shmaddr}; questo però può avvenire solo se l'indirizzo coincide con il
2582 limite di una pagina, cioè se è un multiplo esatto del parametro di sistema
2583 \const{SHMLBA}, che in Linux è sempre uguale \const{PAGE\_SIZE}. 
2584
2585 Si tenga presente però che quando si usa \val{NULL} come valore di
2586 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2587 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2588 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2589 riferiti all'indirizzo di partenza del segmento).
2590
2591 L'argomento \param{shmflg} permette di cambiare il comportamento della
2592 funzione; esso va specificato come maschera binaria, i bit utilizzati sono
2593 solo due e sono identificati dalle costanti \const{SHM\_RND} e
2594 \const{SHM\_RDONLY}, che vanno combinate con un OR aritmetico.  Specificando
2595 \const{SHM\_RND} si evita che \func{shmat} ritorni un errore quando
2596 \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi usare
2597 un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2598 agganciato, ma al più vicino multiplo di \const{SHMLBA} (il nome della
2599 costante sta infatti per \textit{rounded}, e serve per specificare un
2600 indirizzo come arrotondamento, in Linux è equivalente a \const{PAGE\_SIZE}).
2601
2602 L'uso di \const{SHM\_RDONLY} permette di agganciare il segmento in sola
2603 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2604 caso un tentativo di scrivere sul segmento comporterà una violazione di
2605 accesso con l'emissione di un segnale di \const{SIGSEGV}. Il comportamento
2606 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2607 lettura e scrittura (ed il processo deve aver questi permessi in
2608 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2609 sola scrittura.
2610
2611 In caso di successo la funzione aggiorna anche i seguenti campi di
2612 \struct{shmid\_ds}:
2613 \begin{itemize*}
2614 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2615   impostato al tempo corrente.
2616 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2617   segmento viene impostato a quello del processo corrente.
2618 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2619   aumentato di uno.
2620 \end{itemize*} 
2621
2622 Come accennato in sez.~\ref{sec:proc_fork} un segmento di memoria condivisa
2623 agganciato ad un processo viene ereditato da un figlio attraverso una
2624 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2625 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2626 eseguito un diverso programma con uno spazio di indirizzi completamente
2627 diverso, tutti i segmenti agganciati al processo originario vengono
2628 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2629 attraverso una \func{exit}.
2630
2631 Una volta che un segmento di memoria condivisa non serve più, si può
2632 sganciarlo esplicitamente dal processo usando l'altra funzione
2633 dell'interfaccia, \funcd{shmdt}, il cui prototipo è:
2634 \begin{functions}
2635   \headdecl{sys/types.h} 
2636   \headdecl{sys/shm.h}
2637
2638   \funcdecl{int shmdt(const void *shmaddr)}
2639   Sgancia dal processo un segmento di memoria condivisa.
2640   
2641   \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
2642     errore, la funzione fallisce solo quando non c'è un segmento agganciato
2643     all'indirizzo \param{shmaddr}, con \var{errno} che assume il valore
2644     \errval{EINVAL}.}
2645 \end{functions}
2646
2647 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2648 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2649 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2650 agganciato al processo.
2651
2652 In caso di successo la funzione aggiorna anche i seguenti campi di
2653 \struct{shmid\_ds}:
2654 \begin{itemize*}
2655 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2656   impostato al tempo corrente.
2657 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2658   segmento viene impostato a quello del processo corrente.
2659 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2660   decrementato di uno.
2661 \end{itemize*} 
2662 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2663 viene tolta dallo spazio di indirizzi del processo.
2664
2665 \begin{figure}[!bht]
2666   \footnotesize \centering
2667   \begin{minipage}[c]{15.6cm}
2668     \includecodesample{listati/SharedMem.c}
2669   \end{minipage} 
2670   \normalsize 
2671   \caption{Il codice delle funzioni che permettono di creare, trovare e
2672     rimuovere un segmento di memoria condivisa.}
2673   \label{fig:ipc_sysv_shm_func}
2674 \end{figure}
2675
2676 Come esempio di uso di queste funzioni vediamo come implementare una serie di
2677 funzioni di libreria che ne semplifichino l'uso, automatizzando le operazioni
2678 più comuni; il codice, contenuto nel file \file{SharedMem.c}, è riportato in
2679 fig.~\ref{fig:ipc_sysv_shm_func}.
2680
2681 La prima funzione (\texttt{\small 3--16}) è \func{ShmCreate} che, data una
2682 chiave, crea il segmento di memoria condivisa restituendo il puntatore allo
2683 stesso. La funzione comincia (\texttt{\small 6}) con il chiamare
2684 \func{shmget}, usando il flag \const{IPC\_CREATE} per creare il segmento
2685 qualora non esista, ed assegnandogli i privilegi specificati dall'argomento
2686 \var{perm} e la dimensione specificata dall'argomento \var{shm\_size}.  In
2687 caso di errore (\texttt{\small 7--9}) si ritorna immediatamente un puntatore
2688 nullo, altrimenti (\texttt{\small 10}) si prosegue agganciando il segmento di
2689 memoria condivisa al processo con \func{shmat}. In caso di errore
2690 (\texttt{\small 11--13}) si restituisce di nuovo un puntatore nullo, infine
2691 (\texttt{\small 14}) si inizializza con \func{memset} il contenuto del
2692 segmento al valore costante specificato dall'argomento \var{fill}, e poi si
2693 ritorna il puntatore al segmento stesso.
2694
2695 La seconda funzione (\texttt{\small 17--31}) è \func{ShmFind}, che, data una
2696 chiave, restituisce l'indirizzo del segmento ad essa associato. Anzitutto
2697 (\texttt{\small 22}) si richiede l'identificatore del segmento con
2698 \func{shmget}, ritornando (\texttt{\small 23--25}) un puntatore nullo in caso
2699 di errore. Poi si prosegue (\texttt{\small 26}) agganciando il segmento al
2700 processo con \func{shmat}, restituendo (\texttt{\small 27--29}) di nuovo un
2701 puntatore nullo in caso di errore, se invece non ci sono errori si restituisce
2702 il puntatore ottenuto da \func{shmat}.
2703
2704 La terza funzione (\texttt{\small 32--51}) è \func{ShmRemove} che, data la
2705 chiave ed il puntatore associati al segmento di memoria condivisa, prima lo
2706 sgancia dal processo e poi lo rimuove. Il primo passo (\texttt{\small 37}) è
2707 la chiamata a \func{shmdt} per sganciare il segmento, restituendo
2708 (\texttt{\small 38--39}) un valore -1 in caso di errore. Il passo successivo
2709 (\texttt{\small 41}) è utilizzare \func{shmget} per ottenre l'identificatore
2710 associato al segmento data la chiave \var{key}. Al solito si restituisce un
2711 valore di -1 (\texttt{\small 42--45}) in caso di errore, mentre se tutto va
2712 bene si conclude restituendo un valore nullo.
2713
2714 Benché la memoria condivisa costituisca il meccanismo di intercomunicazione
2715 fra processi più veloce, essa non è sempre il più appropriato, dato che, come
2716 abbiamo visto, si avrà comunque la necessità di una sincronizzazione degli
2717 accessi.  Per questo motivo, quando la comunicazione fra processi è
2718 sequenziale, altri meccanismi come le pipe, le fifo o i socket, che non
2719 necessitano di sincronizzazione esplicita, sono da preferire. Essa diventa
2720 l'unico meccanismo possibile quando la comunicazione non è
2721 sequenziale\footnote{come accennato in sez.~\ref{sec:ipc_sysv_mq} per la
2722   comunicazione non sequenziale si possono usare le code di messaggi,
2723   attraverso l'uso del campo \var{mtype}, ma solo se quest'ultima può essere
2724   effettuata in forma di messaggio.} o quando non può avvenire secondo una
2725 modalità predefinita.
2726
2727 Un esempio classico di uso della memoria condivisa è quello del
2728 ``\textit{monitor}'', in cui viene per scambiare informazioni fra un processo
2729 server, che vi scrive dei dati di interesse generale che ha ottenuto, e i
2730 processi client interessati agli stessi dati che così possono leggerli in
2731 maniera completamente asincrona.  Con questo schema di funzionamento da una
2732 parte si evita che ciascun processo client debba compiere l'operazione,
2733 potenzialmente onerosa, di ricavare e trattare i dati, e dall'altra si evita
2734 al processo server di dover gestire l'invio a tutti i client di tutti i dati
2735 (non potendo il server sapere quali di essi servono effettivamente al singolo
2736 client).
2737
2738 Nel nostro caso implementeremo un ``\textsl{monitor}'' di una directory: un
2739 processo si incaricherà di tenere sotto controllo alcuni parametri relativi ad
2740 una directory (il numero dei file contenuti, la dimensione totale, quante
2741 directory, link simbolici, file normali, ecc.) che saranno salvati in un
2742 segmento di memoria condivisa cui altri processi potranno accedere per
2743 ricavare la parte di informazione che interessa.
2744
2745 In fig.~\ref{fig:ipc_dirmonitor_main} si è riportata la sezione principale del
2746 corpo del programma server, insieme alle definizioni delle altre funzioni
2747 usate nel programma e delle variabili globali, omettendo tutto quello che
2748 riguarda la gestione delle opzioni e la stampa delle istruzioni di uso a
2749 video; al solito il codice completo si trova con i sorgenti allegati nel file
2750 \file{DirMonitor.c}.
2751
2752 \begin{figure}[!htb]
2753   \footnotesize \centering
2754   \begin{minipage}[c]{15.6cm}
2755     \includecodesample{listati/DirMonitor.c}
2756   \end{minipage} 
2757   \normalsize 
2758   \caption{Codice della funzione principale del programma \file{DirMonitor.c}.}
2759   \label{fig:ipc_dirmonitor_main}
2760 \end{figure}
2761
2762 Il programma usa delle variabili globali (\texttt{\small 2--14}) per mantenere
2763 i valori relativi agli oggetti usati per la comunicazione inter-processo; si è
2764 definita inoltre una apposita struttura \struct{DirProp} che contiene i dati
2765 relativi alle proprietà che si vogliono mantenere nella memoria condivisa, per
2766 l'accesso da parte dei client.
2767
2768 Il programma, dopo la sezione, omessa, relativa alla gestione delle opzioni da
2769 riga di comando (che si limitano alla eventuale stampa di un messaggio di
2770 aiuto a video ed all'impostazione della durata dell'intervallo con cui viene
2771 ripetuto il calcolo delle proprietà della directory) controlla (\texttt{\small
2772   20--23}) che sia stato specificato l'argoemnto necessario contenente il nome
2773 della directory da tenere sotto controllo, senza il quale esce immediatamente
2774 con un messaggio di errore.
2775
2776 Poi, per verificare che l'argomento specifichi effettivamente una directory,
2777 si esegue (\texttt{\small 24--26}) su di esso una \func{chdir}, uscendo
2778 immediatamente in caso di errore.  Questa funzione serve anche per impostare
2779 la directory di lavoro del programma nella directory da tenere sotto
2780 controllo, in vista del successivo uso della funzione
2781 \func{daemon}.\footnote{si noti come si è potuta fare questa scelta,
2782   nonostante le indicazioni illustrate in sez.~\ref{sec:sess_daemon}, per il
2783   particolare scopo del programma, che necessita comunque di restare
2784   all'interno di una directory.} Infine (\texttt{\small 27--29}) si installano
2785 i gestori per i vari segnali di terminazione che, avendo a che fare con un
2786 programma che deve essere eseguito come server, sono il solo strumento
2787 disponibile per concluderne l'esecuzione.
2788
2789 Il passo successivo (\texttt{\small 30--39}) è quello di creare gli oggetti di
2790 intercomunicazione necessari. Si inizia costruendo (\texttt{\small 30}) la
2791 chiave da usare come riferimento con il nome del programma,\footnote{si è
2792   usato un riferimento relativo alla home dell'utente, supposto che i sorgenti
2793   di GaPiL siano stati installati direttamente in essa. Qualora si effettui
2794   una installazione diversa si dovrà correggere il programma.} dopo di che si
2795 richiede (\texttt{\small 31}) la creazione di un segmento di memoria condivisa
2796 con usando la funzione \func{ShmCreate} illustrata in precedenza (una pagina
2797 di memoria è sufficiente per i dati che useremo), uscendo (\texttt{\small
2798   32--35}) qualora la creazione ed il successivo agganciamento al processo non
2799 abbia successo. Con l'indirizzo \var{shmptr} così ottenuto potremo poi
2800 accedere alla memoria condivisa, che, per come abbiamo lo abbiamo definito,
2801 sarà vista nella forma data da \struct{DirProp}. Infine (\texttt{\small
2802   36--39}) utilizzando sempre la stessa chiave, si crea, tramite le funzioni
2803 di interfaccia già descritte in sez.~\ref{sec:ipc_sysv_sem}, anche un mutex,
2804 che utilizzeremo per regolare l'accesso alla memoria condivisa.
2805
2806 \begin{figure}[!htb]
2807   \footnotesize \centering
2808   \begin{minipage}[c]{15.6cm}
2809     \includecodesample{listati/ComputeValues.c}
2810   \end{minipage} 
2811   \normalsize 
2812   \caption{Codice delle funzioni ausiliarie usate da \file{DirMonitor.c}.}
2813   \label{fig:ipc_dirmonitor_sub}
2814 \end{figure}
2815
2816 Completata l'inizializzazione e la creazione degli oggetti di
2817 intercomunicazione il programma entra nel ciclo principale (\texttt{\small
2818   40--49}) dove vengono eseguite indefinitamente le attività di monitoraggio.
2819 Il primo passo (\texttt{\small 41}) è eseguire \func{daemon} per proseguire
2820 con l'esecuzione in background come si conviene ad un programma demone; si
2821 noti che si è mantenuta, usando un valore non nullo del primo argomento, la
2822 directory di lavoro corrente.  Una volta che il programma è andato in
2823 background l'esecuzione prosegue (\texttt{\small 42--48}) all'interno di un
2824 ciclo infinito: si inizia (\texttt{\small 43}) bloccando il mutex con
2825 \func{MutexLock} per poter accedere alla memoria condivisa (la funzione si
2826 bloccherà automaticamente se qualche client sta leggendo), poi (\texttt{\small
2827   44}) si cancellano i valori precedentemente immagazzinati nella memoria
2828 condivisa con \func{memset}, e si esegue (\texttt{\small 45}) un nuovo calcolo
2829 degli stessi utilizzando la funzione \func{DirScan}; infine (\texttt{\small
2830   46}) si sblocca il mutex con \func{MutexUnlock}, e si attende
2831 (\texttt{\small 47}) per il periodo di tempo specificato a riga di comando con
2832 l'opzione \code{-p} con una \func{sleep}.
2833
2834 Si noti come per il calcolo dei valori da mantenere nella memoria condivisa si
2835 sia usata ancora una volta la funzione \func{DirScan}, già utilizzata (e
2836 descritta in dettaglio) in sez.~\ref{sec:file_dir_read}, che ci permette di
2837 effettuare la scansione delle voci della directory, chiamando per ciascuna di
2838 esse la funzione \func{ComputeValues}, che esegue tutti i calcoli necessari.
2839
2840 Il codice di quest'ultima è riportato in fig.~\ref{fig:ipc_dirmonitor_sub}.
2841 Come si vede la funzione (\texttt{\small 2--16}) è molto semplice e si limita
2842 a chiamare (\texttt{\small 5}) la funzione \func{stat} sul file indicato da
2843 ciascuna voce, per ottenerne i dati, che poi utilizza per incrementare i vari
2844 contatori nella memoria condivisa, cui accede grazie alla variabile globale
2845 \var{shmptr}.
2846
2847 Dato che la funzione è chiamata da \func{DirScan}, si è all'interno del ciclo
2848 principale del programma, con un mutex acquisito, perciò non è necessario
2849 effettuare nessun controllo e si può accedere direttamente alla memoria
2850 condivisa usando \var{shmptr} per riempire i campi della struttura
2851 \struct{DirProp}; così prima (\texttt{\small 6--7}) si sommano le dimensioni
2852 dei file ed il loro numero, poi, utilizzando le macro di
2853 tab.~\ref{tab:file_type_macro}, si contano (\texttt{\small 8--14}) quanti ce
2854 ne sono per ciascun tipo.
2855
2856 In fig.~\ref{fig:ipc_dirmonitor_sub} è riportato anche il codice
2857 (\texttt{\small 17--23}) del gestore dei segnali di terminazione, usato per
2858 chiudere il programma. Esso, oltre a provocare l'uscita del programma, si
2859 incarica anche di cancellare tutti gli oggetti di intercomunicazione non più
2860 necessari.  Per questo anzitutto (\texttt{\small 19}) acquisisce il mutex con
2861 \func{MutexLock}, per evitare di operare mentre un client sta ancora leggendo
2862 i dati, dopo di che (\texttt{\small 20}) distacca e rimuove il segmento di
2863 memoria condivisa usando \func{ShmRemove}.  Infine (\texttt{\small 21})
2864 rimuove il mutex con \func{MutexRemove} ed esce (\texttt{\small 22}).
2865
2866 \begin{figure}[!htb]
2867   \footnotesize \centering
2868   \begin{minipage}[c]{15.6 cm}
2869     \includecodesample{listati/ReadMonitor.c}
2870   \end{minipage} 
2871   \normalsize 
2872   \caption{Codice del programma client del monitor delle proprietà di una
2873     directory, \file{ReadMonitor.c}.}
2874   \label{fig:ipc_dirmonitor_client}
2875 \end{figure}
2876
2877 Il codice del client usato per leggere le informazioni mantenute nella memoria
2878 condivisa è riportato in fig.~\ref{fig:ipc_dirmonitor_client}. Al solito si è
2879 omessa la sezione di gestione delle opzioni e la funzione che stampa a video
2880 le istruzioni; il codice completo è nei sorgenti allegati, nel file
2881 \file{ReadMonitor.c}.
2882
2883 Una volta conclusa la gestione delle opzioni a riga di comando il programma
2884 rigenera (\texttt{\small 7}) con \func{ftok} la stessa chiave usata dal server
2885 per identificare il segmento di memoria condivisa ed il mutex, poi
2886 (\texttt{\small 8}) richiede con \func{ShmFind} l'indirizzo della memoria
2887 condivisa agganciando al contempo il segmento al processo, Infine
2888 (\texttt{\small 17--20}) con \func{MutexFind} si richiede l'identificatore del
2889 mutex.  Completata l'inizializzazione ed ottenuti i riferimenti agli oggetti
2890 di intercomunicazione necessari viene eseguito il corpo principale del
2891 programma (\texttt{\small 21--33}); si comincia (\texttt{\small 22})
2892 acquisendo il mutex con \func{MutexLock}; qui avviene il blocco del processo
2893 se la memoria condivisa non è disponibile.  Poi (\texttt{\small 23--31}) si
2894 stampano i vari valori mantenuti nella memoria condivisa attraverso l'uso di
2895 \var{shmptr}.  Infine (\texttt{\small 41}) con \func{MutexUnlock} si rilascia
2896 il mutex, prima di uscire.
2897
2898 Verifichiamo allora il funzionamento dei nostri programmi; al solito, usando
2899 le funzioni di libreria occorre definire opportunamente
2900 \code{LD\_LIBRARY\_PATH}; poi si potrà lanciare il server con:
2901 \begin{verbatim}
2902 [piccardi@gont sources]$ ./dirmonitor ./
2903 \end{verbatim}%$
2904 ed avendo usato \func{daemon} il comando ritornerà immediatamente. Una volta
2905 che il server è in esecuzione, possiamo passare ad invocare il client per
2906 verificarne i risultati, in tal caso otterremo:
2907 \begin{verbatim}
2908 [piccardi@gont sources]$ ./readmon 
2909 Ci sono 68 file dati
2910 Ci sono 3 directory
2911 Ci sono 0 link
2912 Ci sono 0 fifo
2913 Ci sono 0 socket
2914 Ci sono 0 device a caratteri
2915 Ci sono 0 device a blocchi
2916 Totale  71 file, per 489831 byte
2917 \end{verbatim}%$
2918 ed un rapido calcolo (ad esempio con \code{ls -a | wc} per contare i file) ci
2919 permette di verificare che il totale dei file è giusto. Un controllo con
2920 \cmd{ipcs} ci permette inoltre di verificare la presenza di un segmento di
2921 memoria condivisa e di un semaforo:
2922 \begin{verbatim}
2923 [piccardi@gont sources]$ ipcs
2924 ------ Shared Memory Segments --------
2925 key        shmid      owner      perms      bytes      nattch     status      
2926 0xffffffff 54067205   piccardi  666        4096       1                       
2927
2928 ------ Semaphore Arrays --------
2929 key        semid      owner      perms      nsems     
2930 0xffffffff 229376     piccardi  666        1         
2931
2932 ------ Message Queues --------
2933 key        msqid      owner      perms      used-bytes   messages    
2934 \end{verbatim}%$
2935
2936 Se a questo punto aggiungiamo un file, ad esempio con \code{touch prova},
2937 potremo verificare che, passati nel peggiore dei casi almeno 10 secondi (o
2938 l'eventuale altro intervallo impostato per la rilettura dei dati) avremo:
2939 \begin{verbatim}
2940 [piccardi@gont sources]$ ./readmon 
2941 Ci sono 69 file dati
2942 Ci sono 3 directory
2943 Ci sono 0 link
2944 Ci sono 0 fifo
2945 Ci sono 0 socket
2946 Ci sono 0 device a caratteri
2947 Ci sono 0 device a blocchi
2948 Totale  72 file, per 489887 byte
2949 \end{verbatim}%$
2950
2951 A questo punto possiamo far uscire il server inviandogli un segnale di
2952 \const{SIGTERM} con il comando \code{killall dirmonitor}, a questo punto
2953 ripetendo la lettura, otterremo un errore:
2954 \begin{verbatim}
2955 [piccardi@gont sources]$ ./readmon 
2956 Cannot find shared memory: No such file or directory
2957 \end{verbatim}%$
2958 e inoltre potremo anche verificare che anche gli oggetti di intercomunicazione
2959 visti in precedenza sono stati regolarmente  cancellati:
2960 \begin{verbatim}
2961 [piccardi@gont sources]$ ipcs
2962 ------ Shared Memory Segments --------
2963 key        shmid      owner      perms      bytes      nattch     status      
2964
2965 ------ Semaphore Arrays --------
2966 key        semid      owner      perms      nsems     
2967
2968 ------ Message Queues --------
2969 key        msqid      owner      perms      used-bytes   messages    
2970 \end{verbatim}%$
2971
2972
2973
2974 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
2975 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
2976 %% condivisa; uno schema semplificato della struttura è illustrato in
2977 %% fig.~\ref{fig:ipc_shm_struct}. 
2978
2979 %% \begin{figure}[htb]
2980 %%   \centering
2981 %%   \includegraphics[width=10cm]{img/shmstruct}
2982 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
2983 %%     Linux.}
2984 %%   \label{fig:ipc_shm_struct}
2985 %% \end{figure}
2986
2987
2988
2989
2990 \section{Tecniche alternative}
2991 \label{sec:ipc_alternatives}
2992
2993 Come abbiamo detto in sez.~\ref{sec:ipc_sysv_generic}, e ripreso nella
2994 descrizione dei singoli oggetti che ne fan parte, il \textit{SysV IPC}
2995 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
2996   capitolo 14.}  Stevens ne effettua una accurata analisi (alcuni dei concetti
2997 sono già stati accennati in precedenza) ed elenca alcune possibili tecniche
2998 alternative, che vogliamo riprendere in questa sezione.
2999
3000
3001 \subsection{Alternative alle code di messaggi}
3002 \label{sec:ipc_mq_alternative}
3003  
3004 Le code di messaggi sono probabilmente il meno usato degli oggetti del
3005 \textit{SysV IPC}; esse infatti nacquero principalmente come meccanismo di
3006 comunicazione bidirezionale quando ancora le pipe erano unidirezionali; con la
3007 disponibilità di \func{socketpair} (vedi sez.~\ref{sec:ipc_socketpair}) o
3008 utilizzando una coppia di pipe, si può ottenere questo risultato senza
3009 incorrere nelle complicazioni introdotte dal \textit{SysV IPC}.
3010
3011 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
3012 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
3013 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
3014 sono impossibili da ottenere con le pipe e i socket\index{socket} di
3015 \func{socketpair}.  A queste esigenze però si può comunque ovviare in maniera
3016 diversa con un uso combinato della memoria condivisa e dei meccanismi di
3017 sincronizzazione, per cui alla fine l'uso delle code di messaggi classiche è
3018 relativamente poco diffuso.
3019
3020 \subsection{I \textsl{file di lock}}
3021 \label{sec:ipc_file_lock}
3022
3023 \index{file!di lock|(}
3024 Come illustrato in sez.~\ref{sec:ipc_sysv_sem} i semafori del \textit{SysV IPC}
3025 presentano una interfaccia inutilmente complessa e con alcuni difetti
3026 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
3027 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
3028 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
3029 necessità di un contatore come i semafori, si possono utilizzare metodi
3030 alternativi.
3031
3032 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
3033 dei \textsl{file di lock} (per i quali esiste anche una opportuna directory,
3034 \file{/var/lock}, nel filesystem standard). Per questo si usa la
3035 caratteristica della funzione \func{open} (illustrata in
3036 sez.~\ref{sec:file_open}) che prevede\footnote{questo è quanto dettato dallo
3037   standard POSIX.1, ciò non toglie che in alcune implementazioni questa
3038   tecnica possa non funzionare; in particolare per Linux, nel caso di NFS, si
3039   è comunque soggetti alla possibilità di una \textit{race
3040     condition}\itindex{race~condition}.} che essa ritorni un errore quando
3041 usata con i flag di \const{O\_CREAT} e \const{O\_EXCL}. In tal modo la
3042 creazione di un \textsl{file di lock} può essere eseguita atomicamente, il
3043 processo che crea il file con successo si può considerare come titolare del
3044 lock (e della risorsa ad esso associata) mentre il rilascio si può eseguire
3045 con una chiamata ad \func{unlink}.
3046
3047 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3048 \func{LockFile} ed \func{UnlockFile} riportate in fig.~\ref{fig:ipc_file_lock}
3049 (sono contenute in \file{LockFile.c}, un'altro dei sorgenti allegati alla
3050 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3051   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3052 (\texttt{\small 4--10}) si limita ad aprire il file di lock (\texttt{\small
3053   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11--17}) lo
3054 cancella con \func{unlink}.
3055
3056 \begin{figure}[!htb]
3057   \footnotesize \centering
3058   \begin{minipage}[c]{15.6cm}
3059     \includecodesample{listati/LockFile.c}
3060   \end{minipage} 
3061   \normalsize 
3062   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3063     permettono di creare e rimuovere un \textsl{file di lock}.}
3064   \label{fig:ipc_file_lock}
3065 \end{figure}
3066
3067 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3068 sez.~\ref{sec:file_open}, questo comportamento di \func{open} può non
3069 funzionare (la funzione viene eseguita, ma non è garantita l'atomicità
3070 dell'operazione) se il filesystem su cui si va ad operare è su NFS; in tal
3071 caso si può adottare una tecnica alternativa che prevede l'uso della
3072 \func{link} per creare come \textsl{file di lock} un hard link ad un file
3073 esistente; se il link esiste già e la funzione fallisce, significa che la
3074 risorsa è bloccata e potrà essere sbloccata solo con un \func{unlink},
3075 altrimenti il link è creato ed il lock acquisito; il controllo e l'eventuale
3076 acquisizione sono atomici; la soluzione funziona anche su NFS, ma ha un'altro
3077 difetto è che è quello di poterla usare solo se si opera all'interno di uno
3078 stesso filesystem.
3079
3080 Un generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3081 problemi, che non lo rendono una alternativa praticabile per la
3082 sincronizzazione: anzitutto in caso di terminazione imprevista del processo,
3083 si lascia allocata la risorsa (il \textsl{file di lock}) e questa deve essere
3084 sempre cancellata esplicitamente.  Inoltre il controllo della disponibilità
3085 può essere eseguito solo con una tecnica di \textit{polling}\itindex{polling},
3086 ed è quindi molto inefficiente.
3087
3088 La tecnica dei file di lock ha comunque una sua utilità, e può essere usata
3089 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3090 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3091 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3092 più programmi: qualora si trovi un file di lock il programma che cerca di
3093 accedere alla seriale si limita a segnalare che la risorsa non è
3094 disponibile.\index{file!di lock|)}
3095
3096
3097 \subsection{La sincronizzazione con il \textit{file locking}}
3098 \label{sec:ipc_lock_file}
3099
3100 Dato che i file di lock\index{file!di lock} presentano gli inconvenienti
3101 illustrati in precedenza, la tecnica alternativa di sincronizzazione più
3102 comune è quella di fare ricorso al \textit{file locking}\index{file!locking}
3103 (trattato in sez.~\ref{sec:file_locking}) usando \func{fcntl} su un file
3104 creato per l'occasione per ottenere un write lock. In questo modo potremo
3105 usare il lock come un \textit{mutex}: per bloccare la risorsa basterà
3106 acquisire il lock, per sbloccarla basterà rilasciare il lock. Una richiesta
3107 fatta con un write lock metterà automaticamente il processo in stato di
3108 attesa, senza necessità di ricorrere al \textit{polling}\itindex{polling} per
3109 determinare la disponibilità della risorsa, e al rilascio della stessa da
3110 parte del processo che la occupava si otterrà il nuovo lock atomicamente.
3111
3112 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3113 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3114 chiusura dei relativi file) e non ci si deve preoccupare di niente; inoltre
3115 non consuma risorse permanentemente allocate nel sistema. Lo svantaggio è che,
3116 dovendo fare ricorso a delle operazioni sul filesystem, esso è in genere
3117 leggermente più lento.
3118
3119 \begin{figure}[!htb]
3120   \footnotesize \centering
3121   \begin{minipage}[c]{15.6cm}
3122     \includecodesample{listati/MutexLocking.c}
3123   \end{minipage} 
3124   \normalsize 
3125   \caption{Il codice delle funzioni che permettono per la gestione dei 
3126     \textit{mutex} con il file locking\index{file!locking}.}
3127   \label{fig:ipc_flock_mutex}
3128 \end{figure}
3129
3130 Il codice delle varie funzioni usate per implementare un mutex utilizzando il
3131 file locking\index{file!locking} è riportato in fig.~\ref{fig:ipc_flock_mutex};
3132 si è mantenuta volutamente una struttura analoga alle precedenti funzioni che
3133 usano i semafori, anche se le due interfacce non possono essere completamente
3134 equivalenti, specie per quanto riguarda la rimozione del mutex.
3135
3136 La prima funzione (\texttt{\small 1--5}) è \func{CreateMutex}, e serve a
3137 creare il mutex; la funzione è estremamente semplice, e si limita
3138 (\texttt{\small 4}) a creare, con una opportuna chiamata ad \func{open}, il
3139 file che sarà usato per il successivo file locking, assicurandosi che non
3140 esista già (nel qual caso segnala un errore); poi restituisce il file
3141 descriptor che sarà usato dalle altre funzioni per acquisire e rilasciare il
3142 mutex.
3143
3144 La seconda funzione (\texttt{\small 6--10}) è \func{FindMutex}, che, come la
3145 precedente, è stata definita per mantenere una analogia con la corrispondente
3146 funzione basata sui semafori. Anch'essa si limita (\texttt{\small 9}) ad
3147 aprire il file da usare per il file locking, solo che in questo caso le
3148 opzioni di \func{open} sono tali che il file in questione deve esistere di
3149 già.
3150
3151 La terza funzione (\texttt{\small 11--22}) è \func{LockMutex} e serve per
3152 acquisire il mutex. La funzione definisce (\texttt{\small 14}) e inizializza
3153 (\texttt{\small 16--19}) la struttura \var{lock} da usare per acquisire un
3154 write lock sul file, che poi (\texttt{\small 21}) viene richiesto con
3155 \func{fcntl}, restituendo il valore di ritorno di quest'ultima. Se il file è
3156 libero il lock viene acquisito e la funzione ritorna immediatamente;
3157 altrimenti \func{fcntl} si bloccherà (si noti che la si è chiamata con
3158 \func{F\_SETLKW}) fino al rilascio del lock.
3159
3160 La quarta funzione (\texttt{\small 24--34}) è \func{UnlockMutex} e serve a
3161 rilasciare il mutex. La funzione è analoga alla precedente, solo che in questo
3162 caso si inizializza (\texttt{\small 28--31}) la struttura \var{lock} per il
3163 rilascio del lock, che viene effettuato (\texttt{\small 33}) con la opportuna
3164 chiamata a \func{fcntl}. Avendo usato il file locking in semantica POSIX (si
3165 riveda quanto detto sez.~\ref{sec:file_posix_lock}) solo il processo che ha
3166 precedentemente eseguito il lock può sbloccare il mutex.
3167
3168 La quinta funzione (\texttt{\small 36--39}) è \func{RemoveMutex} e serve a
3169 cancellare il mutex. Anche questa funzione è stata definita per mantenere una
3170 analogia con le funzioni basate sui semafori, e si limita a cancellare
3171 (\texttt{\small 38}) il file con una chiamata ad \func{unlink}. Si noti che in
3172 questo caso la funzione non ha effetto sui mutex già ottenuti con precedenti
3173 chiamate a \func{FindMutex} o \func{CreateMutex}, che continueranno ad essere
3174 disponibili fintanto che i relativi file descriptor restano aperti. Pertanto
3175 per rilasciare un mutex occorrerà prima chiamare \func{UnlockMutex} oppure
3176 chiudere il file usato per il lock.
3177
3178 La sesta funzione (\texttt{\small 41--55}) è \func{ReadMutex} e serve a
3179 leggere lo stato del mutex. In questo caso si prepara (\texttt{\small 46--49})
3180 la solita struttura \var{lock} come l'acquisizione del lock, ma si effettua
3181 (\texttt{\small 51}) la chiamata a \func{fcntl} usando il comando
3182 \const{F\_GETLK} per ottenere lo stato del lock, e si restituisce
3183 (\texttt{\small 52}) il valore di ritorno in caso di errore, ed il valore del
3184 campo \var{l\_type} (che descrive lo stato del lock) altrimenti
3185 (\texttt{\small 54}). Per questo motivo la funzione restituirà -1 in caso di
3186 errore e uno dei due valori \const{F\_UNLCK} o \const{F\_WRLCK}\footnote{non
3187   si dovrebbe mai avere il terzo valore possibile, \const{F\_RDLCK}, dato che
3188   la nostra interfaccia usa solo i write lock. Però è sempre possibile che
3189   siano richiesti altri lock sul file al di fuori dell'interfaccia, nel qual
3190   caso si potranno avere, ovviamente, interferenze indesiderate.} in caso di
3191 successo, ad indicare che il mutex è, rispettivamente, libero o occupato.
3192
3193 Basandosi sulla semantica dei file lock POSIX valgono tutte le considerazioni
3194 relative al comportamento di questi ultimi fatte in
3195 sez.~\ref{sec:file_posix_lock}; questo significa ad esempio che, al contrario
3196 di quanto avveniva con l'interfaccia basata sui semafori, chiamate multiple a
3197 \func{UnlockMutex} o \func{LockMutex} non si cumulano e non danno perciò
3198 nessun inconveniente.
3199
3200
3201 \subsection{Il \textit{memory mapping} anonimo}
3202 \label{sec:ipc_mmap_anonymous}
3203
3204 \itindbeg{memory~mapping}
3205 Abbiamo già visto che quando i processi sono \textsl{correlati}\footnote{se
3206   cioè hanno almeno un progenitore comune.} l'uso delle pipe può costituire
3207 una valida alternativa alle code di messaggi; nella stessa situazione si può
3208 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3209 \textit{memory mapping} anonimo.
3210
3211 In sez.~\ref{sec:file_memory_map} abbiamo visto come sia possibile mappare il
3212 contenuto di un file nella memoria di un processo, e che, quando viene usato
3213 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3214 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3215 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3216 inefficiente, in quanto occorre passare attraverso il disco. Però abbiamo
3217 visto anche che se si esegue la mappatura con il flag \const{MAP\_ANONYMOUS}
3218 la regione mappata non viene associata a nessun file, anche se quanto scritto
3219 rimane in memoria e può essere riletto; allora, dato che un processo figlio
3220 mantiene nel suo spazio degli indirizzi anche le regioni mappate, esso sarà
3221 anche in grado di accedere a quanto in esse è contenuto.
3222
3223 In questo modo diventa possibile creare una memoria condivisa fra processi
3224 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3225 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3226   funzionalità simile a questa viene implementata mappando il file speciale
3227   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3228   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3229   restano in memoria e possono essere riletti secondo le stesse modalità usate
3230   nel \textit{memory mapping} anonimo.} Vedremo come utilizzare questa tecnica
3231 più avanti, quando realizzeremo una nuova versione del monitor visto in
3232 sez.~\ref{sec:ipc_sysv_shm} che possa restituisca i risultati via rete.
3233 \itindend{memory~mapping}
3234
3235
3236 \section{Il sistema di comunicazione fra processi di POSIX}
3237 \label{sec:ipc_posix}
3238
3239 Per superare i numerosi problemi del \textit{SysV IPC}, evidenziati per i suoi
3240 aspetti generali in coda a sez.~\ref{sec:ipc_sysv_generic} e per i singoli
3241 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3242 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3243 una interfaccia completamente nuova, che tratteremo in questa sezione.
3244
3245
3246 \subsection{Considerazioni generali}
3247 \label{sec:ipc_posix_generic}
3248
3249 In Linux non tutti gli oggetti del POSIX IPC sono pienamente supportati nel
3250 kernel ufficiale; solo la memoria condivisa è presente con l'interfaccia
3251 completa, ma solo a partire dal kernel 2.4.x, i semafori sono forniti dalle
3252 \acr{glibc} nella sezione che implementa i thread POSIX, le code di messaggi
3253 non hanno alcun tipo di supporto ufficiale.  Per queste ultime esistono
3254 tuttavia dei patch e una libreria aggiuntiva.
3255
3256 La caratteristica fondamentale dell'interfaccia POSIX è l'abbandono dell'uso
3257 degli identificatori e delle chiavi visti nel SysV IPC, per passare ai
3258 \textit{Posix IPC names}\itindex{Posix~IPC~names}, che sono sostanzialmente
3259 equivalenti ai nomi dei file. Tutte le funzioni che creano un oggetto di IPC
3260 Posix prendono come primo argomento una stringa che indica uno di questi nomi;
3261 lo standard è molto generico riguardo l'implementazione, ed i nomi stessi
3262 possono avere o meno una corrispondenza sul filesystem; tutto quello che è
3263 richiesto è che:
3264 \begin{itemize}
3265 \item i nomi devono essere conformi alle regole che caratterizzano i
3266   \itindex{pathname}\textit{pathname}, in particolare non essere più lunghi di
3267   \const{PATH\_MAX} byte e terminati da un carattere nullo.
3268 \item se il nome inizia per una \texttt{/} chiamate differenti allo stesso
3269   nome fanno riferimento allo stesso oggetto, altrimenti l'interpretazione del
3270   nome dipende dall'implementazione.
3271 \item l'interpretazione di ulteriori \texttt{/} presenti nel nome dipende
3272   dall'implementazione.
3273 \end{itemize}
3274
3275 Data la assoluta genericità delle specifiche, il comportamento delle funzioni
3276 è pertanto subordinato in maniera quasi completa alla relativa
3277 implementazione.\footnote{tanto che Stevens in \cite{UNP2} cita questo caso
3278   come un esempio della maniera standard usata dallo standard POSIX per
3279   consentire implementazioni non standardizzabili.} Nel caso di Linux, sia per
3280 quanto riguarda la memoria condivisa, che per quanto riguarda le code di
3281 messaggi, tutto viene creato usando come radici delle opportune directory
3282 (rispettivamente \file{/dev/shm} e \file{/dev/mqueue}, per i dettagli si
3283 faccia riferimento a sez.~\ref{sec:ipc_posix_shm} e
3284 sez.~\ref{sec:ipc_posix_mq}) ed i nomi specificati nelle relative funzioni
3285 sono considerati come un \itindsub{pathname}{assoluto}\textit{pathname}
3286 assoluto (comprendente eventuali sottodirectory) rispetto a queste radici.
3287
3288 Il vantaggio degli oggetti di IPC POSIX è comunque che essi vengono inseriti
3289 nell'albero dei file, e possono essere maneggiati con le usuali funzioni e
3290 comandi di accesso ai file,\footnote{questo è ancora più vero nel caso di
3291   Linux, che usa una implementazione che lo consente, non è detto che
3292   altrettanto valga per altri kernel. In particolare sia la memoria condivisa
3293   che per le code di messaggi, come si può facilmente evincere con uno
3294   \cmd{strace}, le system call utilizzate sono le stesse, in quanto esse sono
3295   realizzate con dei file in speciali filesystem.}  che funzionano come su dei
3296 file normali.
3297
3298 In particolare i permessi associati agli oggetti di IPC POSIX sono identici ai
3299 permessi dei file, e il controllo di accesso segue esattamente la stessa
3300 semantica (quella illustrata in sez.~\ref{sec:file_access_control}), invece di
3301 quella particolare (si ricordi quanto visto in
3302 sez.~\ref{sec:ipc_sysv_access_control}) usata per gli oggetti del SysV IPC. Per
3303 quanto riguarda l'attribuzione dell'utente e del gruppo proprietari
3304 dell'oggetto alla creazione di quest'ultimo essa viene effettuata secondo la
3305 semantica SysV (essi corrispondono cioè a userid e groupid effettivi del
3306 processo che esegue la creazione).
3307
3308
3309
3310 \subsection{Code di messaggi}
3311 \label{sec:ipc_posix_mq}
3312
3313 Le code di messaggi non sono ancora supportate nel kernel ufficiale, esiste
3314 però una implementazione sperimentale di Michal Wronski e Krzysztof
3315 Benedyczak,\footnote{i patch al kernel e la relativa libreria possono essere
3316 trovati su \href{http://www.mat.uni.torun.pl/~wrona/posix_ipc}
3317 {\textsf{http://www.mat.uni.torun.pl/\tild{}wrona/posix\_ipc}}, questi sono
3318 stati inseriti nel kernel ufficiale a partire dalla versione 2.6.6-rc1.}.  In
3319 generale, come le corrispettive del SysV IPC, le code di messaggi sono poco
3320 usate, dato che i socket\index{socket}, nei casi in cui sono sufficienti, sono
3321 più comodi, e che in casi più complessi la comunicazione può essere gestita
3322 direttamente con mutex e memoria condivisa con tutta la flessibilità che
3323 occorre.
3324
3325 Per poter utilizzare le code di messaggi, oltre ad utilizzare un kernel cui
3326 siano stati opportunamente applicati i relativi patch, occorre utilizzare la
3327 libreria \file{mqueue}\footnote{i programmi che usano le code di messaggi cioè
3328   devono essere compilati aggiungendo l'opzione \code{-lmqueue} al comando
3329   \cmd{gcc}, dato che le funzioni non fanno parte della libreria standard, in
3330   corrispondenza all'inclusione del supporto nel kernel ufficiale, anche le
3331   relative funzioni sono state inserite nelle \acr{glibc} a partire dalla
3332   versione 2.3.4.}  che contiene le funzioni dell'interfaccia
3333 POSIX.\footnote{in realtà l'implementazione è realizzata tramite delle
3334   speciali chiamate ad \func{ioctl} sui file del filesystem speciale su cui
3335   vengono mantenuti questi oggetti di IPC.}
3336
3337
3338 La libreria inoltre richiede la presenza dell'apposito filesystem di tipo
3339 \texttt{mqueue} montato su \file{/dev/mqueue}; questo può essere fatto
3340 aggiungendo ad \file{/etc/fstab} una riga come:
3341 \begin{verbatim}
3342 mqueue   /dev/mqueue       mqueue    defaults        0      0
3343 \end{verbatim}
3344 ed esso sarà utilizzato come radice sulla quale vengono risolti i nomi delle
3345 code di messaggi che iniziano con una \texttt{/}. Le opzioni di mount
3346 accettate sono \texttt{uid}, \texttt{gid} e \texttt{mode} che permettono
3347 rispettivamente di impostare l'utente, il gruppo ed i permessi associati al
3348 filesystem.
3349
3350
3351 La funzione che permette di aprire (e crearla se non esiste ancora) una coda
3352 di messaggi POSIX è \funcd{mq\_open}, ed il suo prototipo è:
3353 \begin{functions}
3354   \headdecl{mqueue.h} 
3355   
3356   \funcdecl{mqd\_t mq\_open(const char *name, int oflag)}
3357   
3358   \funcdecl{mqd\_t mq\_open(const char *name, int oflag, unsigned long mode,
3359     struct mq\_attr *attr)}
3360   
3361   Apre una coda di messaggi POSIX impostandone le caratteristiche.
3362   
3363   \bodydesc{La funzione restituisce il descrittore associato alla coda in caso
3364     di successo e -1 in caso di errore; nel quel caso \var{errno} assumerà i
3365     valori:
3366     \begin{errlist}
3367     \item[\errcode{EACCESS}] Il processo non ha i privilegi per accedere al
3368       alla memoria secondo quanto specificato da \param{oflag}.
3369     \item[\errcode{EEXIST}] Si è specificato \const{O\_CREAT} e
3370       \const{O\_EXCL} ma la coda già esiste.
3371     \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
3372     \item[\errcode{EINVAL}] Il file non supporta la funzione, o si è
3373       specificato \const{O\_CREAT} con una valore non nullo di \param{attr} e
3374       valori non validi di \var{mq\_maxmsg} e \var{mq\_msgsize}.
3375     \item[\errcode{ENOENT}] Non si è specificato \const{O\_CREAT} ma la coda
3376       non esiste.
3377     \end{errlist}
3378     ed inoltre \errval{ENOMEM}, \errval{ENOSPC}, \errval{EFAULT},
3379     \errval{EMFILE} ed \errval{ENFILE}.}
3380 \end{functions}
3381
3382 La funzione apre la coda di messaggi identificata dall'argomento \param{name}
3383 restituendo il descrittore ad essa associato, del tutto analogo ad un file
3384 descriptor, con l'unica differenza che lo standard prevede un apposito tipo
3385 \type{mqd\_t}.\footnote{nella implementazione citata questo è definito come
3386   \ctyp{int}.} Se la coda esiste già il descrittore farà riferimento allo
3387 stesso oggetto, consentendo così la comunicazione fra due processi diversi.
3388
3389 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3390 possono essere specificati per \param{oflag}, che deve essere specificato come
3391 maschera binaria; i valori possibili per i vari bit sono quelli visti in
3392 tab.~\ref{tab:file_open_flags} dei quali però \func{mq\_open} riconosce solo i
3393 seguenti:
3394 \begin{basedescript}{\desclabelwidth{2cm}\desclabelstyle{\nextlinelabel}}
3395 \item[\const{O\_RDONLY}] Apre la coda solo per la ricezione di messaggi. Il
3396   processo potrà usare il descrittore con \func{mq\_receive} ma non con
3397   \func{mq\_send}.
3398 \item[\const{O\_WRONLY}] Apre la coda solo per la trasmissione di messaggi. Il
3399   processo potrà usare il descrittore con \func{mq\_send} ma non con
3400   \func{mq\_receive}.
3401 \item[\const{O\_RDWR}] Apre la coda solo sia per la trasmissione che per la
3402   ricezione. 
3403 \item[\const{O\_CREAT}] Necessario qualora si debba creare la coda; la
3404   presenza di questo bit richiede la presenza degli ulteriori argomenti
3405   \param{mode} e \param{attr}.
3406 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3407   chiamata se la coda esiste già, altrimenti esegue la creazione atomicamente.
3408 \item[\const{O\_NONBLOCK}] Imposta la coda in modalità non bloccante, le
3409   funzioni di ricezione e trasmissione non si bloccano quando non ci sono le
3410   risorse richieste, ma ritornano immediatamente con un errore di
3411   \errcode{EAGAIN}.
3412 \end{basedescript}
3413
3414 I primi tre bit specificano la modalità di apertura della coda, e sono fra
3415 loro esclusivi. Ma qualunque sia la modalità in cui si è aperta una coda,
3416 questa potrà essere riaperta più volte in una modalità diversa, e vi si potrà
3417 sempre accedere attraverso descrittori diversi, esattamente come si può fare
3418 per i file normali.
3419
3420 Se la coda non esiste e la si vuole creare si deve specificare
3421 \const{O\_CREAT}, in tal caso occorre anche specificare i permessi di
3422 creazione con l'argomento \param{mode}; i valori di quest'ultimo sono identici
3423 a quelli usati per \func{open}, anche se per le code di messaggi han senso
3424 solo i permessi di lettura e scrittura. Oltre ai permessi di creazione possono
3425 essere specificati anche gli attributi specifici della coda tramite
3426 l'argomento \param{attr}; quest'ultimo è un puntatore ad una apposita
3427 struttura \struct{mq\_attr}, la cui definizione è riportata in
3428 fig.~\ref{fig:ipc_mq_attr}.
3429
3430 \begin{figure}[!htb]
3431   \footnotesize \centering
3432   \begin{minipage}[c]{15cm}
3433     \includestruct{listati/mq_attr.h}
3434   \end{minipage} 
3435   \normalsize
3436   \caption{La struttura \structd{mq\_attr}, contenente gli attributi di una
3437     coda di messaggi POSIX.}
3438   \label{fig:ipc_mq_attr}
3439 \end{figure}
3440
3441 Per ls creazione della coda i campi della struttura che devono essere
3442 specificati sono \var{mq\_msgsize} e \var{mq\_maxmsg}, che indicano
3443 rispettivamente la dimensione massima di un messaggio ed il numero massimo di
3444 messaggi che essa può contenere. Il valore dovrà essere positivo e minore dei
3445 rispettivi limiti di sistema \const{MQ\_MAXMSG} e \const{MQ\_MSGSIZE},
3446 altrimenti la funzione fallirà con un errore di \errcode{EINVAL}.  Qualora si
3447 specifichi per \param{attr} un puntatore nullo gli attributi della coda
3448 saranno impostati ai valori predefiniti.
3449
3450 Quando l'accesso alla coda non è più necessario si può chiudere il relativo
3451 descrittore con la funzione \funcd{mq\_close}, il cui prototipo è:
3452 \begin{prototype}{mqueue.h}
3453 {int mq\_close(mqd\_t mqdes)}
3454
3455 Chiude la coda \param{mqdes}.
3456   
3457 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3458   errore; nel quel caso \var{errno} assumerà i valori \errval{EBADF} o
3459   \errval{EINTR}.}
3460 \end{prototype}
3461
3462 La funzione è analoga a \func{close},\footnote{in Linux, dove le code sono
3463   implementate come file su un filesystem dedicato, è esattamente la stessa
3464   funzione.} dopo la sua esecuzione il processo non sarà più in grado di usare
3465 il descrittore della coda, ma quest'ultima continuerà ad esistere nel sistema
3466 e potrà essere acceduta con un'altra chiamata a \func{mq\_open}. All'uscita di
3467 un processo tutte le code aperte, così come i file, vengono chiuse
3468 automaticamente. Inoltre se il processo aveva agganciato una richiesta di
3469 notifica sul descrittore che viene chiuso, questa sarà rilasciata e potrà
3470 essere richiesta da qualche altro processo.
3471
3472
3473 Quando si vuole effettivamente rimuovere una coda dal sistema occorre usare la
3474 funzione \funcd{mq\_unlink}, il cui prototipo è:
3475 \begin{prototype}{mqueue.h}
3476 {int mq\_unlink(const char *name)}
3477
3478 Rimuove una coda di messaggi.
3479   
3480 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3481   errore; nel quel caso \var{errno} assumerà gli stessi valori riportati da
3482   \func{unlink}.}
3483 \end{prototype}
3484
3485 Anche in questo caso il comportamento della funzione è analogo a quello di
3486 \func{unlink} per i file,\footnote{di nuovo l'implementazione di Linux usa
3487   direttamente \func{unlink}.} la funzione rimove la coda \param{name}, così
3488 che una successiva chiamata a \func{mq\_open} fallisce o crea una coda
3489 diversa. 
3490
3491 Come per i file ogni coda di messaggi ha un contatore di riferimenti, per cui
3492 la coda non viene effettivamente rimossa dal sistema fin quando questo non si
3493 annulla. Pertanto anche dopo aver eseguito con successo \func{mq\_unlink} la
3494 coda resterà accessibile a tutti i processi che hanno un descrittore aperto su
3495 di essa.  Allo stesso modo una coda ed i suoi contenuti resteranno disponibili
3496 all'interno del sistema anche quando quest'ultima non è aperta da nessun
3497 processo (questa è una delle differenze più rilevanti nei confronti di pipe e
3498 fifo).
3499
3500 La sola differenza fra code di messaggi POSIX e file normali è che, essendo il
3501 filesystem delle code di messaggi virtuale e basato su oggetti interni al
3502 kernel, il suo contenuto viene perduto con il riavvio del sistema.
3503
3504 Come accennato in precedenza ad ogni coda di messaggi è associata una
3505 struttura \struct{mq\_attr}, che può essere letta e modificata attraverso le
3506 due funzioni \funcd{mq\_getattr} e \funcd{mq\_setattr}, i cui prototipi sono:
3507 \begin{functions}
3508   \headdecl{mqueue.h} 
3509   
3510   \funcdecl{int mq\_getattr(mqd\_t mqdes, struct mq\_attr *mqstat)}
3511   Legge gli attributi di una coda di messaggi POSIX.
3512   
3513   \funcdecl{int mq\_setattr(mqd\_t mqdes, const struct mq\_attr *mqstat,
3514     struct mq\_attr *omqstat)}
3515   Modifica gli attributi di una coda di messaggi POSIX.
3516   
3517   \bodydesc{Entrambe le funzioni restituiscono 0 in caso di successo e -1 in
3518     caso di errore; nel quel caso \var{errno} assumerà i valori \errval{EBADF}
3519     o \errval{EINVAL}.}
3520 \end{functions}
3521
3522 La funzione \func{mq\_getattr} legge i valori correnti degli attributi della
3523 coda nella struttura puntata da \param{mqstat}; di questi l'unico relativo
3524 allo stato corrente della coda è \var{mq\_curmsgs} che indica il numero di
3525 messaggi da essa contenuti, gli altri indicano le caratteristiche generali
3526 della stessa.
3527
3528 La funzione \func{mq\_setattr} permette di modificare gli attributi di una
3529 coda tramite i valori contenuti nella struttura puntata da \param{mqstat}, ma
3530 può essere modificato solo il campo \var{mq\_flags}, gli altri campi vengono
3531 ignorati. In particolare i valori di \var{mq\_maxmsg} e \var{mq\_msgsize}
3532 possono essere specificati solo in fase ci creazione della coda.  Inoltre i
3533 soli valori possibili per \var{mq\_flags} sono 0 e \const{O\_NONBLOCK}, per
3534 cui alla fine la funzione può essere utilizzata solo per abilitare o
3535 disabilitare la modalità non bloccante. L'argomento \param{omqstat} viene
3536 usato, quando diverso da \val{NULL}, per specificare l'indirizzo di una
3537 struttura su cui salvare i valori degli attributi precedenti alla chiamata
3538 della funzione.
3539
3540 Per inserire messaggi su di una coda sono previste due funzioni,
3541 \funcd{mq\_send} e \funcd{mq\_timedsend}, i cui prototipi sono:
3542 \begin{functions}
3543   \headdecl{mqueue.h} 
3544   
3545   \funcdecl{int mq\_send(mqd\_t mqdes, const char *msg\_ptr, size\_t msg\_len,
3546     unsigned int msg\_prio)} 
3547   Esegue l'inserimento di un messaggio su una coda.
3548   
3549   \funcdecl{int mq\_timedsend(mqd\_t mqdes, const char *msg\_ptr, size\_t
3550     msg\_len, unsigned msg\_prio, const struct timespec *abs\_timeout)}   
3551   Esegue l'inserimento di un messaggio su una coda entro il tempo
3552   \param{abs\_timeout}.
3553
3554   
3555   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso di
3556     errore; nel quel caso \var{errno} assumerà i valori:
3557     \begin{errlist}
3558     \item[\errcode{EAGAIN}] Si è aperta la coda con \const{O\_NONBLOCK}, e la
3559       coda è piena.
3560     \item[\errcode{EMSGSIZE}] La lunghezza del messaggio \param{msg\_len}
3561       eccede il limite impostato per la coda.
3562     \item[\errcode{ENOMEM}] Il kernel non ha memoria sufficiente. Questo
3563       errore può avvenire quando l'inserimento del messaggio
3564     \item[\errcode{EINVAL}] Si è specificato un valore nullo per
3565       \param{msg\_len}, o un valore di \param{msg\_prio} fuori dai limiti, o
3566       un valore non valido per \param{abs\_timeout}.
3567     \item[\errcode{ETIMEDOUT}] L'inserimento del messaggio non è stato
3568       effettuato entro il tempo stabilito.
3569     \end{errlist}    
3570     ed inoltre \errval{EBADF} ed \errval{EINTR}.}
3571 \end{functions}
3572
3573 Entrambe le funzioni richiedono un puntatore al testo del messaggio
3574 nell'argomento \param{msg\_ptr} e la relativa lunghezza in \param{msg\_len}.
3575 Se quest'ultima eccede la dimensione massima specificata da \var{mq\_msgsize}
3576 le funzioni ritornano immediatamente con un errore di \errcode{EMSGSIZE}.
3577
3578 L'argomento \param{msg\_prio} indica la priorità dell'argomento; i messaggi di
3579 priorità maggiore vengono inseriti davanti a quelli di priorità inferiore (e
3580 quindi saranno riletti per primi). A parità del valore della priorità il
3581 messaggio sarà inserito in coda a tutti quelli con la stessa priorità. Il
3582 valore della priorità non può eccedere il limite di sistema
3583 \const{MQ\_PRIO\_MAX}, che nel caso è pari a 32768.
3584
3585 Qualora la coda sia piena, entrambe le funzioni si bloccano, a meno che non
3586 sia stata selezionata in fase di apertura la modalità non bloccante, nel qual
3587 caso entrambe ritornano \errcode{EAGAIN}. La sola differenza fra le due
3588 funzioni è che la seconda, passato il tempo massimo impostato con l'argomento
3589 \param{abs\_timeout}, ritorna comunque con un errore di \errcode{ETIMEDOUT}.
3590
3591
3592 Come per l'inserimento, anche per l'estrazione dei messaggi da una coda sono
3593 previste due funzioni, \funcd{mq\_receive} e \funcd{mq\_timedreceive}, i cui
3594 prototipi sono:
3595 \begin{functions}
3596   \headdecl{mqueue.h} 
3597   
3598   \funcdecl{ssize\_t mq\_receive(mqd\_t mqdes, char *msg\_ptr, size\_t
3599     msg\_len, unsigned int *msg\_prio)}   
3600   Effettua la ricezione di un messaggio da una coda.
3601   
3602   \funcdecl{ssize\_t mq\_timedreceive(mqd\_t mqdes, char *msg\_ptr, size\_t
3603     msg\_len, unsigned int *msg\_prio, const struct timespec *abs\_timeout)}
3604   Effettua la ricezione di un messaggio da una coda entro il tempo
3605   \param{abs\_timeout}.
3606   
3607   \bodydesc{Le funzioni restituiscono il numero di byte del messaggio in caso
3608     di successo e -1 in caso di errore; nel quel caso \var{errno} assumerà i
3609     valori:
3610     \begin{errlist}
3611     \item[\errcode{EAGAIN}] Si è aperta la coda con \const{O\_NONBLOCK}, e la
3612       coda è vuota.
3613     \item[\errcode{EMSGSIZE}] La lunghezza del messaggio sulla coda eccede il
3614       valore \param{msg\_len} specificato per la ricezione.
3615     \item[\errcode{EINVAL}] Si è specificato un valore nullo per
3616       \param{msg\_ptr}, o un valore non valido per \param{abs\_timeout}.
3617     \item[\errcode{ETIMEDOUT}] La ricezione del messaggio non è stata
3618       effettuata entro il tempo stabilito.
3619     \end{errlist}    
3620     ed inoltre \errval{EBADF}, \errval{EINTR}, \errval{ENOMEM}, o
3621     \errval{EINVAL}.}
3622 \end{functions}
3623
3624 La funzione estrae dalla coda il messaggio a priorità più alta, o il più
3625 vecchio fra quelli della stessa priorità. Una volta ricevuto il messaggio
3626 viene tolto dalla coda e la sua dimensione viene restituita come valore di
3627 ritorno.
3628
3629 Se la dimensione specificata da \param{msg\_len} non è sufficiente a contenere
3630 il messaggio, entrambe le funzioni, al contrario di quanto avveniva nelle code
3631 di messaggi di SysV, ritornano un errore di \errcode{EMSGSIZE} senza estrarre
3632 il messaggio.  È pertanto opportuno eseguire sempre una chiamata a
3633 \func{mq\_getaddr} prima di eseguire una ricezione, in modo da ottenere la
3634 dimensione massima dei messaggi sulla coda, per poter essere in grado di
3635 allocare dei buffer sufficientemente ampi per la lettura.
3636
3637 Se si specifica un puntatore per l'argomento \param{msg\_prio} il valore della
3638 priorità del messaggio viene memorizzato all'indirizzo da esso indicato.
3639 Qualora non interessi usare la priorità dei messaggi si può specificare
3640 \var{NULL}, ed usare un valore nullo della priorità nelle chiamate a
3641 \func{mq\_send}.
3642
3643 Si noti che con le code di messaggi POSIX non si ha la possibilità di
3644 selezionare quale messaggio estrarre con delle condizioni sulla priorità, a
3645 differenza di quanto avveniva con le code di messaggi di SysV che permettono
3646 invece la selezione in base al valore del campo \var{mtype}. Qualora non
3647 interessi usare la priorità dei messaggi si
3648
3649 Qualora la coda sia vuota entrambe le funzioni si bloccano, a meno che non si
3650 sia selezionata la modalità non bloccante; in tal caso entrambe ritornano
3651 immediatamente con l'errore \errcode{EAGAIN}. Anche in questo caso la sola
3652 differenza fra le due funzioni è che la seconda non attende indefinitamente e
3653 passato il tempo massimo \param{abs\_timeout} ritorna comunque con un errore
3654 di \errcode{ETIMEDOUT}.
3655
3656 Uno dei problemi sottolineati da Stevens in \cite{UNP2}, comuni ad entrambe le
3657 tipologie di code messaggi, è che non è possibile per chi riceve identificare
3658 chi è che ha inviato il messaggio, in particolare non è possibile sapere da
3659 quale utente esso provenga. Infatti, in mancanza di un meccanismo interno al
3660 kernel, anche se si possono inserire delle informazioni nel messaggio, queste
3661 non possono essere credute, essendo completamente dipendenti da chi lo invia.
3662 Vedremo però come, attraverso l'uso del meccanismo di notifica, sia possibile
3663 superare in parte questo problema.
3664
3665 Una caratteristica specifica delle code di messaggi POSIX è la possibilità di
3666 usufruire di un meccanismo di notifica asincrono; questo può essere attivato
3667 usando la funzione \funcd{mq\_notify}, il cui prototipo è:
3668 \begin{prototype}{mqueue.h}
3669 {int mq\_notify(mqd\_t mqdes, const struct sigevent *notification)}
3670
3671 Attiva il meccanismo di notifica per la coda \param{mqdes}.
3672   
3673 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3674   errore; nel quel caso \var{errno} assumerà i valori: 
3675     \begin{errlist}
3676     \item[\errcode{EBUSY}] C'è già un processo registrato per la notifica.
3677     \item[\errcode{EBADF}] Il descrittore non fa riferimento ad una coda di
3678       messaggi.
3679     \end{errlist}}
3680 \end{prototype}
3681
3682 Il meccanismo di notifica permette di segnalare in maniera asincrona ad un
3683 processo la presenza di dati sulla coda, in modo da evitare la necessità di
3684 bloccarsi nell'attesa. Per far questo un processo deve registrarsi con la
3685 funzione \func{mq\_notify}, ed il meccanismo è disponibile per un solo
3686 processo alla volta per ciascuna coda.
3687
3688 Il comportamento di \func{mq\_notify} dipende dal valore dell'argomento
3689 \param{notification}, che è un puntatore ad una apposita struttura
3690 \struct{sigevent}, (definita in fig.~\ref{fig:file_sigevent}) introdotta dallo
3691 standard POSIX.1b per gestire la notifica di eventi; per altri dettagli si può
3692 vedere quanto detto in sez.~\ref{sec:file_asyncronous_io} a proposito dell'uso
3693 della stessa struttura per l'invio dei segnali usati per l'I/O asincrono.
3694
3695 Attraverso questa struttura si possono impostare le modalità con cui viene
3696 effettuata la notifica; in particolare il campo \var{sigev\_notify} deve
3697 essere posto a \const{SIGEV\_SIGNAL}\footnote{il meccanismo di notifica basato
3698   sui thread, specificato tramite il valore \const{SIGEV\_THREAD}, non è
3699   implementato.} ed il campo \var{sigev\_signo} deve indicare il valore del
3700 segnale che sarà inviato al processo. Inoltre il campo \var{sigev\_value} è il
3701 puntatore ad una struttura \struct{sigval\_t} (definita in
3702 fig.~\ref{fig:sig_sigval}) che permette di restituire al gestore del segnale un
3703 valore numerico o un indirizzo,\footnote{per il suo uso si riveda la
3704   trattazione fatta in sez.~\ref{sec:sig_real_time} a proposito dei segnali
3705   real-time.} posto che questo sia installato nella forma estesa vista in
3706 sez.~\ref{sec:sig_sigaction}.
3707
3708 La funzione registra il processo chiamante per la notifica se
3709 \param{notification} punta ad una struttura \struct{sigevent} opportunamente
3710 inizializzata, o cancella una precedente registrazione se è \val{NULL}. Dato
3711 che un solo processo alla volta può essere registrato, la funzione fallisce
3712 con \errcode{EBUSY} se c'è un altro processo già registrato.  Si tenga
3713 presente inoltre che alla chiusura del descrittore associato alla coda (e
3714 quindi anche all'uscita del processo) ogni eventuale registrazione di notifica
3715 presente viene cancellata.
3716
3717 La notifica del segnale avviene all'arrivo di un messaggio in una coda vuota
3718 (cioè solo se sulla coda non ci sono messaggi) e se non c'è nessun processo
3719 bloccato in una chiamata a \func{mq\_receive}, in questo caso infatti il
3720 processo bloccato ha la precedenza ed il messaggio gli viene immediatamente
3721 inviato, mentre per il meccanismo di notifica tutto funziona come se la coda
3722 fosse rimasta vuota.
3723
3724 Quando un messaggio arriva su una coda vuota al processo che si era registrato
3725 viene inviato il segnale specificato da \code{notification->sigev\_signo}, e
3726 la coda diventa disponibile per una ulteriore registrazione.  Questo comporta
3727 che se si vuole mantenere il meccanismo di notifica occorre ripetere la
3728 registrazione chiamando nuovamente \func{mq\_notify} all'interno del gestore
3729 del segnale di notifica. A differenza della situazione simile che si aveva con
3730 i segnali non affidabili,\footnote{l'argomento è stato affrontato in
3731   \ref{sec:sig_semantics}.} questa caratteristica non configura una
3732 race-condition perché l'invio di un segnale avviene solo se la coda è vuota;
3733 pertanto se si vuole evitare di correre il rischio di perdere eventuali
3734 ulteriori segnali inviati nel lasso di tempo che occorre per ripetere la
3735 richiesta di notifica basta avere cura di eseguire questa operazione prima di
3736 estrarre i messaggi presenti dalla coda.
3737
3738 L'invio del segnale di notifica avvalora alcuni campi di informazione
3739 restituiti al gestore attraverso la struttura \struct{siginfo\_t} (definita in
3740 fig.~\ref{fig:sig_siginfo_t}). In particolare \var{si\_pid} viene impostato al
3741 valore del \acr{pid} del processo che ha emesso il segnale, \var{si\_uid}
3742 all'userid effettivo, \var{si\_code} a \const{SI\_MESGQ}, e \var{si\_errno} a
3743 0. Questo ci dice che, se si effettua la ricezione dei messaggi usando
3744 esclusivamente il meccanismo di notifica, è possibile ottenere le informazioni
3745 sul processo che ha inserito un messaggio usando un gestore per il segnale in
3746 forma estesa\footnote{di nuovo si faccia riferimento a quanto detto al
3747   proposito in sez.~\ref{sec:sig_sigaction} e sez.~\ref{sec:sig_real_time}.}
3748
3749
3750
3751 \subsection{Semafori}
3752 \label{sec:ipc_posix_sem}
3753
3754 Dei semafori POSIX esistono sostanzialmente due implementazioni; una è fatta a
3755 livello di libreria ed è fornita dalla libreria dei thread; questa però li
3756 implementa solo a livello di thread e non di processi.\footnote{questo
3757   significa che i semafori sono visibili solo all'interno dei thread creati da
3758   un singolo processo, e non possono essere usati come meccanismo di
3759   sincronizzazione fra processi diversi.} Esiste però anche una libreria
3760 realizzata da Konstantin Knizhnik, che reimplementa l'interfaccia POSIX usando
3761 i semafori di SysV IPC, e che non vale comunque la pena di usare visto che i
3762 problemi sottolineati in sez.~\ref{sec:ipc_sysv_sem} rimangono, anche se
3763 mascherati.
3764
3765 In realtà a partire dal kernel 2.5.7 è stato introdotto un meccanismo di
3766 sincronizzazione completamente nuovo, basato sui cosiddetti
3767 \textit{futex}\footnote{la sigla sta per \textit{fast user mode mutex}.}, con
3768 il quale dovrebbe essere possibile implementare una versione nativa dei
3769 semafori; esso è già stato usato con successo per reimplementare in maniera
3770 più efficiente tutte le direttive di sincronizzazione previste per i thread
3771 POSIX. L'interfaccia corrente è stata stabilizzata a partire dal kernel
3772 2.5.40.
3773
3774
3775
3776
3777 \subsection{Memoria condivisa}
3778 \label{sec:ipc_posix_shm}
3779
3780 La memoria condivisa è l'unico degli oggetti di IPC POSIX già presente nel
3781 kernel ufficiale; in realtà il supporto a questo tipo di oggetti è realizzato
3782 attraverso il filesystem \texttt{tmpfs}, uno speciale filesystem che mantiene
3783 tutti i suoi contenuti in memoria,\footnote{il filesystem \texttt{tmpfs} è
3784   diverso da un normale RAM disk, anch'esso disponibile attraverso il
3785   filesystem \texttt{ramfs}, proprio perché realizza una interfaccia
3786   utilizzabile anche per la memoria condivisa; esso infatti non ha dimensione
3787   fissa, ed usa direttamente la cache interna del kernel (che viene usata
3788   anche per la shared memory in stile SysV). In più i suoi contenuti, essendo
3789   trattati direttamente dalla memoria virtuale\index{memoria~virtuale} possono
3790   essere salvati sullo swap automaticamente.} che viene attivato abilitando
3791 l'opzione \texttt{CONFIG\_TMPFS} in fase di compilazione del kernel.
3792
3793
3794 Per potere utilizzare l'interfaccia POSIX per le code di messaggi le
3795 \acr{glibc}\footnote{le funzioni sono state introdotte con le glibc-2.2.}
3796 richiedono di compilare i programmi con l'opzione \code{-lrt}; inoltre è
3797 necessario che in \file{/dev/shm} sia montato un filesystem \texttt{tmpfs};
3798 questo di norma viene eseguita aggiungendo una riga tipo:
3799 \begin{verbatim}
3800 tmpfs   /dev/shm        tmpfs   defaults        0      0
3801 \end{verbatim}
3802 ad \file{/etc/fstab}. In realtà si può montare un filesystem \texttt{tmpfs}
3803 dove si vuole, per usarlo come RAM disk, con un comando del tipo:
3804 \begin{verbatim}
3805 mount -t tmpfs -o size=128M,nr_inodes=10k,mode=700 tmpfs /mytmpfs
3806 \end{verbatim}
3807
3808 Il filesystem riconosce, oltre quelle mostrate, le opzioni \texttt{uid} e
3809 \texttt{gid} che identificano rispettivamente utente e gruppo cui assegnarne
3810 la titolarità, e \texttt{nr\_blocks} che permette di specificarne la
3811 dimensione in blocchi, cioè in multipli di \const{PAGECACHE\_SIZE} che in
3812 questo caso è l'unità di allocazione elementare.
3813
3814 La funzione che permette di aprire un segmento di memoria condivisa POSIX, ed
3815 eventualmente di crearlo se non esiste ancora, è \funcd{shm\_open}; il suo
3816 prototipo è:
3817 \begin{prototype}{mqueue.h}
3818 {int shm\_open(const char *name, int oflag, mode\_t mode)}
3819
3820 Apre un segmento di memoria condivisa.
3821   
3822 \bodydesc{La funzione restituisce un file descriptor positivo in caso di
3823   successo e -1 in caso di errore; nel quel caso \var{errno} assumerà gli
3824   stessi valori riportati da \func{open}.}
3825 \end{prototype}
3826
3827 La funzione apre un segmento di memoria condivisa identificato dal nome
3828 \param{name}. Come già spiegato in sez.~\ref{sec:ipc_posix_generic} questo nome
3829 può essere specificato in forma standard solo facendolo iniziare per \file{/}
3830 e senza ulteriori \file{/}, Linux supporta comunque nomi generici, che
3831 verranno intepretati prendendo come radice \file{/dev/shm}.\footnote{occorre
3832   pertanto evitare di specificare qualcosa del tipo \file{/dev/shm/nome}
3833   all'interno di \param{name}, perché questo comporta, da parte delle routine
3834   di libereria, il tentativo di accedere a \file{/dev/shm/dev/shm/nome}.}
3835
3836 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3837 possono essere specificati per \param{oflag}, che deve essere specificato come
3838 maschera binaria comprendente almeno uno dei due valori \const{O\_RDONLY} e
3839 \const{O\_RDWR}; i valori possibili per i vari bit sono quelli visti in
3840 tab.~\ref{tab:file_open_flags} dei quali però \func{shm\_open} riconosce solo
3841 i seguenti:
3842 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
3843 \item[\const{O\_RDONLY}] Apre il file descriptor associato al segmento di
3844   memoria condivisa per l'accesso in sola lettura.
3845 \item[\const{O\_RDWR}] Apre il file descriptor associato al segmento di
3846   memoria condivisa per l'accesso in lettura e scrittura.
3847 \item[\const{O\_CREAT}] Necessario qualora si debba creare il segmento di
3848   memoria condivisa se esso non esiste; in questo caso viene usato il valore
3849   di \param{mode} per impostare i permessi, che devono essere compatibili con
3850   le modalità con cui si è aperto il file.
3851 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3852   chiamata a \func{shm\_open} se il segmento esiste già, altrimenti esegue la
3853   creazione atomicamente.
3854 \item[\const{O\_TRUNC}] Se il segmento di memoria condivisa esiste già, ne
3855   tronca le dimensioni a 0 byte.
3856 \end{basedescript}
3857
3858 In caso di successo la funzione restituisce un file descriptor associato al
3859 segmento di memoria condiviso con le stesse modalità di
3860 \func{open}\footnote{in realtà, come accennato, \func{shm\_open} è un semplice
3861   wrapper per \func{open}, usare direttamente quest'ultima avrebbe lo stesso
3862   effetto.}  viste in sez.~\ref{sec:file_open}; in particolare viene impostato
3863 il flag \const{FD\_CLOEXEC}.  Chiamate effettuate da diversi processi usando
3864 lo stesso nome, restituiranno file descriptor associati allo stesso segmento
3865 (così come, nel caso di file di dati, essi sono associati allo stesso inode).
3866 In questo modo è possibile effettuare una chiamata ad \func{mmap} sul file
3867 descriptor restituito da \func{shm\_open} ed i processi vedranno lo stesso
3868 segmento di memoria condivisa.
3869
3870 Quando il nome non esiste il segmento può essere creato specificando
3871 \const{O\_CREAT}; in tal caso il segmento avrà (così come i nuovi file)
3872 lunghezza nulla. Dato che un segmento di lunghezza nulla è di scarsa utilità,
3873 per impostarne la dimensione si deve usare \func{ftruncate} (vedi
3874 sez.~\ref{sec:file_file_size}), prima di mapparlo in memoria con \func{mmap}.
3875 Si tenga presente che una volta chiamata \func{mmap} si può chiudere il file
3876 descriptor (con \func{close}), senza che la mappatura ne risenta.
3877
3878
3879 Come per i file, quando si vuole effettivamente rimuovere segmento di memoria
3880 condivisa, occorre usare la funzione \funcd{shm\_unlink}, il cui prototipo è:
3881 \begin{prototype}{mqueue.h}
3882 {int shm\_unlink(const char *name)}
3883
3884 Rimuove un segmento di memoria condivisa.
3885   
3886 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3887   errore; nel quel caso \var{errno} assumerà gli stessi valori riportati da
3888   \func{unlink}.}
3889 \end{prototype}
3890
3891 La funzione è del tutto analoga ad \func{unlink}, e si limita a cancellare il
3892 nome del segmento da \file{/dev/shm}, senza nessun effetto né sui file
3893 descriptor precedentemente aperti con \func{shm\_open}, né sui segmenti già
3894 mappati in memoria; questi verranno cancellati automaticamente dal sistema
3895 solo con le rispettive chiamate a \func{close} e \func{munmap}.  Una volta
3896 eseguita questa funzione però, qualora si richieda l'apertura di un segmento
3897 con lo stesso nome, la chiamata a \func{shm\_open} fallirà, a meno di non aver
3898 usato \const{O\_CREAT}, in quest'ultimo caso comunque si otterrà un file
3899 descriptor che fa riferimento ad un segmento distinto da eventuali precedenti.
3900
3901 \begin{figure}[!htb]
3902   \footnotesize \centering
3903   \begin{minipage}[c]{15.6cm}
3904     \includecodesample{listati/MemShared.c}
3905   \end{minipage} 
3906   \normalsize 
3907   \caption{Il codice delle funzioni di gestione dei segmenti di memoria
3908     condivisa POSIX.}
3909   \label{fig:ipc_posix_shmmem}
3910 \end{figure}
3911
3912 Come esempio per l'uso di queste funzioni vediamo come è possibile riscrivere
3913 una interfaccia semplificata analoga a quella vista in
3914 fig.~\ref{fig:ipc_sysv_shm_func} per la memoria condivisa in stile SysV. Il
3915 codice, riportato in fig.~\ref{fig:ipc_posix_shmmem}, è sempre contenuto nel
3916 file \file{SharedMem.c} dei sorgenti allegati.
3917
3918 La prima funzione (\texttt{\small 1--24}) è \func{CreateShm} che, dato un nome
3919 nell'argomento \var{name} crea un nuovo segmento di memoria condivisa,
3920 accessibile in lettura e scrittura, e ne restituisce l'indirizzo. Anzitutto si
3921 definiscono (\texttt{\small 8}) i flag per la successiva (\texttt{\small 9})
3922 chiamata a \func{shm\_open}, che apre il segmento in lettura e scrittura
3923 (creandolo se non esiste, ed uscendo in caso contrario) assegnandogli sul
3924 filesystem i permessi specificati dall'argomento \var{perm}. In caso di errore
3925 (\texttt{\small 10--12}) si restituisce un puntatore nullo, altrimenti si
3926 prosegue impostando (\texttt{\small 14}) la dimensione del segmento con
3927 \func{ftruncate}. Di nuovo (\texttt{\small 15--16}) si esce immediatamente
3928 restituendo un puntatore nullo in caso di errore. Poi si passa (\texttt{\small
3929   18}) a mappare in memoria il segmento con \func{mmap} specificando dei
3930 diritti di accesso corrispondenti alla modalità di apertura.  Di nuovo si
3931 restituisce (\texttt{\small 19--21}) un puntatore nullo in caso di errore,
3932 altrimenti si inizializza (\texttt{\small 22}) il contenuto del segmento al
3933 valore specificato dall'argomento \var{fill} con \func{memset}, e se ne
3934 restituisce (\texttt{\small 23}) l'indirizzo.
3935
3936 La seconda funzione (\texttt{\small 25--40}) è \func{FindShm} che trova un
3937 segmento di memoria condiviso già esistente, restituendone l'indirizzo. In
3938 questo caso si apre (\texttt{\small 31}) il segmento con \func{shm\_open}
3939 richiedendo che il segmento sia già esistente, in caso di errore
3940 (\texttt{\small 31--33}) si ritorna immediatamente un puntatore nullo.
3941 Ottenuto il file descriptor del segmento lo si mappa (\texttt{\small 35}) in
3942 memoria con \func{mmap}, restituendo (\texttt{\small 36--38}) un puntatore
3943 nullo in caso di errore, o l'indirizzo (\texttt{\small 39}) dello stesso in
3944 caso di successo.
3945
3946 La terza funzione (\texttt{\small 40--45}) è \func{RemoveShm}, e serve a
3947 cancellare un segmento di memoria condivisa. Dato che al contrario di quanto
3948 avveniva con i segmenti del SysV IPC gli oggetti allocati nel kernel vengono
3949 rilasciati automaticamente quando nessuna li usa più, tutto quello che c'è da
3950 fare (\texttt{\small 44}) in questo caso è chiamare \func{shm\_unlink},
3951 retituendo al chiamante il valore di ritorno.
3952
3953
3954
3955 %%% Local Variables: 
3956 %%% mode: latex
3957 %%% TeX-master: "gapil"
3958 %%% End: