Risistemazione delle pagine web dopo l'installazione di trac su
[gapil.git] / ipc.tex
1 %% ipc.tex
2 %%
3 %% Copyright (C) 2000-2005 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11 \chapter{La comunicazione fra processi}
12 \label{cha:IPC}
13
14
15 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
16 la comunicazione fra processi. In questo capitolo affronteremo solo i
17 meccanismi più elementari che permettono di mettere in comunicazione processi
18 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
19 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
20
21 Tralasceremo invece tutte le problematiche relative alla comunicazione
22 attraverso la rete (e le relative interfacce) che saranno affrontate in
23 dettaglio in un secondo tempo.  Non affronteremo neanche meccanismi più
24 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) e CORBA
25 (\textit{Common Object Request Brocker Architecture}) che in genere sono
26 implementati con un ulteriore livello sopra i meccanismi elementari.
27
28
29 \section{La comunicazione fra processi tradizionale}
30 \label{sec:ipc_unix}
31
32 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
33 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
34 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
35 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
36 ne gestiscono l'uso e le varie forme in cui si è evoluto.
37
38
39 \subsection{Le \textit{pipe} standard}
40 \label{sec:ipc_pipes}
41
42 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
43 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
44 sostanza di una coppia di file descriptor\footnote{si tenga presente che
45   le pipe sono oggetti creati dal kernel e non risiedono su disco.} connessi
46 fra di loro in modo che se quanto scrive su di uno si può rileggere
47 dall'altro. Si viene così a costituire un canale di comunicazione tramite i
48 due file descriptor, nella forma di un \textsl{tubo} (da cui il nome)
49 attraverso cui fluiscono i dati.
50
51 La funzione che permette di creare questa speciale coppia di file descriptor
52 associati ad una \textit{pipe} è appunto \funcd{pipe}, ed il suo prototipo è:
53 \begin{prototype}{unistd.h}
54 {int pipe(int filedes[2])} 
55   
56 Crea una coppia di file descriptor associati ad una \textit{pipe}.
57   
58   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
59     errore, nel qual caso \var{errno} potrà assumere i valori \errval{EMFILE},
60     \errval{ENFILE} e \errval{EFAULT}.}
61 \end{prototype}
62
63 La funzione restituisce la coppia di file descriptor nel vettore
64 \param{filedes}; il primo è aperto in lettura ed il secondo in scrittura. Come
65 accennato concetto di funzionamento di una pipe è semplice: quello che si
66 scrive nel file descriptor aperto in scrittura viene ripresentato tale e quale
67 nel file descriptor aperto in lettura. I file descriptor infatti non sono
68 connessi a nessun file reale, ma ad un buffer nel kernel, la cui dimensione è
69 specificata dal parametro di sistema \const{PIPE\_BUF}, (vedi
70 sez.~\ref{sec:sys_file_limits}). Lo schema di funzionamento di una pipe è
71 illustrato in fig.~\ref{fig:ipc_pipe_singular}, in cui sono illustrati i due
72 capi della pipe, associati a ciascun file descriptor, con le frecce che
73 indicano la direzione del flusso dei dati.
74
75 \begin{figure}[htb]
76   \centering
77   \includegraphics[height=5cm]{img/pipe}
78   \caption{Schema della struttura di una pipe.}
79   \label{fig:ipc_pipe_singular}
80 \end{figure}
81
82 Chiaramente creare una pipe all'interno di un singolo processo non serve a
83 niente; se però ricordiamo quanto esposto in sez.~\ref{sec:file_sharing}
84 riguardo al comportamento dei file descriptor nei processi figli, è immediato
85 capire come una pipe possa diventare un meccanismo di intercomunicazione. Un
86 processo figlio infatti condivide gli stessi file descriptor del padre,
87 compresi quelli associati ad una pipe (secondo la situazione illustrata in
88 fig.~\ref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
89 capo della pipe, l'altro può leggere.
90
91 \begin{figure}[htb]
92   \centering
93   \includegraphics[height=5cm]{img/pipefork}
94   \caption{Schema dei collegamenti ad una pipe, condivisi fra processo padre e
95     figlio dopo l'esecuzione \func{fork}.}
96   \label{fig:ipc_pipe_fork}
97 \end{figure}
98
99 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
100 comunicazione fra processi attraverso una pipe, utilizzando le proprietà
101 ordinarie dei file, ma ci mostra anche qual'è il principale\footnote{Stevens
102   in \cite{APUE} riporta come limite anche il fatto che la comunicazione è
103   unidirezionale, ma in realtà questo è un limite facilmente superabile usando
104   una coppia di pipe.} limite nell'uso delle pipe. È necessario infatti che i
105 processi possano condividere i file descriptor della pipe, e per questo essi
106 devono comunque essere \textsl{parenti} (dall'inglese \textit{siblings}), cioè
107 o derivare da uno stesso processo padre in cui è avvenuta la creazione della
108 pipe, o, più comunemente, essere nella relazione padre/figlio.
109
110 A differenza di quanto avviene con i file normali, la lettura da una pipe può
111 essere bloccante (qualora non siano presenti dati), inoltre se si legge da una
112 pipe il cui capo in scrittura è stato chiuso, si avrà la ricezione di un EOF
113 (vale a dire che la funzione \func{read} ritornerà restituendo 0).  Se invece
114 si esegue una scrittura su una pipe il cui capo in lettura non è aperto il
115 processo riceverà il segnale \const{SIGPIPE}, e la funzione di scrittura
116 restituirà un errore di \errcode{EPIPE} (al ritorno del gestore, o qualora il
117 segnale sia ignorato o bloccato).
118
119 La dimensione del buffer della pipe (\const{PIPE\_BUF}) ci dà inoltre un'altra
120 importante informazione riguardo il comportamento delle operazioni di lettura
121 e scrittura su di una pipe; esse infatti sono atomiche fintanto che la
122 quantità di dati da scrivere non supera questa dimensione. Qualora ad esempio
123 si effettui una scrittura di una quantità di dati superiore l'operazione verrà
124 effettuata in più riprese, consentendo l'intromissione di scritture effettuate
125 da altri processi.
126
127
128 \subsection{Un esempio dell'uso delle pipe}
129 \label{sec:ipc_pipe_use}
130
131 Per capire meglio il funzionamento delle pipe faremo un esempio di quello che
132 è il loro uso più comune, analogo a quello effettuato della shell, e che
133 consiste nell'inviare l'output di un processo (lo standard output) sull'input
134 di un'altro. Realizzeremo il programma di esempio nella forma di un
135 \textit{CGI}\footnote{Un CGI (\textit{Common Gateway Interface}) è un
136   programma che permette la creazione dinamica di un oggetto da inserire
137   all'interno di una pagina HTML.}  per Apache, che genera una immagine JPEG
138 di un codice a barre, specificato come parametro di input.
139
140 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
141 delle caratteristiche specifiche, esso infatti non viene lanciato da una
142 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
143 solito ha la forma:
144 \begin{verbatim}
145     http://www.sito.it/cgi-bin/programma?parametro
146 \end{verbatim}
147 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
148 che ne descrive il mime-type) sullo standard output, in modo che il web-server
149 possa reinviarlo al browser che ha effettuato la richiesta, che in questo modo
150 è in grado di visualizzarlo opportunamente.
151
152 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
153 \cmd{gs}, il primo infatti è in grado di generare immagini PostScript di
154 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
155 serve per poter effettuare la conversione della stessa immagine in formato
156 JPEG. Usando una pipe potremo inviare l'output del primo sull'input del
157 secondo, secondo lo schema mostrato in fig.~\ref{fig:ipc_pipe_use}, in cui la
158 direzione del flusso dei dati è data dalle frecce continue.
159
160 \begin{figure}[htb]
161   \centering
162   \includegraphics[height=5cm]{img/pipeuse}
163   \caption{Schema dell'uso di una pipe come mezzo di comunicazione fra
164     due processi attraverso l'esecuzione una \func{fork} e la chiusura dei
165     capi non utilizzati.}
166   \label{fig:ipc_pipe_use}
167 \end{figure}
168
169 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
170 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
171 \textit{CGI} deve poter gestire più richieste in concorrenza, e si avrebbe una
172 evidente \textit{race condition}\index{\textit{race~condition}} in caso di
173 accesso simultaneo a detto file.\footnote{il problema potrebbe essere superato
174   determinando in anticipo un nome appropriato per il file temporaneo, che
175   verrebbe utilizzato dai vari sotto-processi, e cancellato alla fine della
176   loro esecuzione; ma a questo le cose non sarebbero più tanto semplici.}
177 L'uso di una pipe invece permette di risolvere il problema in maniera semplice
178 ed elegante, oltre ad essere molto più efficiente, dato che non si deve
179 scrivere su disco.
180
181 Il programma ci servirà anche come esempio dell'uso delle funzioni di
182 duplicazione dei file descriptor che abbiamo trattato in
183 sez.~\ref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
184 funzioni infatti che è possibile dirottare gli stream standard dei processi
185 (che abbiamo visto in sez.~\ref{sec:file_std_descr} e
186 sez.~\ref{sec:file_std_stream}) sulla pipe. In
187 fig.~\ref{fig:ipc_barcodepage_code} abbiamo riportato il corpo del programma,
188 il cui codice completo è disponibile nel file \file{BarCodePage.c} che si
189 trova nella directory dei sorgenti.
190
191
192 \begin{figure}[!htb]
193   \footnotesize \centering
194   \begin{minipage}[c]{15cm}
195     \includecodesample{listati/BarCodePage.c}
196   \end{minipage} 
197   \normalsize 
198   \caption{Sezione principale del codice del \textit{CGI} 
199     \file{BarCodePage.c}.}
200   \label{fig:ipc_barcodepage_code}
201 \end{figure}
202
203 La prima operazione del programma (\texttt{\small 4--12}) è quella di creare
204 le due pipe che serviranno per la comunicazione fra i due comandi utilizzati
205 per produrre il codice a barre; si ha cura di controllare la riuscita della
206 chiamata, inviando in caso di errore un messaggio invece dell'immagine
207 richiesta.\footnote{la funzione \func{WriteMess} non è riportata in
208   fig.~\ref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
209   formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
210   \textit{mime type}, e formattando il messaggio in HTML, in modo che
211   quest'ultimo possa essere visualizzato correttamente da un browser.}
212
213 Una volta create le pipe, il programma può creare (\texttt{\small 13-17}) il
214 primo processo figlio, che si incaricherà (\texttt{\small 19--25}) di eseguire
215 \cmd{barcode}. Quest'ultimo legge dallo standard input una stringa di
216 caratteri, la converte nell'immagine PostScript del codice a barre ad essa
217 corrispondente, e poi scrive il risultato direttamente sullo standard output.
218
219 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
220 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima pipe, e se
221 ne collega (\texttt{\small 21}) il capo in lettura allo standard input, usando
222 \func{dup2}. Si ricordi che invocando \func{dup2} il secondo file, qualora
223 risulti aperto, viene, come nel caso corrente, chiuso prima di effettuare la
224 duplicazione. Allo stesso modo, dato che \cmd{barcode} scrive l'immagine
225 PostScript del codice a barre sullo standard output, per poter effettuare una
226 ulteriore redirezione il capo in lettura della seconda pipe viene chiuso
227 (\texttt{\small 22}) mentre il capo in scrittura viene collegato allo standard
228 output (\texttt{\small 23}).
229
230 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
231 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
232 leggerà dalla prima pipe la stringa da codificare che gli sarà inviata dal
233 padre, e scriverà l'immagine PostScript del codice a barre sulla seconda.
234
235 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
236 (\texttt{\small 26}) il capo inutilizzato della prima pipe (quello in input) e
237 poi scrive (\texttt{\small 27}) la stringa da convertire sul capo in output,
238 così che \cmd{barcode} possa riceverla dallo standard input. A questo punto
239 l'uso della prima pipe da parte del padre è finito ed essa può essere
240 definitivamente chiusa (\texttt{\small 28}), si attende poi (\texttt{\small
241   29}) che l'esecuzione di \cmd{barcode} sia completata.
242
243 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
244 PostScript del codice a barre sul capo in scrittura della seconda pipe; a
245 questo punto si può eseguire la seconda conversione, da PS a JPEG, usando il
246 programma \cmd{gs}. Per questo si crea (\texttt{\small 30--34}) un secondo
247 processo figlio, che poi (\texttt{\small 35--42}) eseguirà questo programma
248 leggendo l'immagine PostScript creata da \cmd{barcode} dallo standard input,
249 per convertirla in JPEG.
250
251 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
252 scrittura della seconda pipe, e se ne collega (\texttt{\small 38}) il capo in
253 lettura allo standard input. Per poter formattare l'output del programma in
254 maniera utilizzabile da un browser, si provvede anche \texttt{\small 40}) alla
255 scrittura dell'apposita stringa di identificazione del mime-type in testa allo
256 standard output. A questo punto si può invocare \texttt{\small 41}) \cmd{gs},
257 provvedendo gli appositi switch che consentono di leggere il file da
258 convertire dallo standard input e di inviare la conversione sullo standard
259 output.
260
261 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
262 capo in scrittura della seconda pipe, e attende la conclusione del figlio
263 (\texttt{\small 45}); a questo punto può (\texttt{\small 46}) uscire. Si tenga
264 conto che l'operazione di chiudere il capo in scrittura della seconda pipe è
265 necessaria, infatti, se non venisse chiusa, \cmd{gs}, che legge il suo
266 standard input da detta pipe, resterebbe bloccato in attesa di ulteriori dati
267 in ingresso (l'unico modo che un programma ha per sapere che l'input è
268 terminato è rilevare che lo standard input è stato chiuso), e la \func{wait}
269 non ritornerebbe.
270
271
272 \subsection{Le funzioni \func{popen} e \func{pclose}}
273 \label{sec:ipc_popen}
274
275 Come si è visto la modalità più comune di utilizzo di una pipe è quella di
276 utilizzarla per fare da tramite fra output ed input di due programmi invocati
277 in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due funzioni
278 che permettono di sintetizzare queste operazioni. La prima di esse si chiama
279 \funcd{popen} ed il suo prototipo è:
280 \begin{prototype}{stdio.h}
281 {FILE *popen(const char *command, const char *type)}
282
283 Esegue il programma \param{command}, di cui, a seconda di \param{type},
284 restituisce, lo standard input o lo standard output nella pipe collegata allo
285 stream restituito come valore di ritorno.
286   
287 \bodydesc{La funzione restituisce l'indirizzo dello stream associato alla pipe
288   in caso di successo e \val{NULL} per un errore, nel qual caso \var{errno}
289   potrà assumere i valori relativi alle sottostanti invocazioni di \func{pipe}
290   e \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
291 \end{prototype}
292
293 La funzione crea una pipe, esegue una \func{fork}, ed invoca il programma
294 \param{command} attraverso la shell (in sostanza esegue \file{/bin/sh} con il
295 flag \code{-c}); l'argomento \param{type} deve essere una delle due stringhe
296 \verb|"w"| o \verb|"r"|, per indicare se la pipe sarà collegata allo standard
297 input o allo standard output del comando invocato.
298
299 La funzione restituisce il puntatore allo stream associato alla pipe creata,
300 che sarà aperto in sola lettura (e quindi associato allo standard output del
301 programma indicato) in caso si sia indicato \code{"r"}, o in sola scrittura (e
302 quindi associato allo standard input) in caso di \code{"w"}.
303
304 Lo stream restituito da \func{popen} è identico a tutti gli effetti ai file
305 stream visti in cap.~\ref{cha:files_std_interface}, anche se è collegato ad
306 una pipe e non ad un file, e viene sempre aperto in modalità
307 \textit{fully-buffered} (vedi sez.~\ref{sec:file_buffering}); l'unica
308 differenza con gli usuali stream è che dovrà essere chiuso dalla seconda delle
309 due nuove funzioni, \funcd{pclose}, il cui prototipo è:
310 \begin{prototype}{stdio.h}
311 {int pclose(FILE *stream)}
312
313 Chiude il file \param{stream}, restituito da una precedente \func{popen}
314 attendendo la terminazione del processo ad essa associato.
315   
316 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
317   errore; nel quel caso il valore di \var{errno} deriva dalle sottostanti
318   chiamate.}
319 \end{prototype}
320 \noindent che oltre alla chiusura dello stream si incarica anche di attendere
321 (tramite \func{wait4}) la conclusione del processo creato dalla precedente
322 \func{popen}.
323
324 Per illustrare l'uso di queste due funzioni riprendiamo il problema
325 precedente: il programma mostrato in fig.~\ref{fig:ipc_barcodepage_code} per
326 quanto funzionante, è (volutamente) codificato in maniera piuttosto complessa,
327 inoltre nella pratica sconta un problema di \cmd{gs} che non è in
328 grado\footnote{nella versione GNU Ghostscript 6.53 (2002-02-13).} di
329 riconoscere correttamente l'Encapsulated PostScript, per cui deve essere usato
330 il PostScript e tutte le volte viene generata una pagina intera, invece che
331 una immagine delle dimensioni corrispondenti al codice a barre.
332
333 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
334 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
335 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
336 generato da \cmd{barcode} utilizzando lo switch \cmd{-E}).  Utilizzando un PDF
337 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
338 originarie del codice a barre e produce un JPEG di dimensioni corrette.
339
340 Questo approccio però non funziona, per via di una delle caratteristiche
341 principali delle pipe. Per poter effettuare la conversione di un PDF infatti è
342 necessario, per la struttura del formato, potersi spostare (con \func{lseek})
343 all'interno del file da convertire; se si esegue la conversione con \cmd{gs}
344 su un file regolare non ci sono problemi, una pipe però è rigidamente
345 sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre con un errore
346 di \errcode{ESPIPE}, rendendo impossibile la conversione.  Questo ci dice che
347 in generale la concatenazione di vari programmi funzionerà soltanto quando
348 tutti prevedono una lettura sequenziale del loro input.
349
350 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
351 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
352 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
353   formato usato spesso come formato intermedio per effettuare conversioni, è
354   infatti molto facile da manipolare, dato che usa caratteri ASCII per
355   memorizzare le immagini, anche se per questo è estremamente inefficiente.}
356 dal quale poi si può ottenere un'immagine di dimensioni corrette attraverso
357 vari programmi di manipolazione (\cmd{pnmcrop}, \cmd{pnmmargin}) che può
358 essere infine trasformata in PNG (con \cmd{pnm2png}).
359
360 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
361 inviando l'output di ciascuno all'input del successivo, per poi ottenere il
362 risultato finale sullo standard output: un caso classico di utilizzazione
363 delle pipe, in cui l'uso di \func{popen} e \func{pclose} permette di
364 semplificare notevolmente la stesura del codice.
365
366 Nel nostro caso, dato che ciascun processo deve scrivere il suo output sullo
367 standard input del successivo, occorrerà usare \func{popen} aprendo la pipe in
368 scrittura. Il codice del nuovo programma è riportato in
369 fig.~\ref{fig:ipc_barcode_code}.  Come si può notare l'ordine di invocazione
370 dei programmi è l'inverso di quello in cui ci si aspetta che vengano
371 effettivamente eseguiti. Questo non comporta nessun problema dato che la
372 lettura su una pipe è bloccante, per cui ciascun processo, per quanto lanciato
373 per primo, si bloccherà in attesa di ricevere sullo standard input il
374 risultato dell'elaborazione del precedente, benchè quest'ultimo venga invocato
375 dopo.
376
377 \begin{figure}[!htb]
378   \footnotesize \centering
379   \begin{minipage}[c]{15cm}
380     \includecodesample{listati/BarCode.c}
381   \end{minipage} 
382   \normalsize 
383   \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
384   \label{fig:ipc_barcode_code}
385 \end{figure}
386
387 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il mime-type
388 sullo standard output; a questo punto il processo padre non necessita più di
389 eseguire ulteriori operazioni sullo standard output e può tranquillamente
390 provvedere alla redirezione.
391
392 Dato che i vari programmi devono essere lanciati in successione, si è
393 approntato un ciclo (\texttt{\small 15--19}) che esegue le operazioni in
394 sequenza: prima crea una pipe (\texttt{\small 17}) per la scrittura eseguendo
395 il programma con \func{popen}, in modo che essa sia collegata allo standard
396 input, e poi redirige (\texttt{\small 18}) lo standard output su detta pipe.
397
398 In questo modo il primo processo ad essere invocato (che è l'ultimo della
399 catena) scriverà ancora sullo standard output del processo padre, ma i
400 successivi, a causa di questa redirezione, scriveranno sulla pipe associata
401 allo standard input del processo invocato nel ciclo precedente.
402
403 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
404 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
405 (\texttt{\small 23}) la stringa del codice a barre sulla pipe, che è collegata
406 al suo standard input, infine si può eseguire (\texttt{\small 24--27}) un
407 ciclo che chiuda, nell'ordine inverso rispetto a quello in cui le si sono
408 create, tutte le pipe create con \func{pclose}.
409
410
411 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
412 \label{sec:ipc_named_pipe}
413
414 Come accennato in sez.~\ref{sec:ipc_pipes} il problema delle \textit{pipe} è
415 che esse possono essere utilizzate solo da processi con un progenitore comune
416 o nella relazione padre/figlio; per superare questo problema lo standard
417 POSIX.1 ha definito dei nuovi oggetti, le \textit{fifo}, che hanno le stesse
418 caratteristiche delle pipe, ma che invece di essere strutture interne del
419 kernel, visibili solo attraverso un file descriptor, sono accessibili
420 attraverso un inode\index{inode} che risiede sul filesystem, così che i
421 processi le possono usare senza dovere per forza essere in una relazione di
422 \textsl{parentela}.
423
424 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le pipe,
425 attraverso un apposito buffer nel kernel, senza transitare dal filesystem;
426 l'inode\index{inode} allocato sul filesystem serve infatti solo a fornire un
427 punto di riferimento per i processi, che permetta loro di accedere alla stessa
428 fifo; il comportamento delle funzioni di lettura e scrittura è identico a
429 quello illustrato per le pipe in sez.~\ref{sec:ipc_pipes}.
430
431 Abbiamo già visto in sez.~\ref{sec:file_mknod} le funzioni \func{mknod} e
432 \func{mkfifo} che permettono di creare una fifo; per utilizzarne una un
433 processo non avrà che da aprire il relativo file speciale o in lettura o
434 scrittura; nel primo caso sarà collegato al capo di uscita della fifo, e dovrà
435 leggere, nel secondo al capo di ingresso, e dovrà scrivere.
436
437 Il kernel crea una singola pipe per ciascuna fifo che sia stata aperta, che può
438 essere acceduta contemporaneamente da più processi, sia in lettura che in
439 scrittura. Dato che per funzionare deve essere aperta in entrambe le
440 direzioni, per una fifo di norma la funzione \func{open} si blocca se viene
441 eseguita quando l'altro capo non è aperto.
442
443 Le fifo però possono essere anche aperte in modalità \textsl{non-bloccante},
444 nel qual caso l'apertura del capo in lettura avrà successo solo quando anche
445 l'altro capo è aperto, mentre l'apertura del capo in scrittura restituirà
446 l'errore di \errcode{ENXIO} fintanto che non verrà aperto il capo in lettura.
447
448 In Linux è possibile aprire le fifo anche in lettura/scrittura,\footnote{lo
449   standard POSIX lascia indefinito il comportamento in questo caso.}
450 operazione che avrà sempre successo immediato qualunque sia la modalità di
451 apertura (bloccante e non bloccante); questo può essere utilizzato per aprire
452 comunque una fifo in scrittura anche se non ci sono ancora processi il
453 lettura; è possibile anche usare la fifo all'interno di un solo processo, nel
454 qual caso però occorre stare molto attenti alla possibili situazioni di
455 stallo.\footnote{se si cerca di leggere da una fifo che non contiene dati si
456   avrà un deadlock\index{\textit{deadlock}} immediato, dato che il processo si
457   blocca e non potrà quindi mai eseguire le funzioni di scrittura.}
458
459 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
460 piuttosto frequente l'utilizzo di una fifo come canale di comunicazione nelle
461 situazioni un processo deve ricevere informazioni da altri. In questo caso è
462 fondamentale che le operazioni di scrittura siano atomiche; per questo si deve
463 sempre tenere presente che questo è vero soltanto fintanto che non si supera
464 il limite delle dimensioni di \const{PIPE\_BUF} (si ricordi quanto detto in
465 sez.~\ref{sec:ipc_pipes}).
466
467 A parte il caso precedente, che resta probabilmente il più comune, Stevens
468 riporta in \cite{APUE} altre due casistiche principali per l'uso delle fifo:
469 \begin{itemize}
470 \item Da parte dei comandi di shell, per evitare la creazione di file
471   temporanei quando si devono inviare i dati di uscita di un processo
472   sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
473   
474 \item Come canale di comunicazione fra client ed server (il modello
475   \textit{client-server} è illustrato in sez.~\ref{sec:net_cliserv}).
476 \end{itemize}
477
478 Nel primo caso quello che si fa è creare tante fifo, da usare come standard
479 input, quanti sono i processi a cui i vogliono inviare i dati, questi ultimi
480 saranno stati posti in esecuzione ridirigendo lo standard input dalle fifo, si
481 potrà poi eseguire il processo che fornisce l'output replicando quest'ultimo,
482 con il comando \cmd{tee}, sulle varie fifo.
483
484 Il secondo caso è relativamente semplice qualora si debba comunicare con un
485 processo alla volta (nel qual caso basta usare due fifo, una per leggere ed
486 una per scrivere), le cose diventano invece molto più complesse quando si
487 vuole effettuare una comunicazione fra il server ed un numero imprecisato di
488 client; se il primo infatti può ricevere le richieste attraverso una fifo
489 ``\textsl{nota}'', per le risposte non si può fare altrettanto, dato che, per
490 la struttura sequenziale delle fifo, i client dovrebbero sapere, prima di
491 leggerli, quando i dati inviati sono destinati a loro.
492
493 Per risolvere questo problema, si può usare un'architettura come quella
494 illustrata in fig.~\ref{fig:ipc_fifo_server_arch} in cui i client inviano le
495 richieste al server su una fifo nota mentre le risposte vengono reinviate dal
496 server a ciascuno di essi su una fifo temporanea creata per l'occasione.
497
498 \begin{figure}[htb]
499   \centering
500   \includegraphics[height=9cm]{img/fifoserver}
501   \caption{Schema dell'utilizzo delle fifo nella realizzazione di una
502   architettura di comunicazione client/server.}
503   \label{fig:ipc_fifo_server_arch}
504 \end{figure}
505
506 Come esempio di uso questa architettura e dell'uso delle fifo, abbiamo scritto
507 un server di \textit{fortunes}, che restituisce, alle richieste di un client,
508 un detto a caso estratto da un insieme di frasi; sia il numero delle frasi
509 dell'insieme, che i file da cui esse vengono lette all'avvio, sono importabili
510 da riga di comando. Il corpo principale del server è riportato in
511 fig.~\ref{fig:ipc_fifo_server}, dove si è tralasciata la parte che tratta la
512 gestione delle opzioni a riga di comando, che effettua il settaggio delle
513 variabili \var{fortunefilename}, che indica il file da cui leggere le frasi,
514 ed \var{n}, che indica il numero di frasi tenute in memoria, ad un valore
515 diverso da quelli preimpostati. Il codice completo è nel file
516 \file{FortuneServer.c}.
517
518 \begin{figure}[!htb]
519   \footnotesize \centering
520   \begin{minipage}[c]{15cm}
521     \includecodesample{listati/FortuneServer.c}
522   \end{minipage} 
523   \normalsize 
524   \caption{Sezione principale del codice del server di \textit{fortunes}
525     basato sulle fifo.}
526   \label{fig:ipc_fifo_server}
527 \end{figure}
528
529 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
530 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
531 \var{fortune} avviene solo quando questa dimensione viene specificata, la
532 presenza di un valore nullo provoca l'uscita dal programma attraverso la
533 routine (non riportata) che ne stampa le modalità d'uso.  Dopo di che installa
534 (\texttt{\small 13--15}) la funzione che gestisce i segnali di interruzione
535 (anche questa non è riportata in fig.~\ref{fig:ipc_fifo_server}) che si limita
536 a rimuovere dal filesystem la fifo usata dal server per comunicare.
537
538 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
539 funzione \code{FortuneParse} che legge dal file specificato in
540 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
541 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
542 Anche il codice della funzione non è riportato, in quanto non direttamente
543 attinente allo scopo dell'esempio.
544
545 Il passo successivo (\texttt{\small 17--22}) è quello di creare con
546 \func{mkfifo} la fifo nota sulla quale il server ascolterà le richieste,
547 qualora si riscontri un errore il server uscirà (escludendo ovviamente il caso
548 in cui la funzione \func{mkfifo} fallisce per la precedente esistenza della
549 fifo).
550
551 Una volta che si è certi che la fifo di ascolto esiste la procedura di
552 inizializzazione è completata. A questo punto si può chiamare (\texttt{\small
553   23}) la funzione \func{daemon} per far proseguire l'esecuzione del programma
554 in background come demone.  Si può quindi procedere (\texttt{\small 24--33})
555 alla apertura della fifo: si noti che questo viene fatto due volte, prima in
556 lettura e poi in scrittura, per evitare di dover gestire all'interno del ciclo
557 principale il caso in cui il server è in ascolto ma non ci sono client che
558 effettuano richieste.  Si ricordi infatti che quando una fifo è aperta solo
559 dal capo in lettura, l'esecuzione di \func{read} ritorna con zero byte (si ha
560 cioè una condizione di end-of-file).
561
562 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
563 client non apre a sua volta la fifo nota in scrittura per effettuare la sua
564 richiesta. Pertanto all'inizio non ci sono problemi, il client però, una volta
565 ricevuta la risposta, uscirà, chiudendo tutti i file aperti, compresa la fifo.
566 A questo punto il server resta (se non ci sono altri client che stanno
567 effettuando richieste) con la fifo chiusa sul lato in lettura, ed in questo
568 stato la funzione \func{read} non si bloccherà in attesa di input, ma
569 ritornerà in continuazione, restituendo un end-of-file.\footnote{Si è usata
570   questa tecnica per compatibilità, Linux infatti supporta l'apertura delle
571   fifo in lettura/scrittura, per cui si sarebbe potuto effettuare una singola
572   apertura con \const{O\_RDWR}, la doppia apertura comunque ha il vantaggio
573   che non si può scrivere per errore sul capo aperto in sola lettura.}
574
575 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
576   24--28}),\footnote{di solito si effettua l'apertura del capo in lettura di
577   una fifo in modalità non bloccante, per evitare il rischio di uno stallo: se
578   infatti nessuno apre la fifo in scrittura il processo non ritornerà mai
579   dalla \func{open}. Nel nostro caso questo rischio non esiste, mentre è
580   necessario potersi bloccare in lettura in attesa di una richiesta.} si
581 esegue una seconda apertura in scrittura (\texttt{\small 29--32}), scartando
582 il relativo file descriptor, che non sarà mai usato, in questo modo però la
583 fifo resta comunque aperta anche in scrittura, cosicché le successive chiamate
584 a \func{read} possono bloccarsi.
585
586 A questo punto si può entrare nel ciclo principale del programma che fornisce
587 le risposte ai client (\texttt{\small 34--50}); questo viene eseguito
588 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
589 modo da passare attraverso la routine di chiusura che cancella la fifo).
590
591 Il server è progettato per accettare come richieste dai client delle stringhe
592 che contengono il nome della fifo sulla quale deve essere inviata la risposta.
593 Per cui prima (\texttt{\small 35--39}) si esegue la lettura dalla stringa di
594 richiesta dalla fifo nota (che a questo punto si bloccherà tutte le volte che
595 non ci sono richieste). Dopo di che, una volta terminata la stringa
596 (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero casuale per
597 ricavare la frase da inviare, si procederà (\texttt{\small 42--46})
598 all'apertura della fifo per la risposta, che poi \texttt{\small 47--48}) vi
599 sarà scritta. Infine (\texttt{\small 49}) si chiude la fifo di risposta che
600 non serve più.
601
602 Il codice del client è invece riportato in fig.~\ref{fig:ipc_fifo_client},
603 anche in questo caso si è omessa la gestione delle opzioni e la funzione che
604 stampa a video le informazioni di utilizzo ed esce, riportando solo la sezione
605 principale del programma e le definizioni delle variabili. Il codice completo
606 è nel file \file{FortuneClient.c} dei sorgenti allegati.
607
608 \begin{figure}[!htb]
609   \footnotesize \centering
610   \begin{minipage}[c]{15cm}
611     \includecodesample{listati/FortuneClient.c}
612   \end{minipage} 
613   \normalsize 
614   \caption{Sezione principale del codice del client di \textit{fortunes}
615     basato sulle fifo.}
616   \label{fig:ipc_fifo_client}
617 \end{figure}
618
619 La prima istruzione (\texttt{\small 12}) compone il nome della fifo che dovrà
620 essere utilizzata per ricevere la risposta dal server.  Si usa il \acr{pid}
621 del processo per essere sicuri di avere un nome univoco; dopo di che
622 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
623 in caso di errore (a meno che il file non sia già presente sul filesystem).
624
625 A questo punto il client può effettuare l'interrogazione del server, per
626 questo prima si apre la fifo nota (\texttt{\small 19--23}), e poi ci si scrive
627 (\texttt{\small 24}) la stringa composta in precedenza, che contiene il nome
628 della fifo da utilizzare per la risposta. Infine si richiude la fifo del
629 server che a questo punto non serve più (\texttt{\small 25}).
630
631 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
632 si apre (\texttt{\small 26--30}) la fifo appena creata, da cui si deve
633 riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
634 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
635 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
636 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
637 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
638 fifo e si cancella (\texttt{\small 34}) il relativo file.
639 Si noti come la fifo per la risposta sia stata aperta solo dopo aver inviato
640 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
641 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
642 scrittura e l'apertura si sarebbe bloccata indefinitamente.
643
644 Verifichiamo allora il comportamento dei nostri programmi, in questo, come in
645 altri esempi precedenti, si fa uso delle varie funzioni di servizio, che sono
646 state raccolte nella libreria \file{libgapil.so}, per poter usare quest'ultima
647 occorrerà definire la speciale variabile di ambiente \code{LD\_LIBRARY\_PATH}
648 in modo che il linker dinamico possa accedervi.
649
650 In generale questa variabile indica il
651 \index{\textit{pathname}}\textit{pathname} della directory contenente la
652 libreria. Nell'ipotesi (che daremo sempre per verificata) che si facciano le
653 prove direttamente nella directory dei sorgenti (dove di norma vengono creati
654 sia i programmi che la libreria), il comando da dare sarà \code{export
655   LD\_LIBRARY\_PATH=./}; a questo punto potremo lanciare il server, facendogli
656 leggere una decina di frasi, con:
657 \begin{verbatim}
658 [piccardi@gont sources]$ ./fortuned -n10
659 \end{verbatim}
660
661 Avendo usato \func{daemon} per eseguire il server in background il comando
662 ritornerà immediatamente, ma potremo verificare con \cmd{ps} che in effetti il
663 programma resta un esecuzione in background, e senza avere associato un
664 terminale di controllo (si ricordi quanto detto in sez.~\ref{sec:sess_daemon}):
665 \begin{verbatim}
666 [piccardi@gont sources]$ ps aux
667 ...
668 piccardi 27489  0.0  0.0  1204  356 ?        S    01:06   0:00 ./fortuned -n10
669 piccardi 27492  3.0  0.1  2492  764 pts/2    R    01:08   0:00 ps aux
670 \end{verbatim}%$
671 e si potrà verificare anche che in \file{/tmp} è stata creata la fifo di
672 ascolto \file{fortune.fifo}. A questo punto potremo interrogare il server con
673 il programma client; otterremo così:
674 \begin{verbatim}
675 [piccardi@gont sources]$ ./fortune
676 Linux ext2fs has been stable for a long time, now it's time to break it
677         -- Linuxkongreß '95 in Berlin
678 [piccardi@gont sources]$ ./fortune
679 Let's call it an accidental feature.
680         --Larry Wall
681 [piccardi@gont sources]$ ./fortune
682 .........    Escape the 'Gates' of Hell
683   `:::'                  .......  ......
684    :::  *                  `::.    ::'
685    ::: .::  .:.::.  .:: .::  `::. :'
686    :::  ::   ::  ::  ::  ::    :::.
687    ::: .::. .::  ::.  `::::. .:'  ::.
688 ...:::.....................::'   .::::..
689         -- William E. Roadcap
690 [piccardi@gont sources]$ ./fortune
691 Linux ext2fs has been stable for a long time, now it's time to break it
692         -- Linuxkongreß '95 in Berlin
693 \end{verbatim}%$
694 e ripetendo varie volte il comando otterremo, in ordine casuale, le dieci
695 frasi tenute in memoria dal server.
696
697 Infine per chiudere il server basterà inviare un segnale di terminazione con
698 \code{killall fortuned} e potremo verificare che il gestore del segnale ha
699 anche correttamente cancellato la fifo di ascolto da \file{/tmp}.
700
701 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
702 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
703   che esamina questa architettura in \cite{APUE}, nota come sia impossibile
704   per il server sapere se un client è andato in crash, con la possibilità di
705   far restare le fifo temporanee sul filesystem, di come sia necessario
706   intercettare \const{SIGPIPE} dato che un client può terminare dopo aver
707   fatto una richiesta, ma prima che la risposta sia inviata (cosa che nel
708   nostro esempio non è stata fatta).}; in generale infatti l'interfaccia delle
709 fifo non è adatta a risolvere questo tipo di problemi, che possono essere
710 affrontati in maniera più semplice ed efficace o usando i
711 \textit{socket}\index{socket} (che tratteremo in dettaglio a partire da
712 cap.~\ref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione
713 diversi, come quelli che esamineremo in seguito.
714
715
716
717 \subsection{La funzione \func{socketpair}}
718 \label{sec:ipc_socketpair}
719
720 Un meccanismo di comunicazione molto simile alle pipe, ma che non presenta il
721 problema della unidirezionalità del flusso dei dati, è quello dei cosiddetti
722 \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo l'argomento
723 dei \textit{socket}\index{socket} in cap.~\ref{cha:socket_intro},\footnote{si
724   tratta comunque di oggetti di comunicazione che, come le pipe, sono
725   utilizzati attraverso dei file descriptor.} nell'ambito dell'interfaccia
726 generale che essi forniscono per la programmazione di rete; e vedremo anche
727 (in~sez.~\ref{sec:sock_sa_local}) come si possono definire dei file speciali
728 (di tipo \textit{socket}, analoghi a quello associati alle fifo) cui si accede
729 però attraverso quella medesima interfaccia; vale però la pena esaminare qui
730 una modalità di uso dei socket locali\footnote{la funzione \func{socketpair} è
731   stata introdotta in BSD4.4, ma è supportata in genere da qualunque sistema
732   che fornisca l'interfaccia dei socket.} che li rende sostanzialmente
733 identici ad una pipe bidirezionale.
734
735 La funzione \funcd{socketpair} infatti consente di creare una coppia di file
736 descriptor connessi fra di loro (tramite un socket\index{socket}, appunto),
737 senza dover ricorrere ad un file speciale sul filesystem, i descrittori sono
738 del tutto analoghi a quelli che si avrebbero con una chiamata a \func{pipe},
739 con la sola differenza è che in questo caso il flusso dei dati può essere
740 effettuato in entrambe le direzioni. Il prototipo della funzione è:
741 \begin{functions}
742   \headdecl{sys/types.h} 
743   \headdecl{sys/socket.h} 
744   
745   \funcdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
746   
747   Crea una coppia di socket\index{socket} connessi fra loro.
748   
749   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
750     errore, nel qual caso \var{errno} assumerà uno dei valori:
751   \begin{errlist}
752   \item[\errcode{EAFNOSUPPORT}] I socket\index{socket} locali non sono
753     supportati.
754   \item[\errcode{EPROTONOSUPPORT}] Il protocollo specificato non è supportato.
755   \item[\errcode{EOPNOTSUPP}] Il protocollo specificato non supporta la
756   creazione di coppie di socket\index{socket}.
757   \end{errlist}
758   ed inoltre \errval{EMFILE},  \errval{EFAULT}.
759 }
760 \end{functions}
761
762 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
763 loro: quello che si scrive su uno di essi sarà ripresentato in input
764 sull'altro e viceversa. I parametri \param{domain}, \param{type} e
765 \param{protocol} derivano dall'interfaccia dei socket\index{socket} (che è
766 quella che fornisce il substrato per connettere i due descrittori), ma in
767 questo caso i soli valori validi che possono essere specificati sono
768 rispettivamente \const{AF\_UNIX}, \const{SOCK\_STREAM} e \val{0}.
769
770 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
771 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei
772 socket\index{socket} locali in generale) permette di trasmettere attraverso le
773 linea non solo dei dati, ma anche dei file descriptor: si può cioè passare da
774 un processo ad un altro un file descriptor, con una sorta di duplicazione
775 dello stesso non all'interno di uno stesso processo, ma fra processi distinti
776 (torneremo su questa funzionalità in sez.~\ref{sec:xxx_fd_passing}).
777
778
779 \section{Il sistema di comunicazione fra processi di System V}
780 \label{sec:ipc_sysv}
781
782 Benché le pipe e le fifo siano ancora ampiamente usate, esse scontano il
783 limite fondamentale che il meccanismo di comunicazione che forniscono è
784 rigidamente sequenziale: una situazione in cui un processo scrive qualcosa che
785 molti altri devono poter leggere non può essere implementata con una pipe.
786
787 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
788 oggetti per la comunicazione fra processi ed una nuova interfaccia di
789 programmazione, che fossero in grado di garantire una maggiore flessibilità.
790 In questa sezione esamineremo come Linux supporta quello che viene chiamato il
791 \textsl{Sistema di comunicazione fra processi} di System V, cui da qui in
792 avanti faremo riferimento come \textit{SysV IPC} (dove IPC è la sigla di
793 \textit{Inter-Process Comunication}).
794
795
796
797 \subsection{Considerazioni generali}
798 \label{sec:ipc_sysv_generic}
799
800 La principale caratteristica del \textit{SysV IPC} è quella di essere basato
801 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
802 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
803 non vengono cancellati dal sistema una volta che non sono più in uso.
804
805 Questo comporta due problemi: il primo è che, al contrario di quanto avviene
806 per pipe e fifo, la memoria allocata per questi oggetti non viene rilasciata
807 automaticamente quando non c'è più nessuno che li utilizzi, ed essi devono
808 essere cancellati esplicitamente, se non si vuole che restino attivi fino al
809 riavvio del sistema. Il secondo problema è che, dato che non c'è, come per i
810 file, un contatore del numero di riferimenti che ne indichi l'essere in uso,
811 essi possono essere cancellati anche se ci sono dei processi che li stanno
812 utilizzando, con tutte le conseguenze (negative) del caso.
813
814 Un'ulteriore caratteristica negativa è che gli oggetti usati nel \textit{SysV
815   IPC} vengono creati direttamente dal kernel, e sono accessibili solo
816 specificando il relativo \textsl{identificatore}. Questo è un numero
817 progressivo (un po' come il \acr{pid} dei processi) che il kernel assegna a
818 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
819 torneremo in sez.~\ref{sec:ipc_sysv_id_use}). L'identificatore viene restituito
820 dalle funzioni che creano l'oggetto, ed è quindi locale al processo che le ha
821 eseguite. Dato che l'identificatore viene assegnato dinamicamente dal kernel
822 non è possibile prevedere quale sarà, né utilizzare un qualche valore statico,
823 si pone perciò il problema di come processi diversi possono accedere allo
824 stesso oggetto.
825
826 Per risolvere il problema nella struttura \struct{ipc\_perm} che il kernel
827 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
828 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
829 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
830 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
831   si sposta il problema dell'accesso dalla classificazione in base
832   all'identificatore alla classificazione in base alla chiave, una delle tante
833   complicazioni inutili presenti nel \textit{SysV IPC}.} Oltre la chiave, la
834 struttura, la cui definizione è riportata in fig.~\ref{fig:ipc_ipc_perm},
835 mantiene varie proprietà ed informazioni associate all'oggetto.
836
837 \begin{figure}[!htb]
838   \footnotesize \centering
839   \begin{minipage}[c]{15cm}
840     \includestruct{listati/ipc_perm.h}
841   \end{minipage} 
842   \normalsize 
843   \caption{La struttura \structd{ipc\_perm}, come definita in
844     \file{sys/ipc.h}.}
845   \label{fig:ipc_ipc_perm}
846 \end{figure}
847
848 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
849 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
850 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
851 sono \textsl{parenti} la soluzione è relativamente semplice, in tal caso
852 infatti si può usare il valore speciale \texttt{IPC\_PRIVATE} per creare un
853 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
854 disponibile in tutti i figli, e potrà essere passato come parametro attraverso
855 una \func{exec}.
856
857 Però quando i processi non sono \textsl{parenti} (come capita tutte le volte
858 che si ha a che fare con un sistema client-server) tutto questo non è
859 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
860 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere.  Una
861 alternativa più efficace è quella che i programmi usino un valore comune per
862 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
863 sempre il rischio che questa chiave possa essere stata già utilizzata da
864 qualcun altro.  Dato che non esiste una convenzione su come assegnare queste
865 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione
866 apposita, \funcd{ftok}, che permette di ottenere una chiave specificando il
867 nome di un file ed un numero di versione; il suo prototipo è:
868 \begin{functions}
869   \headdecl{sys/types.h} 
870   \headdecl{sys/ipc.h} 
871   
872   \funcdecl{key\_t ftok(const char *pathname, int proj\_id)}
873   
874   Restituisce una chiave per identificare un oggetto del \textit{SysV IPC}.
875   
876   \bodydesc{La funzione restituisce la chiave in caso di successo e -1
877     altrimenti, nel qual caso \var{errno} sarà uno dei possibili codici di
878     errore di \func{stat}.}
879 \end{functions}
880
881 La funzione determina un valore della chiave sulla base di \param{pathname},
882 che deve specificare il \index{\textit{pathname}}\textit{pathname} di un file
883 effettivamente esistente e di un numero di progetto \param{proj\_id)}, che di
884 norma viene specificato come carattere, dato che ne vengono utilizzati solo
885 gli 8 bit meno significativi.\footnote{nelle libc4 e libc5, come avviene in
886   SunOS, l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, le
887   \acr{glibc} usano il prototipo specificato da XPG4, ma vengono lo stesso
888   utilizzati gli 8 bit meno significativi.}
889
890 Il problema è che anche così non c'è la sicurezza che il valore della chiave
891 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
892 con i 16 bit meno significativi dell'inode\index{inode} del file
893 \param{pathname} (che vengono ottenuti attraverso \func{stat}, da cui derivano
894 i possibili errori), e gli 8 bit meno significativi del numero del dispositivo
895 su cui è il file.  Diventa perciò relativamente facile ottenere delle
896 collisioni, specie se i file sono su dispositivi con lo stesso \textit{minor
897   number}, come \file{/dev/hda1} e \file{/dev/sda1}.
898
899 In genere quello che si fa è utilizzare un file comune usato dai programmi che
900 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
901 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
902 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
903 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
904 bene in fase di creazione, le cose possono complicarsi per i programmi che
905 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
906 attributi di \struct{ipc\_perm}, non esiste una modalità semplice per essere
907 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
908 creato da chi ci si aspetta.
909
910 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
911 contatore di riferimenti per la cancellazione automatica, il principale
912 problema del \textit{SysV IPC}. Non esiste infatti una modalità chiara per
913 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
914 file, e tutta l'interfaccia è inutilmente complessa.  Per questo ne è stata
915 effettuata una revisione completa nello standard POSIX.1b, che tratteremo in
916 sez.~\ref{sec:ipc_posix}.
917
918
919 \subsection{Il controllo di accesso}
920 \label{sec:ipc_sysv_access_control}
921
922 Oltre alle chiavi, abbiamo visto che ad ogni oggetto sono associate in
923 \struct{ipc\_perm} ulteriori informazioni, come gli identificatori del creatore
924 (nei campi \var{cuid} e \var{cgid}) e del proprietario (nei campi \var{uid} e
925 \var{gid}) dello stesso, e un insieme di permessi (nel campo \var{mode}). In
926 questo modo è possibile definire un controllo di accesso sugli oggetti di IPC,
927 simile a quello che si ha per i file (vedi sez.~\ref{sec:file_perm_overview}).
928
929 Benché questo controllo di accesso sia molto simile a quello dei file, restano
930 delle importanti differenze. La prima è che il permesso di esecuzione non
931 esiste (e se specificato viene ignorato), per cui si può parlare solo di
932 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
933 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
934 ed hanno lo stesso significato di quelli riportati in
935 tab.~\ref{tab:file_mode_flags}\footnote{se però si vogliono usare le costanti
936   simboliche ivi definite occorrerà includere il file \file{sys/stat.h},
937   alcuni sistemi definiscono le costanti \const{MSG\_R} (\texttt{0400}) e
938   \const{MSG\_W} (\texttt{0200}) per indicare i permessi base di lettura e
939   scrittura per il proprietario, da utilizzare, con gli opportuni shift, pure
940   per il gruppo e gli altri, in Linux, visto la loro scarsa utilità, queste
941   costanti non sono definite.} e come per i file definiscono gli accessi per
942 il proprietario, il suo gruppo e tutti gli altri.
943
944 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
945 \struct{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono settati
946 rispettivamente al valore dell'user-ID e del group-ID effettivo del processo che
947 ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
948 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
949
950 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
951 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
952 specificano tutte un argomento \param{flag}, in tal caso quando viene
953 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
954 permessi, questi vengono controllati e l'identificatore viene restituito solo
955 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
956 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
957 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
958 nullo, nel qual caso l'identificatore sarà restituito comunque.
959
960 Il secondo livello di controllo è quello delle varie funzioni che accedono
961 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
962 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
963 \begin{itemize}
964 \item se il processo ha i privilegi di amministratore l'accesso è sempre
965   consentito. 
966 \item se l'user-ID effettivo del processo corrisponde o al valore del campo
967   \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
968   in \var{mode} è appropriato\footnote{per appropriato si intende che è
969     settato il permesso di scrittura per le operazioni di scrittura e quello
970     di lettura per le operazioni di lettura.} l'accesso è consentito.
971 \item se il group-ID effettivo del processo corrisponde o al
972   valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
973   per il gruppo in \var{mode} è appropriato l'accesso è consentito.
974 \item se il permesso per gli altri è appropriato l'accesso è consentito.
975 \end{itemize}
976 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
977 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
978 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
979 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
980 il valore di \var{umask} (si ricordi quanto esposto in
981 sez.~\ref{sec:file_umask}) non ha alcun significato.
982
983
984 \subsection{Gli identificatori ed il loro utilizzo}
985 \label{sec:ipc_sysv_id_use}
986
987 L'unico campo di \struct{ipc\_perm} del quale non abbiamo ancora parlato è
988 \var{seq}, che in fig.~\ref{fig:ipc_ipc_perm} è qualificato con un criptico
989 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
990 strettamente attinente alle modalità con cui il kernel assegna gli
991 identificatori degli oggetti del sistema di IPC.
992
993 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
994 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
995 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
996 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
997 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
998 dimensioni (inferiori al numero massimo di oggetti disponibili).
999
1000 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1001 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1002 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1003 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1004 relativo identificatore viene immediatamente assegnato a quelle di un altro
1005 server partito subito dopo, con la possibilità che i client del primo non
1006 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1007 con gli oggetti del secondo, con conseguenze imprevedibili.
1008
1009 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1010 \var{seq} per provvedere un meccanismo che porti gli identificatori ad
1011 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1012 un identificatore può venire riutilizzato.
1013
1014 Il sistema dispone sempre di un numero fisso di oggetti di IPC,\footnote{fino
1015   al kernel 2.2.x questi valori, definiti dalle costanti \const{MSGMNI},
1016   \const{SEMMNI} e \const{SHMMNI}, potevano essere cambiati (come tutti gli
1017   altri limiti relativi al \textit{SysV IPC}) solo con una ricompilazione del
1018   kernel, andando a modificarne la definizione nei relativi header file.  A
1019   partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1020   scrivendo sui file \file{shmmni}, \file{msgmni} e \file{sem} di
1021   \file{/proc/sys/kernel} o con l'uso di \func{sysctl}.} e per ciascuno di
1022 essi viene mantenuto in \var{seq} un numero di sequenza progressivo che viene
1023 incrementato di uno ogni volta che l'oggetto viene cancellato. Quando
1024 l'oggetto viene creato usando uno spazio che era già stato utilizzato in
1025 precedenza per restituire l'identificatore al numero di oggetti presenti viene
1026 sommato il valore di \var{seq} moltiplicato per il numero massimo di oggetti
1027 di quel tipo,\footnote{questo vale fino ai kernel della serie 2.2.x, dalla
1028   serie 2.4.x viene usato lo stesso fattore per tutti gli oggetti, esso è dato
1029   dalla costante \const{IPCMNI}, definita in \file{include/linux/ipc.h}, che
1030   indica il limite massimo per il numero di tutti oggetti di IPC, ed il cui
1031   valore è 32768.}  si evita così il riutilizzo degli stessi numeri, e si fa
1032 sì che l'identificatore assuma tutti i valori possibili.
1033
1034 \begin{figure}[!htb]
1035   \footnotesize \centering
1036   \begin{minipage}[c]{15cm}
1037     \includecodesample{listati/IPCTestId.c}
1038   \end{minipage} 
1039   \normalsize 
1040   \caption{Sezione principale del programma di test per l'assegnazione degli
1041     identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1042   \label{fig:ipc_sysv_idtest}
1043 \end{figure}
1044
1045 In fig.~\ref{fig:ipc_sysv_idtest} è riportato il codice di un semplice
1046 programma di test che si limita a creare un oggetto (specificato a riga di
1047 comando), stamparne il numero di identificatore e cancellarlo per un numero
1048 specificato di volte. Al solito non si è riportato il codice della gestione
1049 delle opzioni a riga di comando, che permette di specificare quante volte
1050 effettuare il ciclo \var{n}, e su quale tipo di oggetto eseguirlo.
1051
1052 La figura non riporta il codice di selezione delle opzioni, che permette di
1053 inizializzare i valori delle variabili \var{type} al tipo di oggetto voluto, e
1054 \var{n} al numero di volte che si vuole effettuare il ciclo di creazione,
1055 stampa, cancellazione. I valori di default sono per l'uso delle code di
1056 messaggi e un ciclo di 5 volte. Se si lancia il comando si otterrà qualcosa
1057 del tipo:
1058 \begin{verbatim}
1059 piccardi@gont sources]$ ./ipctestid
1060 Identifier Value 0 
1061 Identifier Value 32768 
1062 Identifier Value 65536 
1063 Identifier Value 98304 
1064 Identifier Value 131072 
1065 \end{verbatim}%$
1066 il che ci mostra che abbiamo un kernel della serie 2.4.x nel quale non avevamo
1067 ancora usato nessuna coda di messaggi. Se ripetiamo il comando otterremo
1068 ancora:
1069 \begin{verbatim}
1070 [piccardi@gont sources]$ ./ipctestid
1071 Identifier Value 163840 
1072 Identifier Value 196608 
1073 Identifier Value 229376 
1074 Identifier Value 262144 
1075 Identifier Value 294912 
1076 \end{verbatim}%$
1077 che ci mostra come il valore di \var{seq} sia in effetti una quantità
1078 mantenuta staticamente all'interno del sistema.
1079
1080
1081 \subsection{Code di messaggi}
1082 \label{sec:ipc_sysv_mq}
1083
1084 Il primo oggetto introdotto dal \textit{SysV IPC} è quello delle code di
1085 messaggi.  Le code di messaggi sono oggetti analoghi alle pipe o alle fifo,
1086 anche se la loro struttura è diversa, ed il loro scopo principale è appunto
1087 quello di permettere a processi diversi di scambiarsi dei dati.
1088
1089 La funzione che permette di richiedere al sistema l'identificatore di una coda
1090 di messaggi esistente (o di crearne una se questa non esiste) è
1091 \funcd{msgget}; il suo prototipo è:
1092 \begin{functions}
1093   \headdecl{sys/types.h} 
1094   \headdecl{sys/ipc.h} 
1095   \headdecl{sys/msg.h} 
1096   
1097   \funcdecl{int msgget(key\_t key, int flag)}
1098   
1099   Restituisce l'identificatore di una coda di messaggi.
1100   
1101   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1102     in caso di errore, nel qual caso \var{errno} assumerà uno dei valori:
1103   \begin{errlist}
1104   \item[\errcode{EACCES}] Il processo chiamante non ha i privilegi per accedere
1105   alla coda richiesta.  
1106   \item[\errcode{EEXIST}] Si è richiesta la creazione di una coda che già
1107   esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}. 
1108   \item[\errcode{EIDRM}] La coda richiesta è marcata per essere cancellata.
1109   \item[\errcode{ENOENT}] Si è cercato di ottenere l'identificatore di una coda
1110     di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1111     non era specificato.
1112   \item[\errcode{ENOSPC}] Si è cercato di creare una coda di messaggi quando è
1113     stato superato il limite massimo di code (\const{MSGMNI}).
1114   \end{errlist}
1115   ed inoltre \errval{ENOMEM}.
1116 }
1117 \end{functions}
1118
1119 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1120 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1121 nuova. L'argomento \param{key} specifica la chiave che è associata
1122 all'oggetto, eccetto il caso in cui si specifichi il valore
1123 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1124 associata alcuna chiave, il processo (ed i suoi eventuali figli) potranno
1125 farvi riferimento solo attraverso l'identificatore.
1126
1127 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE}\footnote{in
1128   Linux questo significa un valore diverso da zero.} l'effetto della funzione
1129 dipende dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1130 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1131 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1132 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1133 validi.
1134
1135 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1136 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1137 corrispondente al valore \const{IPC\_CREAT}. In questo caso i nove bit meno
1138 significativi di \param{flag} saranno usati come permessi per il nuovo
1139 oggetto, secondo quanto illustrato in sez.~\ref{sec:ipc_sysv_access_control}.
1140 Se si imposta anche il bit corrispondente a \const{IPC\_EXCL} la funzione avrà
1141 successo solo se l'oggetto non esiste già, fallendo con un errore di
1142 \errcode{EEXIST} altrimenti.
1143
1144 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1145 processi di accedere alla coda (se hanno privilegi sufficienti) una volta che
1146 questi possano indovinare o ricavare (ad esempio per tentativi)
1147 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1148 IPC infatti non esiste una maniera che  garantisca l'accesso esclusivo ad una
1149 coda di messaggi.  Usare \const{IPC\_PRIVATE} o const{IPC\_CREAT} e
1150 \const{IPC\_EXCL} per \param{flag} comporta solo la creazione di una nuova
1151 coda.
1152
1153 \begin{table}[htb]
1154   \footnotesize
1155   \centering
1156   \begin{tabular}[c]{|c|r|l|l|}
1157     \hline
1158     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
1159     & \textbf{Significato} \\
1160     \hline
1161     \hline
1162     \const{MSGMNI}&   16& \file{msgmni} & Numero massimo di code di
1163                                           messaggi. \\
1164     \const{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1165                                           messaggio.\\
1166     \const{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di 
1167                                           una coda.\\
1168     \hline
1169   \end{tabular}
1170   \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1171   \label{tab:ipc_msg_limits}
1172 \end{table}
1173
1174 Le code di messaggi sono caratterizzate da tre limiti fondamentali, definiti
1175 negli header e corrispondenti alle prime tre costanti riportate in
1176 tab.~\ref{tab:ipc_msg_limits}, come accennato però in Linux è possibile
1177 modificare questi limiti attraverso l'uso di \func{sysctl} o scrivendo nei
1178 file \file{msgmax}, \file{msgmnb} e \file{msgmni} di \file{/proc/sys/kernel/}.
1179
1180
1181 \begin{figure}[htb]
1182   \centering \includegraphics[width=15cm]{img/mqstruct}
1183   \caption{Schema della struttura di una coda messaggi.}
1184   \label{fig:ipc_mq_schema}
1185 \end{figure}
1186
1187
1188 Una coda di messaggi è costituita da una \textit{linked list};\footnote{una
1189   \textit{linked list} è una tipica struttura di dati, organizzati in una
1190   lista in cui ciascun elemento contiene un puntatore al successivo. In questo
1191   modo la struttura è veloce nell'estrazione ed immissione dei dati dalle
1192   estremità dalla lista (basta aggiungere un elemento in testa o in coda ed
1193   aggiornare un puntatore), e relativamente veloce da attraversare in ordine
1194   sequenziale (seguendo i puntatori), è invece relativamente lenta
1195   nell'accesso casuale e nella ricerca.}  i nuovi messaggi vengono inseriti in
1196 coda alla lista e vengono letti dalla cima, in fig.~\ref{fig:ipc_mq_schema} si
1197 è riportato lo schema con cui queste strutture vengono mantenute dal
1198 kernel.\footnote{lo schema illustrato in fig.~\ref{fig:ipc_mq_schema} è in
1199   realtà una semplificazione di quello usato effettivamente fino ai kernel
1200   della serie 2.2.x, nei kernel della serie 2.4.x la gestione delle code di
1201   messaggi è stata modificata ed è effettuata in maniera diversa; abbiamo
1202   mantenuto lo schema precedente in quanto illustra comunque in maniera più
1203   che adeguata i principi di funzionamento delle code di messaggi.}
1204
1205 \begin{figure}[!htb]
1206   \footnotesize \centering
1207   \begin{minipage}[c]{15cm}
1208     \includestruct{listati/msqid_ds.h}
1209   \end{minipage} 
1210   \normalsize 
1211   \caption{La struttura \structd{msqid\_ds}, associata a ciascuna coda di
1212     messaggi.}
1213   \label{fig:ipc_msqid_ds}
1214 \end{figure}
1215
1216 A ciascuna coda è associata una struttura \struct{msgid\_ds}, la cui
1217 definizione, è riportata in fig.~\ref{fig:ipc_msqid_ds}. In questa struttura il
1218 kernel mantiene le principali informazioni riguardo lo stato corrente della
1219 coda.\footnote{come accennato questo vale fino ai kernel della serie 2.2.x,
1220   essa viene usata nei kernel della serie 2.4.x solo per compatibilità in
1221   quanto è quella restituita dalle funzioni dell'interfaccia.  Si noti come ci
1222   sia una differenza con i campi mostrati nello schema di
1223   fig.~\ref{fig:ipc_mq_schema} che sono presi dalla definizione di
1224   \file{linux/msg.h}, e fanno riferimento alla definizione della omonima
1225   struttura usata nel kernel.} In fig.~\ref{fig:ipc_msqid_ds} sono elencati i
1226 campi significativi definiti in \file{sys/msg.h}, a cui si sono aggiunti gli
1227 ultimi tre campi che sono previsti dalla implementazione originale di System
1228 V, ma non dallo standard Unix98.
1229
1230 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1231 inizializzata, in particolare il campo \var{msg\_perm} viene inizializzato
1232 come illustrato in sez.~\ref{sec:ipc_sysv_access_control}, per quanto riguarda
1233 gli altri campi invece:
1234 \begin{itemize*}
1235 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1236   sulla coda, viene inizializzato a 0.
1237 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1238   rispettivamente il \acr{pid} dell'ultimo processo che ha inviato o ricevuto
1239   un messaggio sulla coda, sono inizializzati a 0.
1240 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1241   rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1242   messaggio sulla coda, sono inizializzati a 0.
1243 \item il campo \var{msg\_ctime}, che esprime il tempo di creazione della coda,
1244   viene inizializzato al tempo corrente.
1245 \item il campo \var{msg\_qbytes} che esprime la dimensione massima del
1246   contenuto della coda (in byte) viene inizializzato al valore preimpostato
1247   del sistema (\const{MSGMNB}).
1248 \item i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1249   primo e ultimo messaggio sono inizializzati a \val{NULL} e
1250   \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1251   inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1252   e non devono essere utilizzati da programmi in user space).
1253 \end{itemize*}
1254
1255 Una volta creata una coda di messaggi le operazioni di controllo vengono
1256 effettuate con la funzione \funcd{msgctl}, che (come le analoghe \func{semctl}
1257 e \func{shmctl}) fa le veci di quello che \func{ioctl} è per i file; il suo
1258 prototipo è:
1259 \begin{functions}
1260   \headdecl{sys/types.h} 
1261   \headdecl{sys/ipc.h} 
1262   \headdecl{sys/msg.h} 
1263   
1264   \funcdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1265   
1266   Esegue l'operazione specificata da \param{cmd} sulla coda \param{msqid}.
1267   
1268   \bodydesc{La funzione restituisce 0 in caso di successo o -1 in caso di
1269     errore, nel qual caso \var{errno} assumerà uno dei valori:
1270   \begin{errlist}
1271   \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma processo
1272     chiamante non ha i privilegi di lettura sulla coda.
1273   \item[\errcode{EIDRM}] La coda richiesta è stata cancellata.
1274   \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1275     il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1276     \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1277     amministratore.
1278   \end{errlist}
1279   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1280 }
1281 \end{functions}
1282
1283 La funzione permette di accedere ai valori della struttura \struct{msqid\_ds},
1284 mantenuta all'indirizzo \param{buf}, per la coda specificata
1285 dall'identificatore \param{msqid}. Il comportamento della funzione dipende dal
1286 valore dell'argomento \param{cmd}, che specifica il tipo di azione da
1287 eseguire; i valori possibili sono:
1288 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1289 \item[\const{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1290   struttura indicata da \param{buf}. Occorre avere il permesso di lettura
1291   sulla coda.
1292 \item[\const{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1293   effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1294   riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1295   funzioni di lettura o di scrittura sulla coda saranno svegliati ricevendo
1296   il medesimo errore. Questo comando può essere eseguito solo da un processo
1297   con user-ID effettivo corrispondente al creatore o al proprietario della
1298   coda, o all'amministratore.
1299 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1300   della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1301   essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1302   struttura \struct{msqid\_ds} puntata da \param{buf}.  Per modificare i valori
1303   di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid} occorre
1304   essere il proprietario o il creatore della coda, oppure l'amministratore; lo
1305   stesso vale per \var{msg\_qbytes}, ma l'amministratore ha la facoltà di
1306   incrementarne il valore a limiti superiori a \const{MSGMNB}.
1307 \end{basedescript}
1308
1309
1310 Una volta che si abbia a disposizione l'identificatore, per inviare un
1311 messaggio su una coda si utilizza la funzione \funcd{msgsnd}; il suo prototipo
1312 è:
1313 \begin{functions}
1314   \headdecl{sys/types.h} 
1315   \headdecl{sys/ipc.h} 
1316   \headdecl{sys/msg.h} 
1317   
1318   \funcdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int
1319     msgflg)} 
1320
1321   Invia un messaggio sulla coda \param{msqid}.
1322   
1323   \bodydesc{La funzione restituisce 0, e -1 in caso di errore, nel qual caso
1324     \var{errno} assumerà uno dei valori:
1325   \begin{errlist}
1326   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1327   \item[\errcode{EIDRM}] La coda è stata cancellata.
1328   \item[\errcode{EAGAIN}] Il messaggio non può essere inviato perché si è
1329   superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1330   sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1331   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
1332   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido, o un
1333     valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1334     maggiore di \const{MSGMAX}.
1335   \end{errlist}
1336   ed inoltre \errval{EFAULT} ed \errval{ENOMEM}.
1337 }
1338 \end{functions}
1339
1340 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1341 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1342 l'argomento \param{msgp}.  Quest'ultimo deve venire passato sempre come
1343 puntatore ad una struttura \struct{msgbuf} analoga a quella riportata in
1344 fig.~\ref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1345 messaggio.  La dimensione massima per il testo di un messaggio non può
1346 comunque superare il limite \const{MSGMAX}.
1347
1348 La struttura di fig.~\ref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1349 la definizione contenuta in \file{sys/msg.h} usa esplicitamente per il secondo
1350 campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini pratici.
1351 La sola cosa che conta è che la struttura abbia come primo membro un campo
1352 \var{mtype} come nell'esempio; esso infatti serve ad identificare il tipo di
1353 messaggio e deve essere sempre specificato come intero positivo di tipo
1354 \ctyp{long}.  Il campo \var{mtext} invece può essere di qualsiasi tipo e
1355 dimensione, e serve a contenere il testo del messaggio.
1356
1357 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1358 ridefinire una struttura simile a quella di fig.~\ref{fig:ipc_msbuf}, adattando
1359 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1360 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1361 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1362 indica il tipo.
1363
1364 Si tenga presente che la lunghezza che deve essere indicata in questo
1365 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1366 cioè \var{message} è una propria struttura che si passa alla funzione,
1367 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1368 consideriamo il caso dell'esempio in fig.~\ref{fig:ipc_msbuf}, \param{msgsz}
1369 dovrà essere pari a \const{LENGTH}).
1370
1371 \begin{figure}[!htb]
1372   \footnotesize \centering
1373   \begin{minipage}[c]{15cm}
1374     \includestruct{listati/msgbuf.h}
1375   \end{minipage} 
1376   \normalsize 
1377   \caption{Schema della struttura \structd{msgbuf}, da utilizzare come
1378     argomento per inviare/ricevere messaggi.}
1379   \label{fig:ipc_msbuf}
1380 \end{figure}
1381
1382 Per capire meglio il funzionamento della funzione riprendiamo in
1383 considerazione la struttura della coda illustrata in
1384 fig.~\ref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo messaggio
1385 sarà aggiunto in fondo alla lista inserendo una nuova struttura \struct{msg},
1386 il puntatore \var{msg\_last} di \struct{msqid\_ds} verrà aggiornato, come pure
1387 il puntatore al messaggio successivo per quello che era il precedente ultimo
1388 messaggio; il valore di \var{mtype} verrà mantenuto in \var{msg\_type} ed il
1389 valore di \param{msgsz} in \var{msg\_ts}; il testo del messaggio sarà copiato
1390 all'indirizzo specificato da \var{msg\_spot}.
1391
1392 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1393 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1394 ritorna immediatamente a meno che si sia ecceduto il valore di
1395 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1396 caso si blocca mandando il processo in stato di \textit{sleep}.  Se si
1397 specifica per \param{flag} il valore \const{IPC\_NOWAIT} la funzione opera in
1398 modalità non bloccante, ed in questi casi ritorna immediatamente con un errore
1399 di \errcode{EAGAIN}.
1400
1401 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1402 che non si liberano risorse sufficienti per poter inserire nella coda il
1403 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare, con
1404 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1405 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1406 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1407
1408 Una volta completato con successo l'invio del messaggio sulla coda, la
1409 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1410 vengono modificati:
1411 \begin{itemize*}
1412 \item Il valore di \var{msg\_lspid}, che viene impostato al \acr{pid} del
1413   processo chiamante.
1414 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1415 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1416 \end{itemize*}
1417
1418 La funzione che viene utilizzata per estrarre un messaggio da una coda è
1419 \funcd{msgrcv}; il suo prototipo è:
1420 \begin{functions}
1421   \headdecl{sys/types.h} 
1422   \headdecl{sys/ipc.h} 
1423   \headdecl{sys/msg.h} 
1424
1425   \funcdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1426     long msgtyp, int msgflg)}
1427   
1428   Legge un messaggio dalla coda \param{msqid}.
1429   
1430   \bodydesc{La funzione restituisce il numero di byte letti in caso di
1431     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà uno
1432     dei valori:
1433   \begin{errlist}
1434   \item[\errcode{EACCES}] Non si hanno i privilegi di accesso sulla coda.
1435   \item[\errcode{EIDRM}] La coda è stata cancellata.
1436   \item[\errcode{E2BIG}] Il testo del messaggio è più lungo di \param{msgsz} e
1437     non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1438   \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale mentre
1439     era in attesa di ricevere un messaggio.
1440   \item[\errcode{EINVAL}] Si è specificato un \param{msgid} invalido o un
1441     valore di \param{msgsz} negativo.
1442   \end{errlist}
1443   ed inoltre \errval{EFAULT}.
1444 }
1445 \end{functions}
1446
1447 La funzione legge un messaggio dalla coda specificata, scrivendolo sulla
1448 struttura puntata da \param{msgp}, che dovrà avere un formato analogo a quello
1449 di fig.~\ref{fig:ipc_msbuf}.  Una volta estratto, il messaggio sarà rimosso
1450 dalla coda.  L'argomento \param{msgsz} indica la lunghezza massima del testo
1451 del messaggio (equivalente al valore del parametro \const{LENGTH} nell'esempio
1452 di fig.~\ref{fig:ipc_msbuf}).
1453
1454 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1455 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1456 \const{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1457 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1458 un errore di \errcode{E2BIG}.
1459
1460 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1461 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1462 una scansione della struttura mostrata in fig.~\ref{fig:ipc_mq_schema},
1463 restituendo il primo messaggio incontrato che corrisponde ai criteri
1464 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1465 coda, è quello meno recente); in particolare:
1466 \begin{itemize}
1467 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1468   quello fra i presenti che è stato inserito per primo. 
1469 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1470   tipo (il valore del campo \var{mtype}) corrisponde al valore di
1471   \param{msgtyp}.
1472 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1473   il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1474   inferiore al valore assoluto di \param{msgtyp}.
1475 \end{itemize}
1476
1477 Il valore di \param{msgflg} permette di controllare il comportamento della
1478 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1479 valori.  Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1480 valori: \const{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1481 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1482 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1483 ci sono messaggi sulla coda.
1484
1485 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1486 disponibili per la lettura, è di bloccare il processo in stato di
1487 \textit{sleep}. Nel caso però si sia specificato \const{IPC\_NOWAIT} la
1488 funzione ritorna immediatamente con un errore \errcode{ENOMSG}. Altrimenti la
1489 funzione ritorna normalmente non appena viene inserito un messaggio del tipo
1490 desiderato, oppure ritorna con errore qualora la coda sia rimossa (con
1491 \var{errno} impostata a \errcode{EIDRM}) o se il processo viene interrotto da
1492 un segnale (con \var{errno} impostata a \errcode{EINTR}).
1493
1494 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1495 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1496 vengono modificati:
1497 \begin{itemize*}
1498 \item Il valore di \var{msg\_lrpid}, che viene impostato al \acr{pid} del
1499   processo chiamante.
1500 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1501 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1502 \end{itemize*}
1503
1504 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1505 SysV IPC; essendo questi permanenti restano nel sistema occupando risorse
1506 anche quando un processo è terminato, al contrario delle pipe per le quali
1507 tutte le risorse occupate vengono rilasciate quanto l'ultimo processo che le
1508 utilizzava termina. Questo comporta che in caso di errori si può saturare il
1509 sistema, e che devono comunque essere esplicitamente previste delle funzioni
1510 di rimozione in caso di interruzioni o uscite dal programma (come vedremo in
1511 fig.~\ref{fig:ipc_mq_fortune_server}).
1512
1513 L'altro problema è non facendo uso di file descriptor le tecniche di
1514 \textit{I/O multiplexing} descritte in sez.~\ref{sec:file_multiplexing} non
1515 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1516 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1517 una di queste strutture alla volta; ad esempio non si può scrivere un server
1518 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1519 di \textit{polling}\index{\textit{polling}} che esegua un ciclo di attesa su
1520 ciascuna di esse.
1521
1522 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1523 server di \textit{fortunes} usando queste al posto delle fifo. In questo caso
1524 useremo una sola coda di messaggi, usando il tipo di messaggio per comunicare
1525 in maniera indipendente con client diversi.
1526
1527 \begin{figure}[!bht]
1528   \footnotesize \centering
1529   \begin{minipage}[c]{15.6cm}
1530     \includecodesample{listati/MQFortuneServer.c}
1531   \end{minipage} 
1532   \normalsize 
1533   \caption{Sezione principale del codice del server di \textit{fortunes}
1534     basato sulle \textit{message queue}.}
1535   \label{fig:ipc_mq_fortune_server}
1536 \end{figure}
1537
1538 In fig.~\ref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1539 principali del codice del nuovo server (il codice completo è nel file
1540 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1541 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1542 per permettere una comunicazione indipendente fra il server ed i vari client,
1543 usando il \acr{pid} di questi ultimi come identificativo. Questo è possibile
1544 in quanto, al contrario di una fifo, la lettura di una coda di messaggi può
1545 non essere sequenziale, proprio grazie alla classificazione dei messaggi sulla
1546 base del loro tipo.
1547
1548 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1549 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1550 definisce due strutture appositamente per la comunicazione; con
1551 \var{msgbuf\_read} (\texttt{\small 8--11}) vengono passate le richieste mentre
1552 con \var{msgbuf\_write} (\texttt{\small 12--15}) vengono restituite le frasi.
1553
1554 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1555 in \var{n} il numero di frasi da leggere specificato a linea di comando ed in
1556 \var{fortunefilename} il file da cui leggerle; dopo aver installato
1557 (\texttt{\small 19--21}) i gestori dei segnali per trattare l'uscita dal
1558 server, viene prima controllato (\texttt{\small 22}) il numero di frasi
1559 richieste abbia senso (cioè sia maggiore di zero), le quali poi
1560 (\texttt{\small 23}) vengono lette nel vettore in memoria con la stessa
1561 funzione \code{FortuneParse} usata anche per il server basato sulle fifo.
1562
1563 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1564 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1565 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1566 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1567 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1568 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1569 programma (\texttt{\small 27--29}) in caso di errore.
1570
1571 Finita la fase di inizializzazione il server prima (\texttt{\small 32}) chiama
1572 la funzione \func{daemon} per andare in background e poi esegue in permanenza
1573 il ciclo principale (\texttt{\small 33--40}). Questo inizia (\texttt{\small
1574   34}) con il porsi in attesa di un messaggio di richiesta da parte di un
1575 client; si noti infatti come \func{msgrcv} richieda un messaggio con
1576 \var{mtype} uguale a 1: questo è il valore usato per le richieste dato che
1577 corrisponde al \acr{pid} di \cmd{init}, che non può essere un client. L'uso
1578 del flag \const{MSG\_NOERROR} è solo per sicurezza, dato che i messaggi di
1579 richiesta sono di dimensione fissa (e contengono solo il \acr{pid} del
1580 client).
1581
1582 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1583 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1584 di richiesta da parte di un client, in tal caso il ciclo prosegue
1585 (\texttt{\small 35}) selezionando una frase a caso, copiandola (\texttt{\small
1586   36}) nella struttura \var{msgbuf\_write} usata per la risposta e
1587 calcolandone (\texttt{\small 37}) la dimensione.
1588
1589 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1590 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 38})
1591 al valore del \acr{pid} del client ricevuto nel messaggio di richiesta.
1592 L'ultimo passo del ciclo (\texttt{\small 39}) è inviare sulla coda il
1593 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1594 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1595
1596 Si noti che il programma può terminare solo grazie ad una interruzione da
1597 parte di un segnale; in tal caso verrà eseguito (\texttt{\small 45--48}) il
1598 gestore \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1599 (\texttt{\small 46}) ed ad uscire (\texttt{\small 47}).
1600
1601 \begin{figure}[!bht]
1602   \footnotesize \centering
1603   \begin{minipage}[c]{15.6cm}
1604     \includecodesample{listati/MQFortuneClient.c}
1605   \end{minipage} 
1606   \normalsize 
1607   \caption{Sezione principale del codice del client di \textit{fortunes}
1608     basato sulle \textit{message queue}.}
1609   \label{fig:ipc_mq_fortune_client}
1610 \end{figure}
1611
1612 In fig.~\ref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice
1613 del programma client.  Al solito il codice completo è con i sorgenti allegati,
1614 nel file \file{MQFortuneClient.c}.  Come sempre si sono rimosse le parti
1615 relative alla gestione delle opzioni, ed in questo caso, anche la
1616 dichiarazione delle variabili, che, per la parte relative alle strutture usate
1617 per la comunicazione tramite le code, sono le stesse viste in
1618 fig.~\ref{fig:ipc_mq_fortune_server}.
1619
1620 Il client in questo caso è molto semplice; la prima parte del programma
1621 (\texttt{\small 4--9}) si occupa di accedere alla coda di messaggi, ed è
1622 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1623 non viene chiamata con il flag di creazione in quanto la coda deve essere
1624 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1625 il programma termina immediatamente. 
1626
1627 Una volta acquisito l'identificatore della coda il client compone il
1628 messaggio di richiesta (\texttt{\small 12--13}) in \var{msg\_read}, usando 1
1629 per il tipo ed inserendo il proprio \acr{pid} come dato da passare al server.
1630 Calcolata (\texttt{\small 14}) la dimensione, provvede (\texttt{\small 15}) ad
1631 immettere la richiesta sulla coda. 
1632
1633 A questo punto non resta che (\texttt{\small 16}) rileggere dalla coda la
1634 risposta del server richiedendo a \func{msgrcv} di selezionare i messaggi di
1635 tipo corrispondente al valore del \acr{pid} inviato nella richiesta. L'ultimo
1636 passo (\texttt{\small 17}) prima di uscire è quello di stampare a video il
1637 messaggio ricevuto.
1638  
1639 Proviamo allora il nostro nuovo sistema, al solito occorre definire
1640 \code{LD\_LIBRAY\_PATH} per accedere alla libreria \file{libgapil.so}, dopo di
1641 che, in maniera del tutto analoga a quanto fatto con il programma che usa le
1642 fifo, potremo far partire il server con:
1643 \begin{verbatim}
1644 [piccardi@gont sources]$ ./mqfortuned -n10
1645 \end{verbatim}%$
1646 come nel caso precedente, avendo eseguito il server in background, il comando
1647 ritornerà immediatamente; potremo però verificare con \cmd{ps} che il
1648 programma è effettivamente in esecuzione, e che ha creato una coda di
1649 messaggi:
1650 \begin{verbatim}
1651 [piccardi@gont sources]$ ipcs
1652
1653 ------ Shared Memory Segments --------
1654 key        shmid      owner      perms      bytes      nattch     status      
1655
1656 ------ Semaphore Arrays --------
1657 key        semid      owner      perms      nsems     
1658
1659 ------ Message Queues --------
1660 key        msqid      owner      perms      used-bytes   messages    
1661 0x0102dc6a 0          piccardi   666        0            0           
1662 \end{verbatim}
1663 a questo punto potremo usare il client per ottenere le nostre frasi:
1664 \begin{verbatim}
1665 [piccardi@gont sources]$ ./mqfortune
1666 Linux ext2fs has been stable for a long time, now it's time to break it
1667         -- Linuxkongreß '95 in Berlin
1668 [piccardi@gont sources]$ ./mqfortune
1669 Let's call it an accidental feature.
1670         --Larry Wall
1671 \end{verbatim}
1672 con un risultato del tutto equivalente al precedente. Infine potremo chiudere
1673 il server inviando il segnale di terminazione con il comando \code{killall
1674   mqfortuned} verificando che effettivamente la coda di messaggi viene rimossa.
1675
1676 Benché funzionante questa architettura risente dello stesso inconveniente
1677 visto anche nel caso del precedente server basato sulle fifo; se il client
1678 viene interrotto dopo l'invio del messaggio di richiesta e prima della lettura
1679 della risposta, quest'ultima resta nella coda (così come per le fifo si aveva
1680 il problema delle fifo che restavano nel filesystem). In questo caso però il
1681 problemi sono maggiori, sia perché è molto più facile esaurire la memoria
1682 dedicata ad una coda di messaggi che gli inode\index{inode} di un filesystem,
1683 sia perché, con il riutilizzo dei \acr{pid} da parte dei processi, un client
1684 eseguito in un momento successivo potrebbe ricevere un messaggio non
1685 indirizzato a lui.
1686
1687
1688
1689 \subsection{Semafori}
1690 \label{sec:ipc_sysv_sem}
1691
1692 I semafori non sono meccanismi di intercomunicazione diretta come quelli
1693 (pipe, fifo e code di messaggi) visti finora, e non consentono di scambiare
1694 dati fra processi, ma servono piuttosto come meccanismi di sincronizzazione o
1695 di protezione per le \textsl{sezioni critiche}\index{sezioni~critiche} del
1696 codice (si ricordi quanto detto in sez.~\ref{sec:proc_race_cond}). 
1697
1698 Un semaforo è uno speciale contatore, mantenuto nel kernel, che permette, a
1699 seconda del suo valore, di consentire o meno la prosecuzione dell'esecuzione
1700 di un programma. In questo modo l'accesso ad una risorsa condivisa da più
1701 processi può essere controllato, associando ad essa un semaforo che consente
1702 di assicurare che non più di un processo alla volta possa usarla.
1703
1704 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1705 assolutamente generico, così come del tutto generali sono modalità con cui lo
1706 si utilizza. Un processo che deve accedere ad una risorsa eseguirà un
1707 controllo del semaforo: se questo è positivo il suo valore sarà decrementato,
1708 indicando che si è consumato una unità della risorsa, ed il processo potrà
1709 proseguire nell'utilizzo di quest'ultima, provvedendo a rilasciarla, una volta
1710 completate le operazioni volute, reincrementando il semaforo.
1711
1712 Se al momento del controllo il valore del semaforo è nullo, siamo invece in
1713 una situazione in cui la risorsa non è disponibile, ed il processo si
1714 bloccherà in stato di \textit{sleep} fin quando chi la sta utilizzando non la
1715 rilascerà, incrementando il valore del semaforo. Non appena il semaforo torna
1716 positivo, indicando che la risorsa è disponibile, il processo sarà svegliato,
1717 e si potrà operare come nel caso precedente (decremento del semaforo, accesso
1718 alla risorsa, incremento del semaforo).
1719
1720 Per poter implementare questo tipo di logica le operazioni di controllo e
1721 decremento del contatore associato al semaforo devono essere atomiche,
1722 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1723 demandata al kernel. La forma più semplice di semaforo è quella del
1724 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1725 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1726 della risorsa; in generale però si possono usare semafori con valori interi,
1727 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1728 ancora disponibili.
1729
1730 Il sistema di comunicazione inter-processo di \textit{SysV IPC} prevede anche i
1731 semafori, ma gli oggetti utilizzati non sono semafori singoli, ma gruppi di
1732 semafori detti \textsl{insiemi} (o \textit{semaphore set}); la funzione che
1733 permette di creare o ottenere l'identificatore di un insieme di semafori è
1734 \funcd{semget}, ed il suo prototipo è:
1735 \begin{functions}
1736   \headdecl{sys/types.h} 
1737   \headdecl{sys/ipc.h} 
1738   \headdecl{sys/sem.h} 
1739   
1740   \funcdecl{int semget(key\_t key, int nsems, int flag)}
1741   
1742   Restituisce l'identificatore di un insieme di semafori.
1743   
1744   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
1745     in caso di errore, nel qual caso \var{errno} assumerà i valori:
1746     \begin{errlist}
1747     \item[\errcode{ENOSPC}] Si è cercato di creare una insieme di semafori
1748       quando è stato superato o il limite per il numero totale di semafori
1749       (\const{SEMMNS}) o quello per il numero totale degli insiemi
1750       (\const{SEMMNI}) nel sistema.
1751     \item[\errcode{EINVAL}] L'argomento \param{nsems} è minore di zero o
1752       maggiore del limite sul numero di semafori per ciascun insieme
1753       (\const{SEMMSL}), o se l'insieme già esiste, maggiore del numero di
1754       semafori che contiene.
1755     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
1756       contenere le strutture per un nuovo insieme di semafori.
1757     \end{errlist}
1758     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
1759     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
1760 \end{functions}
1761
1762 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1763 restituisce l'identificatore di un insieme di semafori, in particolare è
1764 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1765 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
1766 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1767 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1768 richiesta dell'identificatore di un insieme già esistente.
1769
1770 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1771 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1772 se ne deve creare per forza un insieme.  Ma questa in definitiva è solo una
1773 complicazione inutile, il problema è che i semafori del \textit{SysV IPC}
1774 soffrono di altri due, ben più gravi, difetti.
1775
1776 Il primo difetto è che non esiste una funzione che permetta di creare ed
1777 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1778 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1779 perde così ogni possibilità di eseguire l'operazione atomicamente.
1780
1781 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1782 \textit{SysV IPC} di essere risorse globali di sistema, che non vengono
1783 cancellate quando nessuno le usa più; ci si così a trova a dover affrontare
1784 esplicitamente il caso in cui un processo termina per un qualche errore,
1785 lasciando un semaforo occupato, che resterà tale fino al successivo riavvio
1786 del sistema. Come vedremo esistono delle modalità per evitare tutto ciò, ma
1787 diventa necessario indicare esplicitamente che si vuole il ripristino del
1788 semaforo all'uscita del processo.
1789
1790
1791 \begin{figure}[!htb]
1792   \footnotesize \centering
1793   \begin{minipage}[c]{15cm}
1794     \includestruct{listati/semid_ds.h}
1795   \end{minipage} 
1796   \normalsize 
1797   \caption{La struttura \structd{semid\_ds}, associata a ciascun insieme di
1798     semafori.}
1799   \label{fig:ipc_semid_ds}
1800 \end{figure}
1801
1802 A ciascun insieme di semafori è associata una struttura \struct{semid\_ds},
1803 riportata in fig.~\ref{fig:ipc_semid_ds}.\footnote{non si sono riportati i
1804   campi ad uso interno del kernel, che vedremo in
1805   fig.~\ref{fig:ipc_sem_schema}, che dipendono dall'implementazione.} Come nel
1806 caso delle code di messaggi quando si crea un nuovo insieme di semafori con
1807 \func{semget} questa struttura viene inizializzata, in particolare il campo
1808 \var{sem\_perm} viene inizializzato come illustrato in
1809 sez.~\ref{sec:ipc_sysv_access_control} (si ricordi che in questo caso il
1810 permesso di scrittura è in realtà permesso di alterare il semaforo), per
1811 quanto riguarda gli altri campi invece:
1812 \begin{itemize*}
1813 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
1814   nell'insieme, viene inizializzato al valore di \param{nsems}.
1815 \item il campo \var{sem\_ctime}, che esprime il tempo di creazione
1816   dell'insieme, viene inizializzato al tempo corrente.
1817 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
1818   effettuata, viene inizializzato a zero.
1819 \end{itemize*}
1820
1821
1822 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
1823 \struct{sem} che ne contiene i dati essenziali, la sua definizione\footnote{si
1824   è riportata la definizione originaria del kernel 1.0, che contiene la prima
1825   realizzazione del \textit{SysV IPC} in Linux. In realtà questa struttura
1826   ormai è ridotta ai soli due primi membri, e gli altri vengono calcolati
1827   dinamicamente. La si è utilizzata a scopo di esempio, perché indica tutti i
1828   valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
1829   citati dalle pagine di manuale.} è riportata in fig.~\ref{fig:ipc_sem}.
1830 Questa struttura, non è accessibile in user space, ma i valori in essa
1831 specificati possono essere letti in maniera indiretta, attraverso l'uso delle
1832 funzioni di controllo.
1833
1834 \begin{figure}[!htb]
1835   \footnotesize \centering
1836   \begin{minipage}[c]{15cm}
1837     \includestruct{listati/sem.h}
1838   \end{minipage} 
1839   \normalsize 
1840   \caption{La struttura \structd{sem}, che contiene i dati di un singolo
1841     semaforo.} 
1842   \label{fig:ipc_sem}
1843 \end{figure}
1844
1845 I dati mantenuti nella struttura, ed elencati in fig.~\ref{fig:ipc_sem},
1846 indicano rispettivamente:
1847 \begin{description*}
1848 \item[\var{semval}] il valore numerico del semaforo.
1849 \item[\var{sempid}] il \acr{pid} dell'ultimo processo che ha eseguito una
1850   operazione sul semaforo.
1851 \item[\var{semncnt}] il numero di processi in attesa che esso venga
1852   incrementato.
1853 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
1854 \end{description*}
1855
1856 \begin{table}[htb]
1857   \footnotesize
1858   \centering
1859   \begin{tabular}[c]{|c|r|p{8cm}|}
1860     \hline
1861     \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
1862     \hline
1863     \hline
1864     \const{SEMMNI}&          128 & Numero massimo di insiemi di semafori. \\
1865     \const{SEMMSL}&          250 & Numero massimo di semafori per insieme.\\
1866     \const{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
1867                                    nel sistema .\\
1868     \const{SEMVMX}&        32767 & Massimo valore per un semaforo.\\
1869     \const{SEMOPM}&           32 & Massimo numero di operazioni per chiamata a
1870                                    \func{semop}. \\
1871     \const{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
1872     \const{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
1873     \const{SEMAEM}&\const{SEMVMX}& valore massimo per l'aggiustamento
1874                                    all'uscita. \\
1875     \hline
1876   \end{tabular}
1877   \caption{Valori delle costanti associate ai limiti degli insiemi di
1878     semafori, definite in \file{linux/sem.h}.} 
1879   \label{tab:ipc_sem_limits}
1880 \end{table}
1881
1882 Come per le code di messaggi anche per gli insiemi di semafori esistono una
1883 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
1884 sono riportate in tab.~\ref{tab:ipc_sem_limits}. Alcuni di questi limiti sono
1885 al solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
1886 direttamente nel file \file{/proc/sys/kernel/sem}.
1887
1888 La funzione che permette di effettuare le varie operazioni di controllo sui
1889 semafori (fra le quali, come accennato, è impropriamente compresa anche la
1890 loro inizializzazione) è \funcd{semctl}; il suo prototipo è:
1891 \begin{functions}
1892   \headdecl{sys/types.h} 
1893   \headdecl{sys/ipc.h} 
1894   \headdecl{sys/sem.h} 
1895   
1896   \funcdecl{int semctl(int semid, int semnum, int cmd)}
1897   \funcdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
1898   
1899   Esegue le operazioni di controllo su un semaforo o un insieme di semafori.
1900   
1901   \bodydesc{La funzione restituisce in caso di successo un valore positivo
1902     quanto usata con tre argomenti ed un valore nullo quando usata con
1903     quattro. In caso di errore restituisce -1, ed \var{errno} assumerà uno dei
1904     valori:
1905     \begin{errlist}
1906     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
1907       l'operazione richiesta.
1908     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
1909     \item[\errcode{EPERM}] Si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
1910       ma il processo non ha privilegi sufficienti ad eseguire l'operazione.
1911     \item[\errcode{ERANGE}] Si è richiesto \const{SETALL} \const{SETVAL} ma il
1912       valore a cui si vuole impostare il semaforo è minore di zero o maggiore
1913       di \const{SEMVMX}.
1914   \end{errlist}
1915   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
1916 }
1917 \end{functions}
1918
1919 La funzione può avere tre o quattro parametri, a seconda dell'operazione
1920 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
1921 \param{semid} o sul singolo semaforo di un insieme, specificato da
1922 \param{semnum}. 
1923
1924 \begin{figure}[!htb]
1925   \footnotesize \centering
1926   \begin{minipage}[c]{15cm}
1927     \includestruct{listati/semun.h}
1928   \end{minipage} 
1929   \normalsize 
1930   \caption{La definizione dei possibili valori di una \direct{union}
1931     \structd{semun}, usata come quarto argomento della funzione
1932     \func{semctl}.}
1933   \label{fig:ipc_semun}
1934 \end{figure}
1935
1936 Qualora la funzione operi con quattro argomenti \param{arg} è un argomento
1937 generico, che conterrà un dato diverso a seconda dell'azione richiesta; per
1938 unificare l'argomento esso deve essere passato come una \struct{semun}, la cui
1939 definizione, con i possibili valori che può assumere, è riportata in
1940 fig.~\ref{fig:ipc_semun}.
1941
1942 Come già accennato sia il comportamento della funzione che il numero di
1943 parametri con cui deve essere invocata, dipendono dal valore dell'argomento
1944 \param{cmd}, che specifica l'azione da intraprendere; i valori validi (che
1945 cioè non causano un errore di \errcode{EINVAL}) per questo argomento sono i
1946 seguenti:
1947 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
1948 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiando il
1949   contenuto della relativa struttura \struct{semid\_ds} all'indirizzo
1950   specificato con \var{arg.buf}. Occorre avere il permesso di lettura.
1951   L'argomento \param{semnum} viene ignorato.
1952 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
1953   dati, con effetto immediato. Tutti i processi che erano stato di
1954   \textit{sleep} vengono svegliati, ritornando con un errore di
1955   \errcode{EIDRM}.  L'user-ID effettivo del processo deve corrispondere o al
1956   creatore o al proprietario dell'insieme, o all'amministratore. L'argomento
1957   \param{semnum} viene ignorato.
1958 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1959   dell'insieme. I valori devono essere passati in una struttura
1960   \struct{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto i
1961   campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
1962   significativi di \var{sem\_perm.mode}. L'user-ID effettivo del processo deve
1963   corrispondere o al creatore o al proprietario dell'insieme, o
1964   all'amministratore.  L'argomento \param{semnum} viene ignorato.
1965 \item[\const{GETALL}] Restituisce il valore corrente di ciascun semaforo
1966   dell'insieme (corrispondente al campo \var{semval} di \struct{sem}) nel
1967   vettore indicato da \param{arg.array}. Occorre avere il permesso di lettura.
1968   L'argomento \param{semnum} viene ignorato.
1969 \item[\const{GETNCNT}] Restituisce come valore di ritorno della funzione il
1970   numero di processi in attesa che il semaforo \param{semnum} dell'insieme
1971   \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
1972   \struct{sem}); va invocata con tre argomenti.  Occorre avere il permesso di
1973   lettura.
1974 \item[\const{GETPID}] Restituisce come valore di ritorno della funzione il
1975   \acr{pid} dell'ultimo processo che ha compiuto una operazione sul semaforo
1976   \param{semnum} dell'insieme \param{semid} (corrispondente al campo
1977   \var{sempid} di \struct{sem}); va invocata con tre argomenti.  Occorre avere
1978   il permesso di lettura.
1979 \item[\const{GETVAL}] Restituisce come valore di ritorno della funzione il il
1980   valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
1981   (corrispondente al campo \var{semval} di \struct{sem}); va invocata con tre
1982   argomenti.  Occorre avere il permesso di lettura.
1983 \item[\const{GETZCNT}] Restituisce come valore di ritorno della funzione il
1984   numero di processi in attesa che il valore del semaforo \param{semnum}
1985   dell'insieme \param{semid} diventi nullo (corrispondente al campo
1986   \var{semncnt} di \struct{sem}); va invocata con tre argomenti.  Occorre avere
1987   il permesso di lettura.
1988 \item[\const{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
1989   aggiornando il campo \var{sem\_ctime} di \struct{semid\_ds}. I valori devono
1990   essere passati nel vettore indicato da \param{arg.array}.  Si devono avere i
1991   privilegi di scrittura sul semaforo.  L'argomento \param{semnum} viene
1992   ignorato.
1993 \item[\const{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
1994   dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
1995   \struct{semid\_ds}.  Si devono avere i privilegi di scrittura sul semaforo.
1996 \end{basedescript}
1997
1998 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
1999 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2000 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2001 valore.  Inoltre la coda delle operazioni di ripristino viene cancellata per
2002 tutti i semafori il cui valore viene modificato.
2003
2004 \begin{table}[htb]
2005   \footnotesize
2006   \centering
2007   \begin{tabular}[c]{|c|l|}
2008     \hline
2009     \textbf{Operazione}  & \textbf{Valore restituito} \\
2010     \hline
2011     \hline
2012     \const{GETNCNT}& valore di \var{semncnt}.\\
2013     \const{GETPID} & valore di \var{sempid}.\\
2014     \const{GETVAL} & valore di \var{semval}.\\
2015     \const{GETZCNT}& valore di \var{semzcnt}.\\
2016     \hline
2017   \end{tabular}
2018   \caption{Valori di ritorno della funzione \func{semctl}.} 
2019   \label{tab:ipc_semctl_returns}
2020 \end{table}
2021
2022 Il valore di ritorno della funzione in caso di successo dipende
2023 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2024 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2025 tab.~\ref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2026 corrispondente al campo della struttura \struct{sem} indicato nella seconda
2027 colonna della tabella.
2028
2029 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2030 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2031 vengono effettuate con la funzione \funcd{semop}, il cui prototipo è:
2032 \begin{functions}
2033   \headdecl{sys/types.h} 
2034   \headdecl{sys/ipc.h} 
2035   \headdecl{sys/sem.h} 
2036   
2037   \funcdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2038   
2039   Esegue le operazioni ordinarie su un semaforo o un insieme di semafori.
2040   
2041   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2042     errore, nel qual caso \var{errno} assumerà uno dei valori:
2043     \begin{errlist}
2044     \item[\errcode{EACCES}] Il processo non ha i privilegi per eseguire
2045       l'operazione richiesta.
2046     \item[\errcode{EIDRM}] L'insieme di semafori è stato cancellato.
2047     \item[\errcode{ENOMEM}] Si è richiesto un \const{SEM\_UNDO} ma il sistema
2048       non ha le risorse per allocare la struttura di ripristino.
2049     \item[\errcode{EAGAIN}] Un'operazione comporterebbe il blocco del processo,
2050       ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2051     \item[\errcode{EINTR}] La funzione, bloccata in attesa dell'esecuzione
2052       dell'operazione, viene interrotta da un segnale.
2053     \item[\errcode{E2BIG}] L'argomento \param{nsops} è maggiore del numero
2054       massimo di operazioni \const{SEMOPM}.
2055     \item[\errcode{ERANGE}] Per alcune operazioni il valore risultante del
2056       semaforo viene a superare il limite massimo \const{SEMVMX}.
2057   \end{errlist}
2058   ed inoltre \errval{EFAULT} ed \errval{EINVAL}.
2059 }
2060 \end{functions}
2061
2062 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2063 un insieme. La funzione richiede come primo argomento l'identificatore
2064 \param{semid} dell'insieme su cui si vuole operare. Il numero di operazioni da
2065 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2066 contenuto viene passato con un puntatore ad un vettore di strutture
2067 \struct{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2068 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante.
2069
2070 \begin{figure}[!htb]
2071   \footnotesize \centering
2072   \begin{minipage}[c]{15cm}
2073     \includestruct{listati/sembuf.h}
2074   \end{minipage} 
2075   \normalsize 
2076   \caption{La struttura \structd{sembuf}, usata per le operazioni sui
2077     semafori.}
2078   \label{fig:ipc_sembuf}
2079 \end{figure}
2080
2081 Il contenuto di ciascuna operazione deve essere specificato attraverso una
2082 opportuna struttura \struct{sembuf} (la cui definizione è riportata in
2083 fig.~\ref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2084 allocare in un opportuno vettore. La struttura permette di indicare il
2085 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2086 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2087 riferimento l'operazione; si ricordi che i semafori sono numerati come in un
2088 vettore, per cui il primo semaforo corrisponde ad un valore nullo di
2089 \var{sem\_num}.
2090
2091 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2092 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2093 \const{SEM\_UNDO}.  Impostando \const{IPC\_NOWAIT} si fa si che, invece di
2094 bloccarsi (in tutti quei casi in cui l'esecuzione di una operazione richiede
2095 che il processo vada in stato di \textit{sleep}), \func{semop} ritorni
2096 immediatamente con un errore di \errcode{EAGAIN}.  Impostando \const{SEM\_UNDO}
2097 si richiede invece che l'operazione venga registrata in modo che il valore del
2098 semaforo possa essere ripristinato all'uscita del processo.
2099
2100 Infine \var{sem\_op} è il campo che controlla l'operazione che viene eseguita
2101 e determina il comportamento della chiamata a \func{semop}; tre sono i casi
2102 possibili:
2103 \begin{basedescript}{\desclabelwidth{2.0cm}}
2104 \item[\var{sem\_op}$>0$] In questo caso il valore di \var{sem\_op} viene
2105   aggiunto al valore corrente di \var{semval}. La funzione ritorna
2106   immediatamente (con un errore di \errcode{ERANGE} qualora si sia superato il
2107   limite \const{SEMVMX}) ed il processo non viene bloccato in nessun caso.
2108   Specificando \const{SEM\_UNDO} si aggiorna il contatore per il ripristino
2109   del valore del semaforo. Al processo chiamante è richiesto il privilegio di
2110   alterazione (scrittura) sull'insieme di semafori.
2111   
2112 \item[\var{sem\_op}$=0$] Nel caso \var{semval} sia zero l'esecuzione procede
2113   immediatamente. Se \var{semval} è diverso da zero il comportamento è
2114   controllato da \var{sem\_flg}, se è stato impostato \const{IPC\_NOWAIT} la
2115   funzione ritorna con un errore di \errcode{EAGAIN}, altrimenti viene
2116   incrementato \var{semzcnt} di uno ed il processo resta in stato di
2117   \textit{sleep} fintanto che non si ha una delle condizioni seguenti:
2118   \begin{itemize*}
2119   \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2120     decrementato di uno.
2121   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop} ritorna
2122     un errore di \errcode{EIDRM}.
2123   \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2124     viene decrementato di uno e \func{semop} ritorna un errore di
2125     \errcode{EINTR}.
2126   \end{itemize*}
2127   Al processo chiamante è richiesto il privilegio di lettura dell'insieme dei
2128   semafori.
2129   
2130 \item[\var{sem\_op}$<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2131   valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2132   positiva o nulla) i valori vengono sommati e la funzione ritorna
2133   immediatamente; qualora si sia impostato \const{SEM\_UNDO} viene anche
2134   aggiornato il contatore per il ripristino del valore del semaforo. In caso
2135   contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2136   negativo) se si è impostato \const{IPC\_NOWAIT} la funzione ritorna con un
2137   errore di \errcode{EAGAIN}, altrimenti viene incrementato di uno
2138   \var{semncnt} ed il processo resta in stato di \textit{sleep} fintanto che
2139   non si ha una delle condizioni seguenti:
2140   \begin{itemize*}
2141   \item \var{semval} diventa maggiore o uguale del valore assoluto di
2142     \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2143     valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2144     impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2145     ripristino del valore del semaforo.
2146   \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2147     ritorna un errore di \errcode{EIDRM}.
2148   \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2149     viene decrementato di uno e \func{semop} ritorna un errore di
2150     \errcode{EINTR}.
2151   \end{itemize*}    
2152   Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2153   sull'insieme di semafori.
2154 \end{basedescript}
2155
2156 In caso di successo della funzione viene aggiornato il campo \var{sempid} per
2157 ogni semaforo modificato al valore del \acr{pid} del processo chiamante;
2158 inoltre vengono pure aggiornati al tempo corrente i campi \var{sem\_otime} e
2159 \var{sem\_ctime}.
2160
2161 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2162 semafori possono restare occupati, abbiamo visto come \func{semop} permetta di
2163 attivare un meccanismo di ripristino attraverso l'uso del flag
2164 \const{SEM\_UNDO}. Il meccanismo è implementato tramite una apposita struttura
2165 \struct{sem\_undo}, associata ad ogni processo per ciascun semaforo che esso
2166 ha modificato; all'uscita i semafori modificati vengono ripristinati, e le
2167 strutture disallocate.  Per mantenere coerente il comportamento queste
2168 strutture non vengono ereditate attraverso una \func{fork} (altrimenti si
2169 avrebbe un doppio ripristino), mentre passano inalterate nell'esecuzione di
2170 una \func{exec} (altrimenti non si avrebbe ripristino).
2171
2172 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2173 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2174 in maniera semplificata nello schema di fig.~\ref{fig:ipc_sem_schema}.  Si è
2175 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2176 semplice (ed illustrata in dettaglio in \cite{tlk}); nel kernel 2.4.x la
2177 struttura del \textit{SysV IPC} è stata modificata, ma le definizioni relative
2178 a queste strutture restano per compatibilità.\footnote{in particolare con le
2179   vecchie versioni delle librerie del C, come le libc5.}
2180
2181 \begin{figure}[htb]
2182   \centering \includegraphics[width=13cm]{img/semtruct}
2183   \caption{Schema della struttura di un insieme di semafori.}
2184   \label{fig:ipc_sem_schema}
2185 \end{figure}
2186
2187 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2188 \struct{semid\_ds} ed il relativo vettore di strutture \struct{sem}. Quando si
2189 richiede una operazione viene anzitutto verificato che tutte le operazioni
2190 possono avere successo; se una di esse comporta il blocco del processo il
2191 kernel crea una struttura \struct{sem\_queue} che viene aggiunta in fondo alla
2192 coda di attesa associata a ciascun insieme di semafori\footnote{che viene
2193   referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last}
2194   di \struct{semid\_ds}.}. 
2195
2196 Nella struttura viene memorizzato il riferimento alle operazioni richieste
2197 (nel campo \var{sops}, che è un puntatore ad una struttura \struct{sembuf}) e
2198 al processo corrente (nel campo \var{sleeper}) poi quest'ultimo viene messo
2199 stato di attesa e viene invocato lo scheduler\index{\textit{scheduler}} per
2200 passare all'esecuzione di un altro processo.
2201
2202 Se invece tutte le operazioni possono avere successo queste vengono eseguite
2203 immediatamente, dopo di che il kernel esegue una scansione della coda di
2204 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2205 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2206 struttura \struct{sem\_queue} viene rimossa e lo stato del processo associato
2207 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2208 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2209 svuotata la coda.  Per gestire il meccanismo del ripristino tutte le volte che
2210 per un'operazione si è specificato il flag \const{SEM\_UNDO} viene mantenuta
2211 per ciascun insieme di semafori una apposita struttura \struct{sem\_undo} che
2212 contiene (nel vettore puntato dal campo \var{semadj}) un valore di
2213 aggiustamento per ogni semaforo cui viene sommato l'opposto del valore usato
2214 per l'operazione.
2215
2216 Queste strutture sono mantenute in due liste,\footnote{rispettivamente
2217   attraverso i due campi \var{id\_next} e \var{proc\_next}.} una associata
2218 all'insieme di cui fa parte il semaforo, che viene usata per invalidare le
2219 strutture se questo viene cancellato o per azzerarle se si è eseguita una
2220 operazione con \func{semctl}; l'altra associata al processo che ha eseguito
2221 l'operazione;\footnote{attraverso il campo \var{semundo} di
2222   \struct{task\_struct}, come mostrato in \ref{fig:ipc_sem_schema}.} quando un
2223 processo termina, la lista ad esso associata viene scandita e le operazioni
2224 applicate al semaforo.  Siccome un processo può accumulare delle richieste di
2225 ripristino per semafori differenti chiamate attraverso diverse chiamate a
2226 \func{semop}, si pone il problema di come eseguire il ripristino dei semafori
2227 all'uscita del processo, ed in particolare se questo può essere fatto
2228 atomicamente.
2229
2230 Il punto è cosa succede quando una delle operazioni previste per il ripristino
2231 non può essere eseguita immediatamente perché ad esempio il semaforo è
2232 occupato; in tal caso infatti, se si pone il processo in stato di
2233 \textit{sleep} aspettando la disponibilità del semaforo (come faceva
2234 l'implementazione originaria) si perde l'atomicità dell'operazione. La scelta
2235 fatta dal kernel è pertanto quella di effettuare subito le operazioni che non
2236 prevedono un blocco del processo e di ignorare silenziosamente le altre;
2237 questo però comporta il fatto che il ripristino non è comunque garantito in
2238 tutte le occasioni.
2239
2240 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2241 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2242 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2243 riportato in fig.~\ref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2244 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2245 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2246 nullo per segnalarne l'indisponibilità. 
2247
2248 \begin{figure}[!bht]
2249   \footnotesize \centering
2250   \begin{minipage}[c]{15cm}
2251     \includecodesample{listati/Mutex.c}
2252   \end{minipage} 
2253   \normalsize 
2254   \caption{Il codice delle funzioni che permettono di creare o recuperare
2255     l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2256   \label{fig:ipc_mutex_create}
2257 \end{figure}
2258
2259 La prima funzione (\texttt{\small 2--15}) è \func{MutexCreate} che data una
2260 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2261 l'identificatore. Il primo passo (\texttt{\small 6}) è chiamare \func{semget}
2262 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2263 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2264 (\texttt{\small 7--9}) si ritorna subito il risultato di \func{semget},
2265 altrimenti (\texttt{\small 10}) si inizializza il semaforo chiamando
2266 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2267 \struct{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 4})
2268 ad 1 per significare che risorsa è libera. In caso di errore (\texttt{\small
2269   11--13}) si restituisce il valore di ritorno di \func{semctl}, altrimenti
2270 (\texttt{\small 14}) si ritorna l'identificatore del semaforo.
2271
2272 La seconda funzione (\texttt{\small 17--20}) è \func{MutexFind}, che, data una
2273 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2274 comprensione del suo funzionamento è immediata in quanto essa è soltanto un
2275 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2276   \textsl{involucro} alla chiamata di un altra, usata in genere per
2277   semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2278   stessa funzione diversi substrati (librerie, ecc.)  che possono fornire le
2279   stesse funzionalità.} di una chiamata a \func{semget} per cercare
2280 l'identificatore associato alla chiave, il valore di ritorno di quest'ultima
2281 viene passato all'indietro al chiamante.
2282
2283 La terza funzione (\texttt{\small 22--25}) è \func{MutexRead} che, dato un
2284 identificatore, restituisce il valore del semaforo associato al mutex. Anche
2285 in questo caso la funzione è un \textit{wrapper} per una chiamata a
2286 \func{semctl} con il comando \const{GETVAL}, che permette di restituire il
2287 valore del semaforo.
2288
2289 La quarta e la quinta funzione (\texttt{\small 36--44}) sono \func{MutexLock},
2290 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2291 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2292 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2293 (\texttt{\small 27--34}). Si noti come per queste ultime si sia fatto uso
2294 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2295 caso di terminazione imprevista del processo.
2296
2297 L'ultima funzione (\texttt{\small 46--49}) della serie, è \func{MutexRemove},
2298 che rimuove il mutex. Anche in questo caso si ha un wrapper per una chiamata a
2299 \func{semctl} con il comando \const{IPC\_RMID}, che permette di cancellare il
2300 semaforo; il valore di ritorno di quest'ultima viene passato all'indietro.
2301
2302 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2303 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2304 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2305 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2306 incrementato di uno, sbloccandolo qualora fosse bloccato.  
2307
2308 Si noti che occorre eseguire sempre prima \func{MutexLock} e poi
2309 \func{MutexUnlock}, perché se per un qualche errore si esegue più volte
2310 quest'ultima il valore del semaforo crescerebbe oltre 1, e \func{MutexLock}
2311 non avrebbe più l'effetto aspettato (bloccare la risorsa quando questa è
2312 considerata libera).  Infine si tenga presente che usare \func{MutexRead} per
2313 controllare il valore dei mutex prima di proseguire in una operazione di
2314 sblocco non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2315 Vedremo in sez.~\ref{sec:ipc_lock_file} come sia possibile ottenere
2316 un'interfaccia analoga a quella appena illustrata, senza incorrere in questi
2317 problemi, usando il file locking\index{file!locking}.
2318
2319
2320 \subsection{Memoria condivisa}
2321 \label{sec:ipc_sysv_shm}
2322
2323 Il terzo oggetto introdotto dal \textit{SysV IPC} è quello dei segmenti di
2324 memoria condivisa. La funzione che permette di ottenerne uno è \funcd{shmget},
2325 ed il suo prototipo è:
2326 \begin{functions}
2327   \headdecl{sys/types.h} 
2328   \headdecl{sys/ipc.h} 
2329   \headdecl{sys/shm.h}
2330   
2331   \funcdecl{int shmget(key\_t key, int size, int flag)}
2332   
2333   Restituisce l'identificatore di una memoria condivisa.
2334   
2335   \bodydesc{La funzione restituisce l'identificatore (un intero positivo) o -1
2336     in caso di errore, nel qual caso \var{errno} assumerà i valori:
2337     \begin{errlist}
2338     \item[\errcode{ENOSPC}] Si è superato il limite (\const{SHMMNI}) sul numero
2339       di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2340       cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2341       la memoria ad essi riservata.
2342     \item[\errcode{EINVAL}] Si è richiesta una dimensione per un nuovo segmento
2343       maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2344       già esiste \param{size} è maggiore delle sue dimensioni.
2345     \item[\errcode{ENOMEM}] Il sistema non ha abbastanza memoria per poter
2346       contenere le strutture per un nuovo segmento di memoria condivisa.
2347     \end{errlist}
2348     ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2349     \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2350 \end{functions}
2351
2352 La funzione, come \func{semget}, è del tutto analoga a \func{msgget}, ed
2353 identico è l'uso degli argomenti \param{key} e \param{flag} per cui non
2354 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
2355 \param{size} specifica invece la dimensione, in byte, del segmento, che viene
2356 comunque arrotondata al multiplo superiore di \const{PAGE\_SIZE}.
2357
2358 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2359 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2360 stessa sezione di memoria.  Pertanto non è necessaria nessuna operazione di
2361 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2362 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2363 dati in memoria.
2364
2365 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2366 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2367 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2368 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2369 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2370 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2371 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2372 altro processo. Per questo in genere la memoria condivisa viene sempre
2373 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2374 norma, significa insieme a dei semafori.
2375
2376 \begin{figure}[!htb]
2377   \footnotesize \centering
2378   \begin{minipage}[c]{15cm}
2379     \includestruct{listati/shmid_ds.h}
2380   \end{minipage} 
2381   \normalsize 
2382   \caption{La struttura \structd{shmid\_ds}, associata a ciascun segmento di
2383     memoria condivisa.}
2384   \label{fig:ipc_shmid_ds}
2385 \end{figure}
2386
2387 A ciascun segmento di memoria condivisa è associata una struttura
2388 \struct{shmid\_ds}, riportata in fig.~\ref{fig:ipc_shmid_ds}.  Come nel caso
2389 delle code di messaggi quando si crea un nuovo segmento di memoria condivisa
2390 con \func{shmget} questa struttura viene inizializzata, in particolare il
2391 campo \var{shm\_perm} viene inizializzato come illustrato in
2392 sez.~\ref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2393 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2394 invece:
2395 \begin{itemize}
2396 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2397   inizializzato al valore di \param{size}.
2398 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2399   segmento, viene inizializzato al tempo corrente.
2400 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2401   rispettivamente il tempo dell'ultima volta che il segmento è stato
2402   agganciato o sganciato da un processo, vengono inizializzati a zero.
2403 \item il campo \var{shm\_lpid}, che esprime il \acr{pid} del processo che ha
2404   eseguito l'ultima operazione, viene inizializzato a zero.
2405 \item il campo \var{shm\_cpid}, che esprime il \acr{pid} del processo che ha
2406   creato il segmento, viene inizializzato al \acr{pid} del processo chiamante.
2407 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2408   al segmento viene inizializzato a zero.
2409 \end{itemize}
2410
2411 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2412 di memoria condivisa esistono una serie di limiti imposti dal sistema.  Alcuni
2413 di questi limiti sono al solito accessibili e modificabili attraverso
2414 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2415 \file{/proc/sys/kernel/}. 
2416
2417 In tab.~\ref{tab:ipc_shm_limits} si sono riportate le
2418 costanti simboliche associate a ciascuno di essi, il loro significato, i
2419 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2420 che permettono di cambiarne il valore. 
2421
2422
2423 \begin{table}[htb]
2424   \footnotesize
2425   \centering
2426   \begin{tabular}[c]{|c|r|c|p{7cm}|}
2427     \hline
2428     \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2429     & \textbf{Significato} \\
2430     \hline
2431     \hline
2432     \const{SHMALL}& 0x200000&\file{shmall}& Numero massimo di pagine che 
2433                                        possono essere usate per i segmenti di
2434                                        memoria condivisa. \\
2435     \const{SHMMAX}&0x2000000&\file{shmmax}& Dimensione massima di un segmento 
2436                                             di memoria condivisa.\\
2437     \const{SHMMNI}&     4096&\file{msgmni}& Numero massimo di segmenti di 
2438                                             memoria condivisa presenti nel
2439                                             kernel.\\ 
2440     \const{SHMMIN}&        1& ---         & Dimensione minima di un segmento di
2441                                             memoria condivisa. \\
2442     \const{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2443                                             minime di un segmento (deve essere
2444                                             allineato alle dimensioni di una
2445                                             pagina di memoria). \\
2446     \const{SHMSEG}&   ---   &     ---     & Numero massimo di segmenti di
2447                                             memoria condivisa 
2448                                             per ciascun processo.\\
2449
2450
2451     \hline
2452   \end{tabular}
2453   \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2454     condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2455     valore preimpostato presente nel sistema.} 
2456   \label{tab:ipc_shm_limits}
2457 \end{table}
2458
2459 Al solito la funzione che permette di effettuare le operazioni di controllo su
2460 un segmento di memoria condivisa è \funcd{shmctl}; il suo prototipo è:
2461 \begin{functions}
2462   \headdecl{sys/ipc.h} 
2463   \headdecl{sys/shm.h}
2464   
2465   \funcdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2466   
2467   Esegue le operazioni di controllo su un segmento di memoria condivisa.
2468   
2469   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
2470     errore, nel qual caso \var{errno} assumerà i valori:
2471     \begin{errlist}
2472     \item[\errcode{EACCES}] Si è richiesto \const{IPC\_STAT} ma i permessi non
2473       consentono l'accesso in lettura al segmento.
2474     \item[\errcode{EINVAL}] O \param{shmid} non è un identificatore valido o
2475       \param{cmd} non è un comando valido.
2476     \item[\errcode{EIDRM}] L'argomento \param{shmid} fa riferimento ad un
2477       segmento che è stato cancellato.
2478     \item[\errcode{EPERM}] Si è specificato un comando con \const{IPC\_SET} o
2479       \const{IPC\_RMID} senza i permessi necessari.
2480     \item[\errcode{EOVERFLOW}] Si è tentato il comando \const{IPC\_STAT} ma il
2481       valore del group-ID o dell'user-ID è troppo grande per essere
2482       memorizzato nella struttura puntata dal \param{buf}.  
2483     \item[\errcode{EFAULT}] L'indirizzo specificato con \param{buf} non è
2484       valido.
2485     \end{errlist}
2486 }
2487 \end{functions}
2488
2489 Il comando specificato attraverso l'argomento \param{cmd} determina i diversi
2490 effetti della funzione; i possibili valori che esso può assumere, ed il
2491 corrispondente comportamento della funzione, sono i seguenti:
2492
2493 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2494 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2495   condivisa nella struttura \struct{shmid\_ds} puntata da \param{buf}. Occorre
2496   che il processo chiamante abbia il permesso di lettura sulla segmento.
2497 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2498   rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2499   processo ad esso agganciato si sarà staccato. Questo comando può essere
2500   eseguito solo da un processo con user-ID effettivo corrispondente o al
2501   creatore del segmento, o al proprietario del segmento, o all'amministratore.
2502 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2503   del segmento.  Per modificare i valori di \var{shm\_perm.mode},
2504   \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2505   il creatore del segmento, oppure l'amministratore. Compiuta l'operazione
2506   aggiorna anche il valore del campo \var{shm\_ctime}.
2507 \item[\const{SHM\_LOCK}] Abilita il \textit{memory
2508     locking}\index{\textit{memory~locking}}\footnote{impedisce cioè che la
2509     memoria usata per il segmento venga salvata su disco dal meccanismo della
2510     memoria virtuale\index{memoria~virtuale}; si ricordi quanto trattato in
2511     sez.~\ref{sec:proc_mem_lock}.} sul segmento di memoria condivisa. Solo
2512   l'amministratore può utilizzare questo comando.
2513 \item[\const{SHM\_UNLOCK}] Disabilita il \textit{memory
2514     locking}\index{\textit{memory~locking}} sul segmento di memoria condivisa.
2515   Solo l'amministratore può utilizzare questo comando.
2516 \end{basedescript}
2517 i primi tre comandi sono gli stessi già visti anche per le code di messaggi e
2518 gli insiemi di semafori, gli ultimi due sono delle estensioni specifiche
2519 previste da Linux, che permettono di abilitare e disabilitare il meccanismo
2520 della memoria virtuale\index{memoria~virtuale} per il segmento.
2521
2522 L'argomento \param{buf} viene utilizzato solo con i comandi \const{IPC\_STAT}
2523 e \const{IPC\_SET} nel qual caso esso dovrà puntare ad una struttura
2524 \struct{shmid\_ds} precedentemente allocata, in cui nel primo caso saranno
2525 scritti i dati del segmento di memoria restituiti dalla funzione e da cui, nel
2526 secondo caso, verranno letti i dati da impostare sul segmento.
2527
2528 Una volta che lo si è creato, per utilizzare un segmento di memoria condivisa
2529 l'interfaccia prevede due funzioni, \funcd{shmat} e \func{shmdt}. La prima di
2530 queste serve ad agganciare un segmento al processo chiamante, in modo che
2531 quest'ultimo possa inserirlo nel suo spazio di indirizzi per potervi accedere;
2532 il suo prototipo è:
2533 \begin{functions}
2534   \headdecl{sys/types.h} 
2535   \headdecl{sys/shm.h}
2536   
2537   \funcdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2538   Aggancia al processo un segmento di memoria condivisa.
2539   
2540   \bodydesc{La funzione restituisce l'indirizzo del segmento in caso di
2541     successo, e -1 in caso di errore, nel qual caso \var{errno} assumerà i
2542     valori:
2543     \begin{errlist}
2544     \item[\errcode{EACCES}] Il processo non ha i privilegi per accedere al
2545       segmento nella modalità richiesta.
2546     \item[\errcode{EINVAL}] Si è specificato un identificatore invalido per
2547       \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2548       per \param{shmaddr}.
2549     \end{errlist}
2550     ed inoltre \errval{ENOMEM}.}
2551 \end{functions}
2552
2553 La funzione inserisce un segmento di memoria condivisa all'interno dello
2554 spazio di indirizzi del processo, in modo che questo possa accedervi
2555 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2556 fig.~\ref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2557 ricordi quanto illustrato al proposito in sez.~\ref{sec:proc_mem_layout}). In
2558 particolare l'indirizzo finale del segmento dati (quello impostato da
2559 \func{brk}, vedi sez.~\ref{sec:proc_mem_sbrk}) non viene influenzato. Si tenga
2560 presente infine che la funzione ha successo anche se il segmento è stato
2561 marcato per la cancellazione.
2562
2563 \begin{figure}[htb]
2564   \centering
2565   \includegraphics[height=10cm]{img/sh_memory_layout}
2566   \caption{Disposizione dei segmenti di memoria di un processo quando si è
2567     agganciato un segmento di memoria condivisa.}
2568   \label{fig:ipc_shmem_layout}
2569 \end{figure}
2570
2571 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{Lo standard
2572   SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2573   come il valore di ritorno della funzione. In Linux è stato così con le
2574   \acr{libc4} e le \acr{libc5}, con il passaggio alle \acr{glibc} il tipo di
2575   \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2576   ritorno un \ctyp{void *}.} deve essere associato il segmento, se il valore
2577 specificato è \val{NULL} è il sistema a scegliere opportunamente un'area di
2578 memoria libera (questo è il modo più portabile e sicuro di usare la funzione).
2579 Altrimenti il kernel aggancia il segmento all'indirizzo specificato da
2580 \param{shmaddr}; questo però può avvenire solo se l'indirizzo coincide con il
2581 limite di una pagina, cioè se è un multiplo esatto del parametro di sistema
2582 \const{SHMLBA}, che in Linux è sempre uguale \const{PAGE\_SIZE}. 
2583
2584 Si tenga presente però che quando si usa \val{NULL} come valore di
2585 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2586 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2587 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2588 riferiti all'indirizzo di partenza del segmento).
2589
2590 L'argomento \param{shmflg} permette di cambiare il comportamento della
2591 funzione; esso va specificato come maschera binaria, i bit utilizzati sono
2592 solo due e sono identificati dalle costanti \const{SHM\_RND} e
2593 \const{SHM\_RDONLY}, che vanno combinate con un OR aritmetico.  Specificando
2594 \const{SHM\_RND} si evita che \func{shmat} ritorni un errore quando
2595 \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi usare
2596 un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2597 agganciato, ma al più vicino multiplo di \const{SHMLBA} (il nome della
2598 costante sta infatti per \textit{rounded}, e serve per specificare un
2599 indirizzo come arrotondamento, in Linux è equivalente a \const{PAGE\_SIZE}).
2600
2601 L'uso di \const{SHM\_RDONLY} permette di agganciare il segmento in sola
2602 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2603 caso un tentativo di scrivere sul segmento comporterà una violazione di
2604 accesso con l'emissione di un segnale di \const{SIGSEGV}. Il comportamento
2605 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2606 lettura e scrittura (ed il processo deve aver questi permessi in
2607 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2608 sola scrittura.
2609
2610 In caso di successo la funzione aggiorna anche i seguenti campi di
2611 \struct{shmid\_ds}:
2612 \begin{itemize*}
2613 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2614   impostato al tempo corrente.
2615 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2616   segmento viene impostato a quello del processo corrente.
2617 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2618   aumentato di uno.
2619 \end{itemize*} 
2620
2621 Come accennato in sez.~\ref{sec:proc_fork} un segmento di memoria condivisa
2622 agganciato ad un processo viene ereditato da un figlio attraverso una
2623 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2624 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2625 eseguito un diverso programma con uno spazio di indirizzi completamente
2626 diverso, tutti i segmenti agganciati al processo originario vengono
2627 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2628 attraverso una \func{exit}.
2629
2630 Una volta che un segmento di memoria condivisa non serve più, si può
2631 sganciarlo esplicitamente dal processo usando l'altra funzione
2632 dell'interfaccia, \funcd{shmdt}, il cui prototipo è:
2633 \begin{functions}
2634   \headdecl{sys/types.h} 
2635   \headdecl{sys/shm.h}
2636
2637   \funcdecl{int shmdt(const void *shmaddr)}
2638   Sgancia dal processo un segmento di memoria condivisa.
2639   
2640   \bodydesc{La funzione restituisce 0 in caso di successo, e -1 in caso di
2641     errore, la funzione fallisce solo quando non c'è un segmento agganciato
2642     all'indirizzo \func{shmaddr}, con \var{errno} che assume il valore
2643     \errval{EINVAL}.}
2644 \end{functions}
2645
2646 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2647 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2648 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2649 agganciato al processo.
2650
2651 In caso di successo la funzione aggiorna anche i seguenti campi di
2652 \struct{shmid\_ds}:
2653 \begin{itemize*}
2654 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2655   impostato al tempo corrente.
2656 \item il \acr{pid} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2657   segmento viene impostato a quello del processo corrente.
2658 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2659   decrementato di uno.
2660 \end{itemize*} 
2661 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2662 viene tolta dallo spazio di indirizzi del processo.
2663
2664 \begin{figure}[!bht]
2665   \footnotesize \centering
2666   \begin{minipage}[c]{15.6cm}
2667     \includecodesample{listati/SharedMem.c}
2668   \end{minipage} 
2669   \normalsize 
2670   \caption{Il codice delle funzioni che permettono di creare, trovare e
2671     rimuovere un segmento di memoria condivisa.}
2672   \label{fig:ipc_sysv_shm_func}
2673 \end{figure}
2674
2675 Come esempio di uso di queste funzioni vediamo come implementare una serie di
2676 funzioni di libreria che ne semplifichino l'uso, automatizzando le operazioni
2677 più comuni; il codice, contenuto nel file \file{SharedMem.c}, è riportato in
2678 fig.~\ref{fig:ipc_sysv_shm_func}.
2679
2680 La prima funzione (\texttt{\small 3--16}) è \func{ShmCreate} che, data una
2681 chiave, crea il segmento di memoria condivisa restituendo il puntatore allo
2682 stesso. La funzione comincia (\texttt{\small 6}) con il chiamare
2683 \func{shmget}, usando il flag \const{IPC\_CREATE} per creare il segmento
2684 qualora non esista, ed assegnandogli i privilegi specificati dall'argomento
2685 \var{perm} e la dimensione specificata dall'argomento \var{shm\_size}.  In
2686 caso di errore (\texttt{\small 7--9}) si ritorna immediatamente un puntatore
2687 nullo, altrimenti (\texttt{\small 10}) si prosegue agganciando il segmento di
2688 memoria condivisa al processo con \func{shmat}. In caso di errore
2689 (\texttt{\small 11--13}) si restituisce di nuovo un puntatore nullo, infine
2690 (\texttt{\small 14}) si inizializza con \func{memset} il contenuto del
2691 segmento al valore costante specificato dall'argomento \var{fill}, e poi si
2692 ritorna il puntatore al segmento stesso.
2693
2694 La seconda funzione (\texttt{\small 17--31}) è \func{ShmFind}, che, data una
2695 chiave, restituisce l'indirizzo del segmento ad essa associato. Anzitutto
2696 (\texttt{\small 22}) si richiede l'identificatore del segmento con
2697 \func{shmget}, ritornando (\texttt{\small 23--25}) un puntatore nullo in caso
2698 di errore. Poi si prosegue (\texttt{\small 26}) agganciando il segmento al
2699 processo con \func{shmat}, restituendo (\texttt{\small 27--29}) di nuovo un
2700 puntatore nullo in caso di errore, se invece non ci sono errori si restituisce
2701 il puntatore ottenuto da \func{shmat}.
2702
2703 La terza funzione (\texttt{\small 32--51}) è \func{ShmRemove} che, data la
2704 chiave ed il puntatore associati al segmento di memoria condivisa, prima lo
2705 sgancia dal processo e poi lo rimuove. Il primo passo (\texttt{\small 37}) è
2706 la chiamata a \func{shmdt} per sganciare il segmento, restituendo
2707 (\texttt{\small 38--39}) un valore -1 in caso di errore. Il passo successivo
2708 (\texttt{\small 41}) è utilizzare \func{shmget} per ottenre l'identificatore
2709 associato al segmento data la chiave \var{key}. Al solito si restituisce un
2710 valore di -1 (\texttt{\small 42--45}) in caso di errore, mentre se tutto va
2711 bene si conclude restituendo un valore nullo.
2712
2713 Benché la memoria condivisa costituisca il meccanismo di intercomunicazione
2714 fra processi più veloce, essa non è sempre il più appropriato, dato che, come
2715 abbiamo visto, si avrà comunque la necessità di una sincronizzazione degli
2716 accessi.  Per questo motivo, quando la comunicazione fra processi è
2717 sequenziale, altri meccanismi come le pipe, le fifo o i socket, che non
2718 necessitano di sincronizzazione esplicita, sono da preferire. Essa diventa
2719 l'unico meccanismo possibile quando la comunicazione non è
2720 sequenziale\footnote{come accennato in sez.~\ref{sec:ipc_sysv_mq} per la
2721   comunicazione non sequenziale si possono usare le code di messaggi,
2722   attraverso l'uso del campo \var{mtype}, ma solo se quest'ultima può essere
2723   effettuata in forma di messaggio.} o quando non può avvenire secondo una
2724 modalità predefinita.
2725
2726 Un esempio classico di uso della memoria condivisa è quello del
2727 ``\textit{monitor}'', in cui viene per scambiare informazioni fra un processo
2728 server, che vi scrive dei dati di interesse generale che ha ottenuto, e i
2729 processi client interessati agli stessi dati che così possono leggerli in
2730 maniera completamente asincrona.  Con questo schema di funzionamento da una
2731 parte si evita che ciascun processo client debba compiere l'operazione,
2732 potenzialmente onerosa, di ricavare e trattare i dati, e dall'altra si evita
2733 al processo server di dover gestire l'invio a tutti i client di tutti i dati
2734 (non potendo il server sapere quali di essi servono effettivamente al singolo
2735 client).
2736
2737 Nel nostro caso implementeremo un ``\textsl{monitor}'' di una directory: un
2738 processo si incaricherà di tenere sotto controllo alcuni parametri relativi ad
2739 una directory (il numero dei file contenuti, la dimensione totale, quante
2740 directory, link simbolici, file normali, ecc.) che saranno salvati in un
2741 segmento di memoria condivisa cui altri processi potranno accedere per
2742 ricavare la parte di informazione che interessa.
2743
2744 In fig.~\ref{fig:ipc_dirmonitor_main} si è riportata la sezione principale del
2745 corpo del programma server, insieme alle definizioni delle altre funzioni
2746 usate nel programma e delle variabili globali, omettendo tutto quello che
2747 riguarda la gestione delle opzioni e la stampa delle istruzioni di uso a
2748 video; al solito il codice completo si trova con i sorgenti allegati nel file
2749 \file{DirMonitor.c}.
2750
2751 \begin{figure}[!htb]
2752   \footnotesize \centering
2753   \begin{minipage}[c]{15.6cm}
2754     \includecodesample{listati/DirMonitor.c}
2755   \end{minipage} 
2756   \normalsize 
2757   \caption{Codice della funzione principale del programma \file{DirMonitor.c}.}
2758   \label{fig:ipc_dirmonitor_main}
2759 \end{figure}
2760
2761 Il programma usa delle variabili globali (\texttt{\small 2--14}) per mantenere
2762 i valori relativi agli oggetti usati per la comunicazione inter-processo; si è
2763 definita inoltre una apposita struttura \struct{DirProp} che contiene i dati
2764 relativi alle proprietà che si vogliono mantenere nella memoria condivisa, per
2765 l'accesso da parte dei client.
2766
2767 Il programma, dopo la sezione, omessa, relativa alla gestione delle opzioni da
2768 riga di comando (che si limitano alla eventuale stampa di un messaggio di
2769 aiuto a video ed all'impostazione della durata dell'intervallo con cui viene
2770 ripetuto il calcolo delle proprietà della directory) controlla (\texttt{\small
2771   20--23}) che sia stato specificato il parametro necessario contenente il
2772 nome della directory da tenere sotto controllo, senza il quale esce
2773 immediatamente con un messaggio di errore.
2774
2775 Poi, per verificare che il parametro specifichi effettivamente una directory,
2776 si esegue (\texttt{\small 24--26}) su di esso una \func{chdir}, uscendo
2777 immediatamente in caso di errore.  Questa funzione serve anche per impostare
2778 la directory di lavoro del programma nella directory da tenere sotto
2779 controllo, in vista del successivo uso della funzione
2780 \func{daemon}.\footnote{si noti come si è potuta fare questa scelta,
2781   nonostante le indicazioni illustrate in sez.~\ref{sec:sess_daemon}, per il
2782   particolare scopo del programma, che necessita comunque di restare
2783   all'interno di una directory.} Infine (\texttt{\small 27--29}) si installano
2784 i gestori per i vari segnali di terminazione che, avendo a che fare con un
2785 programma che deve essere eseguito come server, sono il solo strumento
2786 disponibile per concluderne l'esecuzione.
2787
2788 Il passo successivo (\texttt{\small 30--39}) è quello di creare gli oggetti di
2789 intercomunicazione necessari. Si inizia costruendo (\texttt{\small 30}) la
2790 chiave da usare come riferimento con il nome del programma,\footnote{si è
2791   usato un riferimento relativo alla home dell'utente, supposto che i sorgenti
2792   di GaPiL siano stati installati direttamente in essa. Qualora si effettui
2793   una installazione diversa si dovrà correggere il programma.} dopo di che si
2794 richiede (\texttt{\small 31}) la creazione di un segmento di memoria condivisa
2795 con usando la funzione \func{ShmCreate} illustrata in precedenza (una pagina
2796 di memoria è sufficiente per i dati che useremo), uscendo (\texttt{\small
2797   32--35}) qualora la creazione ed il successivo agganciamento al processo non
2798 abbia successo. Con l'indirizzo \var{shmptr} così ottenuto potremo poi
2799 accedere alla memoria condivisa, che, per come abbiamo lo abbiamo definito,
2800 sarà vista nella forma data da \struct{DirProp}. Infine (\texttt{\small
2801   36--39}) utilizzando sempre la stessa chiave, si crea, tramite le funzioni
2802 di interfaccia già descritte in sez.~\ref{sec:ipc_sysv_sem}, anche un mutex,
2803 che utilizzeremo per regolare l'accesso alla memoria condivisa.
2804
2805 \begin{figure}[!htb]
2806   \footnotesize \centering
2807   \begin{minipage}[c]{15.6cm}
2808     \includecodesample{listati/ComputeValues.c}
2809   \end{minipage} 
2810   \normalsize 
2811   \caption{Codice delle funzioni ausiliarie usate da \file{DirMonitor.c}.}
2812   \label{fig:ipc_dirmonitor_sub}
2813 \end{figure}
2814
2815 Completata l'inizializzazione e la creazione degli oggetti di
2816 intercomunicazione il programma entra nel ciclo principale (\texttt{\small
2817   40--49}) dove vengono eseguite indefinitamente le attività di monitoraggio.
2818 Il primo passo (\texttt{\small 41}) è eseguire \func{daemon} per proseguire
2819 con l'esecuzione in background come si conviene ad un programma demone; si
2820 noti che si è mantenuta, usando un valore non nullo del primo argomento, la
2821 directory di lavoro corrente.  Una volta che il programma è andato in
2822 background l'esecuzione prosegue (\texttt{\small 42--48}) all'interno di un
2823 ciclo infinito: si inizia (\texttt{\small 43}) bloccando il mutex con
2824 \func{MutexLock} per poter accedere alla memoria condivisa (la funzione si
2825 bloccherà automaticamente se qualche client sta leggendo), poi (\texttt{\small
2826   44}) si cancellano i valori precedentemente immagazzinati nella memoria
2827 condivisa con \func{memset}, e si esegue (\texttt{\small 45}) un nuovo calcolo
2828 degli stessi utilizzando la funzione \func{DirScan}; infine (\texttt{\small
2829   46}) si sblocca il mutex con \func{MutexUnlock}, e si attende
2830 (\texttt{\small 47}) per il periodo di tempo specificato a riga di comando con
2831 l'opzione \code{-p} con una \func{sleep}.
2832
2833 Si noti come per il calcolo dei valori da mantenere nella memoria condivisa si
2834 sia usata ancora una volta la funzione \func{DirScan}, già utilizzata (e
2835 descritta in dettaglio) in sez.~\ref{sec:file_dir_read}, che ci permette di
2836 effettuare la scansione delle voci della directory, chiamando per ciascuna di
2837 esse la funzione \func{ComputeValues}, che esegue tutti i calcoli necessari.
2838
2839 Il codice di quest'ultima è riportato in fig.~\ref{fig:ipc_dirmonitor_sub}.
2840 Come si vede la funzione (\texttt{\small 2--16}) è molto semplice e si limita
2841 a chiamare (\texttt{\small 5}) la funzione \func{stat} sul file indicato da
2842 ciascuna voce, per ottenerne i dati, che poi utilizza per incrementare i vari
2843 contatori nella memoria condivisa, cui accede grazie alla variabile globale
2844 \var{shmptr}.
2845
2846 Dato che la funzione è chiamata da \func{DirScan}, si è all'interno del ciclo
2847 principale del programma, con un mutex acquisito, perciò non è necessario
2848 effettuare nessun controllo e si può accedere direttamente alla memoria
2849 condivisa usando \var{shmptr} per riempire i campi della struttura
2850 \struct{DirProp}; così prima (\texttt{\small 6--7}) si sommano le dimensioni
2851 dei file ed il loro numero, poi, utilizzando le macro di
2852 tab.~\ref{tab:file_type_macro}, si contano (\texttt{\small 8--14}) quanti ce
2853 ne sono per ciascun tipo.
2854
2855 In fig.~\ref{fig:ipc_dirmonitor_sub} è riportato anche il codice
2856 (\texttt{\small 17--23}) del gestore dei segnali di terminazione, usato per
2857 chiudere il programma. Esso, oltre a provocare l'uscita del programma, si
2858 incarica anche di cancellare tutti gli oggetti di intercomunicazione non più
2859 necessari.  Per questo anzitutto (\texttt{\small 19}) acquisisce il mutex con
2860 \func{MutexLock}, per evitare di operare mentre un client sta ancora leggendo
2861 i dati, dopo di che (\texttt{\small 20}) distacca e rimuove il segmento di
2862 memoria condivisa usando \func{ShmRemove}.  Infine (\texttt{\small 21})
2863 rimuove il mutex con \func{MutexRemove} ed esce (\texttt{\small 22}).
2864
2865 \begin{figure}[!htb]
2866   \footnotesize \centering
2867   \begin{minipage}[c]{15.6 cm}
2868     \includecodesample{listati/ReadMonitor.c}
2869   \end{minipage} 
2870   \normalsize 
2871   \caption{Codice del programma client del monitor delle proprietà di una
2872     directory, \file{ReadMonitor.c}.}
2873   \label{fig:ipc_dirmonitor_client}
2874 \end{figure}
2875
2876 Il codice del client usato per leggere le informazioni mantenute nella memoria
2877 condivisa è riportato in fig.~\ref{fig:ipc_dirmonitor_client}. Al solito si è
2878 omessa la sezione di gestione delle opzioni e la funzione che stampa a video
2879 le istruzioni; il codice completo è nei sorgenti allegati, nel file
2880 \file{ReadMonitor.c}.
2881
2882 Una volta conclusa la gestione delle opzioni a riga di comando il programma
2883 rigenera (\texttt{\small 7}) con \func{ftok} la stessa chiave usata dal server
2884 per identificare il segmento di memoria condivisa ed il mutex, poi
2885 (\texttt{\small 8}) richiede con \func{ShmFind} l'indirizzo della memoria
2886 condivisa agganciando al contempo il segmento al processo, Infine
2887 (\texttt{\small 17--20}) con \func{MutexFind} si richiede l'identificatore del
2888 mutex.  Completata l'inizializzazione ed ottenuti i riferimenti agli oggetti
2889 di intercomunicazione necessari viene eseguito il corpo principale del
2890 programma (\texttt{\small 21--33}); si comincia (\texttt{\small 22})
2891 acquisendo il mutex con \func{MutexLock}; qui avviene il blocco del processo
2892 se la memoria condivisa non è disponibile.  Poi (\texttt{\small 23--31}) si
2893 stampano i vari valori mantenuti nella memoria condivisa attraverso l'uso di
2894 \var{shmptr}.  Infine (\texttt{\small 41}) con \func{MutexUnlock} si rilascia
2895 il mutex, prima di uscire.
2896
2897 Verifichiamo allora il funzionamento dei nostri programmi; al solito, usando
2898 le funzioni di libreria occorre definire opportunamente
2899 \code{LD\_LIBRARY\_PATH}; poi si potrà lanciare il server con:
2900 \begin{verbatim}
2901 [piccardi@gont sources]$ ./dirmonitor ./
2902 \end{verbatim}%$
2903 ed avendo usato \func{daemon} il comando ritornerà immediatamente. Una volta
2904 che il server è in esecuzione, possiamo passare ad invocare il client per
2905 verificarne i risultati, in tal caso otterremo:
2906 \begin{verbatim}
2907 [piccardi@gont sources]$ ./readmon 
2908 Ci sono 68 file dati
2909 Ci sono 3 directory
2910 Ci sono 0 link
2911 Ci sono 0 fifo
2912 Ci sono 0 socket
2913 Ci sono 0 device a caratteri
2914 Ci sono 0 device a blocchi
2915 Totale  71 file, per 489831 byte
2916 \end{verbatim}%$
2917 ed un rapido calcolo (ad esempio con \code{ls -a | wc} per contare i file) ci
2918 permette di verificare che il totale dei file è giusto. Un controllo con
2919 \cmd{ipcs} ci permette inoltre di verificare la presenza di un segmento di
2920 memoria condivisa e di un semaforo:
2921 \begin{verbatim}
2922 [piccardi@gont sources]$ ipcs
2923 ------ Shared Memory Segments --------
2924 key        shmid      owner      perms      bytes      nattch     status      
2925 0xffffffff 54067205   piccardi  666        4096       1                       
2926
2927 ------ Semaphore Arrays --------
2928 key        semid      owner      perms      nsems     
2929 0xffffffff 229376     piccardi  666        1         
2930
2931 ------ Message Queues --------
2932 key        msqid      owner      perms      used-bytes   messages    
2933 \end{verbatim}%$
2934
2935 Se a questo punto aggiungiamo un file, ad esempio con \code{touch prova},
2936 potremo verificare che, passati nel peggiore dei casi almeno 10 secondi (o
2937 l'eventuale altro intervallo impostato per la rilettura dei dati) avremo:
2938 \begin{verbatim}
2939 [piccardi@gont sources]$ ./readmon 
2940 Ci sono 69 file dati
2941 Ci sono 3 directory
2942 Ci sono 0 link
2943 Ci sono 0 fifo
2944 Ci sono 0 socket
2945 Ci sono 0 device a caratteri
2946 Ci sono 0 device a blocchi
2947 Totale  72 file, per 489887 byte
2948 \end{verbatim}%$
2949
2950 A questo punto possiamo far uscire il server inviandogli un segnale di
2951 \const{SIGTERM} con il comando \code{killall dirmonitor}, a questo punto
2952 ripetendo la lettura, otterremo un errore:
2953 \begin{verbatim}
2954 [piccardi@gont sources]$ ./readmon 
2955 Cannot find shared memory: No such file or directory
2956 \end{verbatim}%$
2957 e inoltre potremo anche verificare che anche gli oggetti di intercomunicazione
2958 visti in precedenza sono stati regolarmente  cancellati:
2959 \begin{verbatim}
2960 [piccardi@gont sources]$ ipcs
2961 ------ Shared Memory Segments --------
2962 key        shmid      owner      perms      bytes      nattch     status      
2963
2964 ------ Semaphore Arrays --------
2965 key        semid      owner      perms      nsems     
2966
2967 ------ Message Queues --------
2968 key        msqid      owner      perms      used-bytes   messages    
2969 \end{verbatim}%$
2970
2971
2972
2973 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
2974 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
2975 %% condivisa; uno schema semplificato della struttura è illustrato in
2976 %% fig.~\ref{fig:ipc_shm_struct}. 
2977
2978 %% \begin{figure}[htb]
2979 %%   \centering
2980 %%   \includegraphics[width=10cm]{img/shmstruct}
2981 %%    \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
2982 %%     Linux.}
2983 %%   \label{fig:ipc_shm_struct}
2984 %% \end{figure}
2985
2986
2987
2988
2989 \section{Tecniche alternative}
2990 \label{sec:ipc_alternatives}
2991
2992 Come abbiamo detto in sez.~\ref{sec:ipc_sysv_generic}, e ripreso nella
2993 descrizione dei singoli oggetti che ne fan parte, il \textit{SysV IPC}
2994 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
2995   capitolo 14.}  Stevens ne effettua una accurata analisi (alcuni dei concetti
2996 sono già stati accennati in precedenza) ed elenca alcune possibili tecniche
2997 alternative, che vogliamo riprendere in questa sezione.
2998
2999
3000 \subsection{Alternative alle code di messaggi}
3001 \label{sec:ipc_mq_alternative}
3002  
3003 Le code di messaggi sono probabilmente il meno usato degli oggetti del
3004 \textit{SysV IPC}; esse infatti nacquero principalmente come meccanismo di
3005 comunicazione bidirezionale quando ancora le pipe erano unidirezionali; con la
3006 disponibilità di \func{socketpair} (vedi sez.~\ref{sec:ipc_socketpair}) o
3007 utilizzando una coppia di pipe, si può ottenere questo risultato senza
3008 incorrere nelle complicazioni introdotte dal \textit{SysV IPC}.
3009
3010 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
3011 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
3012 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
3013 sono impossibili da ottenere con le pipe e i socket\index{socket} di
3014 \func{socketpair}.  A queste esigenze però si può comunque ovviare in maniera
3015 diversa con un uso combinato della memoria condivisa e dei meccanismi di
3016 sincronizzazione, per cui alla fine l'uso delle code di messaggi classiche è
3017 relativamente poco diffuso.
3018
3019 \subsection{I \textsl{file di lock}}
3020 \label{sec:ipc_file_lock}
3021
3022 \index{file!di lock|(}
3023 Come illustrato in sez.~\ref{sec:ipc_sysv_sem} i semafori del \textit{SysV IPC}
3024 presentano una interfaccia inutilmente complessa e con alcuni difetti
3025 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
3026 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
3027 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
3028 necessità di un contatore come i semafori, si possono utilizzare metodi
3029 alternativi.
3030
3031 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
3032 dei \textsl{file di lock} (per i quali esiste anche una opportuna directory,
3033 \file{/var/lock}, nel filesystem standard). Per questo si usa la
3034 caratteristica della funzione \func{open} (illustrata in
3035 sez.~\ref{sec:file_open}) che prevede\footnote{questo è quanto dettato dallo
3036   standard POSIX.1, ciò non toglie che in alcune implementazioni questa
3037   tecnica possa non funzionare; in particolare per Linux, nel caso di NFS, si
3038   è comunque soggetti alla possibilità di una race
3039   condition\index{\textit{race~condition}}.} che essa ritorni un errore quando
3040 usata con i flag di \const{O\_CREAT} e \const{O\_EXCL}. In tal modo la
3041 creazione di un \textsl{file di lock} può essere eseguita atomicamente, il
3042 processo che crea il file con successo si può considerare come titolare del
3043 lock (e della risorsa ad esso associata) mentre il rilascio si può eseguire
3044 con una chiamata ad \func{unlink}.
3045
3046 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3047 \func{LockFile} ed \func{UnlockFile} riportate in fig.~\ref{fig:ipc_file_lock}
3048 (sono contenute in \file{LockFile.c}, un'altro dei sorgenti allegati alla
3049 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3050   lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3051 (\texttt{\small 4--10}) si limita ad aprire il file di lock (\texttt{\small
3052   9}) nella modalità descritta, mentre la seconda (\texttt{\small 11--17}) lo
3053 cancella con \func{unlink}.
3054
3055 \begin{figure}[!htb]
3056   \footnotesize \centering
3057   \begin{minipage}[c]{15.6cm}
3058     \includecodesample{listati/LockFile.c}
3059   \end{minipage} 
3060   \normalsize 
3061   \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3062     permettono di creare e rimuovere un \textsl{file di lock}.}
3063   \label{fig:ipc_file_lock}
3064 \end{figure}
3065
3066 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3067 sez.~\ref{sec:file_open}, questo comportamento di \func{open} può non
3068 funzionare (la funzione viene eseguita, ma non è garantita l'atomicità
3069 dell'operazione) se il filesystem su cui si va ad operare è su NFS; in tal
3070 caso si può adottare una tecnica alternativa che prevede l'uso della
3071 \func{link} per creare come \textsl{file di lock} un hard link ad un file
3072 esistente; se il link esiste già e la funzione fallisce, significa che la
3073 risorsa è bloccata e potrà essere sbloccata solo con un \func{unlink},
3074 altrimenti il link è creato ed il lock acquisito; il controllo e l'eventuale
3075 acquisizione sono atomici; la soluzione funziona anche su NFS, ma ha un'altro
3076 difetto è che è quello di poterla usare solo se si opera all'interno di uno
3077 stesso filesystem.
3078
3079 Un generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3080 problemi, che non lo rendono una alternativa praticabile per la
3081 sincronizzazione: anzitutto in caso di terminazione imprevista del processo,
3082 si lascia allocata la risorsa (il \textsl{file di lock}) e questa deve essere
3083 sempre cancellata esplicitamente.  Inoltre il controllo della disponibilità
3084 può essere eseguito solo con una tecnica di
3085 \textit{polling}\index{\textit{polling}}, ed è quindi molto inefficiente.
3086
3087 La tecnica dei file di lock ha comunque una sua utilità, e può essere usata
3088 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3089 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3090 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3091 più programmi: qualora si trovi un file di lock il programma che cerca di
3092 accedere alla seriale si limita a segnalare che la risorsa non è
3093 disponibile.\index{file!di lock|)}
3094
3095
3096 \subsection{La sincronizzazione con il \textit{file locking}}
3097 \label{sec:ipc_lock_file}
3098
3099 Dato che i file di lock\index{file!di lock} presentano gli inconvenienti
3100 illustrati in precedenza, la tecnica alternativa di sincronizzazione più
3101 comune è quella di fare ricorso al \textit{file locking}\index{file!locking}
3102 (trattato in sez.~\ref{sec:file_locking}) usando \func{fcntl} su un file
3103 creato per l'occasione per ottenere un write lock. In questo modo potremo
3104 usare il lock come un \textit{mutex}: per bloccare la risorsa basterà
3105 acquisire il lock, per sbloccarla basterà rilasciare il lock. Una richiesta
3106 fatta con un write lock metterà automaticamente il processo in stato di
3107 attesa, senza necessità di ricorrere al
3108 \textit{polling}\index{\textit{polling}} per determinare la disponibilità
3109 della risorsa, e al rilascio della stessa da parte del processo che la
3110 occupava si otterrà il nuovo lock atomicamente.
3111
3112 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3113 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3114 chiusura dei relativi file) e non ci si deve preoccupare di niente; inoltre
3115 non consuma risorse permanentemente allocate nel sistema. Lo svantaggio è che,
3116 dovendo fare ricorso a delle operazioni sul filesystem, esso è in genere
3117 leggermente più lento.
3118
3119 \begin{figure}[!htb]
3120   \footnotesize \centering
3121   \begin{minipage}[c]{15.6cm}
3122     \includecodesample{listati/MutexLocking.c}
3123   \end{minipage} 
3124   \normalsize 
3125   \caption{Il codice delle funzioni che permettono per la gestione dei 
3126     \textit{mutex} con il file locking\index{file!locking}.}
3127   \label{fig:ipc_flock_mutex}
3128 \end{figure}
3129
3130 Il codice delle varie funzioni usate per implementare un mutex utilizzando il
3131 file locking\index{file!locking} è riportato in fig.~\ref{fig:ipc_flock_mutex};
3132 si è mantenuta volutamente una struttura analoga alle precedenti funzioni che
3133 usano i semafori, anche se le due interfacce non possono essere completamente
3134 equivalenti, specie per quanto riguarda la rimozione del mutex.
3135
3136 La prima funzione (\texttt{\small 1--5}) è \func{CreateMutex}, e serve a
3137 creare il mutex; la funzione è estremamente semplice, e si limita
3138 (\texttt{\small 4}) a creare, con una opportuna chiamata ad \func{open}, il
3139 file che sarà usato per il successivo file locking, assicurandosi che non
3140 esista già (nel qual caso segnala un errore); poi restituisce il file
3141 descriptor che sarà usato dalle altre funzioni per acquisire e rilasciare il
3142 mutex.
3143
3144 La seconda funzione (\texttt{\small 6--10}) è \func{FindMutex}, che, come la
3145 precedente, è stata definita per mantenere una analogia con la corrispondente
3146 funzione basata sui semafori. Anch'essa si limita (\texttt{\small 9}) ad
3147 aprire il file da usare per il file locking, solo che in questo caso le
3148 opzioni di \func{open} sono tali che il file in questione deve esistere di
3149 già.
3150
3151 La terza funzione (\texttt{\small 11--22}) è \func{LockMutex} e serve per
3152 acquisire il mutex. La funzione definisce (\texttt{\small 14}) e inizializza
3153 (\texttt{\small 16--19}) la struttura \var{lock} da usare per acquisire un
3154 write lock sul file, che poi (\texttt{\small 21}) viene richiesto con
3155 \func{fcntl}, restituendo il valore di ritorno di quest'ultima. Se il file è
3156 libero il lock viene acquisito e la funzione ritorna immediatamente;
3157 altrimenti \func{fcntl} si bloccherà (si noti che la si è chiamata con
3158 \func{F\_SETLKW}) fino al rilascio del lock.
3159
3160 La quarta funzione (\texttt{\small 24--34}) è \func{UnlockMutex} e serve a
3161 rilasciare il mutex. La funzione è analoga alla precedente, solo che in questo
3162 caso si inizializza (\texttt{\small 28--31}) la struttura \var{lock} per il
3163 rilascio del lock, che viene effettuato (\texttt{\small 33}) con la opportuna
3164 chiamata a \func{fcntl}. Avendo usato il file locking in semantica POSIX (si
3165 riveda quanto detto sez.~\ref{sec:file_posix_lock}) solo il processo che ha
3166 precedentemente eseguito il lock può sbloccare il mutex.
3167
3168 La quinta funzione (\texttt{\small 36--39}) è \func{RemoveMutex} e serve a
3169 cancellare il mutex. Anche questa funzione è stata definita per mantenere una
3170 analogia con le funzioni basate sui semafori, e si limita a cancellare
3171 (\texttt{\small 38}) il file con una chiamata ad \func{unlink}. Si noti che in
3172 questo caso la funzione non ha effetto sui mutex già ottenuti con precedenti
3173 chiamate a \func{FindMutex} o \func{CreateMutex}, che continueranno ad essere
3174 disponibili fintanto che i relativi file descriptor restano aperti. Pertanto
3175 per rilasciare un mutex occorrerà prima chiamare \func{UnlockMutex} oppure
3176 chiudere il file usato per il lock.
3177
3178 La sesta funzione (\texttt{\small 41--55}) è \func{ReadMutex} e serve a
3179 leggere lo stato del mutex. In questo caso si prepara (\texttt{\small 46--49})
3180 la solita struttura \var{lock} come l'acquisizione del lock, ma si effettua
3181 (\texttt{\small 51}) la chiamata a \func{fcntl} usando il comando
3182 \const{F\_GETLK} per ottenere lo stato del lock, e si restituisce
3183 (\texttt{\small 52}) il valore di ritorno in caso di errore, ed il valore del
3184 campo \var{l\_type} (che descrive lo stato del lock) altrimenti
3185 (\texttt{\small 54}). Per questo motivo la funzione restituirà -1 in caso di
3186 errore e uno dei due valori \const{F\_UNLCK} o \const{F\_WRLCK}\footnote{non
3187   si dovrebbe mai avere il terzo valore possibile, \const{F\_RDLCK}, dato che
3188   la nostra interfaccia usa solo i write lock. Però è sempre possibile che
3189   siano richiesti altri lock sul file al di fuori dell'interfaccia, nel qual
3190   caso si potranno avere, ovviamente, interferenze indesiderate.} in caso di
3191 successo, ad indicare che il mutex è, rispettivamente, libero o occupato.
3192
3193 Basandosi sulla semantica dei file lock POSIX valgono tutte le considerazioni
3194 relative al comportamento di questi ultimi fatte in
3195 sez.~\ref{sec:file_posix_lock}; questo significa ad esempio che, al contrario
3196 di quanto avveniva con l'interfaccia basata sui semafori, chiamate multiple a
3197 \func{UnlockMutex} o \func{LockMutex} non si cumulano e non danno perciò
3198 nessun inconveniente.
3199
3200
3201 \subsection{Il \textit{memory mapping} anonimo}
3202 \label{sec:ipc_mmap_anonymous}
3203
3204 Abbiamo già visto che quando i processi sono \textsl{correlati}\footnote{se
3205   cioè hanno almeno un progenitore comune.} l'uso delle pipe può costituire
3206 una valida alternativa alle code di messaggi; nella stessa situazione si può
3207 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3208 \textit{memory mapping} anonimo.
3209
3210 In sez.~\ref{sec:file_memory_map} abbiamo visto come sia possibile mappare il
3211 contenuto di un file nella memoria di un processo, e che, quando viene usato
3212 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3213 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3214 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3215 inefficiente, in quanto occorre passare attraverso il disco. Però abbiamo
3216 visto anche che se si esegue la mappatura con il flag \const{MAP\_ANONYMOUS}
3217 la regione mappata non viene associata a nessun file, anche se quanto scritto
3218 rimane in memoria e può essere riletto; allora, dato che un processo figlio
3219 mantiene nel suo spazio degli indirizzi anche le regioni mappate, esso sarà
3220 anche in grado di accedere a quanto in esse è contenuto.
3221
3222 In questo modo diventa possibile creare una memoria condivisa fra processi
3223 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3224 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3225   funzionalità simile a questa viene implementata mappando il file speciale
3226   \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3227   vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3228   restano in memoria e possono essere riletti secondo le stesse modalità usate
3229   nel \textit{memory mapping} anonimo.} Vedremo come utilizzare questa tecnica
3230 più avanti, quando realizzeremo una nuova versione del monitor visto in
3231 sez.~\ref{sec:ipc_sysv_shm} che possa restituisca i risultati via rete.
3232
3233
3234
3235 \section{Il sistema di comunicazione fra processi di POSIX}
3236 \label{sec:ipc_posix}
3237
3238 Per superare i numerosi problemi del \textit{SysV IPC}, evidenziati per i suoi
3239 aspetti generali in coda a sez.~\ref{sec:ipc_sysv_generic} e per i singoli
3240 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3241 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3242 una interfaccia completamente nuova, che tratteremo in questa sezione.
3243
3244
3245 \subsection{Considerazioni generali}
3246 \label{sec:ipc_posix_generic}
3247
3248 In Linux non tutti gli oggetti del POSIX IPC sono pienamente supportati nel
3249 kernel ufficiale; solo la memoria condivisa è presente con l'interfaccia
3250 completa, ma solo a partire dal kernel 2.4.x, i semafori sono forniti dalle
3251 \acr{glibc} nella sezione che implementa i thread POSIX, le code di messaggi
3252 non hanno alcun tipo di supporto ufficiale.  Per queste ultime esistono
3253 tuttavia dei patch e una libreria aggiuntiva.
3254
3255 La caratteristica fondamentale dell'interfaccia POSIX è l'abbandono dell'uso
3256 degli identificatori e delle chiavi visti nel SysV IPC, per passare ai
3257 \textit{Posix IPC names}\index{\textit{Posix~IPC~names}}, che sono
3258 sostanzialmente equivalenti ai nomi dei file. Tutte le funzioni che creano un
3259 oggetto di IPC Posix prendono come primo argomento una stringa che indica uno
3260 di questi nomi; lo standard è molto generico riguardo l'implementazione, ed i
3261 nomi stessi possono avere o meno una corrispondenza sul filesystem; tutto
3262 quello che è richiesto è che:
3263 \begin{itemize}
3264 \item i nomi devono essere conformi alle regole che caratterizzano i
3265   \index{\textit{pathname}}\textit{pathname}, in particolare non essere più
3266   lunghi di \const{PATH\_MAX} byte e terminati da un carattere nullo.
3267 \item se il nome inizia per una \texttt{/} chiamate differenti allo stesso
3268   nome fanno riferimento allo stesso oggetto, altrimenti l'interpretazione del
3269   nome dipende dall'implementazione.
3270 \item l'interpretazione di ulteriori \texttt{/} presenti nel nome dipende
3271   dall'implementazione.
3272 \end{itemize}
3273
3274 Data la assoluta genericità delle specifiche, il comportamento delle funzioni
3275 è pertanto subordinato in maniera quasi completa alla relativa
3276 implementazione.\footnote{tanto che Stevens in \cite{UNP2} cita questo caso
3277   come un esempio della maniera standard usata dallo standard POSIX per
3278   consentire implementazioni non standardizzabili.} Nel caso di Linux, sia per
3279 quanto riguarda la memoria condivisa, che per quanto riguarda le code di
3280 messaggi, tutto viene creato usando come radici delle opportune directory
3281 (rispettivamente \file{/dev/shm} e \file{/dev/mqueue}, per i dettagli si
3282 faccia riferimento a sez.~\ref{sec:ipc_posix_shm} e
3283 sez.~\ref{sec:ipc_posix_mq}) ed i nomi specificati nelle relative funzioni
3284 sono considerati come un \index{\textit{pathname}!assoluto}\textit{pathname}
3285 assoluto (comprendente eventuali sottodirectory) rispetto a queste radici.
3286
3287 Il vantaggio degli oggetti di IPC POSIX è comunque che essi vengono inseriti
3288 nell'albero dei file, e possono essere maneggiati con le usuali funzioni e
3289 comandi di accesso ai file,\footnote{questo è ancora più vero nel caso di
3290   Linux, che usa una implementazione che lo consente, non è detto che
3291   altrettanto valga per altri kernel. In particolare sia la memoria condivisa
3292   che per le code di messaggi, come si può facilmente evincere con uno
3293   \cmd{strace}, le system call utilizzate sono le stesse, in quanto esse sono
3294   realizzate con dei file in speciali filesystem.}  che funzionano come su dei
3295 file normali.
3296
3297 In particolare i permessi associati agli oggetti di IPC POSIX sono identici ai
3298 permessi dei file, e il controllo di accesso segue esattamente la stessa
3299 semantica (quella illustrata in sez.~\ref{sec:file_access_control}), invece di
3300 quella particolare (si ricordi quanto visto in
3301 sez.~\ref{sec:ipc_sysv_access_control}) usata per gli oggetti del SysV IPC. Per
3302 quanto riguarda l'attribuzione dell'utente e del gruppo proprietari
3303 dell'oggetto alla creazione di quest'ultimo essa viene effettuata secondo la
3304 semantica SysV (essi corrispondono cioè a userid e groupid effettivi del
3305 processo che esegue la creazione).
3306
3307
3308
3309 \subsection{Code di messaggi}
3310 \label{sec:ipc_posix_mq}
3311
3312 Le code di messaggi non sono ancora supportate nel kernel ufficiale, esiste
3313 però una implementazione sperimentale di Michal Wronski e Krzysztof
3314 Benedyczak,\footnote{i patch al kernel e la relativa libreria possono essere
3315   trovati su \href{http://www.mat.uni.torun.pl/~wrona/posix_ipc}
3316   {http://www.mat.uni.torun.pl/\tild{}wrona/posix\_ipc}, questi sono stati
3317   inseriti nel kernel ufficiale a partire dalla versione 2.6.6-rc1.}.  In
3318 generale, come le corrispettive del SysV IPC, le code di messaggi sono poco
3319 usate, dato che i socket\index{socket}, nei casi in cui sono sufficienti, sono
3320 più comodi, e che in casi più complessi la comunicazione può essere gestita
3321 direttamente con mutex e memoria condivisa con tutta la flessibilità che
3322 occorre.
3323
3324 Per poter utilizzare le code di messaggi, oltre ad utilizzare un kernel cui
3325 siano stati opportunamente applicati i relativi patch, occorre utilizzare la
3326 libreria \file{mqueue}\footnote{i programmi che usano le code di messaggi cioè
3327   devono essere compilati aggiungendo l'opzione \code{-lmqueue} al comando
3328   \cmd{gcc}, dato che le funzioni non fanno parte della libreria standard, in
3329   corrispondenza all'inclusione del supporto nel kernel ufficiale, anche le
3330   relative funzioni sono state inserite nelle \acr{glibc} a partire dalla
3331   versione 2.3.4.}  che contiene le funzioni dell'interfaccia
3332 POSIX.\footnote{in realtà l'implementazione è realizzata tramite delle
3333   speciali chiamate ad \func{ioctl} sui file del filesystem speciale su cui
3334   vengono mantenuti questi oggetti di IPC.}
3335
3336
3337 La libreria inoltre richiede la presenza dell'apposito filesystem di tipo
3338 \texttt{mqueue} montato su \file{/dev/mqueue}; questo può essere fatto
3339 aggiungendo ad \file{/etc/fstab} una riga come:
3340 \begin{verbatim}
3341 mqueue   /dev/mqueue       mqueue    defaults        0      0
3342 \end{verbatim}
3343 ed esso sarà utilizzato come radice sulla quale vengono risolti i nomi delle
3344 code di messaggi che iniziano con una \texttt{/}. Le opzioni di mount
3345 accettate sono \texttt{uid}, \texttt{gid} e \texttt{mode} che permettono
3346 rispettivamente di impostare l'utente, il gruppo ed i permessi associati al
3347 filesystem.
3348
3349
3350 La funzione che permette di aprire (e crearla se non esiste ancora) una coda
3351 di messaggi POSIX è \funcd{mq\_open}, ed il suo prototipo è:
3352 \begin{functions}
3353   \headdecl{mqueue.h} 
3354   
3355   \funcdecl{mqd\_t mq\_open(const char *name, int oflag)}
3356   
3357   \funcdecl{mqd\_t mq\_open(const char *name, int oflag, unsigned long mode,
3358     struct mq\_attr *attr)}
3359   
3360   Apre una coda di messaggi POSIX impostandone le caratteristiche.
3361   
3362   \bodydesc{La funzione restituisce il descrittore associato alla coda in caso
3363     di successo e -1 in caso di errore; nel quel caso \var{errno} assumerà i
3364     valori:
3365     \begin{errlist}
3366     \item[\errcode{EACCESS}] Il processo non ha i privilegi per accedere al
3367       alla memoria secondo quanto specificato da \param{oflag}.
3368     \item[\errcode{EEXIST}] Si è specificato \const{O\_CREAT} e
3369       \const{O\_EXCL} ma la coda già esiste.
3370     \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
3371     \item[\errcode{EINVAL}] Il file non supporta la funzione, o si è
3372       specificato \const{O\_CREAT} con una valore non nullo di \param{attr} e
3373       valori non validi di \var{mq\_maxmsg} e \var{mq\_msgsize}.
3374     \item[\errcode{ENOENT}] Non si è specificato \const{O\_CREAT} ma la coda
3375       non esiste.
3376     \end{errlist}
3377     ed inoltre \errval{ENOMEM}, \errval{ENOSPC}, \errval{EFAULT},
3378     \errval{EMFILE} ed \errval{ENFILE}.}
3379 \end{functions}
3380
3381 La funzione apre la coda di messaggi identificata dall'argomento \param{name}
3382 restituendo il descrittore ad essa associato, del tutto analogo ad un file
3383 descriptor, con l'unica differenza che lo standard prevede un apposito tipo
3384 \type{mqd\_t}.\footnote{nella implementazione citata questo è definito come
3385   \ctyp{int}.} Se la coda esiste già il descrittore farà riferimento allo
3386 stesso oggetto, consentendo così la comunicazione fra due processi diversi.
3387
3388 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3389 possono essere specificati per \param{oflag}, che deve essere specificato come
3390 maschera binaria; i valori possibili per i vari bit sono quelli visti in
3391 tab.~\ref{tab:file_open_flags} dei quali però \func{mq\_open} riconosce solo i
3392 seguenti:
3393 \begin{basedescript}{\desclabelwidth{2cm}\desclabelstyle{\nextlinelabel}}
3394 \item[\const{O\_RDONLY}] Apre la coda solo per la ricezione di messaggi. Il
3395   processo potrà usare il descrittore con \func{mq\_receive} ma non con
3396   \func{mq\_send}.
3397 \item[\const{O\_WRONLY}] Apre la coda solo per la trasmissione di messaggi. Il
3398   processo potrà usare il descrittore con \func{mq\_send} ma non con
3399   \func{mq\_receive}.
3400 \item[\const{O\_RDWR}] Apre la coda solo sia per la trasmissione che per la
3401   ricezione. 
3402 \item[\const{O\_CREAT}] Necessario qualora si debba creare la coda; la
3403   presenza di questo bit richiede la presenza degli ulteriori argomenti
3404   \param{mode} e \param{attr}.
3405 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3406   chiamata se la coda esiste già, altrimenti esegue la creazione atomicamente.
3407 \item[\const{O\_NONBLOCK}] Imposta la coda in modalità non bloccante, le
3408   funzioni di ricezione e trasmissione non si bloccano quando non ci sono le
3409   risorse richieste, ma ritornano immediatamente con un errore di
3410   \errcode{EAGAIN}.
3411 \end{basedescript}
3412
3413 I primi tre bit specificano la modalità di apertura della coda, e sono fra
3414 loro esclusivi. Ma qualunque sia la modalità in cui si è aperta una coda,
3415 questa potrà essere riaperta più volte in una modalità diversa, e vi si potrà
3416 sempre accedere attraverso descrittori diversi, esattamente come si può fare
3417 per i file normali.
3418
3419 Se la coda non esiste e la si vuole creare si deve specificare
3420 \const{O\_CREAT}, in tal caso occorre anche specificare i permessi di
3421 creazione con l'argomento \param{mode}; i valori di quest'ultimo sono identici
3422 a quelli usati per \func{open}, anche se per le code di messaggi han senso
3423 solo i permessi di lettura e scrittura. Oltre ai permessi di creazione possono
3424 essere specificati anche gli attributi specifici della coda tramite
3425 l'argomento \param{attr}; quest'ultimo è un puntatore ad una apposita
3426 struttura \struct{mq\_attr}, la cui definizione è riportata in
3427 fig.~\ref{fig:ipc_mq_attr}.
3428
3429 \begin{figure}[!htb]
3430   \footnotesize \centering
3431   \begin{minipage}[c]{15cm}
3432     \includestruct{listati/mq_attr.h}
3433   \end{minipage} 
3434   \normalsize
3435   \caption{La struttura \structd{mq\_attr}, contenente gli attributi di una
3436     coda di messaggi POSIX.}
3437   \label{fig:ipc_mq_attr}
3438 \end{figure}
3439
3440 Per ls creazione della coda i campi della struttura che devono essere
3441 specificati sono \var{mq\_msgsize} e \var{mq\_maxmsg}, che indicano
3442 rispettivamente la dimensione massima di un messaggio ed il numero massimo di
3443 messaggi che essa può contenere. Il valore dovrà essere positivo e minore dei
3444 rispettivi limiti di sistema \const{MQ\_MAXMSG} e \const{MQ\_MSGSIZE},
3445 altrimenti la funzione fallirà con un errore di \errcode{EINVAL}.  Qualora si
3446 specifichi per \param{attr} un puntatore nullo gli attributi della coda
3447 saranno impostati ai valori predefiniti.
3448
3449 Quando l'accesso alla coda non è più necessario si può chiudere il relativo
3450 descrittore con la funzione \funcd{mq\_close}, il cui prototipo è:
3451 \begin{prototype}{mqueue.h}
3452 {int mq\_close(mqd\_t mqdes)}
3453
3454 Chiude la coda \param{mqdes}.
3455   
3456 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3457   errore; nel quel caso \var{errno} assumerà i valori \errval{EBADF} o
3458   \errval{EINTR}.}
3459 \end{prototype}
3460
3461 La funzione è analoga a \func{close},\footnote{in Linux, dove le code sono
3462   implementate come file su un filesystem dedicato, è esattamente la stessa
3463   funzione.} dopo la sua esecuzione il processo non sarà più in grado di usare
3464 il descrittore della coda, ma quest'ultima continuerà ad esistere nel sistema
3465 e potrà essere acceduta con un'altra chiamata a \func{mq\_open}. All'uscita di
3466 un processo tutte le code aperte, così come i file, vengono chiuse
3467 automaticamente. Inoltre se il processo aveva agganciato una richiesta di
3468 notifica sul descrittore che viene chiuso, questa sarà rilasciata e potrà
3469 essere richiesta da qualche altro processo.
3470
3471
3472 Quando si vuole effettivamente rimuovere una coda dal sistema occorre usare la
3473 funzione \funcd{mq\_unlink}, il cui prototipo è:
3474 \begin{prototype}{mqueue.h}
3475 {int mq\_unlink(const char *name)}
3476
3477 Rimuove una coda di messaggi.
3478   
3479 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3480   errore; nel quel caso \var{errno} assumerà gli stessi valori riportati da
3481   \func{unlink}.}
3482 \end{prototype}
3483
3484 Anche in questo caso il comportamento della funzione è analogo a quello di
3485 \func{unlink} per i file,\footnote{di nuovo l'implementazione di Linux usa
3486   direttamente \func{unlink}.} la funzione rimove la coda \param{name}, così
3487 che una successiva chiamata a \func{mq\_open} fallisce o crea una coda
3488 diversa. 
3489
3490 Come per i file ogni coda di messaggi ha un contatore di riferimenti, per cui
3491 la coda non viene effettivamente rimossa dal sistema fin quando questo non si
3492 annulla. Pertanto anche dopo aver eseguito con successo \func{mq\_unlink} la
3493 coda resterà accessibile a tutti i processi che hanno un descrittore aperto su
3494 di essa.  Allo stesso modo una coda ed i suoi contenuti resteranno disponibili
3495 all'interno del sistema anche quando quest'ultima non è aperta da nessun
3496 processo (questa è una delle differenze più rilevanti nei confronti di pipe e
3497 fifo).
3498
3499 La sola differenza fra code di messaggi POSIX e file normali è che, essendo il
3500 filesystem delle code di messaggi virtuale e basato su oggetti interni al
3501 kernel, il suo contenuto viene perduto con il riavvio del sistema.
3502
3503 Come accennato in precedenza ad ogni coda di messaggi è associata una
3504 struttura \struct{mq\_attr}, che può essere letta e modificata attraverso le
3505 due funzioni \funcd{mq\_getattr} e \funcd{mq\_setattr}, i cui prototipi sono:
3506 \begin{functions}
3507   \headdecl{mqueue.h} 
3508   
3509   \funcdecl{int mq\_getattr(mqd\_t mqdes, struct mq\_attr *mqstat)}
3510   Legge gli attributi di una coda di messaggi POSIX.
3511   
3512   \funcdecl{int mq\_setattr(mqd\_t mqdes, const struct mq\_attr *mqstat,
3513     struct mq\_attr *omqstat)}
3514   Modifica gli attributi di una coda di messaggi POSIX.
3515   
3516   \bodydesc{Entrambe le funzioni restituiscono 0 in caso di successo e -1 in
3517     caso di errore; nel quel caso \var{errno} assumerà i valori \errval{EBADF}
3518     o \errval{EINVAL}.}
3519 \end{functions}
3520
3521 La funzione \func{mq\_getattr} legge i valori correnti degli attributi della
3522 coda nella struttura puntata da \param{mqstat}; di questi l'unico relativo
3523 allo stato corrente della coda è \var{mq\_curmsgs} che indica il numero di
3524 messaggi da essa contenuti, gli altri indicano le caratteristiche generali
3525 della stessa.
3526
3527 La funzione \func{mq\_setattr} permette di modificare gli attributi di una
3528 coda tramite i valori contenuti nella struttura puntata da \param{mqstat}, ma
3529 può essere modificato solo il campo \var{mq\_flags}, gli altri campi vengono
3530 ignorati. In particolare i valori di \var{mq\_maxmsg} e \var{mq\_msgsize}
3531 possono essere specificati solo in fase ci creazione della coda.  Inoltre i
3532 soli valori possibili per \var{mq\_flags} sono 0 e \const{O\_NONBLOCK}, per
3533 cui alla fine la funzione può essere utilizzata solo per abilitare o
3534 disabilitare la modalità non bloccante. L'argomento \param{omqstat} viene
3535 usato, quando diverso da \val{NULL}, per specificare l'indirizzo di una
3536 struttura su cui salvare i valori degli attributi precedenti alla chiamata
3537 della funzione.
3538
3539 Per inserire messaggi su di una coda sono previste due funzioni,
3540 \funcd{mq\_send} e \funcd{mq\_timedsend}, i cui prototipi sono:
3541 \begin{functions}
3542   \headdecl{mqueue.h} 
3543   
3544   \funcdecl{int mq\_send(mqd\_t mqdes, const char *msg\_ptr, size\_t msg\_len,
3545     unsigned int msg\_prio)} 
3546   Esegue l'inserimento di un messaggio su una coda.
3547   
3548   \funcdecl{int mq\_timedsend(mqd\_t mqdes, const char *msg\_ptr, size\_t
3549     msg\_len, unsigned msg\_prio, const struct timespec *abs\_timeout)}   
3550   Esegue l'inserimento di un messaggio su una coda entro il tempo
3551   \param{abs\_timeout}.
3552
3553   
3554   \bodydesc{Le funzioni restituiscono 0 in caso di successo e -1 in caso di
3555     errore; nel quel caso \var{errno} assumerà i valori:
3556     \begin{errlist}
3557     \item[\errcode{EAGAIN}] Si è aperta la coda con \const{O\_NONBLOCK}, e la
3558       coda è piena.
3559     \item[\errcode{EMSGSIZE}] La lunghezza del messaggio \param{msg\_len}
3560       eccede il limite impostato per la coda.
3561     \item[\errcode{ENOMEM}] Il kernel non ha memoria sufficiente. Questo
3562       errore può avvenire quando l'inserimento del messaggio
3563     \item[\errcode{EINVAL}] Si è specificato un valore nullo per
3564       \param{msg\_len}, o un valore di \param{msg\_prio} fuori dai limiti, o
3565       un valore non valido per \param{abs\_timeout}.
3566     \item[\errcode{ETIMEDOUT}] L'inserimento del messaggio non è stato
3567       effettuato entro il tempo stabilito.
3568     \end{errlist}    
3569     ed inoltre \errval{EBADF} ed \errval{EINTR}.}
3570 \end{functions}
3571
3572 Entrambe le funzioni richiedono un puntatore al testo del messaggio
3573 nell'argomento \param{msg\_ptr} e la relativa lunghezza in \param{msg\_len}.
3574 Se quest'ultima eccede la dimensione massima specificata da \var{mq\_msgsize}
3575 le funzioni ritornano immediatamente con un errore di \errcode{EMSGSIZE}.
3576
3577 L'argomento \param{msg\_prio} indica la priorità dell'argomento; i messaggi di
3578 priorità maggiore vengono inseriti davanti a quelli di priorità inferiore (e
3579 quindi saranno riletti per primi). A parità del valore della priorità il
3580 messaggio sarà inserito in coda a tutti quelli con la stessa priorità. Il
3581 valore della priorità non può eccedere il limite di sistema
3582 \const{MQ\_PRIO\_MAX}, che nel caso è pari a 32768.
3583
3584 Qualora la coda sia piena, entrambe le funzioni si bloccano, a meno che non
3585 sia stata selezionata in fase di apertura la modalità non bloccante, nel qual
3586 caso entrambe ritornano \errcode{EAGAIN}. La sola differenza fra le due
3587 funzioni è che la seconda, passato il tempo massimo impostato con l'argomento
3588 \param{abs\_timeout}, ritorna comunque con un errore di \errcode{ETIMEDOUT}.
3589
3590
3591 Come per l'inserimento, anche per l'estrazione dei messaggi da una coda sono
3592 previste due funzioni, \funcd{mq\_receive} e \funcd{mq\_timedreceive}, i cui
3593 prototipi sono:
3594 \begin{functions}
3595   \headdecl{mqueue.h} 
3596   
3597   \funcdecl{ssize\_t mq\_receive(mqd\_t mqdes, char *msg\_ptr, size\_t
3598     msg\_len, unsigned int *msg\_prio)}   
3599   Effettua la ricezione di un messaggio da una coda.
3600   
3601   \funcdecl{ssize\_t mq\_timedreceive(mqd\_t mqdes, char *msg\_ptr, size\_t
3602     msg\_len, unsigned int *msg\_prio, const struct timespec *abs\_timeout)}
3603   Effettua la ricezione di un messaggio da una coda entro il tempo
3604   \param{abs\_timeout}.
3605   
3606   \bodydesc{Le funzioni restituiscono il numero di byte del messaggio in caso
3607     di successo e -1 in caso di errore; nel quel caso \var{errno} assumerà i
3608     valori:
3609     \begin{errlist}
3610     \item[\errcode{EAGAIN}] Si è aperta la coda con \const{O\_NONBLOCK}, e la
3611       coda è vuota.
3612     \item[\errcode{EMSGSIZE}] La lunghezza del messaggio sulla coda eccede il
3613       valore \param{msg\_len} specificato per la ricezione.
3614     \item[\errcode{EINVAL}] Si è specificato un valore nullo per
3615       \param{msg\_ptr}, o un valore non valido per \param{abs\_timeout}.
3616     \item[\errcode{ETIMEDOUT}] La ricezione del messaggio non è stata
3617       effettuata entro il tempo stabilito.
3618     \end{errlist}    
3619     ed inoltre \errval{EBADF}, \errval{EINTR}, \errval{ENOMEM}, o
3620     \errval{EINVAL}.}
3621 \end{functions}
3622
3623 La funzione estrae dalla coda il messaggio a priorità più alta, o il più
3624 vecchio fra quelli della stessa priorità. Una volta ricevuto il messaggio
3625 viene tolto dalla coda e la sua dimensione viene restituita come valore di
3626 ritorno.
3627
3628 Se la dimensione specificata da \param{msg\_len} non è sufficiente a contenere
3629 il messaggio, entrambe le funzioni, al contrario di quanto avveniva nelle code
3630 di messaggi di SysV, ritornano un errore di \errcode{EMSGSIZE} senza estrarre
3631 il messaggio.  È pertanto opportuno eseguire sempre una chiamata a
3632 \func{mq\_getaddr} prima di eseguire una ricezione, in modo da ottenere la
3633 dimensione massima dei messaggi sulla coda, per poter essere in grado di
3634 allocare dei buffer sufficientemente ampi per la lettura.
3635
3636 Se si specifica un puntatore per l'argomento \param{msg\_prio} il valore della
3637 priorità del messaggio viene memorizzato all'indirizzo da esso indicato.
3638 Qualora non interessi usare la priorità dei messaggi si può specificare
3639 \var{NULL}, ed usare un valore nullo della priorità nelle chiamate a
3640 \func{mq\_send}.
3641
3642 Si noti che con le code di messaggi POSIX non si ha la possibilità di
3643 selezionare quale messaggio estrarre con delle condizioni sulla priorità, a
3644 differenza di quanto avveniva con le code di messaggi di SysV che permettono
3645 invece la selezione in base al valore del campo \var{mtype}. Qualora non
3646 interessi usare la priorità dei messaggi si
3647
3648 Qualora la coda sia vuota entrambe le funzioni si bloccano, a meno che non si
3649 sia selezionata la modalità non bloccante; in tal caso entrambe ritornano
3650 immediatamente con l'errore \errcode{EAGAIN}. Anche in questo caso la sola
3651 differenza fra le due funzioni è che la seconda non attende indefinitamente e
3652 passato il tempo massimo \param{abs\_timeout} ritorna comunque con un errore
3653 di \errcode{ETIMEDOUT}.
3654
3655 Uno dei problemi sottolineati da Stevens in \cite{UNP2}, comuni ad entrambe le
3656 tipologie di code messaggi, è che non è possibile per chi riceve identificare
3657 chi è che ha inviato il messaggio, in particolare non è possibile sapere da
3658 quale utente esso provenga. Infatti, in mancanza di un meccanismo interno al
3659 kernel, anche se si possono inserire delle informazioni nel messaggio, queste
3660 non possono essere credute, essendo completamente dipendenti da chi lo invia.
3661 Vedremo però come, attraverso l'uso del meccanismo di notifica, sia possibile
3662 superare in parte questo problema.
3663
3664 Una caratteristica specifica delle code di messaggi POSIX è la possibilità di
3665 usufruire di un meccanismo di notifica asincrono; questo può essere attivato
3666 usando la funzione \funcd{mq\_notify}, il cui prototipo è:
3667 \begin{prototype}{mqueue.h}
3668 {int mq\_notify(mqd\_t mqdes, const struct sigevent *notification)}
3669
3670 Attiva il meccanismo di notifica per la coda \param{mqdes}.
3671   
3672 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3673   errore; nel quel caso \var{errno} assumerà i valori: 
3674     \begin{errlist}
3675     \item[\errcode{EBUSY}] C'è già un processo registrato per la notifica.
3676     \item[\errcode{EBADF}] Il descrittore non fa riferimento ad una coda di
3677       messaggi.
3678     \end{errlist}}
3679 \end{prototype}
3680
3681 Il meccanismo di notifica permette di segnalare in maniera asincrona ad un
3682 processo la presenza di dati sulla coda, in modo da evitare la necessità di
3683 bloccarsi nell'attesa. Per far questo un processo deve registrarsi con la
3684 funzione \func{mq\_notify}, ed il meccanismo è disponibile per un solo
3685 processo alla volta per ciascuna coda.
3686
3687 Il comportamento di \func{mq\_notify} dipende dal valore dell'argomento
3688 \param{notification}, che è un puntatore ad una apposita struttura
3689 \struct{sigevent}, (definita in fig.~\ref{fig:file_sigevent}) introdotta dallo
3690 standard POSIX.1b per gestire la notifica di eventi; per altri dettagli si può
3691 vedere quanto detto in sez.~\ref{sec:file_asyncronous_io} a proposito dell'uso
3692 della stessa struttura per l'invio dei segnali usati per l'I/O asincrono.
3693
3694 Attraverso questa struttura si possono impostare le modalità con cui viene
3695 effettuata la notifica; in particolare il campo \var{sigev\_notify} deve
3696 essere posto a \const{SIGEV\_SIGNAL}\footnote{il meccanismo di notifica basato
3697   sui thread, specificato tramite il valore \const{SIGEV\_THREAD}, non è
3698   implementato.} ed il campo \var{sigev\_signo} deve indicare il valore del
3699 segnale che sarà inviato al processo. Inoltre il campo \var{sigev\_value} è il
3700 puntatore ad una struttura \struct{sigval\_t} (definita in
3701 fig.~\ref{fig:sig_sigval}) che permette di restituire al gestore del segnale un
3702 valore numerico o un indirizzo,\footnote{per il suo uso si riveda la
3703   trattazione fatta in sez.~\ref{sec:sig_real_time} a proposito dei segnali
3704   real-time.} posto che questo sia installato nella forma estesa vista in
3705 sez.~\ref{sec:sig_sigaction}.
3706
3707 La funzione registra il processo chiamante per la notifica se
3708 \param{notification} punta ad una struttura \struct{sigevent} opportunamente
3709 inizializzata, o cancella una precedente registrazione se è \val{NULL}. Dato
3710 che un solo processo alla volta può essere registrato, la funzione fallisce
3711 con \errcode{EBUSY} se c'è un altro processo già registrato.  Si tenga
3712 presente inoltre che alla chiusura del descrittore associato alla coda (e
3713 quindi anche all'uscita del processo) ogni eventuale registrazione di notifica
3714 presente viene cancellata.
3715
3716 La notifica del segnale avviene all'arrivo di un messaggio in una coda vuota
3717 (cioè solo se sulla coda non ci sono messaggi) e se non c'è nessun processo
3718 bloccato in una chiamata a \func{mq\_receive}, in questo caso infatti il
3719 processo bloccato ha la precedenza ed il messaggio gli viene immediatamente
3720 inviato, mentre per il meccanismo di notifica tutto funziona come se la coda
3721 fosse rimasta vuota.
3722
3723 Quando un messaggio arriva su una coda vuota al processo che si era registrato
3724 viene inviato il segnale specificato da \code{notification->sigev\_signo}, e
3725 la coda diventa disponibile per una ulteriore registrazione.  Questo comporta
3726 che se si vuole mantenere il meccanismo di notifica occorre ripetere la
3727 registrazione chiamando nuovamente \func{mq\_notify} all'interno del gestore
3728 del segnale di notifica. A differenza della situazione simile che si aveva con
3729 i segnali non affidabili,\footnote{l'argomento è stato affrontato in
3730   \ref{sec:sig_semantics}.} questa caratteristica non configura una
3731 race-condition perché l'invio di un segnale avviene solo se la coda è vuota;
3732 pertanto se si vuole evitare di correre il rischio di perdere eventuali
3733 ulteriori segnali inviati nel lasso di tempo che occorre per ripetere la
3734 richiesta di notifica basta avere cura di eseguire questa operazione prima di
3735 estrarre i messaggi presenti dalla coda.
3736
3737 L'invio del segnale di notifica avvalora alcuni campi di informazione
3738 restituiti al gestore attraverso la struttura \struct{siginfo\_t} (definita in
3739 fig.~\ref{fig:sig_siginfo_t}). In particolare \var{si\_pid} viene impostato al
3740 valore del \acr{pid} del processo che ha emesso il segnale, \var{si\_uid}
3741 all'userid effettivo, \var{si\_code} a \const{SI\_MESGQ}, e \var{si\_errno} a
3742 0. Questo ci dice che, se si effettua la ricezione dei messaggi usando
3743 esclusivamente il meccanismo di notifica, è possibile ottenere le informazioni
3744 sul processo che ha inserito un messaggio usando un gestore per il segnale in
3745 forma estesa\footnote{di nuovo si faccia riferimento a quanto detto al
3746   proposito in sez.~\ref{sec:sig_sigaction} e sez.~\ref{sec:sig_real_time}.}
3747
3748
3749
3750 \subsection{Semafori}
3751 \label{sec:ipc_posix_sem}
3752
3753 Dei semafori POSIX esistono sostanzialmente due implementazioni; una è fatta a
3754 livello di libreria ed è fornita dalla libreria dei thread; questa però li
3755 implementa solo a livello di thread e non di processi.\footnote{questo
3756   significa che i semafori sono visibili solo all'interno dei thread creati da
3757   un singolo processo, e non possono essere usati come meccanismo di
3758   sincronizzazione fra processi diversi.} Esiste però anche una libreria
3759 realizzata da Konstantin Knizhnik, che reimplementa l'interfaccia POSIX usando
3760 i semafori di SysV IPC, e che non vale comunque la pena di usare visto che i
3761 problemi sottolineati in sez.~\ref{sec:ipc_sysv_sem} rimangono, anche se
3762 mascherati.
3763
3764 In realtà a partire dal kernel 2.5.7 è stato introdotto un meccanismo di
3765 sincronizzazione completamente nuovo, basato sui cosiddetti
3766 \textit{futex}\footnote{la sigla sta per \textit{fast user mode mutex}.}, con
3767 il quale dovrebbe essere possibile implementare una versione nativa dei
3768 semafori; esso è già stato usato con successo per reimplementare in maniera
3769 più efficiente tutte le direttive di sincronizzazione previste per i thread
3770 POSIX. L'interfaccia corrente è stata stabilizzata a partire dal kernel
3771 2.5.40.
3772
3773
3774
3775
3776 \subsection{Memoria condivisa}
3777 \label{sec:ipc_posix_shm}
3778
3779 La memoria condivisa è l'unico degli oggetti di IPC POSIX già presente nel
3780 kernel ufficiale; in realtà il supporto a questo tipo di oggetti è realizzato
3781 attraverso il filesystem \texttt{tmpfs}, uno speciale filesystem che mantiene
3782 tutti i suoi contenuti in memoria,\footnote{il filesystem \texttt{tmpfs} è
3783   diverso da un normale RAM disk, anch'esso disponibile attraverso il
3784   filesystem \texttt{ramfs}, proprio perché realizza una interfaccia
3785   utilizzabile anche per la memoria condivisa; esso infatti non ha dimensione
3786   fissa, ed usa direttamente la cache interna del kernel (che viene usata
3787   anche per la shared memory in stile SysV). In più i suoi contenuti, essendo
3788   trattati direttamente dalla memoria virtuale\index{memoria~virtuale} possono
3789   essere salvati sullo swap automaticamente.} che viene attivato abilitando
3790 l'opzione \texttt{CONFIG\_TMPFS} in fase di compilazione del kernel.
3791
3792
3793 Per potere utilizzare l'interfaccia POSIX per le code di messaggi le
3794 \acr{glibc}\footnote{le funzioni sono state introdotte con le glibc-2.2.}
3795 richiedono di compilare i programmi con l'opzione \code{-lrt}; inoltre è
3796 necessario che in \file{/dev/shm} sia montato un filesystem \texttt{tmpfs};
3797 questo di norma viene eseguita aggiungendo una riga tipo:
3798 \begin{verbatim}
3799 tmpfs   /dev/shm        tmpfs   defaults        0      0
3800 \end{verbatim}
3801 ad \file{/etc/fstab}. In realtà si può montare un filesystem \texttt{tmpfs}
3802 dove si vuole, per usarlo come RAM disk, con un comando del tipo:
3803 \begin{verbatim}
3804 mount -t tmpfs -o size=128M,nr_inodes=10k,mode=700 tmpfs /mytmpfs
3805 \end{verbatim}
3806
3807 Il filesystem riconosce, oltre quelle mostrate, le opzioni \texttt{uid} e
3808 \texttt{gid} che identificano rispettivamente utente e gruppo cui assegnarne
3809 la titolarità, e \texttt{nr\_blocks} che permette di specificarne la
3810 dimensione in blocchi, cioè in multipli di \const{PAGECACHE\_SIZE} che in
3811 questo caso è l'unità di allocazione elementare.
3812
3813 La funzione che permette di aprire un segmento di memoria condivisa POSIX, ed
3814 eventualmente di crearlo se non esiste ancora, è \funcd{shm\_open}; il suo
3815 prototipo è:
3816 \begin{prototype}{mqueue.h}
3817 {int shm\_open(const char *name, int oflag, mode\_t mode)}
3818
3819 Apre un segmento di memoria condivisa.
3820   
3821 \bodydesc{La funzione restituisce un file descriptor positivo in caso di
3822   successo e -1 in caso di errore; nel quel caso \var{errno} assumerà gli
3823   stessi valori riportati da \func{open}.}
3824 \end{prototype}
3825
3826 La funzione apre un segmento di memoria condivisa identificato dal nome
3827 \param{name}. Come già spiegato in sez.~\ref{sec:ipc_posix_generic} questo nome
3828 può essere specificato in forma standard solo facendolo iniziare per \file{/}
3829 e senza ulteriori \file{/}, Linux supporta comunque nomi generici, che
3830 verranno intepretati prendendo come radice \file{/dev/shm}.\footnote{occorre
3831   pertanto evitare di specificare qualcosa del tipo \file{/dev/shm/nome}
3832   all'interno di \param{name}, perché questo comporta, da parte delle routine
3833   di libereria, il tentativo di accedere a \file{/dev/shm/dev/shm/nome}.}
3834
3835 La funzione è del tutto analoga ad \func{open} ed analoghi sono i valori che
3836 possono essere specificati per \param{oflag}, che deve essere specificato come
3837 maschera binaria comprendente almeno uno dei due valori \const{O\_RDONLY} e
3838 \const{O\_RDWR}; i valori possibili per i vari bit sono quelli visti in
3839 tab.~\ref{tab:file_open_flags} dei quali però \func{shm\_open} riconosce solo
3840 i seguenti:
3841 \begin{basedescript}{\desclabelwidth{2.0cm}\desclabelstyle{\nextlinelabel}}
3842 \item[\const{O\_RDONLY}] Apre il file descriptor associato al segmento di
3843   memoria condivisa per l'accesso in sola lettura.
3844 \item[\const{O\_RDWR}] Apre il file descriptor associato al segmento di
3845   memoria condivisa per l'accesso in lettura e scrittura.
3846 \item[\const{O\_CREAT}] Necessario qualora si debba creare il segmento di
3847   memoria condivisa se esso non esiste; in questo caso viene usato il valore
3848   di \param{mode} per impostare i permessi, che devono essere compatibili con
3849   le modalità con cui si è aperto il file.
3850 \item[\const{O\_EXCL}] Se usato insieme a \const{O\_CREAT} fa fallire la
3851   chiamata a \func{shm\_open} se il segmento esiste già, altrimenti esegue la
3852   creazione atomicamente.
3853 \item[\const{O\_TRUNC}] Se il segmento di memoria condivisa esiste già, ne
3854   tronca le dimensioni a 0 byte.
3855 \end{basedescript}
3856
3857 In caso di successo la funzione restituisce un file descriptor associato al
3858 segmento di memoria condiviso con le stesse modalità di
3859 \func{open}\footnote{in realtà, come accennato, \func{shm\_open} è un semplice
3860   wrapper per \func{open}, usare direttamente quest'ultima avrebbe lo stesso
3861   effetto.}  viste in sez.~\ref{sec:file_open}; in particolare viene impostato
3862 il flag \const{FD\_CLOEXEC}.  Chiamate effettuate da diversi processi usando
3863 lo stesso nome, restituiranno file descriptor associati allo stesso segmento
3864 (così come, nel caso di file di dati, essi sono associati allo stesso inode).
3865 In questo modo è possibile effettuare una chiamata ad \func{mmap} sul file
3866 descriptor restituito da \func{shm\_open} ed i processi vedranno lo stesso
3867 segmento di memoria condivisa.
3868
3869 Quando il nome non esiste il segmento può essere creato specificando
3870 \const{O\_CREAT}; in tal caso il segmento avrà (così come i nuovi file)
3871 lunghezza nulla. Dato che un segmento di lunghezza nulla è di scarsa utilità,
3872 per impostarne la dimensione si deve usare \func{ftruncate} (vedi
3873 sez.~\ref{sec:file_file_size}), prima di mapparlo in memoria con \func{mmap}.
3874 Si tenga presente che una volta chiamata \func{mmap} si può chiudere il file
3875 descriptor (con \func{close}), senza che la mappatura ne risenta.
3876
3877
3878 Come per i file, quando si vuole effettivamente rimuovere segmento di memoria
3879 condivisa, occorre usare la funzione \funcd{shm\_unlink}, il cui prototipo è:
3880 \begin{prototype}{mqueue.h}
3881 {int shm\_unlink(const char *name)}
3882
3883 Rimuove un segmento di memoria condivisa.
3884   
3885 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
3886   errore; nel quel caso \var{errno} assumerà gli stessi valori riportati da
3887   \func{unlink}.}
3888 \end{prototype}
3889
3890 La funzione è del tutto analoga ad \func{unlink}, e si limita a cancellare il
3891 nome del segmento da \file{/dev/shm}, senza nessun effetto né sui file
3892 descriptor precedentemente aperti con \func{shm\_open}, né sui segmenti già
3893 mappati in memoria; questi verranno cancellati automaticamente dal sistema
3894 solo con le rispettive chiamate a \func{close} e \func{munmap}.  Una volta
3895 eseguita questa funzione però, qualora si richieda l'apertura di un segmento
3896 con lo stesso nome, la chiamata a \func{shm\_open} fallirà, a meno di non aver
3897 usato \const{O\_CREAT}, in quest'ultimo caso comunque si otterrà un file
3898 descriptor che fa riferimento ad un segmento distinto da eventuali precedenti.
3899
3900 \begin{figure}[!htb]
3901   \footnotesize \centering
3902   \begin{minipage}[c]{15.6cm}
3903     \includecodesample{listati/MemShared.c}
3904   \end{minipage} 
3905   \normalsize 
3906   \caption{Il codice delle funzioni di gestione dei segmenti di memoria
3907     condivisa POSIX.}
3908   \label{fig:ipc_posix_shmmem}
3909 \end{figure}
3910
3911 Come esempio per l'uso di queste funzioni vediamo come è possibile riscrivere
3912 una interfaccia semplificata analoga a quella vista in
3913 fig.~\ref{fig:ipc_sysv_shm_func} per la memoria condivisa in stile SysV. Il
3914 codice, riportato in fig.~\ref{fig:ipc_posix_shmmem}, è sempre contenuto nel
3915 file \file{SharedMem.c} dei sorgenti allegati.
3916
3917 La prima funzione (\texttt{\small 1--24}) è \func{CreateShm} che, dato un nome
3918 nell'argomento \var{name} crea un nuovo segmento di memoria condivisa,
3919 accessibile in lettura e scrittura, e ne restituisce l'indirizzo. Anzitutto si
3920 definiscono (\texttt{\small 8}) i flag per la successiva (\texttt{\small 9})
3921 chiamata a \func{shm\_open}, che apre il segmento in lettura e scrittura
3922 (creandolo se non esiste, ed uscendo in caso contrario) assegnandogli sul
3923 filesystem i permessi specificati dall'argomento \var{perm}. In caso di errore
3924 (\texttt{\small 10--12}) si restituisce un puntatore nullo, altrimenti si
3925 prosegue impostando (\texttt{\small 14}) la dimensione del segmento con
3926 \func{ftruncate}. Di nuovo (\texttt{\small 15--16}) si esce immediatamente
3927 restituendo un puntatore nullo in caso di errore. Poi si passa (\texttt{\small
3928   18}) a mappare in memoria il segmento con \func{mmap} specificando dei
3929 diritti di accesso corrispondenti alla modalità di apertura.  Di nuovo si
3930 restituisce (\texttt{\small 19--21}) un puntatore nullo in caso di errore,
3931 altrimenti si inizializza (\texttt{\small 22}) il contenuto del segmento al
3932 valore specificato dall'argomento \var{fill} con \func{memset}, e se ne
3933 restituisce (\texttt{\small 23}) l'indirizzo.
3934
3935 La seconda funzione (\texttt{\small 25--40}) è \func{FindShm} che trova un
3936 segmento di memoria condiviso già esistente, restituendone l'indirizzo. In
3937 questo caso si apre (\texttt{\small 31}) il segmento con \func{shm\_open}
3938 richiedendo che il segmento sia già esistente, in caso di errore
3939 (\texttt{\small 31--33}) si ritorna immediatamente un puntatore nullo.
3940 Ottenuto il file descriptor del segmento lo si mappa (\texttt{\small 35}) in
3941 memoria con \func{mmap}, restituendo (\texttt{\small 36--38}) un puntatore
3942 nullo in caso di errore, o l'indirizzo (\texttt{\small 39}) dello stesso in
3943 caso di successo.
3944
3945 La terza funzione (\texttt{\small 40--45}) è \func{RemoveShm}, e serve a
3946 cancellare un segmento di memoria condivisa. Dato che al contrario di quanto
3947 avveniva con i segmenti del SysV IPC gli oggetti allocati nel kernel vengono
3948 rilasciati automaticamente quando nessuna li usa più, tutto quello che c'è da
3949 fare (\texttt{\small 44}) in questo caso è chiamare \func{shm\_unlink},
3950 retituendo al chiamante il valore di ritorno.
3951
3952
3953
3954 %%% Local Variables: 
3955 %%% mode: latex
3956 %%% TeX-master: "gapil"
3957 %%% End: