3 %% Copyright (C) 2000-2019 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{L'intercomunicazione fra processi}
16 Uno degli aspetti fondamentali della programmazione in un sistema unix-like è
17 la comunicazione fra processi. In questo capitolo affronteremo solo i
18 meccanismi più elementari che permettono di mettere in comunicazione processi
19 diversi, come quelli tradizionali che coinvolgono \textit{pipe} e
20 \textit{fifo} e i meccanismi di intercomunicazione di System V e quelli POSIX.
22 Tralasceremo invece tutte le problematiche relative alla comunicazione
23 attraverso la rete (e le relative interfacce) che saranno affrontate in
24 dettaglio in un secondo tempo. Non affronteremo neanche meccanismi più
25 complessi ed evoluti come le RPC (\textit{Remote Procedure Calls}) che in
26 genere sono implementati da un ulteriore livello di librerie sopra i
27 meccanismi elementari.
30 \section{L'intercomunicazione fra processi tradizionale}
33 Il primo meccanismo di comunicazione fra processi introdotto nei sistemi Unix,
34 è quello delle cosiddette \textit{pipe}; esse costituiscono una delle
35 caratteristiche peculiari del sistema, in particolar modo dell'interfaccia a
36 linea di comando. In questa sezione descriveremo le sue basi, le funzioni che
37 ne gestiscono l'uso e le varie forme in cui si è evoluto.
40 \subsection{Le \textit{pipe} standard}
43 Le \textit{pipe} nascono sostanzialmente con Unix, e sono il primo, e tuttora
44 uno dei più usati, meccanismi di comunicazione fra processi. Si tratta in
45 sostanza di una coppia di file descriptor connessi fra di loro in modo che
46 quanto scrive su di uno si può rileggere dall'altro. Si viene così a
47 costituire un canale di comunicazione realizzato tramite i due file
48 descriptor, che costituisce appunto una sorta di \textsl{tubo} (che appunto il
49 significato del termine inglese \textit{pipe}) attraverso cui si possono far
52 In pratica si tratta di un buffer circolare in memoria in cui il kernel
53 appoggia i dati immessi nel file descriptor su cui si scrive per farli poi
54 riemergere dal file descriptor da cui si legge. Si tenga ben presente che in
55 questo passaggio di dati non è previsto nessun tipo di accesso al disco e che
56 nonostante l'uso dei file descriptor le \textit{pipe} non han nulla a che fare
57 con i file di dati di cui si è parlato al cap.~\ref{cha:file_IO_interface}.
59 La funzione di sistema che permette di creare questa speciale coppia di file
60 descriptor associati ad una \textit{pipe} è appunto \funcd{pipe}, ed il suo
65 \fdecl{int pipe(int filedes[2])}
66 \fdesc{Crea la coppia di file descriptor di una \textit{pipe}.}
69 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
70 caso \var{errno} assumerà uno dei valori:
72 \item[\errcode{EFAULT}] \param{filedes} non è un indirizzo valido.
74 ed inoltre \errval{EMFILE} e \errval{ENFILE} nel loro significato generico.}
77 La funzione restituisce la coppia di file descriptor nel vettore
78 \param{filedes}, il primo è aperto in lettura ed il secondo in scrittura. Come
79 accennato concetto di funzionamento di una \textit{pipe} è semplice: quello
80 che si scrive nel file descriptor aperto in scrittura viene ripresentato tale
81 e quale nel file descriptor aperto in lettura.
83 I file descriptor infatti non sono connessi a nessun file reale, ma, come
84 accennato, ad un buffer nel kernel la cui dimensione è specificata dal
85 parametro di sistema \const{PIPE\_BUF}, (vedi
86 sez.~\ref{sec:sys_file_limits}). Lo schema di funzionamento di una
87 \textit{pipe} è illustrato in fig.~\ref{fig:ipc_pipe_singular}, in cui sono
88 indicati i due capi della \textit{pipe}, associati a ciascun file descriptor,
89 con le frecce che indicano la direzione del flusso dei dati.
93 \includegraphics[height=5cm]{img/pipe}
94 \caption{Schema della struttura di una \textit{pipe}.}
95 \label{fig:ipc_pipe_singular}
98 Della funzione di sistema esiste una seconda versione, \funcd{pipe2},
99 introdotta con il kernel 2.6.27 e la \acr{glibc} 2.9 e specifica di Linux
100 (utilizzabile solo definendo la macro \macro{\_GNU\_SOURCE}), che consente di
101 impostare atomicamente le caratteristiche dei file descriptor restituiti, il
107 \fdecl{int pipe2(int pipefd[2], int flags)}
108 \fdesc{Crea la coppia di file descriptor di una \textit{pipe}.}
111 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
112 caso \var{errno} assumerà uno dei valori:
114 \item[\errcode{EINVAL}] il valore di \param{flags} non valido.
116 e gli altri già visti per \func{pipe} con lo stesso significato.}
119 Utilizzando un valore nullo per \param{flags} la funzione è identica a
120 \func{pipe}, si può però passare come valore l'OR aritmetico di uno qualunque
121 fra \const{O\_NONBLOCK} o \const{O\_CLOEXEC} che hanno l'effetto di impostare
122 su entrambi i file descriptor restituiti dalla funzione i relativi flag, già
123 descritti per \func{open} in tab.~\ref{tab:open_operation_flag}, che attivano
124 rispettivamente la modalità di accesso \textsl{non-bloccante} ed il
125 \textit{close-on-exec}.
127 Chiaramente creare una \textit{pipe} all'interno di un singolo processo non
128 serve a niente; se però ricordiamo quanto esposto in
129 sez.~\ref{sec:file_shared_access} riguardo al comportamento dei file
130 descriptor nei processi figli, è immediato capire come una \textit{pipe} possa
131 diventare un meccanismo di intercomunicazione. Un processo figlio infatti
132 condivide gli stessi file descriptor del padre, compresi quelli associati ad
133 una \textit{pipe} (secondo la situazione illustrata in
134 fig.~\ref{fig:ipc_pipe_fork}). In questo modo se uno dei processi scrive su un
135 capo della \textit{pipe}, l'altro può leggere.
139 \includegraphics[height=5cm]{img/pipefork}
140 \caption{Schema dei collegamenti ad una \textit{pipe}, condivisi fra
141 processo padre e figlio dopo l'esecuzione \func{fork}.}
142 \label{fig:ipc_pipe_fork}
145 Tutto ciò ci mostra come sia immediato realizzare un meccanismo di
146 comunicazione fra processi attraverso una \textit{pipe}, utilizzando le
147 proprietà ordinarie dei file, ma ci mostra anche qual è il principale limite
148 nell'uso delle \textit{pipe}.\footnote{Stevens in \cite{APUE} riporta come
149 limite anche il fatto che la comunicazione è unidirezionale, ma in realtà
150 questo è un limite superabile usando una coppia di \textit{pipe}, anche se
151 al costo di una maggiore complessità di gestione.} È necessario infatti che
152 i processi possano condividere i file descriptor della \textit{pipe}, e per
153 questo essi devono comunque essere \textsl{parenti} (dall'inglese
154 \textit{siblings}), cioè o derivare da uno stesso processo padre in cui è
155 avvenuta la creazione della \textit{pipe}, o, più comunemente, essere nella
156 relazione padre/figlio.
158 A differenza di quanto avviene con i file normali, la lettura da una
159 \textit{pipe} può essere bloccante (qualora non siano presenti dati), inoltre
160 se si legge da una \textit{pipe} il cui capo in scrittura è stato chiuso, si
161 avrà la ricezione di un EOF (vale a dire che la funzione \func{read} ritornerà
162 restituendo 0). Se invece si esegue una scrittura su una \textit{pipe} il cui
163 capo in lettura non è aperto il processo riceverà il segnale \signal{SIGPIPE},
164 e la funzione di scrittura restituirà un errore di \errcode{EPIPE} (al ritorno
165 del gestore, o qualora il segnale sia ignorato o bloccato).
167 La dimensione del buffer della \textit{pipe} (\const{PIPE\_BUF}) ci dà inoltre
168 un'altra importante informazione riguardo il comportamento delle operazioni di
169 lettura e scrittura su di una \textit{pipe}; esse infatti sono atomiche
170 fintanto che la quantità di dati da scrivere non supera questa
171 dimensione. Qualora ad esempio si effettui una scrittura di una quantità di
172 dati superiore l'operazione verrà effettuata in più riprese, consentendo
173 l'intromissione di scritture effettuate da altri processi.
175 La dimensione originale del buffer era di 4096 byte (uguale ad una pagina di
176 memoria) fino al kernel 2.6.11, ed è stata portata in seguito a 64kb; ma a
177 partire dal kernel 2.6.35 è stata resa disponibile l'operazione di controllo
178 \const{F\_SETPIPE\_SZ} (vedi sez.~\ref{sec:ipc_pipes}) che consente di
179 modificarne la dimensione.
183 \subsection{Un esempio dell'uso delle \textit{pipe}}
184 \label{sec:ipc_pipe_use}
186 Per capire meglio il funzionamento delle \textit{pipe} faremo un esempio di
187 quello che è il loro uso più comune, analogo a quello effettuato della shell,
188 e che consiste nell'inviare l'output di un processo (lo standard output)
189 sull'input di un altro. Realizzeremo il programma di esempio nella forma di un
190 \textit{CGI}\footnote{quella dei CGI (\textit{Common Gateway Interface}) è una
191 interfaccia che consente ad un server web di eseguire un programma il cui
192 output (che deve essere opportunamente formattato seguendo le specifiche
193 dell'interfaccia) può essere presentato come risposta ad una richiesta HTTP
194 al posto del contenuto di un file, e che ha costituito probabilmente la
195 prima modalità con cui sono state create pagine HTML dinamiche.} che genera
196 una immagine JPEG di un codice a barre, specificato come argomento in
199 Un programma che deve essere eseguito come \textit{CGI} deve rispondere a
200 delle caratteristiche specifiche, esso infatti non viene lanciato da una
201 shell, ma dallo stesso web server, alla richiesta di una specifica URL, che di
204 http://www.sito.it/cgi-bin/programma?argomento
206 ed il risultato dell'elaborazione deve essere presentato (con una intestazione
207 che ne descrive il \textit{mime-type}) sullo \textit{standard output}, in modo
208 che il server web possa reinviarlo al browser che ha effettuato la richiesta,
209 che in questo modo è in grado di visualizzarlo opportunamente.
213 \includegraphics[height=5cm]{img/pipeuse}
214 \caption{Schema dell'uso di una \textit{pipe} come mezzo di comunicazione fra
215 due processi attraverso l'esecuzione una \func{fork} e la chiusura dei
216 capi non utilizzati.}
217 \label{fig:ipc_pipe_use}
220 Per realizzare quanto voluto useremo in sequenza i programmi \cmd{barcode} e
221 \cmd{gs}, il primo infatti è in grado di generare immagini PostScript di
222 codici a barre corrispondenti ad una qualunque stringa, mentre il secondo
223 serve per poter effettuare la conversione della stessa immagine in formato
224 JPEG. Usando una \textit{pipe} potremo inviare l'output del primo sull'input
225 del secondo, secondo lo schema mostrato in fig.~\ref{fig:ipc_pipe_use}, in cui
226 la direzione del flusso dei dati è data dalle frecce continue.
228 Si potrebbe obiettare che sarebbe molto più semplice salvare il risultato
229 intermedio su un file temporaneo. Questo però non tiene conto del fatto che un
230 \textit{CGI} può essere eseguito più volte in contemporanea, e si avrebbe una
231 evidente \textit{race condition} in caso di accesso simultaneo a detto file da
232 istanze diverse. Il problema potrebbe essere superato utilizzando un sempre
233 diverso per il file temporaneo, che verrebbe creato all'avvio di ogni istanza,
234 utilizzato dai sottoprocessi, e cancellato alla fine della sua esecuzione; ma
235 a questo punto le cose non sarebbero più tanto semplici. L'uso di una
236 \textit{pipe} invece permette di risolvere il problema in maniera semplice ed
237 elegante, oltre ad essere molto più efficiente, dato che non si deve scrivere
240 Il programma ci servirà anche come esempio dell'uso delle funzioni di
241 duplicazione dei file descriptor che abbiamo trattato in
242 sez.~\ref{sec:file_dup}, in particolare di \func{dup2}. È attraverso queste
243 funzioni infatti che è possibile dirottare gli stream standard dei processi
244 (che abbiamo visto in tab.~\ref{tab:file_std_files} e
245 sez.~\ref{sec:file_stream}) sulla \textit{pipe}. In
246 fig.~\ref{fig:ipc_barcodepage_code} abbiamo riportato il corpo del programma,
247 il cui codice completo è disponibile nel file \file{BarCodePage.c} che si
248 trova nella directory dei sorgenti.
251 \footnotesize \centering
252 \begin{minipage}[c]{\codesamplewidth}
253 \includecodesample{listati/BarCodePage.c}
256 \caption{Sezione principale del codice del \textit{CGI}
257 \file{BarCodePage.c}.}
258 \label{fig:ipc_barcodepage_code}
261 La prima operazione del programma (\texttt{\small 4-12}) è quella di creare
262 le due \textit{pipe} che serviranno per la comunicazione fra i due comandi
263 utilizzati per produrre il codice a barre; si ha cura di controllare la
264 riuscita della chiamata, inviando in caso di errore un messaggio invece
265 dell'immagine richiesta. La funzione \func{WriteMess} non è riportata in
266 fig.~\ref{fig:ipc_barcodepage_code}; essa si incarica semplicemente di
267 formattare l'uscita alla maniera dei CGI, aggiungendo l'opportuno
268 \textit{mime-type}, e formattando il messaggio in HTML, in modo che
269 quest'ultimo possa essere visualizzato correttamente da un browser.
271 Una volta create le \textit{pipe}, il programma può creare (\texttt{\small
272 13-17}) il primo processo figlio, che si incaricherà (\texttt{\small
273 19-25}) di eseguire \cmd{barcode}. Quest'ultimo legge dallo standard input
274 una stringa di caratteri, la converte nell'immagine PostScript del codice a
275 barre ad essa corrispondente, e poi scrive il risultato direttamente sullo
278 Per poter utilizzare queste caratteristiche prima di eseguire \cmd{barcode} si
279 chiude (\texttt{\small 20}) il capo aperto in scrittura della prima
280 \textit{pipe}, e se ne collega (\texttt{\small 21}) il capo in lettura allo
281 \textit{standard input} usando \func{dup2}. Si ricordi che invocando
282 \func{dup2} il secondo file, qualora risulti aperto, viene, come nel caso
283 corrente, chiuso prima di effettuare la duplicazione. Allo stesso modo, dato
284 che \cmd{barcode} scrive l'immagine PostScript del codice a barre sullo
285 standard output, per poter effettuare una ulteriore redirezione il capo in
286 lettura della seconda \textit{pipe} viene chiuso (\texttt{\small 22}) mentre
287 il capo in scrittura viene collegato allo standard output (\texttt{\small
290 In questo modo all'esecuzione (\texttt{\small 25}) di \cmd{barcode} (cui si
291 passa in \var{size} la dimensione della pagina per l'immagine) quest'ultimo
292 leggerà dalla prima \textit{pipe} la stringa da codificare che gli sarà
293 inviata dal padre, e scriverà l'immagine PostScript del codice a barre sulla
296 Al contempo una volta lanciato il primo figlio, il processo padre prima chiude
297 (\texttt{\small 26}) il capo inutilizzato della prima \textit{pipe} (quello in
298 ingresso) e poi scrive (\texttt{\small 27}) la stringa da convertire sul capo
299 in uscita, così che \cmd{barcode} possa riceverla dallo \textit{standard
300 input}. A questo punto l'uso della prima \textit{pipe} da parte del padre è
301 finito ed essa può essere definitivamente chiusa (\texttt{\small 28}), si
302 attende poi (\texttt{\small 29}) che l'esecuzione di \cmd{barcode} sia
305 Alla conclusione della sua esecuzione \cmd{barcode} avrà inviato l'immagine
306 PostScript del codice a barre sul capo in scrittura della seconda
307 \textit{pipe}; a questo punto si può eseguire la seconda conversione, da PS a
308 JPEG, usando il programma \cmd{gs}. Per questo si crea (\texttt{\small
309 30-34}) un secondo processo figlio, che poi (\texttt{\small 35-42})
310 eseguirà questo programma leggendo l'immagine PostScript creata da
311 \cmd{barcode} dallo \textit{standard input}, per convertirla in JPEG.
313 Per fare tutto ciò anzitutto si chiude (\texttt{\small 37}) il capo in
314 scrittura della seconda \textit{pipe}, e se ne collega (\texttt{\small 38}) il
315 capo in lettura allo \textit{standard input}. Per poter formattare l'output
316 del programma in maniera utilizzabile da un browser, si provvede anche
317 \texttt{\small 40}) alla scrittura dell'apposita stringa di identificazione
318 del \textit{mime-type} in testa allo \textit{standard output}. A questo punto
319 si può invocare \texttt{\small 41}) \cmd{gs}, provvedendo le opportune opzioni
320 del comando che consentono di leggere il file da convertire dallo
321 \textit{standard input} e di inviare la conversione sullo \textit{standard
324 Per completare le operazioni il processo padre chiude (\texttt{\small 44}) il
325 capo in scrittura della seconda \textit{pipe}, e attende la conclusione del
326 figlio (\texttt{\small 45}); a questo punto può (\texttt{\small 46})
327 uscire. Si tenga conto che l'operazione di chiudere il capo in scrittura della
328 seconda \textit{pipe} è necessaria, infatti, se non venisse chiusa, \cmd{gs},
329 che legge il suo \textit{standard input} da detta \textit{pipe}, resterebbe
330 bloccato in attesa di ulteriori dati in ingresso (l'unico modo che un
331 programma ha per sapere che i dati in ingresso sono terminati è rilevare che
332 lo \textit{standard input} è stato chiuso), e la \func{wait} non ritornerebbe.
335 \subsection{Le funzioni \func{popen} e \func{pclose}}
336 \label{sec:ipc_popen}
338 Come si è visto la modalità più comune di utilizzo di una \textit{pipe} è
339 quella di utilizzarla per fare da tramite fra output ed input di due programmi
340 invocati in sequenza; per questo motivo lo standard POSIX.2 ha introdotto due
341 funzioni che permettono di sintetizzare queste operazioni. La prima di esse si
342 chiama \funcd{popen} ed il suo prototipo è:
347 \fdecl{FILE *popen(const char *command, const char *type)}
348 \fdesc{Esegue un programma dirottando l'uscita su una \textit{pipe}.}
351 {La funzione ritorna l'indirizzo dello stream associato alla \textit{pipe} in
352 caso di successo e \val{NULL} per un errore, nel qual caso \var{errno} potrà
353 assumere i valori relativi alle sottostanti invocazioni di \func{pipe} e
354 \func{fork} o \errcode{EINVAL} se \param{type} non è valido.}
357 La funzione crea una \textit{pipe}, esegue una \func{fork} creando un nuovo
358 processo nel quale invoca il programma \param{command} attraverso la shell (in
359 sostanza esegue \file{/bin/sh} con il flag \code{-c}).
360 L'argomento \param{type} deve essere una delle due stringhe \verb|"w"| o
361 \verb|"r"|, per richiedere che la \textit{pipe} restituita come valore di
362 ritorno sia collegata allo \textit{standard input} o allo \textit{standard
363 output} del comando invocato.
365 La funzione restituisce il puntatore ad uno stream associato alla
366 \textit{pipe} creata, che sarà aperto in sola lettura (e quindi associato allo
367 \textit{standard output} del programma indicato) in caso si sia indicato
368 \code{r}, o in sola scrittura (e quindi associato allo \textit{standard
369 input}) in caso di \code{w}. A partire dalla versione 2.9 della \acr{glibc}
370 (questa è una estensione specifica di Linux) all'argomento \param{type} può
371 essere aggiunta la lettera ``\texttt{e}'' per impostare automaticamente il
372 flag di \textit{close-on-exec} sul file descriptor sottostante (si ricordi
373 quanto spiegato in sez.~\ref{sec:file_open_close}).
375 Lo \textit{stream} restituito da \func{popen} è identico a tutti gli effetti
376 ai \textit{file stream} visti in sez.~\ref{sec:files_std_interface}, anche se
377 è collegato ad una \textit{pipe} e non ad un file, e viene sempre aperto in
378 modalità \textit{fully-buffered} (vedi sez.~\ref{sec:file_buffering}); l'unica
379 differenza con gli usuali stream è che dovrà essere chiuso dalla seconda delle
380 due nuove funzioni, \funcd{pclose}, il cui prototipo è:
384 \fdecl{int pclose(FILE *stream)}
385 \fdesc{Chiude una \textit{pipe} creata con \func{popen}.}
388 {La funzione ritorna lo stato del processo creato da \func{popen} in caso di
389 successo e $-1$ per un errore, nel qual caso \var{errno} assumerà i valori
390 derivanti dalle sottostanti funzioni \func{fclose} e \func{wait4}.}
393 La funzione chiude il file \param{stream} associato ad una \textit{pipe}
394 creato da una precedente \func{popen}, ed oltre alla chiusura dello stream si
395 incarica anche di attendere (tramite \func{wait4}) la conclusione del processo
396 creato dalla precedente \func{popen}. Se lo stato di uscita non può essere
397 letto la funzione restituirà per \var{errno} un errore di \errval{ECHILD}.
399 Per illustrare l'uso di queste due funzioni riprendiamo il problema
400 precedente: il programma mostrato in fig.~\ref{fig:ipc_barcodepage_code} per
401 quanto funzionante, è volutamente codificato in maniera piuttosto complessa,
402 inoltre doveva scontare un problema di \cmd{gs} che non era in grado di
403 riconoscere correttamente l'Encapsulated PostScript,\footnote{si fa
404 riferimento alla versione di GNU Ghostscript 6.53 (2002-02-13), usata quando
405 l'esempio venne scritto per la prima volta.} per cui si era utilizzato il
406 PostScript semplice, generando una pagina intera invece che una immagine delle
407 dimensioni corrispondenti al codice a barre.
409 Se si vuole generare una immagine di dimensioni appropriate si deve usare un
410 approccio diverso. Una possibilità sarebbe quella di ricorrere ad ulteriore
411 programma, \cmd{epstopsf}, per convertire in PDF un file EPS (che può essere
412 generato da \cmd{barcode} utilizzando l'opzione \cmd{-E}). Utilizzando un PDF
413 al posto di un EPS \cmd{gs} esegue la conversione rispettando le dimensioni
414 originarie del codice a barre e produce un JPEG di dimensioni corrette.
416 Questo approccio però non può funzionare per via di una delle caratteristiche
417 principali delle \textit{pipe}. Per poter effettuare la conversione di un PDF
418 infatti è necessario, per la struttura del formato, potersi spostare (con
419 \func{lseek}) all'interno del file da convertire. Se si esegue la conversione
420 con \cmd{gs} su un file regolare non ci sono problemi, una \textit{pipe} però
421 è rigidamente sequenziale, e l'uso di \func{lseek} su di essa fallisce sempre
422 con un errore di \errcode{ESPIPE}, rendendo impossibile la conversione.
423 Questo ci dice che in generale la concatenazione di vari programmi funzionerà
424 soltanto quando tutti prevedono una lettura sequenziale del loro input.
426 Per questo motivo si è dovuto utilizzare un procedimento diverso, eseguendo
427 prima la conversione (sempre con \cmd{gs}) del PS in un altro formato
428 intermedio, il PPM,\footnote{il \textit{Portable PixMap file format} è un
429 formato usato spesso come formato intermedio per effettuare conversioni, è
430 infatti molto facile da manipolare, dato che usa caratteri ASCII per
431 memorizzare le immagini, anche se per questo è estremamente inefficiente
432 come formato di archiviazione.} dal quale poi si può ottenere un'immagine
433 di dimensioni corrette attraverso vari programmi di manipolazione
434 (\cmd{pnmcrop}, \cmd{pnmmargin}) che può essere infine trasformata in PNG (con
437 In questo caso però occorre eseguire in sequenza ben quattro comandi diversi,
438 inviando l'uscita di ciascuno all'ingresso del successivo, per poi ottenere il
439 risultato finale sullo \textit{standard output}: un caso classico di
440 utilizzazione delle \textit{pipe}, in cui l'uso di \func{popen} e \func{pclose}
441 permette di semplificare notevolmente la stesura del codice.
443 Nel nostro caso, dato che ciascun processo deve scrivere la sua uscita sullo
444 \textit{standard input} del successivo, occorrerà usare \func{popen} aprendo
445 la \textit{pipe} in scrittura. Il codice del nuovo programma è riportato in
446 fig.~\ref{fig:ipc_barcode_code}. Come si può notare l'ordine di invocazione
447 dei programmi è l'inverso di quello in cui ci si aspetta che vengano
448 effettivamente eseguiti. Questo non comporta nessun problema dato che la
449 lettura su una \textit{pipe} è bloccante, per cui un processo, anche se
450 lanciato per primo, se non ottiene i dati che gli servono si bloccherà in
451 attesa sullo \textit{standard input} finché non otterrà il risultato
452 dell'elaborazione del processo che li deve creare, che pur essendo logicamente
453 precedente, viene lanciato dopo di lui.
456 \footnotesize \centering
457 \begin{minipage}[c]{\codesamplewidth}
458 \includecodesample{listati/BarCode.c}
461 \caption{Codice completo del \textit{CGI} \file{BarCode.c}.}
462 \label{fig:ipc_barcode_code}
465 Nel nostro caso il primo passo (\texttt{\small 14}) è scrivere il
466 \textit{mime-type} sullo \textit{standard output}; a questo punto il processo
467 padre non necessita più di eseguire ulteriori operazioni sullo
468 \textit{standard output} e può tranquillamente provvedere alla redirezione.
470 Dato che i vari programmi devono essere lanciati in successione, si è
471 approntato un ciclo (\texttt{\small 15-19}) che esegue le operazioni in
472 sequenza: prima crea una \textit{pipe} (\texttt{\small 17}) per la scrittura
473 eseguendo il programma con \func{popen}, in modo che essa sia collegata allo
474 \textit{standard input}, e poi redirige (\texttt{\small 18}) lo
475 \textit{standard output} su detta \textit{pipe}.
477 In questo modo il primo processo ad essere invocato (che è l'ultimo della
478 catena) scriverà ancora sullo \textit{standard output} del processo padre, ma
479 i successivi, a causa di questa redirezione, scriveranno sulla \textit{pipe}
480 associata allo \textit{standard input} del processo invocato nel ciclo
483 Alla fine tutto quello che resta da fare è lanciare (\texttt{\small 21}) il
484 primo processo della catena, che nel caso è \cmd{barcode}, e scrivere
485 (\texttt{\small 23}) la stringa del codice a barre sulla \textit{pipe}, che è
486 collegata al suo \textit{standard input}, infine si può eseguire
487 (\texttt{\small 24-27}) un ciclo che chiuda con \func{pclose}, nell'ordine
488 inverso rispetto a quello in cui le si sono create, tutte le \textit{pipe}
489 create in precedenza.
492 \subsection{Le \textit{pipe} con nome, o \textit{fifo}}
493 \label{sec:ipc_named_pipe}
495 Come accennato in sez.~\ref{sec:ipc_pipes} il problema delle \textit{pipe} è
496 che esse possono essere utilizzate solo da processi con un progenitore comune
497 o nella relazione padre/figlio. Per superare questo problema lo standard
498 POSIX.1 ha introdotto le \textit{fifo}, che hanno le stesse caratteristiche
499 delle \textit{pipe}, ma che invece di essere visibili solo attraverso un file
500 descriptor creato all'interno di un processo da una \textit{system call}
501 apposita, costituiscono un oggetto che risiede sul filesystem (si rammenti
502 quanto detto in sez.~\ref{sec:file_file_types}) che può essere aperto come un
503 qualunque file, così che i processi le possono usare senza dovere per forza
504 essere in una relazione di \textsl{parentela}.
506 Utilizzando una \textit{fifo} tutti i dati passeranno, come per le
507 \textit{pipe}, attraverso un buffer nel kernel, senza transitare dal
508 filesystem. Il fatto che siano associate ad un \textit{inode} presente sul
509 filesystem serve infatti solo a fornire un punto di accesso per i processi,
510 che permetta a questi ultimi di accedere alla stessa \textit{fifo} senza avere
511 nessuna relazione, con una semplice \func{open}. Il comportamento delle
512 funzioni di lettura e scrittura è identico a quello illustrato per le
513 \textit{pipe} in sez.~\ref{sec:ipc_pipes}.
515 Abbiamo già trattato in sez.~\ref{sec:file_mknod} le funzioni \func{mknod} e
516 \func{mkfifo} che permettono di creare una \textit{fifo}. Per utilizzarne una
517 un processo non avrà che da aprire il relativo file speciale o in lettura o
518 scrittura; nel primo caso il processo sarà collegato al capo di uscita della
519 \textit{fifo}, e dovrà leggere, nel secondo al capo di ingresso, e dovrà
522 Il kernel alloca un singolo buffer per ciascuna \textit{fifo} che sia stata
523 aperta, e questa potrà essere acceduta contemporaneamente da più processi, sia
524 in lettura che in scrittura. Dato che per funzionare deve essere aperta in
525 entrambe le direzioni, per una \textit{fifo} la funzione \func{open} di norma
526 si blocca se viene eseguita quando l'altro capo non è aperto.
528 Le \textit{fifo} però possono essere anche aperte in modalità
529 \textsl{non-bloccante}, nel qual caso l'apertura del capo in lettura avrà
530 successo solo quando anche l'altro capo è aperto, mentre l'apertura del capo
531 in scrittura restituirà l'errore di \errcode{ENXIO} fintanto che non verrà
532 aperto il capo in lettura.
534 In Linux è possibile aprire le \textit{fifo} anche in lettura/scrittura (lo
535 standard POSIX lascia indefinito il comportamento in questo caso) operazione
536 che avrà sempre successo immediato qualunque sia la modalità di apertura,
537 bloccante e non bloccante. Questo può essere utilizzato per aprire comunque
538 una \textit{fifo} in scrittura anche se non ci sono ancora processi il
539 lettura. Infine è possibile anche usare la \textit{fifo} all'interno di un
540 solo processo, nel qual caso però occorre stare molto attenti alla possibili
541 situazioni di stallo: se si cerca di leggere da una \textit{fifo} che non
542 contiene dati si avrà infatti un \textit{deadlock} immediato, dato che il
543 processo si blocca e quindi non potrà mai eseguire le funzioni di scrittura.
545 Per la loro caratteristica di essere accessibili attraverso il filesystem, è
546 piuttosto frequente l'utilizzo di una \textit{fifo} come canale di
547 comunicazione nelle situazioni un processo deve ricevere informazioni da
548 altri. In questo caso è fondamentale che le operazioni di scrittura siano
549 atomiche; per questo si deve sempre tenere presente che questo è vero soltanto
550 fintanto che non si supera il limite delle dimensioni di \const{PIPE\_BUF} (si
551 ricordi quanto detto in sez.~\ref{sec:ipc_pipes}).
553 A parte il caso precedente, che resta probabilmente il più comune, Stevens
554 riporta in \cite{APUE} altre due casistiche principali per l'uso delle
557 \item Da parte dei comandi di shell, per evitare la creazione di file
558 temporanei quando si devono inviare i dati di uscita di un processo
559 sull'input di parecchi altri (attraverso l'uso del comando \cmd{tee}).
560 \item Come canale di comunicazione fra un client ed un
561 server (il modello \textit{client-server} è illustrato in
562 sez.~\ref{sec:net_cliserv}).
565 Nel primo caso quello che si fa è creare tante \textit{fifo} da usare come
566 \textit{standard input} quanti sono i processi a cui i vogliono inviare i
567 dati; questi ultimi saranno stati posti in esecuzione ridirigendo lo
568 \textit{standard input} dalle \textit{fifo}, si potrà poi eseguire il processo
569 che fornisce l'output replicando quest'ultimo, con il comando \cmd{tee}, sulle
572 Il secondo caso è relativamente semplice qualora si debba comunicare con un
573 processo alla volta, nel qual caso basta usare due \textit{fifo}, una per
574 leggere ed una per scrivere. Le cose diventano invece molto più complesse
575 quando si vuole effettuare una comunicazione fra un server ed un numero
576 imprecisato di client. Se il primo infatti può ricevere le richieste
577 attraverso una \textit{fifo} ``\textsl{nota}'', per le risposte non si può
578 fare altrettanto, dato che, per la struttura sequenziale delle \textit{fifo},
579 i client dovrebbero sapere prima di leggerli quando i dati inviati sono
582 Per risolvere questo problema, si può usare un'architettura come quella
583 illustrata in fig.~\ref{fig:ipc_fifo_server_arch} in cui i client
584 inviano le richieste al server su una \textit{fifo} nota mentre le
585 risposte vengono reinviate dal server a ciascuno di essi su una
586 \textit{fifo} temporanea creata per l'occasione.
590 \includegraphics[height=9cm]{img/fifoserver}
591 \caption{Schema dell'utilizzo delle \textit{fifo} nella realizzazione di una
592 architettura di comunicazione client/server.}
593 \label{fig:ipc_fifo_server_arch}
596 Come esempio di uso questa architettura e dell'uso delle \textit{fifo},
597 abbiamo scritto un server di \textit{fortunes}, che restituisce, alle
598 richieste di un client, un detto a caso estratto da un insieme di frasi. Sia
599 il numero delle frasi dell'insieme, che i file da cui esse vengono lette
600 all'avvio, sono impostabili da riga di comando. Il corpo principale del
601 server è riportato in fig.~\ref{fig:ipc_fifo_server}, dove si è
602 tralasciata la parte che tratta la gestione delle opzioni a riga di comando,
603 che effettua l'impostazione delle variabili \var{fortunefilename}, che indica
604 il file da cui leggere le frasi, ed \var{n}, che indica il numero di frasi
605 tenute in memoria, ad un valore diverso da quelli preimpostati. Il codice
606 completo è nel file \file{FortuneServer.c}.
608 \begin{figure}[!htbp]
609 \footnotesize \centering
610 \begin{minipage}[c]{\codesamplewidth}
611 \includecodesample{listati/FortuneServer.c}
614 \caption{Sezione principale del codice del server di \textit{fortunes}
615 basato sulle \textit{fifo}.}
616 \label{fig:ipc_fifo_server}
619 Il server richiede (\texttt{\small 12}) che sia stata impostata una dimensione
620 dell'insieme delle frasi non nulla, dato che l'inizializzazione del vettore
621 \var{fortune} avviene solo quando questa dimensione viene specificata, la
622 presenza di un valore nullo provoca l'uscita dal programma attraverso la
623 funzione (non riportata) che ne stampa le modalità d'uso. Dopo di che
624 installa (\texttt{\small 13-15}) la funzione che gestisce i segnali di
625 interruzione (anche questa non è riportata in fig.~\ref{fig:ipc_fifo_server})
626 che si limita a rimuovere dal filesystem la \textit{fifo} usata dal server per
629 Terminata l'inizializzazione (\texttt{\small 16}) si effettua la chiamata alla
630 funzione \code{FortuneParse} che legge dal file specificato in
631 \var{fortunefilename} le prime \var{n} frasi e le memorizza (allocando
632 dinamicamente la memoria necessaria) nel vettore di puntatori \var{fortune}.
633 Anche il codice della funzione non è riportato, in quanto non direttamente
634 attinente allo scopo dell'esempio.
636 Il passo successivo (\texttt{\small 17-22}) è quello di creare con
637 \func{mkfifo} la \textit{fifo} nota sulla quale il server ascolterà le
638 richieste, qualora si riscontri un errore il server uscirà (escludendo
639 ovviamente il caso in cui la funzione \func{mkfifo} fallisce per la precedente
640 esistenza della \textit{fifo}).
642 Una volta che si è certi che la \textit{fifo} di ascolto esiste la procedura
643 di inizializzazione è completata. A questo punto (\texttt{\small 23}) si può
644 chiamare la funzione \func{daemon} per far proseguire l'esecuzione del
645 programma in background come demone. Si può quindi procedere (\texttt{\small
646 24-33}) alla apertura della \textit{fifo}: si noti che questo viene fatto
647 due volte, prima in lettura e poi in scrittura, per evitare di dover gestire
648 all'interno del ciclo principale il caso in cui il server è in ascolto ma non
649 ci sono client che effettuano richieste. Si ricordi infatti che quando una
650 \textit{fifo} è aperta solo dal capo in lettura, l'esecuzione di \func{read}
651 ritorna con zero byte (si ha cioè una condizione di \textit{end-of-file}).
653 Nel nostro caso la prima apertura si bloccherà fintanto che un qualunque
654 client non apre a sua volta la \textit{fifo} nota in scrittura per effettuare
655 la sua richiesta. Pertanto all'inizio non ci sono problemi, il client però,
656 una volta ricevuta la risposta, uscirà, chiudendo tutti i file aperti,
657 compresa la \textit{fifo}. A questo punto il server resta (se non ci sono
658 altri client che stanno effettuando richieste) con la \textit{fifo} chiusa sul
659 lato in lettura, ed in questo stato la funzione \func{read} non si bloccherà
660 in attesa di dati in ingresso, ma ritornerà in continuazione, restituendo una
661 condizione di \textit{end-of-file}.
663 Si è usata questa tecnica per compatibilità, Linux infatti supporta l'apertura
664 delle \textit{fifo} in lettura/scrittura, per cui si sarebbe potuto effettuare
665 una singola apertura con \const{O\_RDWR}; la doppia apertura comunque ha il
666 vantaggio che non si può scrivere per errore sul capo aperto in sola lettura.
668 Per questo motivo, dopo aver eseguito l'apertura in lettura (\texttt{\small
669 24-28}),\footnote{di solito si effettua l'apertura del capo in lettura di
670 una \textit{fifo} in modalità non bloccante, per evitare il rischio di uno
671 stallo: se infatti nessuno apre la \textit{fifo} in scrittura il processo
672 non ritornerà mai dalla \func{open}. Nel nostro caso questo rischio non
673 esiste, mentre è necessario potersi bloccare in lettura in attesa di una
674 richiesta.} si esegue una seconda apertura in scrittura (\texttt{\small
675 29-32}), scartando il relativo file descriptor, che non sarà mai usato, in
676 questo modo però la \textit{fifo} resta comunque aperta anche in scrittura,
677 cosicché le successive chiamate a \func{read} possono bloccarsi.
679 A questo punto si può entrare nel ciclo principale del programma che fornisce
680 le risposte ai client (\texttt{\small 34-50}); questo viene eseguito
681 indefinitamente (l'uscita del server viene effettuata inviando un segnale, in
682 modo da passare attraverso la funzione di chiusura che cancella la
685 Il server è progettato per accettare come richieste dai client delle stringhe
686 che contengono il nome della \textit{fifo} sulla quale deve essere inviata la
687 risposta. Per cui prima (\texttt{\small 35-39}) si esegue la lettura dalla
688 stringa di richiesta dalla \textit{fifo} nota (che a questo punto si bloccherà
689 tutte le volte che non ci sono richieste). Dopo di che, una volta terminata la
690 stringa (\texttt{\small 40}) e selezionato (\texttt{\small 41}) un numero
691 casuale per ricavare la frase da inviare, si procederà (\texttt{\small
692 42-46}) all'apertura della \textit{fifo} per la risposta, che poi
693 (\texttt{\small 47-48}) vi sarà scritta. Infine (\texttt{\small 49}) si
694 chiude la \textit{fifo} di risposta che non serve più.
696 Il codice del client è invece riportato in fig.~\ref{fig:ipc_fifo_client},
697 anche in questo caso si è omessa la gestione delle opzioni e la funzione che
698 stampa a video le informazioni di utilizzo ed esce, riportando solo la sezione
699 principale del programma e le definizioni delle variabili. Il codice completo
700 è nel file \file{FortuneClient.c} dei sorgenti allegati.
702 \begin{figure}[!htbp]
703 \footnotesize \centering
704 \begin{minipage}[c]{\codesamplewidth}
705 \includecodesample{listati/FortuneClient.c}
708 \caption{Sezione principale del codice del client di \textit{fortunes}
709 basato sulle \textit{fifo}.}
710 \label{fig:ipc_fifo_client}
713 La prima istruzione (\texttt{\small 12}) compone il nome della \textit{fifo}
714 che dovrà essere utilizzata per ricevere la risposta dal server. Si usa il
715 \ids{PID} del processo per essere sicuri di avere un nome univoco; dopo di che
716 (\texttt{\small 13-18}) si procede alla creazione del relativo file, uscendo
717 in caso di errore (a meno che il file non sia già presente sul filesystem).
719 A questo punto il client può effettuare l'interrogazione del server, per
720 questo prima si apre la \textit{fifo} nota (\texttt{\small 19-23}), e poi ci
721 si scrive (\texttt{\small 24}) la stringa composta in precedenza, che contiene
722 il nome della \textit{fifo} da utilizzare per la risposta. Infine si richiude
723 la \textit{fifo} del server che a questo punto non serve più (\texttt{\small
726 Inoltrata la richiesta si può passare alla lettura della risposta; anzitutto
727 si apre (\texttt{\small 26-30}) la \textit{fifo} appena creata, da cui si
728 deve riceverla, dopo di che si effettua una lettura (\texttt{\small 31})
729 nell'apposito buffer; si è supposto, come è ragionevole, che le frasi inviate
730 dal server siano sempre di dimensioni inferiori a \const{PIPE\_BUF},
731 tralasciamo la gestione del caso in cui questo non è vero. Infine si stampa
732 (\texttt{\small 32}) a video la risposta, si chiude (\texttt{\small 33}) la
733 \textit{fifo} e si cancella (\texttt{\small 34}) il relativo file. Si noti
734 come la \textit{fifo} per la risposta sia stata aperta solo dopo aver inviato
735 la richiesta, se non si fosse fatto così si avrebbe avuto uno stallo, in
736 quanto senza la richiesta, il server non avrebbe potuto aprirne il capo in
737 scrittura e l'apertura si sarebbe bloccata indefinitamente.
739 Verifichiamo allora il comportamento dei nostri programmi, in questo, come in
740 altri esempi precedenti, si fa uso delle varie funzioni di servizio, che sono
741 state raccolte nella libreria \file{libgapil.so}, e per poterla usare
742 occorrerà definire la variabile di ambiente \envvar{LD\_LIBRARY\_PATH} in modo
743 che il linker dinamico possa accedervi.
745 In generale questa variabile indica il \textit{pathname} della directory
746 contenente la libreria. Nell'ipotesi (che daremo sempre per verificata) che si
747 facciano le prove direttamente nella directory dei sorgenti (dove di norma
748 vengono creati sia i programmi che la libreria), il comando da dare sarà
749 \code{export LD\_LIBRARY\_PATH=./}; a questo punto potremo lanciare il server,
750 facendogli leggere una decina di frasi, con:
752 [piccardi@gont sources]$ \textbf{./fortuned -n10}
756 Avendo usato \func{daemon} per eseguire il server in background il comando
757 ritornerà immediatamente, ma potremo verificare con \cmd{ps} che in effetti il
758 programma resta un esecuzione in background, e senza avere associato un
759 terminale di controllo (si ricordi quanto detto in sez.~\ref{sec:sess_daemon}):
761 [piccardi@gont sources]$ \textbf{ps aux}
763 piccardi 27489 0.0 0.0 1204 356 ? S 01:06 0:00 ./fortuned -n10
764 piccardi 27492 3.0 0.1 2492 764 pts/2 R 01:08 0:00 ps aux
767 e si potrà verificare anche che in \file{/tmp} è stata creata la \textit{fifo}
768 di ascolto \file{fortune.fifo}. A questo punto potremo interrogare il server
769 con il programma client; otterremo così:
771 [piccardi@gont sources]$ \textbf{./fortune}
772 Linux ext2fs has been stable for a long time, now it's time to break it
773 -- Linuxkongreß '95 in Berlin
774 [piccardi@gont sources]$ \textbf{./fortune}
775 Let's call it an accidental feature.
777 [piccardi@gont sources]$ \textbf{./fortune}
778 ......... Escape the 'Gates' of Hell
781 ::: .:: .:.::. .:: .:: `::. :'
782 ::: :: :: :: :: :: :::.
783 ::: .::. .:: ::. `::::. .:' ::.
784 ...:::.....................::' .::::..
785 -- William E. Roadcap
786 [piccardi@gont sources]$ ./fortune
787 Linux ext2fs has been stable for a long time, now it's time to break it
788 -- Linuxkongreß '95 in Berlin
791 e ripetendo varie volte il comando otterremo, in ordine casuale, le dieci
792 frasi tenute in memoria dal server.
794 Infine per chiudere il server basterà inviargli un segnale di terminazione (ad
795 esempio con \cmd{killall fortuned}) e potremo verificare che il gestore del
796 segnale ha anche correttamente cancellato la \textit{fifo} di ascolto da
799 Benché il nostro sistema client-server funzioni, la sua struttura è piuttosto
800 complessa e continua ad avere vari inconvenienti\footnote{lo stesso Stevens,
801 che esamina questa architettura in \cite{APUE}, nota come sia impossibile
802 per il server sapere se un client è andato in crash, con la possibilità di
803 far restare le \textit{fifo} temporanee sul filesystem, di come sia
804 necessario intercettare \signal{SIGPIPE} dato che un client può terminare
805 dopo aver fatto una richiesta, ma prima che la risposta sia inviata (cosa
806 che nel nostro esempio non è stata fatta).}; in generale infatti
807 l'interfaccia delle \textit{fifo} non è adatta a risolvere questo tipo di
808 problemi, che possono essere affrontati in maniera più semplice ed efficace o
809 usando i socket (che tratteremo in dettaglio a partire da
810 cap.~\ref{cha:socket_intro}) o ricorrendo a meccanismi di comunicazione
811 diversi, come quelli che esamineremo in seguito.
815 \subsection{La funzione \func{socketpair}}
816 \label{sec:ipc_socketpair}
818 Un meccanismo di comunicazione molto simile alle \textit{pipe}, ma che non
819 presenta il problema della unidirezionalità del flusso dei dati, è quello dei
820 cosiddetti \textsl{socket locali} (o \textit{Unix domain socket}). Tratteremo
821 in generale i socket in cap.~\ref{cha:socket_intro}, nell'ambito
822 dell'interfaccia che essi forniscono per la programmazione di rete, e vedremo
823 anche (in~sez.~\ref{sec:sock_sa_local}) come si possono utilizzare i file
824 speciali di tipo socket, analoghi a quelli associati alle \textit{fifo} (si
825 rammenti sez.~\ref{sec:file_file_types}) cui si accede però attraverso quella
826 medesima interfaccia; vale però la pena esaminare qui una modalità di uso dei
827 socket locali che li rende sostanzialmente identici ad una \textit{pipe}
830 La funzione di sistema \funcd{socketpair}, introdotta da BSD ma supportata in
831 genere da qualunque sistema che fornisca l'interfaccia dei socket ed inclusa
832 in POSIX.1-2001, consente infatti di creare una coppia di file descriptor
833 connessi fra loro (tramite un socket, appunto) senza dover ricorrere ad un
834 file speciale sul filesystem. I descrittori sono del tutto analoghi a quelli
835 che si avrebbero con una chiamata a \func{pipe}, con la sola differenza è che
836 in questo caso il flusso dei dati può essere effettuato in entrambe le
837 direzioni. Il prototipo della funzione è:
842 \fdecl{int socketpair(int domain, int type, int protocol, int sv[2])}
843 \fdesc{Crea una coppia di socket connessi fra loro.}
846 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
847 caso \var{errno} assumerà uno dei valori:
849 \item[\errcode{EAFNOSUPPORT}] i socket locali non sono supportati.
850 \item[\errcode{EOPNOTSUPP}] il protocollo specificato non supporta la
851 creazione di coppie di socket.
852 \item[\errcode{EPROTONOSUPPORT}] il protocollo specificato non è supportato.
854 ed inoltre \errval{EFAULT}, \errval{EMFILE} e \errval{ENFILE} nel loro
855 significato generico.}
858 La funzione restituisce in \param{sv} la coppia di descrittori connessi fra di
859 loro: quello che si scrive su uno di essi sarà ripresentato in input
860 sull'altro e viceversa. Gli argomenti \param{domain}, \param{type} e
861 \param{protocol} derivano dall'interfaccia dei socket (vedi
862 sez.~\ref{sec:sock_creation}) che è quella che fornisce il substrato per
863 connettere i due descrittori, ma in questo caso i soli valori validi che
864 possono essere specificati sono rispettivamente \const{AF\_UNIX},
865 \const{SOCK\_STREAM} e \val{0}.
867 A partire dal kernel 2.6.27 la funzione supporta nell'indicazione del tipo di
868 socket anche i due flag \const{SOCK\_NONBLOCK} e \const{SOCK\_CLOEXEC}
869 (trattati in sez.~\ref{sec:sock_type}), con effetto identico agli analoghi
870 \const{O\_CLOEXEC} e \const{O\_NONBLOCK} di una \func{open} (vedi
871 tab.~\ref{tab:open_operation_flag}).
873 L'utilità di chiamare questa funzione per evitare due chiamate a \func{pipe}
874 può sembrare limitata; in realtà l'utilizzo di questa funzione (e dei socket
875 locali in generale) permette di trasmettere attraverso le linea non solo dei
876 dati, ma anche dei file descriptor: si può cioè passare da un processo ad un
877 altro un file descriptor, con una sorta di duplicazione dello stesso non
878 all'interno di uno stesso processo, ma fra processi distinti (torneremo su
879 questa funzionalità in sez.~\ref{sec:sock_fd_passing}).
882 \section{L'intercomunicazione fra processi di System V}
885 Benché le \textit{pipe} e le \textit{fifo} siano ancora ampiamente usate, esse
886 scontano il limite fondamentale che il meccanismo di comunicazione che
887 forniscono è rigidamente sequenziale: una situazione in cui un processo scrive
888 qualcosa che molti altri devono poter leggere non può essere implementata con
891 Per questo nello sviluppo di System V vennero introdotti una serie di nuovi
892 oggetti per la comunicazione fra processi ed una nuova interfaccia di
893 programmazione, poi inclusa anche in POSIX.1-2001, che fossero in grado di
894 garantire una maggiore flessibilità. In questa sezione esamineremo come Linux
895 supporta quello che viene chiamato il \textsl{Sistema di comunicazione fra
896 processi} di System V, cui da qui in avanti faremo riferimento come
897 \textit{SysV-IPC} (dove IPC è la sigla di \textit{Inter-Process
902 \subsection{Considerazioni generali}
903 \label{sec:ipc_sysv_generic}
905 La principale caratteristica del \textit{SysV-IPC} è quella di essere basato
906 su oggetti permanenti che risiedono nel kernel. Questi, a differenza di quanto
907 avviene per i file descriptor, non mantengono un contatore dei riferimenti, e
908 non vengono cancellati dal sistema una volta che non sono più in uso. Questo
909 comporta due problemi: il primo è che, al contrario di quanto avviene per
910 \textit{pipe} e \textit{fifo}, la memoria allocata per questi oggetti non
911 viene rilasciata automaticamente quando non c'è più nessuno che li utilizzi ed
912 essi devono essere cancellati esplicitamente, se non si vuole che restino
913 attivi fino al riavvio del sistema. Il secondo problema è, dato che non c'è
914 come per i file un contatore del numero di riferimenti che ne indichi l'essere
915 in uso, che essi possono essere cancellati anche se ci sono dei processi che
916 li stanno utilizzando, con tutte le conseguenze (ovviamente assai sgradevoli)
919 Un'ulteriore caratteristica negativa è che gli oggetti usati nel
920 \textit{SysV-IPC} vengono creati direttamente dal kernel, e sono accessibili
921 solo specificando il relativo \textsl{identificatore}. Questo è un numero
922 progressivo (un po' come il \ids{PID} dei processi) che il kernel assegna a
923 ciascuno di essi quanto vengono creati (sul procedimento di assegnazione
924 torneremo in sez.~\ref{sec:ipc_sysv_id_use}). L'identificatore viene
925 restituito dalle funzioni che creano l'oggetto, ed è quindi locale al processo
926 che le ha eseguite. Dato che l'identificatore viene assegnato dinamicamente
927 dal kernel non è possibile prevedere quale sarà, né utilizzare un qualche
928 valore statico, si pone perciò il problema di come processi diversi possono
929 accedere allo stesso oggetto.
931 Per risolvere il problema nella struttura \struct{ipc\_perm} che il kernel
932 associa a ciascun oggetto, viene mantenuto anche un campo apposito che
933 contiene anche una \textsl{chiave}, identificata da una variabile del tipo
934 primitivo \type{key\_t}, da specificare in fase di creazione dell'oggetto, e
935 tramite la quale è possibile ricavare l'identificatore.\footnote{in sostanza
936 si sposta il problema dell'accesso dalla classificazione in base
937 all'identificatore alla classificazione in base alla chiave, una delle tante
938 complicazioni inutili presenti nel \textit{SysV-IPC}.} Oltre la chiave, la
939 struttura, la cui definizione è riportata in fig.~\ref{fig:ipc_ipc_perm},
940 mantiene varie proprietà ed informazioni associate all'oggetto.
943 \footnotesize \centering
944 \begin{minipage}[c]{0.80\textwidth}
945 \includestruct{listati/ipc_perm.h}
948 \caption{La struttura \structd{ipc\_perm}, come definita in
949 \headfiled{sys/ipc.h}.}
950 \label{fig:ipc_ipc_perm}
953 Usando la stessa chiave due processi diversi possono ricavare l'identificatore
954 associato ad un oggetto ed accedervi. Il problema che sorge a questo punto è
955 come devono fare per accordarsi sull'uso di una stessa chiave. Se i processi
956 sono \textsl{imparentati} la soluzione è relativamente semplice, in tal caso
957 infatti si può usare il valore speciale \constd{IPC\_PRIVATE} per creare un
958 nuovo oggetto nel processo padre, l'identificatore così ottenuto sarà
959 disponibile in tutti i figli, e potrà essere passato come argomento attraverso
962 Però quando i processi non sono \textsl{imparentati} (come capita tutte le
963 volte che si ha a che fare con un sistema client-server) tutto questo non è
964 possibile; si potrebbe comunque salvare l'identificatore su un file noto, ma
965 questo ovviamente comporta lo svantaggio di doverselo andare a rileggere. Una
966 alternativa più efficace è quella che i programmi usino un valore comune per
967 la chiave (che ad esempio può essere dichiarato in un header comune), ma c'è
968 sempre il rischio che questa chiave possa essere stata già utilizzata da
969 qualcun altro. Dato che non esiste una convenzione su come assegnare queste
970 chiavi in maniera univoca l'interfaccia mette a disposizione una funzione
971 apposita, \funcd{ftok}, che permette di ottenere una chiave specificando il
972 nome di un file ed un numero di versione; il suo prototipo è:
977 \fdecl{key\_t ftok(const char *pathname, int proj\_id)}
978 \fdesc{Restituisce una chiave per identificare un oggetto del \textit{SysV
981 {La funzione ritorna la chiave in caso di successo e $-1$ per un errore, nel
982 qual caso \var{errno} assumerà uno dei possibili codici di errore di
986 La funzione determina un valore della chiave sulla base di \param{pathname},
987 che deve specificare il \textit{pathname} di un file effettivamente esistente
988 e di un numero di progetto \param{proj\_id)}, che di norma viene specificato
989 come carattere, dato che ne vengono utilizzati solo gli 8 bit meno
990 significativi. Nelle \acr{libc4} e \acr{libc5}, come avviene in SunOS,
991 l'argomento \param{proj\_id} è dichiarato tipo \ctyp{char}, la \acr{glibc} usa
992 il prototipo specificato da XPG4, ma vengono lo stesso utilizzati gli 8 bit
995 Il problema è che anche così non c'è la sicurezza che il valore della chiave
996 sia univoco, infatti esso è costruito combinando il byte di \param{proj\_id)}
997 con i 16 bit meno significativi dell'inode del file \param{pathname} (che
998 vengono ottenuti attraverso \func{stat}, da cui derivano i possibili errori),
999 e gli 8 bit meno significativi del numero del dispositivo su cui è il file.
1000 Diventa perciò relativamente facile ottenere delle collisioni, specie se i
1001 file sono su dispositivi con lo stesso \textit{minor number}, come
1002 \file{/dev/hda1} e \file{/dev/sda1}.
1004 In genere quello che si fa è utilizzare un file comune usato dai programmi che
1005 devono comunicare (ad esempio un header comune, o uno dei programmi che devono
1006 usare l'oggetto in questione), utilizzando il numero di progetto per ottenere
1007 le chiavi che interessano. In ogni caso occorre sempre controllare, prima di
1008 creare un oggetto, che la chiave non sia già stata utilizzata. Se questo va
1009 bene in fase di creazione, le cose possono complicarsi per i programmi che
1010 devono solo accedere, in quanto, a parte gli eventuali controlli sugli altri
1011 attributi di \struct{ipc\_perm}, non esiste una modalità semplice per essere
1012 sicuri che l'oggetto associato ad una certa chiave sia stato effettivamente
1013 creato da chi ci si aspetta.
1015 Questo è, insieme al fatto che gli oggetti sono permanenti e non mantengono un
1016 contatore di riferimenti per la cancellazione automatica, il principale
1017 problema del \textit{SysV-IPC}. Non esiste infatti una modalità chiara per
1018 identificare un oggetto, come sarebbe stato se lo si fosse associato ad in
1019 file, e tutta l'interfaccia è inutilmente complessa. Per questo se ne
1020 sconsiglia assolutamente l'uso nei nuovi programmi, considerato che è ormai
1021 disponibile una revisione completa dei meccanismi di IPC fatta secondo quanto
1022 indicato dallo standard POSIX.1b, che presenta una realizzazione più sicura ed
1023 una interfaccia più semplice, che tratteremo in sez.~\ref{sec:ipc_posix}.
1026 \subsection{Il controllo di accesso}
1027 \label{sec:ipc_sysv_access_control}
1029 Oltre alle chiavi, abbiamo visto in fig.~\ref{fig:ipc_ipc_perm} che ad ogni
1030 oggetto sono associate in \struct{ipc\_perm} ulteriori informazioni, come gli
1031 identificatori del creatore (nei campi \var{cuid} e \var{cgid}) e del
1032 proprietario (nei campi \var{uid} e \var{gid}) dello stesso, e un insieme di
1033 permessi (nel campo \var{mode}). In questo modo è possibile definire un
1034 controllo di accesso sugli oggetti di IPC, simile a quello che si ha per i
1035 file (vedi sez.~\ref{sec:file_perm_overview}).
1037 Benché questo controllo di accesso sia molto simile a quello dei file, restano
1038 delle importanti differenze. La prima è che il permesso di esecuzione non
1039 esiste (e se specificato viene ignorato), per cui si può parlare solo di
1040 permessi di lettura e scrittura (nel caso dei semafori poi quest'ultimo è più
1041 propriamente un permesso di modifica). I valori di \var{mode} sono gli stessi
1042 ed hanno lo stesso significato di quelli riportati in
1043 tab.~\ref{tab:file_mode_flags} e come per i file definiscono gli accessi per
1044 il proprietario, il suo gruppo e tutti gli altri.
1046 Se però si vogliono usare le costanti simboliche di
1047 tab.~\ref{tab:file_mode_flags} occorrerà includere anche il file
1048 \headfile{sys/stat.h}; alcuni sistemi definiscono le costanti \constd{MSG\_R}
1049 (il valore ottale \texttt{0400}) e \constd{MSG\_W} (il valore ottale
1050 \texttt{0200}) per indicare i permessi base di lettura e scrittura per il
1051 proprietario, da utilizzare, con gli opportuni shift, pure per il gruppo e gli
1052 altri. In Linux, visto la loro scarsa utilità, queste costanti non sono
1055 Quando l'oggetto viene creato i campi \var{cuid} e \var{uid} di
1056 \struct{ipc\_perm} ed i campi \var{cgid} e \var{gid} vengono impostati
1057 rispettivamente al valore dell'\ids{UID} e del \ids{GID} effettivo del processo
1058 che ha chiamato la funzione, ma, mentre i campi \var{uid} e \var{gid} possono
1059 essere cambiati, i campi \var{cuid} e \var{cgid} restano sempre gli stessi.
1061 Il controllo di accesso è effettuato a due livelli. Il primo livello è nelle
1062 funzioni che richiedono l'identificatore di un oggetto data la chiave. Queste
1063 specificano tutte un argomento \param{flag}, in tal caso quando viene
1064 effettuata la ricerca di una chiave, qualora \param{flag} specifichi dei
1065 permessi, questi vengono controllati e l'identificatore viene restituito solo
1066 se corrispondono a quelli dell'oggetto. Se ci sono dei permessi non presenti
1067 in \var{mode} l'accesso sarà negato. Questo controllo però è di utilità
1068 indicativa, dato che è sempre possibile specificare per \param{flag} un valore
1069 nullo, nel qual caso l'identificatore sarà restituito comunque.
1071 Il secondo livello di controllo è quello delle varie funzioni che accedono
1072 direttamente (in lettura o scrittura) all'oggetto. In tal caso lo schema dei
1073 controlli è simile a quello dei file, ed avviene secondo questa sequenza:
1075 \item se il processo ha i privilegi di amministratore (più precisamente
1076 \const{CAP\_IPC\_OWNER}) l'accesso è sempre consentito.
1077 \item se l'\ids{UID} effettivo del processo corrisponde o al valore del campo
1078 \var{cuid} o a quello del campo \var{uid} ed il permesso per il proprietario
1079 in \var{mode} è appropriato\footnote{per appropriato si intende che è
1080 impostato il permesso di scrittura per le operazioni di scrittura e quello
1081 di lettura per le operazioni di lettura.} l'accesso è consentito.
1082 \item se il \ids{GID} effettivo del processo corrisponde o al
1083 valore del campo \var{cgid} o a quello del campo \var{gid} ed il permesso
1084 per il gruppo in \var{mode} è appropriato l'accesso è consentito.
1085 \item se il permesso per gli altri è appropriato l'accesso è consentito.
1087 solo se tutti i controlli elencati falliscono l'accesso è negato. Si noti che
1088 a differenza di quanto avviene per i permessi dei file, fallire in uno dei
1089 passi elencati non comporta il fallimento dell'accesso. Un'ulteriore
1090 differenza rispetto a quanto avviene per i file è che per gli oggetti di IPC
1091 il valore di \textit{umask} (si ricordi quanto esposto in
1092 sez.~\ref{sec:file_perm_management}) non ha alcun significato.
1095 \subsection{Gli identificatori ed il loro utilizzo}
1096 \label{sec:ipc_sysv_id_use}
1098 L'unico campo di \struct{ipc\_perm} del quale non abbiamo ancora parlato è
1099 \var{seq}, che in fig.~\ref{fig:ipc_ipc_perm} è qualificato con un criptico
1100 ``\textsl{numero di sequenza}'', ne parliamo adesso dato che esso è
1101 strettamente attinente alle modalità con cui il kernel assegna gli
1102 identificatori degli oggetti del sistema di IPC.
1104 Quando il sistema si avvia, alla creazione di ogni nuovo oggetto di IPC viene
1105 assegnato un numero progressivo, pari al numero di oggetti di quel tipo
1106 esistenti. Se il comportamento fosse sempre questo sarebbe identico a quello
1107 usato nell'assegnazione dei file descriptor nei processi, ed i valori degli
1108 identificatori tenderebbero ad essere riutilizzati spesso e restare di piccole
1109 dimensioni (inferiori al numero massimo di oggetti disponibili).
1111 Questo va benissimo nel caso dei file descriptor, che sono locali ad un
1112 processo, ma qui il comportamento varrebbe per tutto il sistema, e per
1113 processi del tutto scorrelati fra loro. Così si potrebbero avere situazioni
1114 come quella in cui un server esce e cancella le sue code di messaggi, ed il
1115 relativo identificatore viene immediatamente assegnato a quelle di un altro
1116 server partito subito dopo, con la possibilità che i client del primo non
1117 facciano in tempo ad accorgersi dell'avvenuto, e finiscano con l'interagire
1118 con gli oggetti del secondo, con conseguenze imprevedibili.
1120 Proprio per evitare questo tipo di situazioni il sistema usa il valore di
1121 \var{seq} per provvedere un meccanismo che porti gli identificatori ad
1122 assumere tutti i valori possibili, rendendo molto più lungo il periodo in cui
1123 un identificatore può venire riutilizzato.
1125 Il sistema dispone sempre di un numero fisso di oggetti di IPC, fino al kernel
1126 2.2.x questi erano definiti dalle costanti \const{MSGMNI}, \const{SEMMNI} e
1127 \const{SHMMNI}, e potevano essere cambiati (come tutti gli altri limiti
1128 relativi al \textit{SysV-IPC}) solo con una ricompilazione del kernel. A
1129 partire dal kernel 2.4.x è possibile cambiare questi valori a sistema attivo
1130 scrivendo sui file \sysctlrelfile{kernel}{shmmni},
1131 \sysctlrelfile{kernel}{msgmni} e \sysctlrelfiled{kernel}{sem} di
1132 \file{/proc/sys/kernel} o con l'uso di \func{sysctl}.
1134 \begin{figure}[!htb]
1135 \footnotesize \centering
1136 \begin{minipage}[c]{\codesamplewidth}
1137 \includecodesample{listati/IPCTestId.c}
1140 \caption{Sezione principale del programma di test per l'assegnazione degli
1141 identificatori degli oggetti di IPC \file{IPCTestId.c}.}
1142 \label{fig:ipc_sysv_idtest}
1145 Per ciascun tipo di oggetto di IPC viene mantenuto in \var{seq} un numero di
1146 sequenza progressivo che viene incrementato di uno ogni volta che l'oggetto
1147 viene cancellato. Quando l'oggetto viene creato usando uno spazio che era già
1148 stato utilizzato in precedenza, per restituire il nuovo identificatore al
1149 numero di oggetti presenti viene sommato il valore corrente del campo
1150 \var{seq}, moltiplicato per il numero massimo di oggetti di quel tipo.
1152 Questo in realtà è quanto avveniva fino ai kernel della serie 2.2, dalla serie
1153 2.4 viene usato lo stesso fattore di moltiplicazione per qualunque tipo di
1154 oggetto, utilizzando il valore dalla costante \constd{IPCMNI} (definita in
1155 \file{include/linux/ipc.h}), che indica il limite massimo complessivo per il
1156 numero di tutti gli oggetti presenti nel \textit{SysV-IPC}, ed il cui default
1157 è 32768. Si evita così il riutilizzo degli stessi numeri, e si fa sì che
1158 l'identificatore assuma tutti i valori possibili.
1160 In fig.~\ref{fig:ipc_sysv_idtest} è riportato il codice di un semplice
1161 programma di test che si limita a creare un oggetto di IPC (specificato con
1162 una opzione a riga di comando), stamparne il numero di identificatore, e
1163 cancellarlo, il tutto un numero di volte specificato tramite una seconda
1164 opzione. La figura non riporta il codice di selezione delle opzioni, che
1165 permette di inizializzare i valori delle variabili \var{type} al tipo di
1166 oggetto voluto, e \var{n} al numero di volte che si vuole effettuare il ciclo
1167 di creazione, stampa, cancellazione.
1169 I valori di default sono per l'uso delle code di messaggi e per 5 ripetizioni
1170 del ciclo. Per questo motivo se non si utilizzano opzioni verrà eseguito per
1171 cinque volte il ciclo (\texttt{\small 7-11}), in cui si crea una coda di
1172 messaggi (\texttt{\small 8}), se ne stampa l'identificativo (\texttt{\small
1173 9}) e la si rimuove (\texttt{\small 10}). Non stiamo ad approfondire adesso
1174 il significato delle funzioni utilizzate, che verranno esaminate nelle
1177 Quello che ci interessa infatti è verificare l'allocazione degli
1178 identificativi associati agli oggetti; lanciando il comando si otterrà
1179 pertanto qualcosa del tipo:
1181 piccardi@gont sources]$ \textbf{./ipctestid}
1183 Identifier Value 32768
1184 Identifier Value 65536
1185 Identifier Value 98304
1186 Identifier Value 131072
1189 il che ci mostra che stiamo lavorando con un kernel posteriore alla serie 2.2
1190 nel quale non avevamo ancora usato nessuna coda di messaggi (il valore nullo
1191 del primo identificativo indica che il campo \var{seq} era zero). Ripetendo il
1192 comando, e quindi eseguendolo in un processo diverso, in cui non può esistere
1193 nessuna traccia di quanto avvenuto in precedenza, otterremo come nuovo
1196 [piccardi@gont sources]$ \textbf{./ipctestid}
1197 Identifier Value 163840
1198 Identifier Value 196608
1199 Identifier Value 229376
1200 Identifier Value 262144
1201 Identifier Value 294912
1204 in cui la sequenza numerica prosegue, cosa che ci mostra come il valore di
1205 \var{seq} continui ad essere incrementato e costituisca in effetti una
1206 quantità mantenuta all'interno del sistema ed indipendente dai processi.
1209 \subsection{Code di messaggi}
1210 \label{sec:ipc_sysv_mq}
1212 Il primo oggetto introdotto dal \textit{SysV-IPC} è quello delle code di
1213 messaggi. Le code di messaggi sono oggetti analoghi alle \textit{pipe} o alle
1214 \textit{fifo} ed il loro scopo principale è quello di fornire a processi
1215 diversi un meccanismo con cui scambiarsi dei dati in forma di messaggio. Dato
1216 che le \textit{pipe} e le \textit{fifo} costituiscono una ottima alternativa,
1217 ed in genere sono molto più semplici da usare, le code di messaggi sono il
1218 meno utilizzato degli oggetti introdotti dal \textit{SysV-IPC}.
1220 La funzione di sistema che permette di ottenere l'identificativo di una coda
1221 di messaggi esistente per potervi accedere, oppure di creare una nuova coda
1222 qualora quella indicata non esista ancora, è \funcd{msgget}, e il suo
1229 \fdecl{int msgget(key\_t key, int flag)}
1230 \fdesc{Ottiene o crea una coda di messaggi.}
1233 {La funzione ritorna l'identificatore (un intero positivo) in caso di successo
1234 e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
1236 \item[\errcode{EACCES}] il processo chiamante non ha i privilegi per
1237 accedere alla coda richiesta.
1238 \item[\errcode{EEXIST}] si è richiesta la creazione di una coda che già
1239 esiste, ma erano specificati sia \const{IPC\_CREAT} che \const{IPC\_EXCL}.
1240 \item[\errcode{EIDRM}] la coda richiesta è marcata per essere cancellata
1241 (solo fino al kernel 2.3.20).
1242 \item[\errcode{ENOENT}] si è cercato di ottenere l'identificatore di una coda
1243 di messaggi specificando una chiave che non esiste e \const{IPC\_CREAT}
1244 non era specificato.
1245 \item[\errcode{ENOSPC}] si è cercato di creare una coda di messaggi quando è
1246 stato superato il limite massimo di code (\const{MSGMNI}).
1248 ed inoltre \errval{ENOMEM} nel suo significato generico.}
1251 Le funzione (come le analoghe che si usano per gli altri oggetti) serve sia a
1252 ottenere l'identificatore di una coda di messaggi esistente, che a crearne una
1253 nuova. L'argomento \param{key} specifica la chiave che è associata
1254 all'oggetto, eccetto il caso in cui si specifichi il valore
1255 \const{IPC\_PRIVATE}, nel qual caso la coda è creata ex-novo e non vi è
1256 associata alcuna chiave (per questo viene detta \textsl{privata}), ed il
1257 processo e i suoi eventuali figli potranno farvi riferimento solo attraverso
1260 Se invece si specifica un valore diverso da \const{IPC\_PRIVATE} (in Linux
1261 questo significa un valore diverso da zero) l'effetto della funzione dipende
1262 dal valore di \param{flag}, se questo è nullo la funzione si limita ad
1263 effettuare una ricerca sugli oggetti esistenti, restituendo l'identificatore
1264 se trova una corrispondenza, o fallendo con un errore di \errcode{ENOENT} se
1265 non esiste o di \errcode{EACCES} se si sono specificati dei permessi non
1268 Se invece si vuole creare una nuova coda di messaggi \param{flag} non può
1269 essere nullo e deve essere fornito come maschera binaria, impostando il bit
1270 corrispondente al valore \constd{IPC\_CREAT}. In questo caso i nove bit meno
1271 significativi di \param{flag} saranno usati come permessi per il nuovo
1272 oggetto, secondo quanto illustrato in sez.~\ref{sec:ipc_sysv_access_control}.
1273 Se si imposta anche il bit corrispondente a \constd{IPC\_EXCL} la funzione avrà
1274 successo solo se l'oggetto non esiste già, fallendo con un errore di
1275 \errcode{EEXIST} altrimenti.
1277 Si tenga conto che l'uso di \const{IPC\_PRIVATE} non impedisce ad altri
1278 processi di accedere alla coda, se hanno privilegi sufficienti, una volta che
1279 questi possano indovinare o ricavare, ad esempio per tentativi,
1280 l'identificatore ad essa associato. Per come sono implementati gli oggetti di
1281 IPC infatti non esiste alcun modo in cui si possa garantire l'accesso
1282 esclusivo ad una coda di messaggi. Usare \const{IPC\_PRIVATE} o
1283 \const{IPC\_CREAT} e \const{IPC\_EXCL} per \param{flag} comporta solo la
1284 creazione di una nuova coda.
1289 \begin{tabular}[c]{|c|r|l|l|}
1291 \textbf{Costante} & \textbf{Valore} & \textbf{File in \file{/proc}}
1292 & \textbf{Significato} \\
1295 \constd{MSGMNI}& 16& \file{msgmni} & Numero massimo di code di
1297 \constd{MSGMAX}& 8192& \file{msgmax} & Dimensione massima di un singolo
1299 \constd{MSGMNB}&16384& \file{msgmnb} & Dimensione massima del contenuto di
1303 \caption{Valori delle costanti associate ai limiti delle code di messaggi.}
1304 \label{tab:ipc_msg_limits}
1307 Le code di messaggi sono caratterizzate da tre limiti fondamentali, un tempo
1308 definiti staticamente e corrispondenti alle prime tre costanti riportate in
1309 tab.~\ref{tab:ipc_msg_limits}. Come accennato però con tutte le versioni più
1310 recenti del kernel con Linux è possibile modificare questi limiti attraverso
1311 l'uso di \func{sysctl} o scrivendo nei file \sysctlrelfiled{kernel}{msgmax},
1312 \sysctlrelfiled{kernel}{msgmnb} e \sysctlrelfiled{kernel}{msgmni} di
1313 \file{/proc/sys/kernel/}.
1315 \itindbeg{linked~list}
1317 Una coda di messaggi è costituita da una \textit{linked list}.\footnote{una
1318 \textit{linked list} è una tipica struttura di dati, organizzati in una
1319 lista in cui ciascun elemento contiene un puntatore al successivo. In questo
1320 modo la struttura è veloce nell'estrazione ed immissione dei dati dalle
1321 estremità dalla lista (basta aggiungere un elemento in testa o in coda ed
1322 aggiornare un puntatore), e relativamente veloce da attraversare in ordine
1323 sequenziale (seguendo i puntatori), è invece relativamente lenta
1324 nell'accesso casuale e nella ricerca.} I nuovi messaggi vengono inseriti in
1325 coda alla lista e vengono letti dalla cima, in fig.~\ref{fig:ipc_mq_schema} si
1326 è riportato uno schema semplificato con cui queste strutture vengono mantenute
1327 dal kernel. Lo schema illustrato in realtà è una semplificazione di quello
1328 usato fino ai kernel della serie 2.2. A partire della serie 2.4 la gestione
1329 delle code di messaggi è effettuata in maniera diversa (e non esiste una
1330 struttura \kstruct{msqid\_ds} nel kernel), ma abbiamo mantenuto lo schema
1331 precedente dato che illustra in maniera più che adeguata i principi di
1332 funzionamento delle code di messaggi.
1334 \itindend{linked~list}
1336 \begin{figure}[!htb]
1337 \centering \includegraphics[width=13cm]{img/mqstruct}
1338 \caption{Schema delle strutture di una coda di messaggi
1339 (\kstructd{msqid\_ds} e \kstructd{msg}).}
1340 \label{fig:ipc_mq_schema}
1344 A ciascuna coda è associata una struttura \kstruct{msqid\_ds} la cui
1345 definizione è riportata in fig.~\ref{fig:ipc_msqid_ds} ed a cui si accede
1346 includendo \headfiled{sys/msg.h};
1348 % INFO: sotto materiale obsoleto e non interessante
1349 % In questa struttura il
1350 % kernel mantiene le principali informazioni riguardo lo stato corrente della
1351 % coda. Come accennato questo vale fino ai kernel della serie 2.2, essa viene
1352 % usata nei kernel della serie 2.4 solo per compatibilità in quanto è quella
1353 % restituita dalle funzioni dell'interfaccia; si noti come ci sia una differenza
1354 % con i campi mostrati nello schema di fig.~\ref{fig:ipc_mq_schema} che sono
1355 % presi dalla definizione di \file{include/linux/msg.h}, e fanno riferimento
1356 % alla definizione della omonima struttura usata nel kernel.
1357 %In fig.~\ref{fig:ipc_msqid_ds} sono elencati i campi definiti in
1358 %\headfile{sys/msg.h};
1359 si tenga presente che il campo \var{\_\_msg\_cbytes} non è previsto dallo
1360 standard POSIX.1-2001 e che alcuni campi fino al kernel 2.2 erano definiti
1363 \begin{figure}[!htb]
1364 \footnotesize \centering
1365 \begin{minipage}[c]{.91\textwidth}
1366 \includestruct{listati/msqid_ds.h}
1369 \caption{La struttura \structd{msqid\_ds}, associata a ciascuna coda di
1371 \label{fig:ipc_msqid_ds}
1374 Quando si crea una nuova coda con \func{msgget} questa struttura viene
1375 inizializzata,\footnote{in realtà viene inizializzata una struttura interna al
1376 kernel, ma i dati citati sono gli stessi.} in particolare il campo
1377 \var{msg\_perm} che esprime i permessi di accesso viene inizializzato nella
1378 modalità illustrata in sez.~\ref{sec:ipc_sysv_access_control}. Per quanto
1379 riguarda gli altri campi invece:
1381 \item il campo \var{msg\_qnum}, che esprime il numero di messaggi presenti
1382 sulla coda, viene inizializzato a 0.
1383 \item i campi \var{msg\_lspid} e \var{msg\_lrpid}, che esprimono
1384 rispettivamente il \ids{PID} dell'ultimo processo che ha inviato o ricevuto
1385 un messaggio sulla coda, sono inizializzati a 0.
1386 \item i campi \var{msg\_stime} e \var{msg\_rtime}, che esprimono
1387 rispettivamente il tempo in cui è stato inviato o ricevuto l'ultimo
1388 messaggio sulla coda, sono inizializzati a 0.
1389 \item il campo \var{msg\_ctime}, che esprime il tempo di ultima modifica della
1390 coda, viene inizializzato al tempo corrente.
1391 \item il campo \var{msg\_qbytes}, che esprime la dimensione massima del
1392 contenuto della coda (in byte) viene inizializzato al valore preimpostato
1393 del sistema (\const{MSGMNB}).
1394 \item il campo \var{\_\_msg\_cbytes}, che esprime la dimensione in byte dei
1395 messaggi presenti sulla coda, viene inizializzato a zero.
1396 % i campi \var{msg\_first} e \var{msg\_last} che esprimono l'indirizzo del
1397 % primo e ultimo messaggio sono inizializzati a \val{NULL} e
1398 % \var{msg\_cbytes}, che esprime la dimensione in byte dei messaggi presenti è
1399 % inizializzato a zero. Questi campi sono ad uso interno dell'implementazione
1400 % e non devono essere utilizzati da programmi in \textit{user space}).
1403 Una volta creata una coda di messaggi le operazioni di controllo vengono
1404 effettuate con la funzione di sistema \funcd{msgctl}, che, come le analoghe
1405 \func{semctl} e \func{shmctl}, fa le veci di quello che \func{ioctl} è per i
1406 file; il suo prototipo è:
1412 \fdecl{int msgctl(int msqid, int cmd, struct msqid\_ds *buf)}
1413 \fdesc{Esegue una operazione su una coda.}
1416 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1417 caso \var{errno} assumerà uno dei valori:
1419 \item[\errcode{EACCES}] si è richiesto \const{IPC\_STAT} ma processo
1420 chiamante non ha i privilegi di lettura sulla coda.
1421 \item[\errcode{EIDRM}] la coda richiesta è stata cancellata.
1422 \item[\errcode{EPERM}] si è richiesto \const{IPC\_SET} o \const{IPC\_RMID} ma
1423 il processo non ha i privilegi, o si è richiesto di aumentare il valore di
1424 \var{msg\_qbytes} oltre il limite \const{MSGMNB} senza essere
1427 ed inoltre \errval{EFAULT} ed \errval{EINVAL} nel loro significato
1431 La funzione permette di eseguire una operazione di controllo per la coda
1432 specificata dall'identificatore \param{msqid}, utilizzando i valori della
1433 struttura \struct{msqid\_ds}, mantenuta all'indirizzo \param{buf}. Il
1434 comportamento della funzione dipende dal valore dell'argomento \param{cmd},
1435 che specifica il tipo di azione da eseguire. I valori possibili
1436 per \param{cmd} sono:
1437 \begin{basedescript}{\desclabelwidth{1.6cm}\desclabelstyle{\nextlinelabel}}
1438 \item[\constd{IPC\_STAT}] Legge le informazioni riguardo la coda nella
1439 struttura \struct{msqid\_ds} indicata da \param{buf}. Occorre avere il
1440 permesso di lettura sulla coda.
1441 \item[\constd{IPC\_RMID}] Rimuove la coda, cancellando tutti i dati, con
1442 effetto immediato. Tutti i processi che cercheranno di accedere alla coda
1443 riceveranno un errore di \errcode{EIDRM}, e tutti processi in attesa su
1444 funzioni di lettura o di scrittura sulla coda saranno svegliati ricevendo
1445 il medesimo errore. Questo comando può essere eseguito solo da un processo
1446 con \ids{UID} effettivo corrispondente al creatore o al proprietario della
1447 coda, o all'amministratore.
1448 \item[\constd{IPC\_SET}] Permette di modificare i permessi ed il proprietario
1449 della coda, ed il limite massimo sulle dimensioni del totale dei messaggi in
1450 essa contenuti (\var{msg\_qbytes}). I valori devono essere passati in una
1451 struttura \struct{msqid\_ds} puntata da \param{buf}. Per modificare i
1452 valori di \var{msg\_perm.mode}, \var{msg\_perm.uid} e \var{msg\_perm.gid}
1453 occorre essere il proprietario o il creatore della coda, oppure
1454 l'amministratore e lo stesso vale per \var{msg\_qbytes}. Infine solo
1455 l'amministratore (più precisamente un processo con la capacità
1456 \const{CAP\_IPC\_RESOURCE}) ha la facoltà di incrementarne il valore a
1457 limiti superiori a \const{MSGMNB}. Se eseguita con successo la funzione
1458 aggiorna anche il campo \var{msg\_ctime}.
1461 A questi tre valori, che sono quelli previsti dallo standard, su Linux se ne
1462 affiancano altri tre (\constd{IPC\_INFO}, \constd{MSG\_STAT} e
1463 \constd{MSG\_INFO}) introdotti ad uso del programma \cmd{ipcs} per ottenere le
1464 informazioni generali relative alle risorse usate dalle code di
1465 messaggi. Questi potranno essere modificati o rimossi in favore dell'uso di
1466 \texttt{/proc}, per cui non devono essere usati e non li tratteremo.
1468 Una volta che si abbia a disposizione l'identificatore, per inviare un
1469 messaggio su una coda si utilizza la funzione di sistema \funcd{msgsnd}, il
1476 \fdecl{int msgsnd(int msqid, struct msgbuf *msgp, size\_t msgsz, int msgflg)}
1477 \fdesc{Invia un messaggio su una coda.}
1480 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
1481 caso \var{errno} assumerà uno dei valori:
1483 \item[\errcode{EACCES}] non si hanno i privilegi di accesso sulla coda.
1484 \item[\errcode{EAGAIN}] il messaggio non può essere inviato perché si è
1485 superato il limite \var{msg\_qbytes} sul numero massimo di byte presenti
1486 sulla coda, e si è richiesto \const{IPC\_NOWAIT} in \param{flag}.
1487 \item[\errcode{EIDRM}] la coda è stata cancellata.
1488 \item[\errcode{EINVAL}] si è specificato un \param{msgid} invalido, o un
1489 valore non positivo per \param{mtype}, o un valore di \param{msgsz}
1490 maggiore di \const{MSGMAX}.
1492 ed inoltre \errval{EFAULT}, \errval{EINTR} e \errval{ENOMEM} nel loro
1493 significato generico.}
1496 La funzione inserisce il messaggio sulla coda specificata da \param{msqid}; il
1497 messaggio ha lunghezza specificata da \param{msgsz} ed è passato attraverso il
1498 l'argomento \param{msgp}. Quest'ultimo deve venire passato sempre come
1499 puntatore ad una struttura \struct{msgbuf} analoga a quella riportata in
1500 fig.~\ref{fig:ipc_msbuf} che è quella che deve contenere effettivamente il
1501 messaggio. La dimensione massima per il testo di un messaggio non può
1502 comunque superare il limite \const{MSGMAX}.
1504 \begin{figure}[!htb]
1505 \footnotesize \centering
1506 \begin{minipage}[c]{0.8\textwidth}
1507 \includestruct{listati/msgbuf.h}
1510 \caption{Schema della struttura \structd{msgbuf}, da utilizzare come
1511 argomento per inviare/ricevere messaggi.}
1512 \label{fig:ipc_msbuf}
1515 La struttura di fig.~\ref{fig:ipc_msbuf} è comunque solo un modello, tanto che
1516 la definizione contenuta in \headfile{sys/msg.h} usa esplicitamente per il
1517 secondo campo il valore \code{mtext[1]}, che non è di nessuna utilità ai fini
1518 pratici. La sola cosa che conta è che la struttura abbia come primo membro un
1519 campo \var{mtype} come nell'esempio; esso infatti serve ad identificare il
1520 tipo di messaggio e deve essere sempre specificato come intero positivo di
1521 tipo \ctyp{long}. Il campo \var{mtext} invece può essere di qualsiasi tipo e
1522 dimensione, e serve a contenere il testo del messaggio.
1524 In generale pertanto per inviare un messaggio con \func{msgsnd} si usa
1525 ridefinire una struttura simile a quella di fig.~\ref{fig:ipc_msbuf}, adattando
1526 alle proprie esigenze il campo \var{mtype}, (o ridefinendo come si vuole il
1527 corpo del messaggio, anche con più campi o con strutture più complesse) avendo
1528 però la cura di mantenere nel primo campo un valore di tipo \ctyp{long} che ne
1531 Si tenga presente che la lunghezza che deve essere indicata in questo
1532 argomento è solo quella del messaggio, non quella di tutta la struttura, se
1533 cioè \var{message} è una propria struttura che si passa alla funzione,
1534 \param{msgsz} dovrà essere uguale a \code{sizeof(message)-sizeof(long)}, (se
1535 consideriamo il caso dell'esempio in fig.~\ref{fig:ipc_msbuf}, \param{msgsz}
1536 dovrà essere pari a \var{LENGTH}).
1538 Per capire meglio il funzionamento della funzione riprendiamo in
1539 considerazione la struttura della coda illustrata in
1540 fig.~\ref{fig:ipc_mq_schema}. Alla chiamata di \func{msgsnd} il nuovo
1541 messaggio sarà aggiunto in fondo alla lista inserendo una nuova struttura
1542 \kstruct{msg}, il puntatore \var{msg\_last} di \kstruct{msqid\_ds} verrà
1543 aggiornato, come pure il puntatore al messaggio successivo per quello che era
1544 il precedente ultimo messaggio; il valore di \var{mtype} verrà mantenuto in
1545 \var{msg\_type} ed il valore di \param{msgsz} in \var{msg\_ts}; il testo del
1546 messaggio sarà copiato all'indirizzo specificato da \var{msg\_spot}.
1548 Il valore dell'argomento \param{flag} permette di specificare il comportamento
1549 della funzione. Di norma, quando si specifica un valore nullo, la funzione
1550 ritorna immediatamente a meno che si sia ecceduto il valore di
1551 \var{msg\_qbytes}, o il limite di sistema sul numero di messaggi, nel qual
1552 caso si blocca. Se si specifica per \param{flag} il valore
1553 \constd{IPC\_NOWAIT} la funzione opera in modalità non-bloccante, ed in questi
1554 casi ritorna immediatamente con un errore di \errcode{EAGAIN}.
1556 Se non si specifica \const{IPC\_NOWAIT} la funzione resterà bloccata fintanto
1557 che non si liberano risorse sufficienti per poter inserire nella coda il
1558 messaggio, nel qual caso ritornerà normalmente. La funzione può ritornare con
1559 una condizione di errore anche in due altri casi: quando la coda viene rimossa
1560 (nel qual caso si ha un errore di \errcode{EIDRM}) o quando la funzione viene
1561 interrotta da un segnale (nel qual caso si ha un errore di \errcode{EINTR}).
1563 Una volta completato con successo l'invio del messaggio sulla coda, la
1564 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1567 \item Il valore di \var{msg\_lspid}, che viene impostato al \ids{PID} del
1569 \item Il valore di \var{msg\_qnum}, che viene incrementato di uno.
1570 \item Il valore \var{msg\_stime}, che viene impostato al tempo corrente.
1573 La funzione di sistema che viene utilizzata per estrarre un messaggio da una
1574 coda è \funcd{msgrcv}, ed il suo prototipo è:
1580 \fdecl{ssize\_t msgrcv(int msqid, struct msgbuf *msgp, size\_t msgsz,
1581 long msgtyp, int msgflg)}
1582 \fdesc{Legge un messaggio da una coda.}
1585 {La funzione ritorna il numero di byte letti in caso di successo e $-1$ per un
1586 errore, nel qual caso \var{errno} assumerà uno dei valori:
1588 \item[\errcode{E2BIG}] il testo del messaggio è più lungo di \param{msgsz} e
1589 non si è specificato \const{MSG\_NOERROR} in \param{msgflg}.
1590 \item[\errcode{EACCES}] non si hanno i privilegi di accesso sulla coda.
1591 \item[\errcode{EIDRM}] la coda è stata cancellata.
1592 \item[\errcode{EINTR}] la funzione è stata interrotta da un segnale mentre
1593 era in attesa di ricevere un messaggio.
1594 \item[\errcode{EINVAL}] si è specificato un \param{msgid} invalido o un
1595 valore di \param{msgsz} negativo.
1597 ed inoltre \errval{EFAULT} nel suo significato generico.}
1600 La funzione legge un messaggio dalla coda specificata da \param{msqid},
1601 scrivendolo sulla struttura puntata da \param{msgp}, che dovrà avere un
1602 formato analogo a quello di fig.~\ref{fig:ipc_msbuf}. Una volta estratto, il
1603 messaggio sarà rimosso dalla coda. L'argomento \param{msgsz} indica la
1604 lunghezza massima del testo del messaggio (equivalente al valore del parametro
1605 \var{LENGTH} nell'esempio di fig.~\ref{fig:ipc_msbuf}).
1607 Se il testo del messaggio ha lunghezza inferiore a \param{msgsz} esso viene
1608 rimosso dalla coda; in caso contrario, se \param{msgflg} è impostato a
1609 \constd{MSG\_NOERROR}, il messaggio viene troncato e la parte in eccesso viene
1610 perduta, altrimenti il messaggio non viene estratto e la funzione ritorna con
1611 un errore di \errcode{E2BIG}.
1613 L'argomento \param{msgtyp} permette di restringere la ricerca ad un
1614 sottoinsieme dei messaggi presenti sulla coda; la ricerca infatti è fatta con
1615 una scansione della struttura mostrata in fig.~\ref{fig:ipc_mq_schema},
1616 restituendo il primo messaggio incontrato che corrisponde ai criteri
1617 specificati (che quindi, visto come i messaggi vengono sempre inseriti dalla
1618 coda, è quello meno recente); in particolare:
1620 \item se \param{msgtyp} è 0 viene estratto il messaggio in cima alla coda, cioè
1621 quello fra i presenti che è stato inserito per primo.
1622 \item se \param{msgtyp} è positivo viene estratto il primo messaggio il cui
1623 tipo (il valore del campo \var{mtype}) corrisponde al valore di
1625 \item se \param{msgtyp} è negativo viene estratto il primo fra i messaggi con
1626 il valore più basso del tipo, fra tutti quelli il cui tipo ha un valore
1627 inferiore al valore assoluto di \param{msgtyp}.
1630 Il valore di \param{msgflg} permette di controllare il comportamento della
1631 funzione, esso può essere nullo o una maschera binaria composta da uno o più
1632 valori. Oltre al precedente \const{MSG\_NOERROR}, sono possibili altri due
1633 valori: \constd{MSG\_EXCEPT}, che permette, quando \param{msgtyp} è positivo,
1634 di leggere il primo messaggio nella coda con tipo diverso da \param{msgtyp}, e
1635 \const{IPC\_NOWAIT} che causa il ritorno immediato della funzione quando non
1636 ci sono messaggi sulla coda.
1638 Il comportamento usuale della funzione infatti, se non ci sono messaggi
1639 disponibili per la lettura, è di bloccare il processo. Nel caso però si sia
1640 specificato \const{IPC\_NOWAIT} la funzione ritorna immediatamente con un
1641 errore \errcode{ENOMSG}. Altrimenti la funzione ritorna normalmente non appena
1642 viene inserito un messaggio del tipo desiderato, oppure ritorna con errore
1643 qualora la coda sia rimossa (con \var{errno} impostata a \errcode{EIDRM}) o se
1644 il processo viene interrotto da un segnale (con \var{errno} impostata a
1647 Una volta completata con successo l'estrazione del messaggio dalla coda, la
1648 funzione aggiorna i dati mantenuti in \struct{msqid\_ds}, in particolare
1651 \item Il valore di \var{msg\_lrpid}, che viene impostato al \ids{PID} del
1653 \item Il valore di \var{msg\_qnum}, che viene decrementato di uno.
1654 \item Il valore \var{msg\_rtime}, che viene impostato al tempo corrente.
1657 Le code di messaggi presentano il solito problema di tutti gli oggetti del
1658 \textit{SysV-IPC} che essendo questi permanenti restano nel sistema occupando
1659 risorse anche quando un processo è terminato, al contrario delle \textit{pipe}
1660 per le quali tutte le risorse occupate vengono rilasciate quanto l'ultimo
1661 processo che le utilizzava termina. Questo comporta che in caso di errori si
1662 può saturare il sistema, e che devono comunque essere esplicitamente previste
1663 delle funzioni di rimozione in caso di interruzioni o uscite dal programma
1664 (come vedremo in fig.~\ref{fig:ipc_mq_fortune_server}).
1666 L'altro problema è che non facendo uso di file descriptor le tecniche di
1667 \textit{I/O multiplexing} descritte in sez.~\ref{sec:file_multiplexing} non
1668 possono essere utilizzate, e non si ha a disposizione niente di analogo alle
1669 funzioni \func{select} e \func{poll}. Questo rende molto scomodo usare più di
1670 una di queste strutture alla volta; ad esempio non si può scrivere un server
1671 che aspetti un messaggio su più di una coda senza fare ricorso ad una tecnica
1672 di \textit{polling} che esegua un ciclo di attesa su ciascuna di esse.
1674 Come esempio dell'uso delle code di messaggi possiamo riscrivere il nostro
1675 server di \textit{fortunes} usando queste al posto delle \textit{fifo}. In
1676 questo caso useremo una sola coda di messaggi, usando il tipo di messaggio per
1677 comunicare in maniera indipendente con client diversi.
1679 \begin{figure}[!htbp]
1680 \footnotesize \centering
1681 \begin{minipage}[c]{\codesamplewidth}
1682 \includecodesample{listati/MQFortuneServer.c}
1685 \caption{Sezione principale del codice del server di \textit{fortunes}
1686 basato sulle \textit{message queue}.}
1687 \label{fig:ipc_mq_fortune_server}
1690 In fig.~\ref{fig:ipc_mq_fortune_server} si è riportato un estratto delle parti
1691 principali del codice del nuovo server (il codice completo è nel file
1692 \file{MQFortuneServer.c} nei sorgenti allegati). Il programma è basato su un
1693 uso accorto della caratteristica di poter associate un ``tipo'' ai messaggi
1694 per permettere una comunicazione indipendente fra il server ed i vari client,
1695 usando il \ids{PID} di questi ultimi come identificativo. Questo è possibile
1696 in quanto, al contrario di una \textit{fifo}, la lettura di una coda di
1697 messaggi può non essere sequenziale, proprio grazie alla classificazione dei
1698 messaggi sulla base del loro tipo.
1700 Il programma, oltre alle solite variabili per il nome del file da cui leggere
1701 le \textit{fortunes} e per il vettore di stringhe che contiene le frasi,
1702 definisce due strutture appositamente per la comunicazione; con
1703 \var{msgbuf\_read} vengono passate (\texttt{\small 8-11}) le richieste mentre
1704 con \var{msgbuf\_write} vengono restituite (\texttt{\small 12-15}) le frasi.
1706 La gestione delle opzioni si è al solito omessa, essa si curerà di impostare
1707 nella variabile \var{n} il numero di frasi da leggere specificato a linea di
1708 comando ed in \var{fortunefilename} il file da cui leggerle. Dopo aver
1709 installato (\texttt{\small 19-21}) i gestori dei segnali per trattare
1710 l'uscita dal server, viene prima controllato (\texttt{\small 22}) il numero di
1711 frasi richieste abbia senso (cioè sia maggiore di zero), le quali poi vengono
1712 lette (\texttt{\small 23}) nel vettore in memoria con la stessa funzione
1713 \code{FortuneParse} usata anche per il server basato sulle \textit{fifo}.
1715 Una volta inizializzato il vettore di stringhe coi messaggi presi dal file
1716 delle \textit{fortune} si procede (\texttt{\small 25}) con la generazione di
1717 una chiave per identificare la coda di messaggi (si usa il nome del file dei
1718 sorgenti del server) con la quale poi si esegue (\texttt{\small 26}) la
1719 creazione della stessa (si noti come si sia chiamata \func{msgget} con un
1720 valore opportuno per l'argomento \param{flag}), avendo cura di abortire il
1721 programma (\texttt{\small 27-29}) in caso di errore.
1723 Finita la fase di inizializzazione il server prima (\texttt{\small 32}) chiama
1724 la funzione \func{daemon} per andare in background e poi esegue in permanenza
1725 il ciclo principale (\texttt{\small 33-40}). Questo inizia (\texttt{\small
1726 34}) con il porsi in attesa di un messaggio di richiesta da parte di un
1727 client. Si noti infatti come \func{msgrcv} richieda un messaggio con
1728 \var{mtype} uguale a 1, questo è il valore usato per le richieste dato che
1729 corrisponde al \ids{PID} di \cmd{init}, che non può essere un client. L'uso
1730 del flag \const{MSG\_NOERROR} è solo per sicurezza, dato che i messaggi di
1731 richiesta sono di dimensione fissa (e contengono solo il \ids{PID} del
1734 Se non sono presenti messaggi di richiesta \func{msgrcv} si bloccherà,
1735 ritornando soltanto in corrispondenza dell'arrivo sulla coda di un messaggio
1736 di richiesta da parte di un client, in tal caso il ciclo prosegue
1737 (\texttt{\small 35}) selezionando una frase a caso, copiandola (\texttt{\small
1738 36}) nella struttura \var{msgbuf\_write} usata per la risposta e
1739 calcolandone (\texttt{\small 37}) la dimensione.
1741 Per poter permettere a ciascun client di ricevere solo la risposta indirizzata
1742 a lui il tipo del messaggio in uscita viene inizializzato (\texttt{\small 38})
1743 al valore del \ids{PID} del client ricevuto nel messaggio di richiesta.
1744 L'ultimo passo del ciclo (\texttt{\small 39}) è inviare sulla coda il
1745 messaggio di risposta. Si tenga conto che se la coda è piena anche questa
1746 funzione potrà bloccarsi fintanto che non venga liberato dello spazio.
1748 Si noti che il programma può terminare solo grazie ad una interruzione da
1749 parte di un segnale; in tal caso verrà eseguito (\texttt{\small 45-48}) il
1750 gestore \code{HandSIGTERM}, che semplicemente si limita a cancellare la coda
1751 (\texttt{\small 46}) ed ad uscire (\texttt{\small 47}).
1753 \begin{figure}[!htbp]
1754 \footnotesize \centering
1755 \begin{minipage}[c]{\codesamplewidth}
1756 \includecodesample{listati/MQFortuneClient.c}
1759 \caption{Sezione principale del codice del client di \textit{fortunes}
1760 basato sulle \textit{message queue}.}
1761 \label{fig:ipc_mq_fortune_client}
1764 In fig.~\ref{fig:ipc_mq_fortune_client} si è riportato un estratto il codice
1765 del programma client. Al solito il codice completo è con i sorgenti allegati,
1766 nel file \file{MQFortuneClient.c}. Come sempre si sono rimosse le parti
1767 relative alla gestione delle opzioni, ed in questo caso, anche la
1768 dichiarazione delle variabili, che, per la parte relative alle strutture usate
1769 per la comunicazione tramite le code, sono le stesse viste in
1770 fig.~\ref{fig:ipc_mq_fortune_server}.
1772 Il client in questo caso è molto semplice; la prima parte del programma
1773 (\texttt{\small 4-9}) si occupa di accedere alla coda di messaggi, ed è
1774 identica a quanto visto per il server, solo che in questo caso \func{msgget}
1775 non viene chiamata con il flag di creazione in quanto la coda deve essere
1776 preesistente. In caso di errore (ad esempio se il server non è stato avviato)
1777 il programma termina immediatamente.
1779 Una volta acquisito l'identificatore della coda il client compone
1780 (\texttt{\small 12-13}) il messaggio di richiesta in \var{msg\_read}, usando
1781 1 per il tipo ed inserendo il proprio \ids{PID} come dato da passare al
1782 server. Calcolata (\texttt{\small 14}) la dimensione, provvede
1783 (\texttt{\small 15}) ad immettere la richiesta sulla coda.
1785 A questo punto non resta che rileggere la risposta (\texttt{\small 16}) dalla
1786 coda del server richiedendo a \func{msgrcv} di selezionare i messaggi di tipo
1787 corrispondente al valore del \ids{PID} inviato nella richiesta. L'ultimo passo
1788 (\texttt{\small 17}) prima di uscire è quello di stampare a video il messaggio
1791 Proviamo allora il nostro nuovo sistema, al solito occorre definire
1792 \code{LD\_LIBRARY\_PATH} per accedere alla libreria \file{libgapil.so}, dopo
1793 di che, in maniera del tutto analoga a quanto fatto con il programma che usa
1794 le \textit{fifo}, potremo far partire il server con:
1796 [piccardi@gont sources]$ \textbf{./mqfortuned -n10}
1799 come nel caso precedente, avendo eseguito il server in background, il comando
1800 ritornerà immediatamente; potremo però verificare con \cmd{ps} che il
1801 programma è effettivamente in esecuzione, e che ha creato una coda di
1804 [piccardi@gont sources]$ \textbf{ipcs}
1806 ------ Shared Memory Segments --------
1807 key shmid owner perms bytes nattch status
1809 ------ Semaphore Arrays --------
1810 key semid owner perms nsems
1812 ------ Message Queues --------
1813 key msqid owner perms used-bytes messages
1814 0x0102dc6a 0 piccardi 666 0 0
1817 a questo punto potremo usare il client per ottenere le nostre frasi:
1819 [piccardi@gont sources]$ \textbf{./mqfortune}
1820 Linux ext2fs has been stable for a long time, now it's time to break it
1821 -- Linuxkongreß '95 in Berlin
1822 [piccardi@gont sources]$ \textbf{./mqfortune}
1823 Let's call it an accidental feature.
1826 con un risultato del tutto equivalente al precedente. Infine potremo chiudere
1827 il server inviando il segnale di terminazione con il comando \code{killall
1828 mqfortuned}, verificando che effettivamente la coda di messaggi venga
1831 Benché funzionante questa architettura risente dello stesso inconveniente
1832 visto anche nel caso del precedente server basato sulle \textit{fifo}; se il
1833 client viene interrotto dopo l'invio del messaggio di richiesta e prima della
1834 lettura della risposta, quest'ultima resta nella coda (così come per le
1835 \textit{fifo} si aveva il problema delle \textit{fifo} che restavano nel
1836 filesystem). In questo caso però il problemi sono maggiori, sia perché è molto
1837 più facile esaurire la memoria dedicata ad una coda di messaggi che gli
1838 \textit{inode} di un filesystem, sia perché, con il riutilizzo dei \ids{PID}
1839 da parte dei processi, un client eseguito in un momento successivo potrebbe
1840 ricevere un messaggio non indirizzato a lui.
1843 \subsection{I semafori}
1844 \label{sec:ipc_sysv_sem}
1846 I semafori non sono propriamente meccanismi di intercomunicazione come
1847 \textit{pipe}, \textit{fifo} e code di messaggi, poiché non consentono di
1848 scambiare dati fra processi, ma servono piuttosto come meccanismi di
1849 sincronizzazione o di protezione per le \textsl{sezioni critiche} del codice
1850 (si ricordi quanto detto in sez.~\ref{sec:proc_race_cond}). Un semaforo
1851 infatti non è altro che un contatore mantenuto nel kernel che determina se
1852 consentire o meno la prosecuzione dell'esecuzione di un programma. In questo
1853 modo si può controllare l'accesso ad una risorsa condivisa da più processi,
1854 associandovi un semaforo che assicuri che non possa essere usata da più di un
1855 processo alla volta.
1857 Il concetto di semaforo è uno dei concetti base nella programmazione ed è
1858 assolutamente generico, così come del tutto generali sono modalità con cui lo
1859 si utilizza. Un processo che deve accedere ad una risorsa condivisa eseguirà
1860 un controllo del semaforo: se questo è positivo il suo valore sarà
1861 decrementato, indicando che si è consumato una unità della risorsa, ed il
1862 processo potrà proseguire nell'utilizzo di quest'ultima, provvedendo a
1863 rilasciarla, una volta completate le operazioni volute, reincrementando il
1866 Se al momento del controllo il valore del semaforo è nullo la risorsa viene
1867 considerata non disponibile, ed il processo si bloccherà fin quando chi la sta
1868 utilizzando non la rilascerà, incrementando il valore del semaforo. Non appena
1869 il semaforo diventa positivo, indicando che la risorsa è tornata disponibile,
1870 il processo bloccato in attesa riprenderà l'esecuzione, e potrà operare come
1871 nel caso precedente (decremento del semaforo, accesso alla risorsa, incremento
1874 Per poter implementare questo tipo di logica le operazioni di controllo e
1875 decremento del contatore associato al semaforo devono essere atomiche,
1876 pertanto una realizzazione di un oggetto di questo tipo è necessariamente
1877 demandata al kernel. La forma più semplice di semaforo è quella del
1878 \textsl{semaforo binario}, o \textit{mutex}, in cui un valore diverso da zero
1879 (normalmente 1) indica la libertà di accesso, e un valore nullo l'occupazione
1880 della risorsa. In generale però si possono usare semafori con valori interi,
1881 utilizzando il valore del contatore come indicatore del ``numero di risorse''
1884 Il sistema di intercomunicazione di \textit{SysV-IPC} prevede anche una
1885 implementazione dei semafori, ma gli oggetti utilizzati sono tuttavia non
1886 semafori singoli, ma gruppi (più propriamente \textsl{insiemi}) di semafori
1887 detti ``\textit{semaphore set}''. La funzione di sistema che permette di
1888 creare o ottenere l'identificatore di un insieme di semafori è \funcd{semget},
1889 ed il suo prototipo è:
1895 \fdecl{int semget(key\_t key, int nsems, int flag)}
1896 \fdesc{Restituisce l'identificatore di un insieme di semafori.}
1899 {La funzione ritorna l'identificatore (un intero positivo) in caso di successo
1900 e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
1902 \item[\errcode{ENOSPC}] si è superato il limite di sistema per il numero
1903 totale di semafori (\const{SEMMNS}) o di insiemi (\const{SEMMNI}).
1904 \item[\errcode{EINVAL}] \param{nsems} è minore di zero o maggiore del limite
1905 sul numero di semafori di un insieme (\const{SEMMSL}), o se l'insieme già
1906 esiste, maggiore del numero di semafori che contiene.
1907 \item[\errcode{ENOMEM}] il sistema non ha abbastanza memoria per poter
1908 contenere le strutture per un nuovo insieme di semafori.
1910 ed inoltre \errval{EACCES}, \errval{EEXIST}, \errval{EIDRM} e
1911 \errval{ENOENT} con lo stesso significato che hanno per \func{msgget}.}
1914 La funzione è del tutto analoga a \func{msgget}, solo che in questo caso
1915 restituisce l'identificatore di un insieme di semafori, in particolare è
1916 identico l'uso degli argomenti \param{key} e \param{flag}, per cui non
1917 ripeteremo quanto detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. L'argomento
1918 \param{nsems} permette di specificare quanti semafori deve contenere l'insieme
1919 quando se ne richieda la creazione, e deve essere nullo quando si effettua una
1920 richiesta dell'identificatore di un insieme già esistente.
1922 Purtroppo questa implementazione complica inutilmente lo schema elementare che
1923 abbiamo descritto, dato che non è possibile definire un singolo semaforo, ma
1924 se ne deve creare per forza un insieme. Ma questa in definitiva è solo una
1925 complicazione inutile dell'interfaccia, il problema è che i semafori forniti
1926 dal \textit{SysV-IPC} soffrono di altri due difetti progettuali molto più
1929 Il primo difetto è che non esiste una funzione che permetta di creare ed
1930 inizializzare un semaforo in un'unica chiamata; occorre prima creare l'insieme
1931 dei semafori con \func{semget} e poi inizializzarlo con \func{semctl}, si
1932 perde così ogni possibilità di eseguire l'operazione atomicamente. Eventuali
1933 accessi che possono avvenire fra la creazione e l'inizializzazione potranno
1934 avere effetti imprevisti.
1936 Il secondo difetto deriva dalla caratteristica generale degli oggetti del
1937 \textit{SysV-IPC} di essere risorse globali di sistema, che non vengono
1938 cancellate quando nessuno le usa più. In questo caso il problema è più grave
1939 perché ci si a trova a dover affrontare esplicitamente il caso in cui un
1940 processo termina per un qualche errore lasciando un semaforo occupato, che
1941 resterà tale fino al successivo riavvio del sistema. Come vedremo esistono
1942 delle modalità per evitare tutto ciò, ma diventa necessario indicare
1943 esplicitamente che si vuole il ripristino del semaforo all'uscita del
1944 processo, e la gestione diventa più complicata.
1946 \begin{figure}[!htb]
1947 \footnotesize \centering
1948 \begin{minipage}[c]{.85\textwidth}
1949 \includestruct{listati/semid_ds.h}
1952 \caption{La struttura \structd{semid\_ds}, associata a ciascun insieme di
1954 \label{fig:ipc_semid_ds}
1957 A ciascun insieme di semafori è associata una struttura \struct{semid\_ds},
1958 riportata in fig.~\ref{fig:ipc_semid_ds}.\footnote{anche in questo caso in
1959 realtà il kernel usa una sua specifica struttura interna, ma i dati
1960 significativi sono sempre quelli citati.} Come nel caso delle code di
1961 messaggi quando si crea un nuovo insieme di semafori con \func{semget} questa
1962 struttura viene inizializzata. In particolare il campo \var{sem\_perm}, che
1963 esprime i permessi di accesso, viene inizializzato come illustrato in
1964 sez.~\ref{sec:ipc_sysv_access_control} (si ricordi che in questo caso il
1965 permesso di scrittura è in realtà permesso di alterare il semaforo), per
1966 quanto riguarda gli altri campi invece:
1968 \item il campo \var{sem\_nsems}, che esprime il numero di semafori
1969 nell'insieme, viene inizializzato al valore di \param{nsems}.
1970 \item il campo \var{sem\_ctime}, che esprime il tempo di ultimo cambiamento
1971 dell'insieme, viene inizializzato al tempo corrente.
1972 \item il campo \var{sem\_otime}, che esprime il tempo dell'ultima operazione
1973 effettuata, viene inizializzato a zero.
1976 \begin{figure}[!htb]
1977 \footnotesize \centering
1978 \begin{minipage}[c]{.85\textwidth}
1979 \includestruct{listati/sem.h}
1982 \caption{La struttura \structd{sem}, che contiene i dati di un singolo
1987 Ciascun semaforo dell'insieme è realizzato come una struttura di tipo
1988 \struct{sem} che ne contiene i dati essenziali, la cui definizione è riportata
1989 in fig.~\ref{fig:ipc_sem}.\footnote{in realtà in fig~\ref{fig:ipc_sem} si è
1990 riportata la definizione originaria del kernel 1.0, che contiene la prima
1991 realizzazione del \textit{SysV-IPC} in Linux; ormai questa struttura è
1992 ridotta ai soli due primi membri, e gli altri vengono calcolati
1993 dinamicamente, la si è usata solo a scopo di esempio, perché indica tutti i
1994 valori associati ad un semaforo, restituiti dalle funzioni di controllo, e
1995 citati dalle pagine di manuale.} Questa struttura non è accessibile
1996 direttamente dallo \textit{user space}, ma i valori in essa specificati
1997 possono essere letti in maniera indiretta, attraverso l'uso delle opportune
1998 funzioni di controllo. I dati mantenuti nella struttura, ed elencati in
1999 fig.~\ref{fig:ipc_sem}, indicano rispettivamente:
2000 \begin{basedescript}{\desclabelwidth{2cm}\desclabelstyle{\nextlinelabel}}
2001 \item[\var{semval}] il valore numerico del semaforo.
2002 \item[\var{sempid}] il \ids{PID} dell'ultimo processo che ha eseguito una
2003 operazione sul semaforo.
2004 \item[\var{semncnt}] il numero di processi in attesa che esso venga
2006 \item[\var{semzcnt}] il numero di processi in attesa che esso si annulli.
2009 Come per le code di messaggi anche per gli insiemi di semafori esistono una
2010 serie di limiti, i cui valori sono associati ad altrettante costanti, che si
2011 sono riportate in tab.~\ref{tab:ipc_sem_limits}. Alcuni di questi limiti sono
2012 al solito accessibili e modificabili attraverso \func{sysctl} o scrivendo
2013 direttamente nel file \sysctlfile{kernel/sem}.
2018 \begin{tabular}[c]{|c|r|p{8cm}|}
2020 \textbf{Costante} & \textbf{Valore} & \textbf{Significato} \\
2023 \constd{SEMMNI}& 128 & Numero massimo di insiemi di semafori.\\
2024 \constd{SEMMSL}& 250 & Numero massimo di semafori per insieme.\\
2025 \constd{SEMMNS}&\const{SEMMNI}*\const{SEMMSL}& Numero massimo di semafori
2027 \constd{SEMVMX}& 32767 & Massimo valore per un semaforo.\\
2028 \constd{SEMOPM}& 32 & Massimo numero di operazioni per chiamata a
2030 \constd{SEMMNU}&\const{SEMMNS}& Massimo numero di strutture di ripristino.\\
2031 \constd{SEMUME}&\const{SEMOPM}& Massimo numero di voci di ripristino.\\
2032 \constd{SEMAEM}&\const{SEMVMX}& Valore massimo per l'aggiustamento
2036 \caption{Valori delle costanti associate ai limiti degli insiemi di
2037 semafori, definite in \file{linux/sem.h}.}
2038 \label{tab:ipc_sem_limits}
2042 La funzione di sistema che permette di effettuare le varie operazioni di
2043 controllo sui semafori fra le quali, come accennato, è impropriamente compresa
2044 anche la loro inizializzazione, è \funcd{semctl}; il suo prototipo è:
2050 \fdecl{int semctl(int semid, int semnum, int cmd)}
2051 \fdecl{int semctl(int semid, int semnum, int cmd, union semun arg)}
2052 \fdesc{Esegue le operazioni di controllo su un semaforo o un insieme di
2056 {La funzione ritorna in caso di successo un valore positivo quanto usata con
2057 tre argomenti ed un valore nullo quando usata con quattro e $-1$ per un
2058 errore, nel qual caso \var{errno} assumerà uno dei valori:
2060 \item[\errcode{EACCES}] i permessi assegnati al semaforo non consentono
2061 l'operazione di lettura o scrittura richiesta e non si hanno i privilegi
2063 \item[\errcode{EIDRM}] l'insieme di semafori è stato cancellato.
2064 \item[\errcode{EPERM}] si è richiesto \const{IPC\_SET} o \const{IPC\_RMID}
2065 ma il processo non è né il creatore né il proprietario del semaforo e
2066 non ha i privilegi di amministratore.
2067 \item[\errcode{ERANGE}] si è richiesto \const{SETALL} \const{SETVAL} ma il
2068 valore a cui si vuole impostare il semaforo è minore di zero o maggiore
2071 ed inoltre \errval{EFAULT} ed \errval{EINVAL} nel loro significato
2075 La funzione può avere tre o quattro argomenti, a seconda dell'operazione
2076 specificata con \param{cmd}, ed opera o sull'intero insieme specificato da
2077 \param{semid} o sul singolo semaforo di un insieme, specificato da
2080 \begin{figure}[!htb]
2081 \footnotesize \centering
2082 \begin{minipage}[c]{0.80\textwidth}
2083 \includestruct{listati/semun.h}
2086 \caption{La definizione dei possibili valori di una \dirct{union}
2087 \structd{semun}, usata come quarto argomento della funzione
2089 \label{fig:ipc_semun}
2092 Qualora la funzione operi con quattro argomenti \param{arg} è un argomento
2093 generico, che conterrà un dato diverso a seconda dell'azione richiesta; per
2094 unificare detto argomento esso deve essere passato come una unione
2095 \struct{semun}, la cui definizione, con i possibili valori che può assumere, è
2096 riportata in fig.~\ref{fig:ipc_semun}.
2098 Nelle versioni più vecchie della \acr{glibc} questa unione veniva definita in
2099 \file{sys/sem.h}, ma nelle versioni più recenti questo non avviene più in
2100 quanto lo standard POSIX.1-2001 richiede che sia sempre definita a cura del
2101 chiamante. In questa seconda evenienza la \acr{glibc} definisce però la
2102 macro \macrod{\_SEM\_SEMUN\_UNDEFINED} che può essere usata per controllare la
2105 Come già accennato sia il comportamento della funzione che il numero di
2106 argomenti con cui deve essere invocata dipendono dal valore dell'argomento
2107 \param{cmd}, che specifica l'azione da intraprendere. Per questo argomento i
2108 valori validi, quelli cioè che non causano un errore di \errcode{EINVAL}, sono
2110 \begin{basedescript}{\desclabelwidth{1.6cm}\desclabelstyle{\nextlinelabel}}
2111 \item[\const{IPC\_STAT}] Legge i dati dell'insieme di semafori, copiandone i
2112 valori nella struttura \struct{semid\_ds} posta all'indirizzo specificato
2113 con \var{arg.buf}. Occorre avere il permesso di lettura.
2114 L'argomento \param{semnum} viene ignorato.
2115 \item[\const{IPC\_RMID}] Rimuove l'insieme di semafori e le relative strutture
2116 dati, con effetto immediato. Tutti i processi che erano bloccati in attesa
2117 vengono svegliati, ritornando con un errore di \errcode{EIDRM}. L'\ids{UID}
2118 effettivo del processo deve corrispondere o al creatore o al proprietario
2119 dell'insieme, o all'amministratore. L'argomento
2120 \param{semnum} viene ignorato.
2121 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2122 dell'insieme. I valori devono essere passati in una struttura
2123 \struct{semid\_ds} puntata da \param{arg.buf} di cui saranno usati soltanto
2124 i campi \var{sem\_perm.uid}, \var{sem\_perm.gid} e i nove bit meno
2125 significativi di \var{sem\_perm.mode}. La funziona aggiorna anche il campo
2126 \var{sem\_ctime}. L'\ids{UID} effettivo del processo deve corrispondere o
2127 al creatore o al proprietario dell'insieme, o all'amministratore.
2128 L'argomento \param{semnum} viene ignorato.
2129 \item[\constd{GETALL}] Restituisce il valore corrente di ciascun semaforo
2130 dell'insieme (corrispondente al campo \var{semval} di \struct{sem}) nel
2131 vettore indicato da \param{arg.array}. Occorre avere il permesso di lettura.
2132 L'argomento \param{semnum} viene ignorato.
2133 \item[\constd{GETNCNT}] Restituisce come valore di ritorno della funzione il
2134 numero di processi in attesa che il semaforo \param{semnum} dell'insieme
2135 \param{semid} venga incrementato (corrispondente al campo \var{semncnt} di
2136 \struct{sem}). Va invocata con tre argomenti. Occorre avere il permesso di
2138 \item[\constd{GETPID}] Restituisce come valore di ritorno della funzione il
2139 \ids{PID} dell'ultimo processo che ha compiuto una operazione sul semaforo
2140 \param{semnum} dell'insieme \param{semid} (corrispondente al campo
2141 \var{sempid} di \struct{sem}). Va invocata con tre argomenti. Occorre avere
2142 il permesso di lettura.
2143 \item[\constd{GETVAL}] Restituisce come valore di ritorno della funzione il
2144 valore corrente del semaforo \param{semnum} dell'insieme \param{semid}
2145 (corrispondente al campo \var{semval} di \struct{sem}). Va invocata con tre
2146 argomenti. Occorre avere il permesso di lettura.
2147 \item[\constd{GETZCNT}] Restituisce come valore di ritorno della funzione il
2148 numero di processi in attesa che il valore del semaforo \param{semnum}
2149 dell'insieme \param{semid} diventi nullo (corrispondente al campo
2150 \var{semncnt} di \struct{sem}). Va invocata con tre argomenti. Occorre
2151 avere il permesso di lettura.
2152 \item[\constd{SETALL}] Inizializza il valore di tutti i semafori dell'insieme,
2153 aggiornando il campo \var{sem\_ctime} di \struct{semid\_ds}. I valori devono
2154 essere passati nel vettore indicato da \param{arg.array}. Si devono avere i
2155 privilegi di scrittura. L'argomento \param{semnum} viene ignorato.
2156 \item[\constd{SETVAL}] Inizializza il semaforo \param{semnum} al valore passato
2157 dall'argomento \param{arg.val}, aggiornando il campo \var{sem\_ctime} di
2158 \struct{semid\_ds}. Si devono avere i privilegi di scrittura.
2161 Come per \func{msgctl} esistono tre ulteriori valori, \const{IPC\_INFO},
2162 \constd{SEM\_STAT} e \constd{SEM\_INFO}, specifici di Linux e fuori da ogni
2163 standard, creati specificamente ad uso del comando \cmd{ipcs}. Dato che anche
2164 questi potranno essere modificati o rimossi, non devono essere utilizzati e
2165 pertanto non li tratteremo.
2167 Quando si imposta il valore di un semaforo (sia che lo si faccia per tutto
2168 l'insieme con \const{SETALL}, che per un solo semaforo con \const{SETVAL}), i
2169 processi in attesa su di esso reagiscono di conseguenza al cambiamento di
2170 valore. Inoltre la coda delle operazioni di ripristino viene cancellata per
2171 tutti i semafori il cui valore viene modificato.
2176 \begin{tabular}[c]{|c|l|}
2178 \textbf{Operazione} & \textbf{Valore restituito} \\
2181 \const{GETNCNT}& Valore di \var{semncnt}.\\
2182 \const{GETPID} & Valore di \var{sempid}.\\
2183 \const{GETVAL} & Valore di \var{semval}.\\
2184 \const{GETZCNT}& Valore di \var{semzcnt}.\\
2187 \caption{Valori di ritorno della funzione \func{semctl}.}
2188 \label{tab:ipc_semctl_returns}
2191 Il valore di ritorno della funzione in caso di successo dipende
2192 dall'operazione richiesta; per tutte le operazioni che richiedono quattro
2193 argomenti esso è sempre nullo, per le altre operazioni, elencate in
2194 tab.~\ref{tab:ipc_semctl_returns} viene invece restituito il valore richiesto,
2195 corrispondente al campo della struttura \struct{sem} indicato nella seconda
2196 colonna della tabella.
2198 Le operazioni ordinarie sui semafori, come l'acquisizione o il rilascio degli
2199 stessi (in sostanza tutte quelle non comprese nell'uso di \func{semctl})
2200 vengono effettuate con la funzione di sistema \funcd{semop}, il cui prototipo
2207 \fdecl{int semop(int semid, struct sembuf *sops, unsigned nsops)}
2208 \fdesc{Esegue operazioni ordinarie su un semaforo o un insieme di semafori.}
2211 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2212 caso \var{errno} assumerà uno dei valori:
2214 \item[\errcode{E2BIG}] l'argomento \param{nsops} è maggiore del numero
2215 massimo di operazioni \const{SEMOPM}.
2216 \item[\errcode{EACCES}] il processo non ha i permessi per eseguire
2217 l'operazione richiesta e non ha i privilegi di amministratore.
2218 \item[\errcode{EAGAIN}] un'operazione comporterebbe il blocco del processo,
2219 ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg}.
2220 \item[\errcode{EFBIG}] il valore del campo \var{sem\_num} è negativo o
2221 maggiore o uguale al numero di semafori dell'insieme.
2222 \item[\errcode{EIDRM}] l'insieme di semafori è stato cancellato.
2223 \item[\errcode{EINTR}] la funzione, bloccata in attesa dell'esecuzione
2224 dell'operazione, viene interrotta da un segnale.
2225 \item[\errcode{ENOMEM}] si è richiesto un \const{SEM\_UNDO} ma il sistema
2226 non ha le risorse per allocare la struttura di ripristino.
2227 \item[\errcode{ERANGE}] per alcune operazioni il valore risultante del
2228 semaforo viene a superare il limite massimo \const{SEMVMX}.
2230 ed inoltre \errval{EFAULT} ed \errval{EINVAL} nel loro significato
2234 La funzione permette di eseguire operazioni multiple sui singoli semafori di
2235 un insieme. La funzione richiede come primo argomento l'identificatore
2236 \param{semid} dell'insieme su cui si vuole operare, il numero di operazioni da
2237 effettuare viene specificato con l'argomento \param{nsop}, mentre il loro
2238 contenuto viene passato con un puntatore ad un vettore di strutture
2239 \struct{sembuf} nell'argomento \param{sops}. Le operazioni richieste vengono
2240 effettivamente eseguite se e soltanto se è possibile effettuarle tutte quante,
2241 ed in tal caso vengono eseguite nella sequenza passata nel
2242 vettore \param{sops}.
2244 Con lo standard POSIX.1-2001 è stata introdotta una variante di \func{semop}
2245 che consente di specificare anche un tempo massimo di attesa. La nuova
2246 funzione di sistema, disponibile a partire dal kernel 2.4.22 e dalla
2247 \acr{glibc} 2.3.3, ed utilizzabile solo dopo aver definito la macro
2248 \macro{\_GNU\_SOURCE}, è \funcd{semtimedop}, ed il suo prototipo è:
2254 \fdecl{int semtimedop(int semid, struct sembuf *sops, unsigned nsops,
2255 struct timespec *timeout)}
2256 \fdesc{Esegue operazioni ordinarie su un semaforo o un insieme di semafori.}
2259 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2260 caso \var{errno} assumerà uno dei valori:
2262 \item[\errcode{EAGAIN}] l'operazione comporterebbe il blocco del processo,
2263 ma si è specificato \const{IPC\_NOWAIT} in \var{sem\_flg} oppure si è
2264 atteso oltre quanto indicato da \param{timeout}.
2266 e gli altri valori già visti per \func{semop}, con lo stesso significato.}
2269 Rispetto a \func{semop} la funzione consente di specificare un tempo massimo
2270 di attesa, indicato con una struttura \struct{timespec} (vedi
2271 fig.~\ref{fig:sys_timespec_struct}), per le operazioni che verrebbero
2272 bloccate. Alla scadenza di detto tempo la funzione ritorna comunque con un
2273 errore di \errval{EAGAIN} senza che nessuna delle operazioni richieste venga
2276 Si tenga presente che la precisione della temporizzazione è comunque limitata
2277 dalla risoluzione dell'orologio di sistema, per cui il tempo di attesa verrà
2278 arrotondato per eccesso. In caso si passi un valore \val{NULL}
2279 per \param{timeout} il comportamento di \func{semtimedop} è identico a quello
2283 \begin{figure}[!htb]
2284 \footnotesize \centering
2285 \begin{minipage}[c]{.80\textwidth}
2286 \includestruct{listati/sembuf.h}
2289 \caption{La struttura \structd{sembuf}, usata per le operazioni sui
2291 \label{fig:ipc_sembuf}
2294 Come indicato il contenuto di ciascuna operazione deve essere specificato
2295 attraverso una struttura \struct{sembuf} (la cui definizione è riportata in
2296 fig.~\ref{fig:ipc_sembuf}) che il programma chiamante deve avere cura di
2297 allocare in un opportuno vettore. La struttura permette di indicare il
2298 semaforo su cui operare, il tipo di operazione, ed un flag di controllo.
2300 Il campo \var{sem\_num} serve per indicare a quale semaforo dell'insieme fa
2301 riferimento l'operazione. Si ricordi che i semafori sono numerati come gli
2302 elementi di un vettore, per cui il primo semaforo di un insieme corrisponde ad
2303 un valore nullo di \var{sem\_num}.
2305 Il campo \var{sem\_flg} è un flag, mantenuto come maschera binaria, per il
2306 quale possono essere impostati i due valori \const{IPC\_NOWAIT} e
2307 \constd{SEM\_UNDO}. Impostando \const{IPC\_NOWAIT} si fa sì che in tutti quei
2308 casi in cui l'esecuzione di una operazione richiederebbe di porre il processo
2309 vada nello stato di \textit{sleep}, invece di bloccarsi \func{semop} ritorni
2310 immediatamente (abortendo così le eventuali operazioni restanti) con un errore
2311 di \errcode{EAGAIN}. Impostando \const{SEM\_UNDO} si richiede invece che
2312 l'operazione in questione venga registrata, in modo che il valore del semaforo
2313 possa essere ripristinato all'uscita del processo.
2315 Infine \var{sem\_op} è il campo che controlla qual'è l'operazione che viene
2316 eseguita e determina in generale il comportamento della chiamata a
2317 \func{semop}. I casi possibili per il valore di questo campo sono tre:
2318 \begin{basedescript}{\desclabelwidth{1.8cm}}
2319 \item[\var{sem\_op} $>0$] In questo caso il valore viene aggiunto al valore
2320 corrente di \var{semval} per il semaforo indicato. Questa operazione non
2321 causa mai un blocco del processo, ed eventualmente \func{semop} ritorna
2322 immediatamente con un errore di \errcode{ERANGE} qualora si sia superato il
2323 limite \const{SEMVMX}. Se l'operazione ha successo si passa immediatamente
2324 alla successiva. Specificando \const{SEM\_UNDO} si aggiorna il contatore
2325 per il ripristino del valore del semaforo. Al processo chiamante è richiesto
2326 il privilegio di alterazione (scrittura) sull'insieme di semafori.
2328 \item[\var{sem\_op} $=0$] Nel caso \var{semval} sia zero l'operazione ha
2329 successo immediato, e o si passa alla successiva o \func{semop} ritorna con
2330 successo se questa era l'ultima. Se \var{semval} è diverso da zero il
2331 comportamento è controllato da \var{sem\_flg}, se è stato impostato
2332 \const{IPC\_NOWAIT} \func{semop} ritorna immediatamente abortendo tutte le
2333 operazioni con un errore di \errcode{EAGAIN}, altrimenti viene incrementato
2334 \var{semzcnt} di uno ed il processo viene bloccato fintanto che non si
2335 verifica una delle condizioni seguenti:
2337 \item \var{semval} diventa zero, nel qual caso \var{semzcnt} viene
2338 decrementato di uno, l'operazione ha successo e si passa alla successiva,
2339 oppure \func{semop} ritorna con successo se questa era l'ultima.
2340 \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2341 ritorna abortendo tutte le operazioni con un errore di \errcode{EIDRM}.
2342 \item il processo chiamante riceve un segnale, nel qual caso \var{semzcnt}
2343 viene decrementato di uno e \func{semop} ritorna abortendo tutte le
2344 operazioni con un errore di \errcode{EINTR}.
2346 Al processo chiamante è richiesto soltanto il privilegio di lettura
2347 dell'insieme dei semafori.
2349 \item[\var{sem\_op} $<0$] Nel caso in cui \var{semval} è maggiore o uguale del
2350 valore assoluto di \var{sem\_op} (se cioè la somma dei due valori resta
2351 positiva o nulla) i valori vengono sommati e l'operazione ha successo e si
2352 passa alla successiva, oppure \func{semop} ritorna con successo se questa
2353 era l'ultima. Qualora si sia impostato \const{SEM\_UNDO} viene anche
2354 aggiornato il contatore per il ripristino del valore del semaforo. In caso
2355 contrario (quando cioè la somma darebbe luogo ad un valore di \var{semval}
2356 negativo) se si è impostato \const{IPC\_NOWAIT} \func{semop} ritorna
2357 immediatamente abortendo tutte le operazioni con un errore di
2358 \errcode{EAGAIN}, altrimenti viene incrementato di uno \var{semncnt} ed il
2359 processo resta in stato di \textit{sleep} fintanto che non si ha una delle
2360 condizioni seguenti:
2362 \item \var{semval} diventa maggiore o uguale del valore assoluto di
2363 \var{sem\_op}, nel qual caso \var{semncnt} viene decrementato di uno, il
2364 valore di \var{sem\_op} viene sommato a \var{semval}, e se era stato
2365 impostato \const{SEM\_UNDO} viene aggiornato il contatore per il
2366 ripristino del valore del semaforo.
2367 \item l'insieme di semafori viene rimosso, nel qual caso \func{semop}
2368 ritorna abortendo tutte le operazioni con un errore di \errcode{EIDRM}.
2369 \item il processo chiamante riceve un segnale, nel qual caso \var{semncnt}
2370 viene decrementato di uno e \func{semop} ritorna abortendo tutte le
2371 operazioni con un errore di \errcode{EINTR}.
2373 Al processo chiamante è richiesto il privilegio di alterazione (scrittura)
2374 sull'insieme di semafori.
2377 Qualora si sia usato \func{semtimedop} alle condizioni di errore precedenti si
2378 aggiunge anche quella di scadenza del tempo di attesa indicato
2379 con \param{timeout} che farà abortire la funzione, qualora resti bloccata
2380 troppo a lungo nell'esecuzione delle operazioni richieste, con un errore di
2383 In caso di successo (sia per \func{semop} che per \func{semtimedop}) per ogni
2384 semaforo modificato verrà aggiornato il campo \var{sempid} al valore del
2385 \ids{PID} del processo chiamante; inoltre verranno pure aggiornati al tempo
2386 corrente i campi \var{sem\_otime} e \var{sem\_ctime}.
2388 Dato che, come già accennato in precedenza, in caso di uscita inaspettata i
2389 semafori possono restare occupati, abbiamo visto come \func{semop} (e
2390 \func{semtimedop}) permetta di attivare un meccanismo di ripristino attraverso
2391 l'uso del flag \const{SEM\_UNDO}. Il meccanismo è implementato tramite una
2392 apposita struttura \kstruct{sem\_undo}, associata ad ogni processo per ciascun
2393 semaforo che esso ha modificato; all'uscita i semafori modificati vengono
2394 ripristinati, e le strutture disallocate. Per mantenere coerente il
2395 comportamento queste strutture non vengono ereditate attraverso una
2396 \func{fork} (altrimenti si avrebbe un doppio ripristino), mentre passano
2397 inalterate nell'esecuzione di una \func{exec} (altrimenti non si avrebbe
2400 Tutto questo però ha un problema di fondo. Per capire di cosa si tratta
2401 occorre fare riferimento all'implementazione usata in Linux, che è riportata
2402 in maniera semplificata nello schema di fig.~\ref{fig:ipc_sem_schema}. Si è
2403 presa come riferimento l'architettura usata fino al kernel 2.2.x che è più
2404 semplice (ed illustrata in dettaglio in \cite{tlk}). Nel kernel 2.4.x la
2405 struttura del \textit{SysV-IPC} è stata modificata, ma le definizioni relative
2406 a queste strutture restano per compatibilità (in particolare con le vecchie
2407 versioni delle librerie del C, come le \acr{libc5}).
2409 \begin{figure}[!htb]
2410 \centering \includegraphics[width=12cm]{img/semtruct}
2411 \caption{Schema delle varie strutture di un insieme di semafori
2412 (\kstructd{semid\_ds}, \kstructd{sem}, \kstructd{sem\_queue} e
2413 \kstructd{sem\_undo}).}
2414 \label{fig:ipc_sem_schema}
2417 Alla creazione di un nuovo insieme viene allocata una nuova strutture
2418 \kstruct{semid\_ds} ed il relativo vettore di strutture \kstruct{sem}. Quando
2419 si richiede una operazione viene anzitutto verificato che tutte le operazioni
2420 possono avere successo; se una di esse comporta il blocco del processo il
2421 kernel crea una struttura \kstruct{sem\_queue} che viene aggiunta in fondo
2422 alla coda di attesa associata a ciascun insieme di semafori, che viene
2423 referenziata tramite i campi \var{sem\_pending} e \var{sem\_pending\_last} di
2424 \kstruct{semid\_ds}. Nella struttura viene memorizzato il riferimento alle
2425 operazioni richieste (nel campo \var{sops}, che è un puntatore ad una
2426 struttura \struct{sembuf}) e al processo corrente (nel campo \var{sleeper})
2427 poi quest'ultimo viene messo stato di attesa e viene invocato lo
2428 \textit{scheduler} per passare all'esecuzione di un altro processo.
2430 Se invece tutte le operazioni possono avere successo vengono eseguite
2431 immediatamente, dopo di che il kernel esegue una scansione della coda di
2432 attesa (a partire da \var{sem\_pending}) per verificare se qualcuna delle
2433 operazioni sospese in precedenza può essere eseguita, nel qual caso la
2434 struttura \kstruct{sem\_queue} viene rimossa e lo stato del processo associato
2435 all'operazione (\var{sleeper}) viene riportato a \textit{running}; il tutto
2436 viene ripetuto fin quando non ci sono più operazioni eseguibili o si è
2437 svuotata la coda. Per gestire il meccanismo del ripristino tutte le volte che
2438 per un'operazione si è specificato il flag \const{SEM\_UNDO} viene mantenuta
2439 per ciascun insieme di semafori una apposita struttura \kstruct{sem\_undo} che
2440 contiene (nel vettore puntato dal campo \var{semadj}) un valore di
2441 aggiustamento per ogni semaforo cui viene sommato l'opposto del valore usato
2444 Queste strutture sono mantenute in due liste (rispettivamente attraverso i due
2445 campi \var{id\_next} e \var{proc\_next}) una associata all'insieme di cui fa
2446 parte il semaforo, che viene usata per invalidare le strutture se questo viene
2447 cancellato o per azzerarle se si è eseguita una operazione con \func{semctl},
2448 l'altra associata al processo che ha eseguito l'operazione, attraverso il
2449 campo \var{semundo} di \kstruct{task\_struct}, come mostrato in
2450 \ref{fig:ipc_sem_schema}. Quando un processo termina, la lista ad esso
2451 associata viene scandita e le operazioni applicate al semaforo. Siccome un
2452 processo può accumulare delle richieste di ripristino per semafori differenti
2453 attraverso diverse chiamate a \func{semop}, si pone il problema di come
2454 eseguire il ripristino dei semafori all'uscita del processo, ed in particolare
2455 se questo può essere fatto atomicamente.
2457 Il punto è cosa succede quando una delle operazioni previste per il ripristino
2458 non può essere eseguita immediatamente perché ad esempio il semaforo è
2459 occupato; in tal caso infatti, se si pone il processo in stato di
2460 \textit{sleep} aspettando la disponibilità del semaforo (come faceva
2461 l'implementazione originaria) si perde l'atomicità dell'operazione. La scelta
2462 fatta dal kernel è pertanto quella di effettuare subito le operazioni che non
2463 prevedono un blocco del processo e di ignorare silenziosamente le altre;
2464 questo però comporta il fatto che il ripristino non è comunque garantito in
2467 Come esempio di uso dell'interfaccia dei semafori vediamo come implementare
2468 con essa dei semplici \textit{mutex} (cioè semafori binari), tutto il codice
2469 in questione, contenuto nel file \file{Mutex.c} allegato ai sorgenti, è
2470 riportato in fig.~\ref{fig:ipc_mutex_create}. Utilizzeremo l'interfaccia per
2471 creare un insieme contenente un singolo semaforo, per il quale poi useremo un
2472 valore unitario per segnalare la disponibilità della risorsa, ed un valore
2473 nullo per segnalarne l'indisponibilità.
2475 \begin{figure}[!htbp]
2476 \footnotesize \centering
2477 \begin{minipage}[c]{\codesamplewidth}
2478 \includecodesample{listati/Mutex.c}
2481 \caption{Il codice delle funzioni che permettono di creare o recuperare
2482 l'identificatore di un semaforo da utilizzare come \textit{mutex}.}
2483 \label{fig:ipc_mutex_create}
2486 La prima funzione (\texttt{\small 2-15}) è \func{MutexCreate} che data una
2487 chiave crea il semaforo usato per il mutex e lo inizializza, restituendone
2488 l'identificatore. Il primo passo (\texttt{\small 6}) è chiamare \func{semget}
2489 con \const{IPC\_CREATE} per creare il semaforo qualora non esista,
2490 assegnandogli i privilegi di lettura e scrittura per tutti. In caso di errore
2491 (\texttt{\small 7-9}) si ritorna subito il risultato di \func{semget},
2492 altrimenti (\texttt{\small 10}) si inizializza il semaforo chiamando
2493 \func{semctl} con il comando \const{SETVAL}, utilizzando l'unione
2494 \struct{semunion} dichiarata ed avvalorata in precedenza (\texttt{\small 4})
2495 ad 1 per significare che risorsa è libera. In caso di errore (\texttt{\small
2496 11-13}) si restituisce il valore di ritorno di \func{semctl}, altrimenti
2497 (\texttt{\small 14}) si ritorna l'identificatore del semaforo.
2499 La seconda funzione (\texttt{\small 17-20}) è \func{MutexFind}, che, data una
2500 chiave, restituisce l'identificatore del semaforo ad essa associato. La
2501 comprensione del suo funzionamento è immediata in quanto essa è soltanto un
2502 \textit{wrapper}\footnote{si chiama così una funzione usata per fare da
2503 \textsl{involucro} alla chiamata di un altra, usata in genere per
2504 semplificare un'interfaccia (come in questo caso) o per utilizzare con la
2505 stessa funzione diversi substrati (librerie, ecc.) che possono fornire le
2506 stesse funzionalità.} di una chiamata a \func{semget} per cercare
2507 l'identificatore associato alla chiave, il valore di ritorno di quest'ultima
2508 viene passato all'indietro al chiamante.
2510 La terza funzione (\texttt{\small 22-25}) è \func{MutexRead} che, dato un
2511 identificatore, restituisce il valore del semaforo associato al mutex. Anche
2512 in questo caso la funzione è un \textit{wrapper} per una chiamata a
2513 \func{semctl} con il comando \const{GETVAL}, che permette di restituire il
2514 valore del semaforo.
2516 La quarta e la quinta funzione (\texttt{\small 36-44}) sono \func{MutexLock},
2517 e \func{MutexUnlock}, che permettono rispettivamente di bloccare e sbloccare
2518 il mutex. Entrambe fanno da wrapper per \func{semop}, utilizzando le due
2519 strutture \var{sem\_lock} e \var{sem\_unlock} definite in precedenza
2520 (\texttt{\small 27-34}). Si noti come per queste ultime si sia fatto uso
2521 dell'opzione \const{SEM\_UNDO} per evitare che il semaforo resti bloccato in
2522 caso di terminazione imprevista del processo.
2524 L'ultima funzione (\texttt{\small 46-49}) della serie, è \func{MutexRemove},
2525 che rimuove il mutex. Anche in questo caso si ha un wrapper per una chiamata a
2526 \func{semctl} con il comando \const{IPC\_RMID}, che permette di cancellare il
2527 semaforo; il valore di ritorno di quest'ultima viene passato all'indietro.
2529 Chiamare \func{MutexLock} decrementa il valore del semaforo: se questo è
2530 libero (ha già valore 1) sarà bloccato (valore nullo), se è bloccato la
2531 chiamata a \func{semop} si bloccherà fintanto che la risorsa non venga
2532 rilasciata. Chiamando \func{MutexUnlock} il valore del semaforo sarà
2533 incrementato di uno, sbloccandolo qualora fosse bloccato.
2535 Si noti che occorre eseguire sempre prima \func{MutexLock} e poi
2536 \func{MutexUnlock}, perché se per un qualche errore si esegue più volte
2537 quest'ultima il valore del semaforo crescerebbe oltre 1, e \func{MutexLock}
2538 non avrebbe più l'effetto aspettato (bloccare la risorsa quando questa è
2539 considerata libera). Infine si tenga presente che usare \func{MutexRead} per
2540 controllare il valore dei mutex prima di proseguire in una operazione di
2541 sblocco non servirebbe comunque, dato che l'operazione non sarebbe atomica.
2542 Vedremo in sez.~\ref{sec:ipc_lock_file} come sia possibile ottenere
2543 un'interfaccia analoga a quella appena illustrata, senza incorrere in questi
2544 problemi, usando il \textit{file locking}.
2547 \subsection{Memoria condivisa}
2548 \label{sec:ipc_sysv_shm}
2550 Il terzo oggetto introdotto dal \textit{SysV-IPC} è quello dei segmenti di
2551 memoria condivisa. La funzione di sistema che permette di ottenerne uno è
2552 \funcd{shmget}, ed il suo prototipo è:
2558 \fdecl{int shmget(key\_t key, int size, int flag)}
2559 \fdesc{Ottiene o crea una memoria condivisa.}
2562 {La funzione ritorna l'identificatore (un intero positivo) in caso di successo
2563 e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei valori:
2565 \item[\errcode{ENOSPC}] si è superato il limite (\const{SHMMNI}) sul numero
2566 di segmenti di memoria nel sistema, o cercato di allocare un segmento le
2567 cui dimensioni fanno superare il limite di sistema (\const{SHMALL}) per
2568 la memoria ad essi riservata.
2569 \item[\errcode{EINVAL}] si è richiesta una dimensione per un nuovo segmento
2570 maggiore di \const{SHMMAX} o minore di \const{SHMMIN}, o se il segmento
2571 già esiste \param{size} è maggiore delle sue dimensioni.
2572 \item[\errcode{ENOMEM}] il sistema non ha abbastanza memoria per poter
2573 contenere le strutture per un nuovo segmento di memoria condivisa.
2574 \item[\errcode{ENOMEM}] si è specificato \const{IPC\_HUGETLB} ma non si
2575 hanno i privilegi di amministratore.
2577 ed inoltre \errval{EACCES}, \errval{ENOENT}, \errval{EEXIST},
2578 \errval{EIDRM}, con lo stesso significato che hanno per \func{msgget}.}
2582 La funzione, come \func{semget}, è analoga a \func{msgget}, ed identico è
2583 l'uso degli argomenti \param{key} e \param{flag} per cui non ripeteremo quanto
2584 detto al proposito in sez.~\ref{sec:ipc_sysv_mq}. A partire dal kernel 2.6
2585 però sono stati introdotti degli ulteriori bit di controllo per
2586 l'argomento \param{flag}, specifici di \func{shmget}, attinenti alle modalità
2587 di gestione del segmento di memoria condivisa in relazione al sistema della
2590 Il primo dei due flag è \constd{SHM\_HUGETLB} che consente di richiedere la
2591 creazione del segmento usando una \textit{huge page}, le pagine di memoria di
2592 grandi dimensioni introdotte con il kernel 2.6 per ottimizzare le prestazioni
2593 nei sistemi più recenti che hanno grandi quantità di memoria. L'operazione è
2594 privilegiata e richiede che il processo abbia la \textit{capability}
2595 \const{CAP\_IPC\_LOCK}. Questa funzionalità è specifica di Linux e non è
2598 Il secondo flag aggiuntivo, introdotto a partire dal kernel 2.6.15, è
2599 \constd{SHM\_NORESERVE}, ed ha lo stesso scopo del flag \const{MAP\_NORESERVE}
2600 di \func{mmap} (vedi sez.~\ref{sec:file_memory_map}): non vengono riservate
2601 delle pagine di swap ad uso del meccanismo del \textit{copy on write} per
2602 mantenere le modifiche fatte sul segmento. Questo significa che caso di
2603 scrittura sul segmento quando non c'è più memoria disponibile, si avrà
2604 l'emissione di un \signal{SIGSEGV}.
2606 Infine l'argomento \param{size} specifica la dimensione del segmento di
2607 memoria condivisa; il valore deve essere specificato in byte, ma verrà
2608 comunque arrotondato al multiplo superiore di \const{PAGE\_SIZE}. Il valore
2609 deve essere specificato quando si crea un nuovo segmento di memoria con
2610 \const{IPC\_CREAT} o \const{IPC\_PRIVATE}, se invece si accede ad un segmento
2611 di memoria condivisa esistente non può essere maggiore del valore con cui esso
2614 La memoria condivisa è la forma più veloce di comunicazione fra due processi,
2615 in quanto permette agli stessi di vedere nel loro spazio di indirizzi una
2616 stessa sezione di memoria. Pertanto non è necessaria nessuna operazione di
2617 copia per trasmettere i dati da un processo all'altro, in quanto ciascuno può
2618 accedervi direttamente con le normali operazioni di lettura e scrittura dei
2621 Ovviamente tutto questo ha un prezzo, ed il problema fondamentale della
2622 memoria condivisa è la sincronizzazione degli accessi. È evidente infatti che
2623 se un processo deve scambiare dei dati con un altro, si deve essere sicuri che
2624 quest'ultimo non acceda al segmento di memoria condivisa prima che il primo
2625 non abbia completato le operazioni di scrittura, inoltre nel corso di una
2626 lettura si deve essere sicuri che i dati restano coerenti e non vengono
2627 sovrascritti da un accesso in scrittura sullo stesso segmento da parte di un
2628 altro processo. Per questo in genere la memoria condivisa viene sempre
2629 utilizzata in abbinamento ad un meccanismo di sincronizzazione, il che, di
2630 norma, significa insieme a dei semafori.
2632 \begin{figure}[!htb]
2633 \footnotesize \centering
2634 \begin{minipage}[c]{0.80\textwidth}
2635 \includestruct{listati/shmid_ds.h}
2638 \caption{La struttura \structd{shmid\_ds}, associata a ciascun segmento di
2640 \label{fig:ipc_shmid_ds}
2643 A ciascun segmento di memoria condivisa è associata una struttura
2644 \struct{shmid\_ds}, riportata in fig.~\ref{fig:ipc_shmid_ds}. Come nel caso
2645 delle code di messaggi quando si crea un nuovo segmento di memoria condivisa
2646 con \func{shmget} questa struttura viene inizializzata, in particolare il
2647 campo \var{shm\_perm} viene inizializzato come illustrato in
2648 sez.~\ref{sec:ipc_sysv_access_control}, e valgono le considerazioni ivi fatte
2649 relativamente ai permessi di accesso; per quanto riguarda gli altri campi
2652 \item il campo \var{shm\_segsz}, che esprime la dimensione del segmento, viene
2653 inizializzato al valore di \param{size}.
2654 \item il campo \var{shm\_ctime}, che esprime il tempo di creazione del
2655 segmento, viene inizializzato al tempo corrente.
2656 \item i campi \var{shm\_atime} e \var{shm\_dtime}, che esprimono
2657 rispettivamente il tempo dell'ultima volta che il segmento è stato
2658 agganciato o sganciato da un processo, vengono inizializzati a zero.
2659 \item il campo \var{shm\_lpid}, che esprime il \ids{PID} del processo che ha
2660 eseguito l'ultima operazione, viene inizializzato a zero.
2661 \item il campo \var{shm\_cpid}, che esprime il \ids{PID} del processo che ha
2662 creato il segmento, viene inizializzato al \ids{PID} del processo chiamante.
2663 \item il campo \var{shm\_nattac}, che esprime il numero di processi agganciati
2664 al segmento viene inizializzato a zero.
2667 Come per le code di messaggi e gli insiemi di semafori, anche per i segmenti
2668 di memoria condivisa esistono una serie di limiti imposti dal sistema. Alcuni
2669 di questi limiti sono al solito accessibili e modificabili attraverso
2670 \func{sysctl} o scrivendo direttamente nei rispettivi file di
2671 \file{/proc/sys/kernel/}.
2673 In tab.~\ref{tab:ipc_shm_limits} si sono riportate le
2674 costanti simboliche associate a ciascuno di essi, il loro significato, i
2675 valori preimpostati, e, quando presente, il file in \file{/proc/sys/kernel/}
2676 che permettono di cambiarne il valore.
2682 \begin{tabular}[c]{|c|r|c|p{7cm}|}
2684 \textbf{Costante} & \textbf{Valore} & \textbf{File in \texttt{proc}}
2685 & \textbf{Significato} \\
2688 \constd{SHMALL}& 0x200000&\sysctlrelfiled{kernel}{shmall}
2689 & Numero massimo di pagine che
2690 possono essere usate per i segmenti di
2691 memoria condivisa.\\
2692 \constd{SHMMAX}&0x2000000&\sysctlrelfiled{kernel}{shmmax}
2693 & Dimensione massima di un segmento di memoria
2695 \constd{SHMMNI}& 4096&\sysctlrelfiled{kernel}{shmmni}
2696 & Numero massimo di segmenti di memoria condivisa
2697 presenti nel kernel.\\
2698 \constd{SHMMIN}& 1& --- & Dimensione minima di un segmento di
2699 memoria condivisa.\\
2700 \constd{SHMLBA}&\const{PAGE\_SIZE}&--- & Limite inferiore per le dimensioni
2701 minime di un segmento (deve essere
2702 allineato alle dimensioni di una
2703 pagina di memoria).\\
2704 \constd{SHMSEG}& --- & --- & Numero massimo di segmenti di
2705 memoria condivisa per ciascun
2706 processo (l'implementazione non
2707 prevede l'esistenza di questo
2713 \caption{Valori delle costanti associate ai limiti dei segmenti di memoria
2714 condivisa, insieme al relativo file in \file{/proc/sys/kernel/} ed al
2715 valore preimpostato presente nel sistema.}
2716 \label{tab:ipc_shm_limits}
2719 Al solito la funzione di sistema che permette di effettuare le operazioni di
2720 controllo su un segmento di memoria condivisa è \funcd{shmctl}; il suo
2726 \fdecl{int shmctl(int shmid, int cmd, struct shmid\_ds *buf)}
2728 \fdesc{Esegue le operazioni di controllo su un segmento di memoria condivisa.}
2731 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2732 caso \var{errno} assumerà uno dei valori:
2734 \item[\errcode{EACCES}] si è richiesto \const{IPC\_STAT} ma i permessi non
2735 consentono l'accesso in lettura al segmento.
2736 \item[\errcode{EFAULT}] l'indirizzo specificato con \param{buf} non è
2738 \item[\errcode{EIDRM}] l'argomento \param{shmid} fa riferimento ad un
2739 segmento che è stato cancellato.
2740 \item[\errcode{EINVAL}] o \param{shmid} non è un identificatore valido o
2741 \param{cmd} non è un comando valido.
2742 \item[\errcode{ENOMEM}] si è richiesto un \textit{memory lock} di
2743 dimensioni superiori al massimo consentito.
2744 \item[\errcode{EOVERFLOW}] si è tentato il comando \const{IPC\_STAT} ma il
2745 valore del \ids{GID} o dell'\ids{UID} è troppo grande per essere
2746 memorizzato nella struttura puntata da \param{buf}.
2747 \item[\errcode{EPERM}] si è specificato un comando con \const{IPC\_SET} o
2748 \const{IPC\_RMID} senza i permessi necessari.
2753 Il comando specificato attraverso l'argomento \param{cmd} determina i diversi
2754 effetti della funzione. Nello standard POSIX.1-2001 i valori che esso può
2755 assumere, ed il corrispondente comportamento della funzione, sono i seguenti:
2757 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2758 \item[\const{IPC\_STAT}] Legge le informazioni riguardo il segmento di memoria
2759 condivisa nella struttura \struct{shmid\_ds} puntata da \param{buf}. Occorre
2760 che il processo chiamante abbia il permesso di lettura sulla segmento.
2761 \item[\const{IPC\_RMID}] Marca il segmento di memoria condivisa per la
2762 rimozione, questo verrà cancellato effettivamente solo quando l'ultimo
2763 processo ad esso agganciato si sarà staccato. Questo comando può essere
2764 eseguito solo da un processo con \ids{UID} effettivo corrispondente o al
2765 creatore del segmento, o al proprietario del segmento, o all'amministratore.
2766 \item[\const{IPC\_SET}] Permette di modificare i permessi ed il proprietario
2767 del segmento. Per modificare i valori di \var{shm\_perm.mode},
2768 \var{shm\_perm.uid} e \var{shm\_perm.gid} occorre essere il proprietario o
2769 il creatore del segmento, oppure l'amministratore. Compiuta l'operazione
2770 aggiorna anche il valore del campo \var{shm\_ctime}.
2773 Oltre ai precedenti su Linux sono definiti anche degli ulteriori comandi, che
2774 consentono di estendere le funzionalità, ovviamente non devono essere usati se
2775 si ha a cuore la portabilità. Questi comandi aggiuntivi sono:
2777 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
2778 \item[\constd{SHM\_LOCK}] Abilita il \textit{memory locking} sul segmento di
2779 memoria condivisa, impedendo che la memoria usata per il segmento venga
2780 salvata su disco dal meccanismo della memoria virtuale. Come illustrato in
2781 sez.~\ref{sec:proc_mem_lock} fino al kernel 2.6.9 solo l'amministratore
2782 poteva utilizzare questa capacità,\footnote{che richiedeva la
2783 \textit{capability} \const{CAP\_IPC\_LOCK}.} a partire dal kernel 2.6.10
2784 anche gli utenti normali possono farlo fino al limite massimo determinato da
2785 \const{RLIMIT\_MEMLOCK} (vedi sez.~\ref{sec:sys_resource_limit}).
2786 \item[\constd{SHM\_UNLOCK}] Disabilita il \textit{memory locking} sul segmento
2787 di memoria condivisa. Fino al kernel 2.6.9 solo l'amministratore poteva
2788 utilizzare questo comando in corrispondenza di un segmento da lui bloccato.
2791 A questi due, come per \func{msgctl} e \func{semctl}, si aggiungono tre
2792 ulteriori valori, \const{IPC\_INFO}, \constd{SHM\_STAT} e \constd{SHM\_INFO},
2793 introdotti ad uso del programma \cmd{ipcs} per ottenere le informazioni
2794 generali relative alle risorse usate dai segmenti di memoria condivisa. Dato
2795 che potranno essere modificati o rimossi in favore dell'uso di \texttt{/proc},
2796 non devono essere usati e non li tratteremo.
2798 L'argomento \param{buf} viene utilizzato solo con i comandi \const{IPC\_STAT}
2799 e \const{IPC\_SET} nel qual caso esso dovrà puntare ad una struttura
2800 \struct{shmid\_ds} precedentemente allocata, in cui nel primo caso saranno
2801 scritti i dati del segmento di memoria restituiti dalla funzione e da cui, nel
2802 secondo caso, verranno letti i dati da impostare sul segmento.
2804 Una volta che lo si è creato, per utilizzare un segmento di memoria condivisa
2805 l'interfaccia prevede due funzioni, \funcd{shmat} e \func{shmdt}. La prima di
2806 queste serve ad agganciare un segmento al processo chiamante, in modo che
2807 quest'ultimo possa inserirlo nel suo spazio di indirizzi per potervi accedere;
2813 \fdecl{void *shmat(int shmid, const void *shmaddr, int shmflg)}
2815 \fdesc{Aggancia un segmento di memoria condivisa al processo chiamante.}
2818 {La funzione ritorna l'indirizzo del segmento in caso di successo e $-1$ (in
2819 un cast a \ctyp{void *}) per un errore, nel qual caso \var{errno} assumerà
2822 \item[\errcode{EACCES}] il processo non ha i privilegi per accedere al
2823 segmento nella modalità richiesta.
2824 \item[\errcode{EINVAL}] si è specificato un identificatore invalido per
2825 \param{shmid}, o un indirizzo non allineato sul confine di una pagina
2826 per \param{shmaddr} o il valore \val{NULL} indicando \const{SHM\_REMAP}.
2828 ed inoltre \errval{ENOMEM} nel suo significato generico.
2832 La funzione inserisce un segmento di memoria condivisa all'interno dello
2833 spazio di indirizzi del processo, in modo che questo possa accedervi
2834 direttamente, la situazione dopo l'esecuzione di \func{shmat} è illustrata in
2835 fig.~\ref{fig:ipc_shmem_layout} (per la comprensione del resto dello schema si
2836 ricordi quanto illustrato al proposito in sez.~\ref{sec:proc_mem_layout}). In
2837 particolare l'indirizzo finale del segmento dati (quello impostato da
2838 \func{brk}, vedi sez.~\ref{sec:proc_mem_alloc}) non viene influenzato.
2839 Si tenga presente infine che la funzione ha successo anche se il segmento è
2840 stato marcato per la cancellazione.
2842 \begin{figure}[!htb]
2843 \centering \includegraphics[height=10cm]{img/sh_memory_layout}
2844 \caption{Disposizione dei segmenti di memoria di un processo quando si è
2845 agganciato un segmento di memoria condivisa.}
2846 \label{fig:ipc_shmem_layout}
2849 L'argomento \param{shmaddr} specifica a quale indirizzo\footnote{lo standard
2850 SVID prevede che l'argomento \param{shmaddr} sia di tipo \ctyp{char *}, così
2851 come il valore di ritorno della funzione; in Linux è stato così con la
2852 \acr{libc4} e la \acr{libc5}, con il passaggio alla \acr{glibc} il tipo di
2853 \param{shmaddr} è divenuto un \ctyp{const void *} e quello del valore di
2854 ritorno un \ctyp{void *} seguendo POSIX.1-2001.} deve essere associato il
2855 segmento, se il valore specificato è \val{NULL} è il sistema a scegliere
2856 opportunamente un'area di memoria libera (questo è il modo più portabile e
2857 sicuro di usare la funzione). Altrimenti il kernel aggancia il segmento
2858 all'indirizzo specificato da \param{shmaddr}; questo però può avvenire solo se
2859 l'indirizzo coincide con il limite di una pagina, cioè se è un multiplo esatto
2860 del parametro di sistema \const{SHMLBA}, che in Linux è sempre uguale
2863 Si tenga presente però che quando si usa \val{NULL} come valore di
2864 \param{shmaddr}, l'indirizzo restituito da \func{shmat} può cambiare da
2865 processo a processo; pertanto se nell'area di memoria condivisa si salvano
2866 anche degli indirizzi, si deve avere cura di usare valori relativi (in genere
2867 riferiti all'indirizzo di partenza del segmento).
2869 L'argomento \param{shmflg} permette di cambiare il comportamento della
2870 funzione; esso va specificato come maschera binaria, i bit utilizzati al
2871 momento sono tre e sono identificati dalle costanti \const{SHM\_RND},
2872 \const{SHM\_RDONLY} e \const{SHM\_REMAP} che vanno combinate con un OR
2875 Specificando \constd{SHM\_RND} si evita che \func{shmat} ritorni un errore
2876 quando \param{shmaddr} non è allineato ai confini di una pagina. Si può quindi
2877 usare un valore qualunque per \param{shmaddr}, e il segmento verrà comunque
2878 agganciato, ma al più vicino multiplo di \const{SHMLBA}; il nome della
2879 costante sta infatti per \textit{rounded}, e serve per specificare un
2880 indirizzo come arrotondamento.
2882 L'uso di \constd{SHM\_RDONLY} permette di agganciare il segmento in sola
2883 lettura (si ricordi che anche le pagine di memoria hanno dei permessi), in tal
2884 caso un tentativo di scrivere sul segmento comporterà una violazione di
2885 accesso con l'emissione di un segnale di \signal{SIGSEGV}. Il comportamento
2886 usuale di \func{shmat} è quello di agganciare il segmento con l'accesso in
2887 lettura e scrittura (ed il processo deve aver questi permessi in
2888 \var{shm\_perm}), non è prevista la possibilità di agganciare un segmento in
2891 Infine \constd{SHM\_REMAP} è una estensione specifica di Linux (quindi non
2892 portabile) che indica che la mappatura del segmento deve rimpiazzare ogni
2893 precedente mappatura esistente nell'intervallo iniziante
2894 all'indirizzo \param{shmaddr} e di dimensione pari alla lunghezza del
2895 segmento. In condizioni normali questo tipo di richiesta fallirebbe con un
2896 errore di \errval{EINVAL}. Ovviamente usando \const{SHM\_REMAP}
2897 l'argomento \param{shmaddr} non può essere nullo.
2899 In caso di successo la funzione \func{shmat} aggiorna anche i seguenti campi
2900 della struttura \struct{shmid\_ds}:
2902 \item il tempo \var{shm\_atime} dell'ultima operazione di aggancio viene
2903 impostato al tempo corrente.
2904 \item il \ids{PID} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2905 segmento viene impostato a quello del processo corrente.
2906 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2910 Come accennato in sez.~\ref{sec:proc_fork} un segmento di memoria condivisa
2911 agganciato ad un processo viene ereditato da un figlio attraverso una
2912 \func{fork}, dato che quest'ultimo riceve una copia dello spazio degli
2913 indirizzi del padre. Invece, dato che attraverso una \func{exec} viene
2914 eseguito un diverso programma con uno spazio di indirizzi completamente
2915 diverso, tutti i segmenti agganciati al processo originario vengono
2916 automaticamente sganciati. Lo stesso avviene all'uscita del processo
2917 attraverso una \func{exit}.
2919 Una volta che un segmento di memoria condivisa non serve più, si può
2920 sganciarlo esplicitamente dal processo usando l'altra funzione
2921 dell'interfaccia, \funcd{shmdt}, il cui prototipo è:
2926 \fdecl{int shmdt(const void *shmaddr)}
2928 \fdesc{Sgancia dal processo un segmento di memoria condivisa.}
2931 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, la funzione
2932 fallisce solo quando non c'è un segmento agganciato
2933 all'indirizzo \param{shmaddr}, con \var{errno} che assume il valore
2938 La funzione sgancia dallo spazio degli indirizzi del processo un segmento di
2939 memoria condivisa; questo viene identificato con l'indirizzo \param{shmaddr}
2940 restituito dalla precedente chiamata a \func{shmat} con il quale era stato
2941 agganciato al processo.
2943 In caso di successo la funzione aggiorna anche i seguenti campi di
2946 \item il tempo \var{shm\_dtime} dell'ultima operazione di sganciamento viene
2947 impostato al tempo corrente.
2948 \item il \ids{PID} \var{shm\_lpid} dell'ultimo processo che ha operato sul
2949 segmento viene impostato a quello del processo corrente.
2950 \item il numero \var{shm\_nattch} di processi agganciati al segmento viene
2951 decrementato di uno.
2953 inoltre la regione di indirizzi usata per il segmento di memoria condivisa
2954 viene tolta dallo spazio di indirizzi del processo.
2956 \begin{figure}[!htbp]
2957 \footnotesize \centering
2958 \begin{minipage}[c]{\codesamplewidth}
2959 \includecodesample{listati/SharedMem.c}
2962 \caption{Il codice delle funzioni che permettono di creare, trovare e
2963 rimuovere un segmento di memoria condivisa.}
2964 \label{fig:ipc_sysv_shm_func}
2967 Come esempio di uso di queste funzioni vediamo come implementare una serie di
2968 funzioni di libreria che ne semplifichino l'uso, automatizzando le operazioni
2969 più comuni; il codice, contenuto nel file \file{SharedMem.c}, è riportato in
2970 fig.~\ref{fig:ipc_sysv_shm_func}.
2972 La prima funzione (\texttt{\small 1-16}) è \func{ShmCreate} che, data una
2973 chiave, crea il segmento di memoria condivisa restituendo il puntatore allo
2974 stesso. La funzione comincia (\texttt{\small 6}) con il chiamare
2975 \func{shmget}, usando il flag \const{IPC\_CREATE} per creare il segmento
2976 qualora non esista, ed assegnandogli i privilegi specificati dall'argomento
2977 \var{perm} e la dimensione specificata dall'argomento \var{shm\_size}. In
2978 caso di errore (\texttt{\small 7-9}) si ritorna immediatamente un puntatore
2979 nullo, altrimenti (\texttt{\small 10}) si prosegue agganciando il segmento di
2980 memoria condivisa al processo con \func{shmat}. In caso di errore
2981 (\texttt{\small 11-13}) si restituisce di nuovo un puntatore nullo, infine
2982 (\texttt{\small 14}) si inizializza con \func{memset} il contenuto del
2983 segmento al valore costante specificato dall'argomento \var{fill}, e poi si
2984 ritorna il puntatore al segmento stesso.
2986 La seconda funzione (\texttt{\small 17-31}) è \func{ShmFind}, che, data una
2987 chiave, restituisce l'indirizzo del segmento ad essa associato. Anzitutto
2988 (\texttt{\small 22}) si richiede l'identificatore del segmento con
2989 \func{shmget}, ritornando (\texttt{\small 23-25}) un puntatore nullo in caso
2990 di errore. Poi si prosegue (\texttt{\small 26}) agganciando il segmento al
2991 processo con \func{shmat}, restituendo (\texttt{\small 27-29}) di nuovo un
2992 puntatore nullo in caso di errore, se invece non ci sono errori si restituisce
2993 il puntatore ottenuto da \func{shmat}.
2995 La terza funzione (\texttt{\small 32-51}) è \func{ShmRemove} che, data la
2996 chiave ed il puntatore associati al segmento di memoria condivisa, prima lo
2997 sgancia dal processo e poi lo rimuove. Il primo passo (\texttt{\small 37}) è
2998 la chiamata a \func{shmdt} per sganciare il segmento, restituendo
2999 (\texttt{\small 38-39}) un valore -1 in caso di errore. Il passo successivo
3000 (\texttt{\small 41}) è utilizzare \func{shmget} per ottenere l'identificatore
3001 associato al segmento data la chiave \var{key}. Al solito si restituisce un
3002 valore di -1 (\texttt{\small 42-45}) in caso di errore, mentre se tutto va
3003 bene si conclude restituendo un valore nullo.
3005 Benché la memoria condivisa costituisca il meccanismo di intercomunicazione
3006 fra processi più veloce, essa non è sempre il più appropriato, dato che, come
3007 abbiamo visto, si avrà comunque la necessità di una sincronizzazione degli
3008 accessi. Per questo motivo, quando la comunicazione fra processi è
3009 sequenziale, altri meccanismi come le \textit{pipe}, le \textit{fifo} o i
3010 socket, che non necessitano di sincronizzazione esplicita, sono da
3011 preferire. Essa diventa l'unico meccanismo possibile quando la comunicazione
3012 non è sequenziale\footnote{come accennato in sez.~\ref{sec:ipc_sysv_mq} per la
3013 comunicazione non sequenziale si possono usare le code di messaggi,
3014 attraverso l'uso del campo \var{mtype}, ma solo se quest'ultima può essere
3015 effettuata in forma di messaggio.} o quando non può avvenire secondo una
3016 modalità predefinita.
3018 Un esempio classico di uso della memoria condivisa è quello del
3019 ``\textit{monitor}'', in cui viene per scambiare informazioni fra un processo
3020 server, che vi scrive dei dati di interesse generale che ha ottenuto, e i
3021 processi client interessati agli stessi dati che così possono leggerli in
3022 maniera completamente asincrona. Con questo schema di funzionamento da una
3023 parte si evita che ciascun processo client debba compiere l'operazione,
3024 potenzialmente onerosa, di ricavare e trattare i dati, e dall'altra si evita
3025 al processo server di dover gestire l'invio a tutti i client di tutti i dati
3026 (non potendo il server sapere quali di essi servono effettivamente al singolo
3029 Nel nostro caso implementeremo un ``\textsl{monitor}'' di una directory: un
3030 processo si incaricherà di tenere sotto controllo alcuni parametri relativi ad
3031 una directory (il numero dei file contenuti, la dimensione totale, quante
3032 directory, link simbolici, file normali, ecc.) che saranno salvati in un
3033 segmento di memoria condivisa cui altri processi potranno accedere per
3034 ricavare la parte di informazione che interessa.
3036 In fig.~\ref{fig:ipc_dirmonitor_main} si è riportata la sezione principale del
3037 corpo del programma server, insieme alle definizioni delle altre funzioni
3038 usate nel programma e delle variabili globali, omettendo tutto quello che
3039 riguarda la gestione delle opzioni e la stampa delle istruzioni di uso a
3040 video; al solito il codice completo si trova con i sorgenti allegati nel file
3041 \file{DirMonitor.c}.
3043 \begin{figure}[!htbp]
3044 \footnotesize \centering
3045 \begin{minipage}[c]{\codesamplewidth}
3046 \includecodesample{listati/DirMonitor.c}
3049 \caption{Codice della funzione principale del programma \file{DirMonitor.c}.}
3050 \label{fig:ipc_dirmonitor_main}
3053 Il programma usa delle variabili globali (\texttt{\small 2-14}) per mantenere
3054 i valori relativi agli oggetti usati per la comunicazione inter-processo; si è
3055 definita inoltre una apposita struttura \struct{DirProp} che contiene i dati
3056 relativi alle proprietà che si vogliono mantenere nella memoria condivisa, per
3057 l'accesso da parte dei client.
3059 Il programma, dopo la sezione, omessa, relativa alla gestione delle opzioni da
3060 riga di comando (che si limitano alla eventuale stampa di un messaggio di
3061 aiuto a video ed all'impostazione della durata dell'intervallo con cui viene
3062 ripetuto il calcolo delle proprietà della directory) controlla (\texttt{\small
3063 20-23}) che sia stato specificato l'argomento necessario contenente il nome
3064 della directory da tenere sotto controllo, senza il quale esce immediatamente
3065 con un messaggio di errore.
3067 Poi, per verificare che l'argomento specifichi effettivamente una directory,
3068 si esegue (\texttt{\small 24-26}) su di esso una \func{chdir}, uscendo
3069 immediatamente in caso di errore. Questa funzione serve anche per impostare
3070 la directory di lavoro del programma nella directory da tenere sotto
3071 controllo, in vista del successivo uso della funzione \func{daemon}. Si noti
3072 come si è potuta fare questa scelta, nonostante le indicazioni illustrate in
3073 sez.~\ref{sec:sess_daemon}, per il particolare scopo del programma, che
3074 necessita comunque di restare all'interno di una directory.
3076 Infine (\texttt{\small 27-29}) si installano i gestori per i vari segnali di
3077 terminazione che, avendo a che fare con un programma che deve essere eseguito
3078 come server, sono il solo strumento disponibile per concluderne l'esecuzione.
3080 Il passo successivo (\texttt{\small 30-39}) è quello di creare gli oggetti di
3081 intercomunicazione necessari. Si inizia costruendo (\texttt{\small 30}) la
3082 chiave da usare come riferimento con il nome del programma,\footnote{si è
3083 usato un riferimento relativo alla home dell'utente, supposto che i sorgenti
3084 di GaPiL siano stati installati direttamente in essa; qualora si effettui
3085 una installazione diversa si dovrà correggere il programma.} dopo di che si
3086 richiede (\texttt{\small 31}) la creazione di un segmento di memoria condivisa
3087 con usando la funzione \func{ShmCreate} illustrata in precedenza (una pagina
3088 di memoria è sufficiente per i dati che useremo), uscendo (\texttt{\small
3089 32-35}) qualora la creazione ed il successivo agganciamento al processo non
3090 abbia successo. Con l'indirizzo \var{shmptr} così ottenuto potremo poi
3091 accedere alla memoria condivisa, che, per come abbiamo lo abbiamo definito,
3092 sarà vista nella forma data da \struct{DirProp}. Infine (\texttt{\small
3093 36-39}) utilizzando sempre la stessa chiave, si crea, tramite le funzioni
3094 di interfaccia già descritte in sez.~\ref{sec:ipc_sysv_sem}, anche un mutex,
3095 che utilizzeremo per regolare l'accesso alla memoria condivisa.
3097 Completata l'inizializzazione e la creazione degli oggetti di
3098 intercomunicazione il programma entra nel ciclo principale (\texttt{\small
3099 40-49}) dove vengono eseguite indefinitamente le attività di monitoraggio.
3100 Il primo passo (\texttt{\small 41}) è eseguire \func{daemon} per proseguire
3101 con l'esecuzione in background come si conviene ad un programma demone; si
3102 noti che si è mantenuta, usando un valore non nullo del primo argomento, la
3103 directory di lavoro corrente. Una volta che il programma è andato in
3104 background l'esecuzione prosegue all'interno di un ciclo infinito
3105 (\texttt{\small 42-48}).
3107 Si inizia (\texttt{\small 43}) bloccando il mutex con \func{MutexLock} per
3108 poter accedere alla memoria condivisa (la funzione si bloccherà
3109 automaticamente se qualche client sta leggendo), poi (\texttt{\small 44}) si
3110 cancellano i valori precedentemente immagazzinati nella memoria condivisa con
3111 \func{memset}, e si esegue (\texttt{\small 45}) un nuovo calcolo degli stessi
3112 utilizzando la funzione \myfunc{dir\_scan}; infine (\texttt{\small 46}) si
3113 sblocca il mutex con \func{MutexUnlock}, e si attende (\texttt{\small 47}) per
3114 il periodo di tempo specificato a riga di comando con l'opzione \code{-p}
3115 usando una \func{sleep}.
3117 Si noti come per il calcolo dei valori da mantenere nella memoria condivisa si
3118 sia usata ancora una volta la funzione \myfunc{dir\_scan}, già utilizzata (e
3119 descritta in dettaglio) in sez.~\ref{sec:file_dir_read}, che ci permette di
3120 effettuare la scansione delle voci della directory, chiamando per ciascuna di
3121 esse la funzione \func{ComputeValues}, che esegue tutti i calcoli necessari.
3123 \begin{figure}[!htbp]
3124 \footnotesize \centering
3125 \begin{minipage}[c]{\codesamplewidth}
3126 \includecodesample{listati/ComputeValues.c}
3129 \caption{Codice delle funzioni ausiliarie usate da \file{DirMonitor.c}.}
3130 \label{fig:ipc_dirmonitor_sub}
3134 Il codice di quest'ultima è riportato in fig.~\ref{fig:ipc_dirmonitor_sub}.
3135 Come si vede la funzione (\texttt{\small 2-16}) è molto semplice e si limita a
3136 chiamare (\texttt{\small 5}) la funzione \func{stat} sul file indicato da
3137 ciascuna voce, per ottenerne i dati, che poi utilizza per incrementare i vari
3138 contatori nella memoria condivisa, cui accede grazie alla variabile globale
3141 Dato che la funzione è chiamata da \myfunc{dir\_scan}, si è all'interno del
3142 ciclo principale del programma, con un mutex acquisito, perciò non è
3143 necessario effettuare nessun controllo e si può accedere direttamente alla
3144 memoria condivisa usando \var{shmptr} per riempire i campi della struttura
3145 \struct{DirProp}; così prima (\texttt{\small 6-7}) si sommano le dimensioni
3146 dei file ed il loro numero, poi, utilizzando le macro di
3147 tab.~\ref{tab:file_type_macro}, si contano (\texttt{\small 8-14}) quanti ce
3148 ne sono per ciascun tipo.
3150 In fig.~\ref{fig:ipc_dirmonitor_sub} è riportato anche il codice
3151 (\texttt{\small 17-23}) del gestore dei segnali di terminazione, usato per
3152 chiudere il programma. Esso, oltre a provocare l'uscita del programma, si
3153 incarica anche di cancellare tutti gli oggetti di intercomunicazione non più
3154 necessari. Per questo anzitutto (\texttt{\small 19}) acquisisce il mutex con
3155 \func{MutexLock}, per evitare di operare mentre un client sta ancora leggendo
3156 i dati, dopo di che (\texttt{\small 20}) distacca e rimuove il segmento di
3157 memoria condivisa usando \func{ShmRemove}. Infine (\texttt{\small 21})
3158 rimuove il mutex con \func{MutexRemove} ed esce (\texttt{\small 22}).
3160 \begin{figure}[!htbp]
3161 \footnotesize \centering
3162 \begin{minipage}[c]{\codesamplewidth}
3163 \includecodesample{listati/ReadMonitor.c}
3166 \caption{Codice del programma client del monitor delle proprietà di una
3167 directory, \file{ReadMonitor.c}.}
3168 \label{fig:ipc_dirmonitor_client}
3171 Il codice del client usato per leggere le informazioni mantenute nella memoria
3172 condivisa è riportato in fig.~\ref{fig:ipc_dirmonitor_client}. Al solito si è
3173 omessa la sezione di gestione delle opzioni e la funzione che stampa a video
3174 le istruzioni; il codice completo è nei sorgenti allegati, nel file
3175 \file{ReadMonitor.c}.
3177 Una volta conclusa la gestione delle opzioni a riga di comando il programma
3178 rigenera (\texttt{\small 7}) con \func{ftok} la stessa chiave usata dal server
3179 per identificare il segmento di memoria condivisa ed il mutex, poi
3180 (\texttt{\small 8}) richiede con \func{ShmFind} l'indirizzo della memoria
3181 condivisa agganciando al contempo il segmento al processo, Infine
3182 (\texttt{\small 17-20}) con \func{MutexFind} si richiede l'identificatore del
3183 mutex. Completata l'inizializzazione ed ottenuti i riferimenti agli oggetti
3184 di intercomunicazione necessari viene eseguito il corpo principale del
3185 programma (\texttt{\small 21-33}); si comincia (\texttt{\small 22})
3186 acquisendo il mutex con \func{MutexLock}; qui avviene il blocco del processo
3187 se la memoria condivisa non è disponibile. Poi (\texttt{\small 23-31}) si
3188 stampano i vari valori mantenuti nella memoria condivisa attraverso l'uso di
3189 \var{shmptr}. Infine (\texttt{\small 41}) con \func{MutexUnlock} si rilascia
3190 il mutex, prima di uscire.
3192 Verifichiamo allora il funzionamento dei nostri programmi; al solito, usando
3193 le funzioni di libreria occorre definire opportunamente
3194 \code{LD\_LIBRARY\_PATH}; poi si potrà lanciare il server con:
3196 [piccardi@gont sources]$ \textbf{./dirmonitor ./}
3199 ed avendo usato \func{daemon} il comando ritornerà immediatamente. Una volta
3200 che il server è in esecuzione, possiamo passare ad invocare il client per
3201 verificarne i risultati, in tal caso otterremo:
3203 [piccardi@gont sources]$ \textbf{./readmon}
3204 Ci sono 68 file dati
3209 Ci sono 0 device a caratteri
3210 Ci sono 0 device a blocchi
3211 Totale 71 file, per 489831 byte
3214 ed un rapido calcolo (ad esempio con \code{ls -a | wc} per contare i file) ci
3215 permette di verificare che il totale dei file è giusto. Un controllo con
3216 \cmd{ipcs} ci permette inoltre di verificare la presenza di un segmento di
3217 memoria condivisa e di un semaforo:
3219 [piccardi@gont sources]$ \textbf{ipcs}
3220 ------ Shared Memory Segments --------
3221 key shmid owner perms bytes nattch status
3222 0xffffffff 54067205 piccardi 666 4096 1
3224 ------ Semaphore Arrays --------
3225 key semid owner perms nsems
3226 0xffffffff 229376 piccardi 666 1
3228 ------ Message Queues --------
3229 key msqid owner perms used-bytes messages
3233 Se a questo punto aggiungiamo un file, ad esempio con \code{touch prova},
3234 potremo verificare che, passati nel peggiore dei casi almeno 10 secondi (o
3235 l'eventuale altro intervallo impostato per la rilettura dei dati) avremo:
3237 [piccardi@gont sources]$ \textbf{./readmon}
3238 Ci sono 69 file dati
3243 Ci sono 0 device a caratteri
3244 Ci sono 0 device a blocchi
3245 Totale 72 file, per 489887 byte
3249 A questo punto possiamo far uscire il server inviandogli un segnale di
3250 \signal{SIGTERM} con il comando \code{killall dirmonitor}, a questo punto
3251 ripetendo la lettura, otterremo un errore:
3253 [piccardi@gont sources]$ \textbf{./readmon}
3254 Cannot find shared memory: No such file or directory
3257 e inoltre potremo anche verificare che anche gli oggetti di intercomunicazione
3258 visti in precedenza sono stati regolarmente cancellati:
3260 [piccardi@gont sources]$ \textbf{ipcs}
3261 ------ Shared Memory Segments --------
3262 key shmid owner perms bytes nattch status
3264 ------ Semaphore Arrays --------
3265 key semid owner perms nsems
3267 ------ Message Queues --------
3268 key msqid owner perms used-bytes messages
3273 %% Per capire meglio il funzionamento delle funzioni facciamo ancora una volta
3274 %% riferimento alle strutture con cui il kernel implementa i segmenti di memoria
3275 %% condivisa; uno schema semplificato della struttura è illustrato in
3276 %% fig.~\ref{fig:ipc_shm_struct}.
3278 %% \begin{figure}[!htb]
3280 %% \includegraphics[width=10cm]{img/shmstruct}
3281 %% \caption{Schema dell'implementazione dei segmenti di memoria condivisa in
3283 %% \label{fig:ipc_shm_struct}
3289 \section{Tecniche alternative}
3290 \label{sec:ipc_alternatives}
3292 Come abbiamo detto in sez.~\ref{sec:ipc_sysv_generic}, e ripreso nella
3293 descrizione dei singoli oggetti che ne fan parte, il \textit{SysV-IPC}
3294 presenta numerosi problemi; in \cite{APUE}\footnote{in particolare nel
3295 capitolo 14.} Stevens ne effettua una accurata analisi (alcuni dei concetti
3296 sono già stati accennati in precedenza) ed elenca alcune possibili tecniche
3297 alternative, che vogliamo riprendere in questa sezione.
3300 \subsection{Alternative alle code di messaggi}
3301 \label{sec:ipc_mq_alternative}
3303 Le code di messaggi sono probabilmente il meno usato degli oggetti del
3304 \textit{SysV-IPC}; esse infatti nacquero principalmente come meccanismo di
3305 comunicazione bidirezionale quando ancora le \textit{pipe} erano
3306 unidirezionali; con la disponibilità di \func{socketpair} (vedi
3307 sez.~\ref{sec:ipc_socketpair}) o utilizzando una coppia di \textit{pipe}, si
3308 può ottenere questo risultato senza incorrere nelle complicazioni introdotte
3309 dal \textit{SysV-IPC}.
3311 In realtà, grazie alla presenza del campo \var{mtype}, le code di messaggi
3312 hanno delle caratteristiche ulteriori, consentendo una classificazione dei
3313 messaggi ed un accesso non rigidamente sequenziale; due caratteristiche che
3314 sono impossibili da ottenere con le \textit{pipe} e i socket di
3315 \func{socketpair}. A queste esigenze però si può comunque ovviare in maniera
3316 diversa con un uso combinato della memoria condivisa e dei meccanismi di
3317 sincronizzazione, per cui alla fine l'uso delle code di messaggi classiche è
3318 relativamente poco diffuso.
3320 % TODO: trattare qui, se non si trova posto migliore, copy_from_process e
3321 % copy_to_process, introdotte con il kernel 3.2. Vedi
3322 % http://lwn.net/Articles/405346/ e
3323 % http://ozlabs.org/~cyeoh/cma/process_vm_readv.txt
3326 \subsection{I \textsl{file di lock}}
3327 \label{sec:ipc_file_lock}
3329 \index{file!di~lock|(}
3331 Come illustrato in sez.~\ref{sec:ipc_sysv_sem} i semafori del \textit{SysV-IPC}
3332 presentano una interfaccia inutilmente complessa e con alcuni difetti
3333 strutturali, per questo quando si ha una semplice esigenza di sincronizzazione
3334 per la quale basterebbe un semaforo binario (quello che abbiamo definito come
3335 \textit{mutex}), per indicare la disponibilità o meno di una risorsa, senza la
3336 necessità di un contatore come i semafori, si possono utilizzare metodi
3339 La prima possibilità, utilizzata fin dalle origini di Unix, è quella di usare
3340 dei \textsl{file di lock} (per i quali è stata anche riservata una opportuna
3341 directory, \file{/var/lock}, nella standardizzazione del \textit{Filesystem
3342 Hierarchy Standard}). Per questo si usa la caratteristica della funzione
3343 \func{open} (illustrata in sez.~\ref{sec:file_open_close}) che
3344 prevede\footnote{questo è quanto dettato dallo standard POSIX.1, ciò non
3345 toglie che in alcune implementazioni questa tecnica possa non funzionare; in
3346 particolare per Linux, nel caso di NFS, si è comunque soggetti alla
3347 possibilità di una \textit{race condition}.} che essa ritorni un errore
3348 quando usata con i flag di \const{O\_CREAT} e \const{O\_EXCL}. In tal modo la
3349 creazione di un \textsl{file di lock} può essere eseguita atomicamente, il
3350 processo che crea il file con successo si può considerare come titolare del
3351 lock (e della risorsa ad esso associata) mentre il rilascio si può eseguire
3352 con una chiamata ad \func{unlink}.
3354 Un esempio dell'uso di questa funzione è mostrato dalle funzioni
3355 \func{LockFile} ed \func{UnlockFile} riportate in fig.~\ref{fig:ipc_file_lock}
3356 (sono contenute in \file{LockFile.c}, un altro dei sorgenti allegati alla
3357 guida) che permettono rispettivamente di creare e rimuovere un \textsl{file di
3358 lock}. Come si può notare entrambe le funzioni sono elementari; la prima
3359 (\texttt{\small 4-10}) si limita ad aprire il file di lock (\texttt{\small
3360 9}) nella modalità descritta, mentre la seconda (\texttt{\small 11-17}) lo
3361 cancella con \func{unlink}.
3363 \begin{figure}[!htbp]
3364 \footnotesize \centering
3365 \begin{minipage}[c]{\codesamplewidth}
3366 \includecodesample{listati/LockFile.c}
3369 \caption{Il codice delle funzioni \func{LockFile} e \func{UnlockFile} che
3370 permettono di creare e rimuovere un \textsl{file di lock}.}
3371 \label{fig:ipc_file_lock}
3374 Uno dei limiti di questa tecnica è che, come abbiamo già accennato in
3375 sez.~\ref{sec:file_open_close}, questo comportamento di \func{open} può non
3376 funzionare (la funzione viene eseguita, ma non è garantita l'atomicità
3377 dell'operazione) se il filesystem su cui si va ad operare è su NFS; in tal
3378 caso si può adottare una tecnica alternativa che prevede l'uso della
3379 \func{link} per creare come \textsl{file di lock} un hard link ad un file
3380 esistente; se il link esiste già e la funzione fallisce, significa che la
3381 risorsa è bloccata e potrà essere sbloccata solo con un \func{unlink},
3382 altrimenti il link è creato ed il lock acquisito; il controllo e l'eventuale
3383 acquisizione sono atomici; la soluzione funziona anche su NFS, ma ha un altro
3384 difetto è che è quello di poterla usare solo se si opera all'interno di uno
3387 In generale comunque l'uso di un \textsl{file di lock} presenta parecchi
3388 problemi che non lo rendono una alternativa praticabile per la
3389 sincronizzazione: anzitutto in caso di terminazione imprevista del processo,
3390 si lascia allocata la risorsa (il \textsl{file di lock}) e questa deve essere
3391 sempre cancellata esplicitamente. Inoltre il controllo della disponibilità
3392 può essere eseguito solo con una tecnica di \textit{polling}, ed è quindi
3395 La tecnica dei file di lock ha comunque una sua utilità, e può essere usata
3396 con successo quando l'esigenza è solo quella di segnalare l'occupazione di una
3397 risorsa, senza necessità di attendere che questa si liberi; ad esempio la si
3398 usa spesso per evitare interferenze sull'uso delle porte seriali da parte di
3399 più programmi: qualora si trovi un file di lock il programma che cerca di
3400 accedere alla seriale si limita a segnalare che la risorsa non è disponibile.
3402 \index{file!di~lock|)}
3405 \subsection{La sincronizzazione con il \textit{file locking}}
3406 \label{sec:ipc_lock_file}
3408 Dato che i file di lock presentano gli inconvenienti illustrati in precedenza,
3409 la tecnica alternativa di sincronizzazione più comune è quella di fare ricorso
3410 al \textit{file locking} (trattato in sez.~\ref{sec:file_locking}) usando
3411 \func{fcntl} su un file creato per l'occasione per ottenere un write lock. In
3412 questo modo potremo usare il lock come un \textit{mutex}: per bloccare la
3413 risorsa basterà acquisire il lock, per sbloccarla basterà rilasciare il
3414 lock. Una richiesta fatta con un write lock metterà automaticamente il
3415 processo in stato di attesa, senza necessità di ricorrere al \textit{polling}
3416 per determinare la disponibilità della risorsa, e al rilascio della stessa da
3417 parte del processo che la occupava si otterrà il nuovo lock atomicamente.
3419 Questo approccio presenta il notevole vantaggio che alla terminazione di un
3420 processo tutti i lock acquisiti vengono rilasciati automaticamente (alla
3421 chiusura dei relativi file) e non ci si deve preoccupare di niente; inoltre
3422 non consuma risorse permanentemente allocate nel sistema. Lo svantaggio è che,
3423 dovendo fare ricorso a delle operazioni sul filesystem, esso è in genere
3424 leggermente più lento.
3426 \begin{figure}[!htbp]
3427 \footnotesize \centering
3428 \begin{minipage}[c]{\codesamplewidth}
3429 \includecodesample{listati/MutexLocking.c}
3432 \caption{Il codice delle funzioni che permettono per la gestione dei
3433 \textit{mutex} con il \textit{file locking}.}
3434 \label{fig:ipc_flock_mutex}
3437 Il codice delle varie funzioni usate per implementare un mutex utilizzando il
3438 \textit{file locking} è riportato in fig.~\ref{fig:ipc_flock_mutex}; si è
3439 mantenuta volutamente una struttura analoga alle precedenti funzioni che usano
3440 i semafori, anche se le due interfacce non possono essere completamente
3441 equivalenti, specie per quanto riguarda la rimozione del mutex.
3443 La prima funzione (\texttt{\small 1-5}) è \func{CreateMutex}, e serve a
3444 creare il mutex; la funzione è estremamente semplice, e si limita
3445 (\texttt{\small 4}) a creare, con una opportuna chiamata ad \func{open}, il
3446 file che sarà usato per il successivo \textit{file locking}, assicurandosi che
3447 non esista già (nel qual caso segnala un errore); poi restituisce il file
3448 descriptor che sarà usato dalle altre funzioni per acquisire e rilasciare il
3451 La seconda funzione (\texttt{\small 6-10}) è \func{FindMutex}, che, come la
3452 precedente, è stata definita per mantenere una analogia con la corrispondente
3453 funzione basata sui semafori. Anch'essa si limita (\texttt{\small 9}) ad
3454 aprire il file da usare per il \textit{file locking}, solo che in questo caso
3455 le opzioni di \func{open} sono tali che il file in questione deve esistere di
3458 La terza funzione (\texttt{\small 11-22}) è \func{LockMutex} e serve per
3459 acquisire il mutex. La funzione definisce (\texttt{\small 14}) e inizializza
3460 (\texttt{\small 16-19}) la struttura \var{lock} da usare per acquisire un
3461 write lock sul file, che poi (\texttt{\small 21}) viene richiesto con
3462 \func{fcntl}, restituendo il valore di ritorno di quest'ultima. Se il file è
3463 libero il lock viene acquisito e la funzione ritorna immediatamente;
3464 altrimenti \func{fcntl} si bloccherà (si noti che la si è chiamata con
3465 \const{F\_SETLKW}) fino al rilascio del lock.
3467 La quarta funzione (\texttt{\small 24-34}) è \func{UnlockMutex} e serve a
3468 rilasciare il mutex. La funzione è analoga alla precedente, solo che in questo
3469 caso si inizializza (\texttt{\small 28-31}) la struttura \var{lock} per il
3470 rilascio del lock, che viene effettuato (\texttt{\small 33}) con la opportuna
3471 chiamata a \func{fcntl}. Avendo usato il \textit{file locking} in semantica
3472 POSIX (si riveda quanto detto sez.~\ref{sec:file_posix_lock}) solo il processo
3473 che ha precedentemente eseguito il lock può sbloccare il mutex.
3475 La quinta funzione (\texttt{\small 36-39}) è \func{RemoveMutex} e serve a
3476 cancellare il mutex. Anche questa funzione è stata definita per mantenere una
3477 analogia con le funzioni basate sui semafori, e si limita a cancellare
3478 (\texttt{\small 38}) il file con una chiamata ad \func{unlink}. Si noti che in
3479 questo caso la funzione non ha effetto sui mutex già ottenuti con precedenti
3480 chiamate a \func{FindMutex} o \func{CreateMutex}, che continueranno ad essere
3481 disponibili fintanto che i relativi file descriptor restano aperti. Pertanto
3482 per rilasciare un mutex occorrerà prima chiamare \func{UnlockMutex} oppure
3483 chiudere il file usato per il lock.
3485 La sesta funzione (\texttt{\small 41-55}) è \func{ReadMutex} e serve a
3486 leggere lo stato del mutex. In questo caso si prepara (\texttt{\small 46-49})
3487 la solita struttura \var{lock} come l'acquisizione del lock, ma si effettua
3488 (\texttt{\small 51}) la chiamata a \func{fcntl} usando il comando
3489 \const{F\_GETLK} per ottenere lo stato del lock, e si restituisce
3490 (\texttt{\small 52}) il valore di ritorno in caso di errore, ed il valore del
3491 campo \var{l\_type} (che descrive lo stato del lock) altrimenti
3492 (\texttt{\small 54}). Per questo motivo la funzione restituirà -1 in caso di
3493 errore e uno dei due valori \const{F\_UNLCK} o \const{F\_WRLCK}\footnote{non
3494 si dovrebbe mai avere il terzo valore possibile, \const{F\_RDLCK}, dato che
3495 la nostra interfaccia usa solo i write lock. Però è sempre possibile che
3496 siano richiesti altri lock sul file al di fuori dell'interfaccia, nel qual
3497 caso si potranno avere, ovviamente, interferenze indesiderate.} in caso di
3498 successo, ad indicare che il mutex è, rispettivamente, libero o occupato.
3500 Basandosi sulla semantica dei file lock POSIX valgono tutte le considerazioni
3501 relative al comportamento di questi ultimi fatte in
3502 sez.~\ref{sec:file_posix_lock}; questo significa ad esempio che, al contrario
3503 di quanto avveniva con l'interfaccia basata sui semafori, chiamate multiple a
3504 \func{UnlockMutex} o \func{LockMutex} non si cumulano e non danno perciò
3505 nessun inconveniente.
3508 \subsection{Il \textit{memory mapping} anonimo}
3509 \label{sec:ipc_mmap_anonymous}
3511 \itindbeg{memory~mapping}
3513 Abbiamo già visto che quando i processi sono \textsl{correlati}, se cioè hanno
3514 almeno un progenitore comune, l'uso delle \textit{pipe} può costituire una
3515 valida alternativa alle code di messaggi; nella stessa situazione si può
3516 evitare l'uso di una memoria condivisa facendo ricorso al cosiddetto
3517 \textit{memory mapping} anonimo.
3519 In sez.~\ref{sec:file_memory_map} abbiamo visto come sia possibile mappare il
3520 contenuto di un file nella memoria di un processo, e che, quando viene usato
3521 il flag \const{MAP\_SHARED}, le modifiche effettuate al contenuto del file
3522 vengono viste da tutti i processi che lo hanno mappato. Utilizzare questa
3523 tecnica per creare una memoria condivisa fra processi diversi è estremamente
3524 inefficiente, in quanto occorre passare attraverso il disco.
3526 Però abbiamo visto anche che se si esegue la mappatura con il flag
3527 \const{MAP\_ANONYMOUS} la regione mappata non viene associata a nessun file,
3528 anche se quanto scritto rimane in memoria e può essere riletto; allora, dato
3529 che un processo figlio mantiene nel suo spazio degli indirizzi anche le
3530 regioni mappate, esso sarà anche in grado di accedere a quanto in esse è
3533 In questo modo diventa possibile creare una memoria condivisa fra processi
3534 diversi, purché questi abbiano almeno un progenitore comune che ha effettuato
3535 il \textit{memory mapping} anonimo.\footnote{nei sistemi derivati da SysV una
3536 funzionalità simile a questa viene implementata mappando il file speciale
3537 \file{/dev/zero}. In tal caso i valori scritti nella regione mappata non
3538 vengono ignorati (come accade qualora si scriva direttamente sul file), ma
3539 restano in memoria e possono essere riletti secondo le stesse modalità usate
3540 nel \textit{memory mapping} anonimo.} Vedremo come utilizzare questa tecnica
3541 più avanti, quando realizzeremo una nuova versione del monitor visto in
3542 sez.~\ref{sec:ipc_sysv_shm} che possa restituisca i risultati via rete.
3544 \itindend{memory~mapping}
3546 % TODO: fare esempio di mmap anonima
3548 % TODO: con il kernel 3.2 è stata introdotta un nuovo meccanismo di
3549 % intercomunicazione veloce chiamato Cross Memory Attach, da capire se e come
3550 % trattarlo qui, vedi http://lwn.net/Articles/405346/
3551 % https://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6.git;a=commitdiff;h=fcf634098c00dd9cd247447368495f0b79be12d1
3553 % TODO: con il kernel 3.17 è stata introdotta una fuunzionalità di
3554 % sigillatura dei file mappati in memoria e la system call memfd
3555 % (capire se va messo qui o altrove) vedi: http://lwn.net/Articles/593918/
3556 % col 5.1 aggiunta a memfd F_SEAL_FUTURE_WRITE, vedi
3557 % https://git.kernel.org/linus/ab3948f58ff8 e https://lwn.net/Articles/782511/
3560 \section{L'intercomunicazione fra processi di POSIX}
3561 \label{sec:ipc_posix}
3563 Per superare i numerosi problemi del \textit{SysV-IPC}, evidenziati per i suoi
3564 aspetti generali in coda a sez.~\ref{sec:ipc_sysv_generic} e per i singoli
3565 oggetti nei paragrafi successivi, lo standard POSIX.1b ha introdotto dei nuovi
3566 meccanismi di comunicazione, che vanno sotto il nome di POSIX IPC, definendo
3567 una interfaccia completamente nuova, che tratteremo in questa sezione.
3570 \subsection{Considerazioni generali}
3571 \label{sec:ipc_posix_generic}
3573 Oggi Linux supporta tutti gli oggetti definito nello standard POSIX per l'IPC,
3574 ma a lungo non è stato così; la memoria condivisa è presente a partire dal
3575 kernel 2.4.x, i semafori sono forniti dalla \acr{glibc} nella sezione che
3576 implementa i \textit{thread} POSIX di nuova generazione che richiedono il
3577 kernel 2.6, le code di messaggi sono supportate a partire dal kernel 2.6.6.
3579 La caratteristica fondamentale dell'interfaccia POSIX è l'abbandono dell'uso
3580 degli identificatori e delle chiavi visti nel \textit{SysV-IPC}, per passare ai
3581 \itindex{POSIX~IPC~names} \textit{POSIX IPC names}, che sono sostanzialmente
3582 equivalenti ai nomi dei file. Tutte le funzioni che creano un oggetto di IPC
3583 POSIX prendono come primo argomento una stringa che indica uno di questi nomi;
3584 lo standard è molto generico riguardo l'implementazione, ed i nomi stessi
3585 possono avere o meno una corrispondenza sul filesystem; tutto quello che è
3588 \item i nomi devono essere conformi alle regole che caratterizzano i
3589 \textit{pathname}, in particolare non essere più lunghi di \const{PATH\_MAX}
3590 byte e terminati da un carattere nullo.
3591 \item se il nome inizia per una \texttt{/} chiamate differenti allo stesso
3592 nome fanno riferimento allo stesso oggetto, altrimenti l'interpretazione del
3593 nome dipende dall'implementazione.
3594 \item l'interpretazione di ulteriori \texttt{/} presenti nel nome dipende
3595 dall'implementazione.
3598 Data la assoluta genericità delle specifiche, il comportamento delle funzioni
3599 è subordinato in maniera quasi completa alla relativa implementazione, tanto
3600 che Stevens in \cite{UNP2} cita questo caso come un esempio della maniera
3601 standard usata dallo standard POSIX per consentire implementazioni non
3604 Nel caso di Linux, sia per quanto riguarda la memoria condivisa ed i semafori,
3605 che per le code di messaggi, tutto viene creato usando come radici delle
3606 opportune directory (rispettivamente \file{/dev/shm} e \file{/dev/mqueue}, per
3607 i dettagli si faccia riferimento a sez.~\ref{sec:ipc_posix_shm},
3608 sez.~\ref{sec:ipc_posix_sem} e sez.~\ref{sec:ipc_posix_mq}). I nomi
3609 specificati nelle relative funzioni devono essere nella forma di un
3610 \textit{pathname} assoluto (devono cioè iniziare con ``\texttt{/}'') e
3611 corrisponderanno ad altrettanti file creati all'interno di queste directory;
3612 per questo motivo detti nomi non possono contenere altre ``\texttt{/}'' oltre
3615 Il vantaggio degli oggetti di IPC POSIX è comunque che essi vengono inseriti
3616 nell'albero dei file, e possono essere maneggiati con le usuali funzioni e
3617 comandi di accesso ai file, che funzionano come su dei file normali. Questo
3618 però è vero nel caso di Linux, che usa una implementazione che lo consente,
3619 non è detto che altrettanto valga per altri kernel. In particolare, come si
3620 può facilmente verificare con il comando \cmd{strace}, sia per la memoria
3621 condivisa che per le code di messaggi varie \textit{system call} utilizzate da
3622 Linux corrispondono in realtà a quelle ordinarie dei file, essendo detti
3623 oggetti realizzati come tali usando degli specifici filesystem.
3625 In particolare i permessi associati agli oggetti di IPC POSIX sono identici ai