3 %% Copyright (C) 2004-2014 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
12 \chapter{La gestione dei socket}
13 \label{cha:sock_generic_management}
15 Esamineremo in questo capitolo una serie di funzionalità aggiuntive relative
16 alla gestione dei socket, come la gestione della risoluzione di nomi e
17 indirizzi, le impostazioni delle varie proprietà ed opzioni relative ai
18 socket, e le funzioni di controllo che permettono di modificarne il
22 \section{La risoluzione dei nomi}
23 \label{sec:sock_name_resolution}
25 Negli esempi dei capitoli precedenti abbiamo sempre identificato le singole
26 macchine attraverso indirizzi numerici, sfruttando al più le funzioni di
27 conversione elementare illustrate in sez.~\ref{sec:sock_addr_func} che
28 permettono di passare da un indirizzo espresso in forma \textit{dotted
29 decimal} ad un numero. Vedremo in questa sezione le funzioni utilizzate per
30 poter utilizzare dei nomi simbolici al posto dei valori numerici, e viceversa
31 quelle che permettono di ottenere i nomi simbolici associati ad indirizzi,
32 porte o altre proprietà del sistema.
35 \subsection{La struttura del \textit{resolver}}
36 \label{sec:sock_resolver}
39 La risoluzione dei nomi è associata tradizionalmente al servizio del
40 \textit{Domain Name Service} che permette di identificare le macchine su
41 internet invece che per numero IP attraverso il relativo \textsl{nome a
42 dominio}.\footnote{non staremo ad entrare nei dettagli della definizione di
43 cosa è un nome a dominio, dandolo per noto, una introduzione alla
44 problematica si trova in \cite{AGL} (cap.~9) mentre per una trattazione
45 approfondita di tutte le problematiche relative al DNS si può fare
46 riferimento a \cite{DNSbind}.} In realtà per DNS si intendono spesso i
47 server che forniscono su internet questo servizio, mentre nel nostro caso
48 affronteremo la problematica dal lato client, di un qualunque programma che
49 necessita di compiere questa operazione.
52 \centering \includegraphics[width=11cm]{img/resolver}
53 \caption{Schema di funzionamento delle funzioni del \textit{resolver}.}
54 \label{fig:sock_resolver_schema}
57 Inoltre quella fra nomi a dominio e indirizzi IP non è l'unica corrispondenza
58 possibile fra nomi simbolici e valori numerici, come abbiamo visto anche in
59 sez.~\ref{sec:sys_user_group} per le corrispondenze fra nomi di utenti e
60 gruppi e relativi identificatori numerici; per quanto riguarda però tutti i
61 nomi associati a identificativi o servizi relativi alla rete il servizio di
62 risoluzione è gestito in maniera unificata da un insieme di funzioni fornite
63 con le librerie del C, detto appunto \textit{resolver}.
65 Lo schema di funzionamento del \textit{resolver} è illustrato in
66 fig.~\ref{fig:sock_resolver_schema}; in sostanza i programmi hanno a
67 disposizione un insieme di funzioni di libreria con cui chiamano il
68 \textit{resolver}, indicate con le frecce nere. Ricevuta la richiesta è
69 quest'ultimo che, sulla base della sua configurazione, esegue le operazioni
70 necessarie a fornire la risposta, che possono essere la lettura delle
71 informazioni mantenute nei relativi dei file statici presenti sulla macchina,
72 una interrogazione ad un DNS (che a sua volta, per il funzionamento del
73 protocollo, può interrogarne altri) o la richiesta ad altri server per i quali
74 sia fornito il supporto, come LDAP.\footnote{la sigla LDAP fa riferimento ad
75 un protocollo, il \textit{Lightweight Directory Access Protocol}, che
76 prevede un meccanismo per la gestione di \textsl{elenchi} di informazioni
77 via rete; il contenuto di un elenco può essere assolutamente generico, e
78 questo permette il mantenimento dei più vari tipi di informazioni su una
79 infrastruttura di questo tipo.}
81 La configurazione del \textit{resolver} attiene più alla amministrazione di
82 sistema che alla programmazione, ciò non di meno, prima di trattare le varie
83 funzioni di librerie utilizzate dai programmi, vale la pena fare una
84 panoramica generale. Originariamente la configurazione del \textit{resolver}
85 riguardava esclusivamente le questioni relative alla gestione dei nomi a
86 dominio, e prevedeva solo l'utilizzo del DNS e del file statico
87 \conffile{/etc/hosts}.
89 Per questo aspetto il file di configurazione principale del sistema è
90 \conffile{/etc/resolv.conf} che contiene in sostanza l'elenco degli indirizzi
91 IP dei server DNS da contattare; a questo si affianca il file
92 \conffile{/etc/host.conf} il cui scopo principale è indicare l'ordine in cui
93 eseguire la risoluzione dei nomi (se usare prima i valori di
94 \conffile{/etc/hosts} o quelli del DNS). Tralasciamo i dettagli relativi alle
95 varie direttive che possono essere usate in questi file, che si trovano nelle
96 rispettive pagine di manuale.
98 Con il tempo però è divenuto possibile fornire diversi sostituti per
99 l'utilizzo delle associazione statiche in \conffile{/etc/hosts}, inoltre oltre
100 alla risoluzione dei nomi a dominio ci sono anche altri nomi da risolvere,
101 come quelli che possono essere associati ad una rete (invece che ad una
102 singola macchina) o ai gruppi di macchine definiti dal servizio
103 NIS,\footnote{il \textit{Network Information Service} è un servizio, creato da
104 Sun, e poi diffuso su tutte le piattaforme unix-like, che permette di
105 raggruppare all'interno di una rete (in quelli che appunto vengono chiamati
106 \textit{netgroup}) varie macchine, centralizzando i servizi di definizione
107 di utenti e gruppi e di autenticazione, oggi è sempre più spesso sostituito
108 da LDAP.} o come quelli dei protocolli e dei servizi che sono mantenuti nei
109 file statici \conffile{/etc/protocols} e \conffile{/etc/services}. Molte di
110 queste informazioni non si trovano su un DNS, ma in una rete locale può essere
111 molto utile centralizzare il mantenimento di alcune di esse su opportuni
112 server. Inoltre l'uso di diversi supporti possibili per le stesse
113 informazioni (ad esempio il nome delle macchine può essere mantenuto sia
114 tramite \conffile{/etc/hosts}, che con il DNS, che con NIS) comporta il
115 problema dell'ordine in cui questi vengono interrogati.\footnote{con le
116 implementazioni classiche i vari supporti erano introdotti modificando
117 direttamente le funzioni di libreria, prevedendo un ordine di interrogazione
118 predefinito e non modificabile (a meno di una ricompilazione delle librerie
121 \itindbeg{Name~Service~Switch~(NSS)}
122 Per risolvere questa serie di problemi la risoluzione dei nomi a dominio
123 eseguirà dal \textit{resolver} è stata inclusa all'interno di un meccanismo
124 generico per la risoluzione di corrispondenze fra nomi ed informazioni ad essi
125 associate chiamato \textit{Name Service Switch}\footnote{il sistema è stato
126 introdotto la prima volta nelle librerie standard di Solaris, le \acr{glibc}
127 hanno ripreso lo stesso schema, si tenga presente che questo sistema non
128 esiste per altre librerie standard come le \acr{libc5} o le \acr{uclib}.}
129 cui abbiamo accennato anche in sez.~\ref{sec:sys_user_group} per quanto
130 riguarda la gestione dei dati associati a utenti e gruppi. Il \textit{Name
131 Service Switch} (cui spesso si fa riferimento con l'acronimo NSS) è un
132 sistema di librerie dinamiche che permette di definire in maniera generica sia
133 i supporti su cui mantenere i dati di corrispondenza fra nomi e valori
134 numerici, sia l'ordine in cui effettuare le ricerche sui vari supporti
135 disponibili. Il sistema prevede una serie di possibili classi di
136 corrispondenza, quelle attualmente definite sono riportate in
137 tab.~\ref{tab:sys_NSS_classes}.
142 \begin{tabular}[c]{|l|p{8cm}|}
144 \textbf{Classe} & \textbf{Tipo di corrispondenza}\\
147 \texttt{passwd} & Corrispondenze fra nome dell'utente e relative
148 proprietà (\ids{UID}, gruppo principale, ecc.).\\
149 \texttt{shadow} & Corrispondenze fra username e password dell'utente
150 (e altre informazioni relative alle password).\\
151 \texttt{group} & Corrispondenze fra nome del gruppo e proprietà dello
153 \texttt{aliases} & Alias per la posta elettronica.\\
154 \texttt{ethers} & Corrispondenze fra numero IP e MAC address della
156 \texttt{hosts} & Corrispondenze fra nome a dominio e numero IP.\\
157 \texttt{netgroup} & Corrispondenze fra gruppo di rete e macchine che lo
159 \texttt{networks} & Corrispondenze fra nome di una rete e suo indirizzo
161 \texttt{protocols}& Corrispondenze fra nome di un protocollo e relativo
162 numero identificativo.\\
163 \texttt{rpc} & Corrispondenze fra nome di un servizio RPC e relativo
164 numero identificativo.\\
165 \texttt{publickey}& Chiavi pubbliche e private usate per gli RFC sicuri,
166 utilizzate da NFS e NIS+. \\
167 \texttt{services} & Corrispondenze fra nome di un servizio e numero di
171 \caption{Le diverse classi di corrispondenze definite
172 all'interno del \textit{Name Service Switch}.}
173 \label{tab:sys_NSS_classes}
176 % TODO rivedere meglio la tabella
178 Il sistema del \textit{Name Service Switch} è controllato dal contenuto del
179 file \conffile{/etc/nsswitch.conf}; questo contiene una riga\footnote{seguendo
180 una convezione comune per i file di configurazione le righe vuote vengono
181 ignorate e tutto quello che segue un carattere ``\texttt{\#}'' viene
182 considerato un commento.} di configurazione per ciascuna di queste classi,
183 che viene inizia col nome di tab.~\ref{tab:sys_NSS_classes} seguito da un
184 carattere ``\texttt{:}'' e prosegue con la lista dei \textsl{servizi} su cui
185 le relative informazioni sono raggiungibili, scritti nell'ordine in cui si
186 vuole siano interrogati.
188 Ogni servizio è specificato a sua volta da un nome, come \texttt{file},
189 \texttt{dns}, \texttt{db}, ecc. che identifica la libreria dinamica che
190 realizza l'interfaccia con esso. Per ciascun servizio se \texttt{NAME} è il
191 nome utilizzato dentro \conffile{/etc/nsswitch.conf}, dovrà essere presente
192 (usualmente in \file{/lib}) una libreria \texttt{libnss\_NAME} che ne
193 implementa le funzioni.
195 In ogni caso, qualunque sia la modalità con cui ricevono i dati o il supporto
196 su cui vengono mantenuti, e che si usino o meno funzionalità aggiuntive
197 fornire dal sistema del \textit{Name Service Switch}, dal punto di vista di un
198 programma che deve effettuare la risoluzione di un nome a dominio, tutto
199 quello che conta sono le funzioni classiche che il \textit{resolver} mette a
200 disposizione,\footnote{è cura della implementazione fattane nelle \acr{glibc}
201 tenere conto della presenza del \textit{Name Service Switch}.} e sono queste
202 quelle che tratteremo nelle sezioni successive.
203 \itindend{Name~Service~Switch~(NSS)}
206 \subsection{Le funzioni di interrogazione del \textit{resolver}}
207 \label{sec:sock_resolver_functions}
209 Prima di trattare le funzioni usate normalmente nella risoluzione dei nomi a
210 dominio conviene trattare in maniera più dettagliata il meccanismo principale
211 da esse utilizzato e cioè quello del servizio DNS. Come accennato questo,
212 benché in teoria sia solo uno dei possibili supporti su cui mantenere le
213 informazioni, in pratica costituisce il meccanismo principale con cui vengono
214 risolti i nomi a dominio. Per questo motivo esistono una serie di funzioni di
215 libreria che servono specificamente ad eseguire delle interrogazioni verso un
216 server DNS, funzioni che poi vengono utilizzate per realizzare le funzioni
217 generiche di libreria usate anche dal sistema del \textit{resolver}.
219 Il sistema del DNS è in sostanza di un database distribuito organizzato in
220 maniera gerarchica, i dati vengono mantenuti in tanti server distinti ciascuno
221 dei quali si occupa della risoluzione del proprio \textsl{dominio}; i nomi a
222 dominio sono organizzati in una struttura ad albero analoga a quella
223 dell'albero dei file, con domini di primo livello (come i \texttt{.org}),
224 secondo livello (come \texttt{.truelite.it}), ecc. In questo caso le
225 separazioni sono fra i vari livelli sono definite dal carattere ``\texttt{.}''
226 ed i nomi devono essere risolti da destra verso sinistra.\footnote{per chi si
227 stia chiedendo quale sia la radice di questo albero, cioè l'equivalente di
228 ``\texttt{/}'', la risposta è il dominio speciale ``\texttt{.}'', che in
229 genere non viene mai scritto esplicitamente, ma che, come chiunque abbia
230 configurato un server DNS sa bene, esiste ed è gestito dai cosiddetti
231 \textit{root DNS} che risolvono i domini di primo livello.} Il meccanismo
232 funziona con il criterio della \textsl{delegazione}, un server responsabile
233 per un dominio di primo livello può delegare la risoluzione degli indirizzi
234 per un suo dominio di secondo livello ad un altro server, il quale a sua volta
235 potrà delegare la risoluzione di un eventuale sotto-dominio di terzo livello ad
236 un altro server ancora.
238 In realtà un server DNS è in grado di fare altro rispetto alla risoluzione di
239 un nome a dominio in un indirizzo IP; ciascuna voce nel database viene
240 chiamata \textit{resource record}, e può contenere diverse informazioni. In
241 genere i \textit{resource record} vengono classificati per la \textsl{classe
242 di indirizzi} cui i dati contenuti fanno riferimento, e per il \textsl{tipo}
243 di questi ultimi.\footnote{ritroveremo classi di indirizzi e tipi di record
244 più avanti in tab.~\ref{tab:DNS_address_class} e
245 tab.~\ref{tab:DNS_record_type}.} Oggigiorno i dati mantenuti nei server DNS
246 sono quasi esclusivamente relativi ad indirizzi internet, per cui in pratica
247 viene utilizzata soltanto una classe di indirizzi; invece le corrispondenze
248 fra un nome a dominio ed un indirizzo IP sono solo uno fra i vari tipi di
249 informazione che un server DNS fornisce normalmente.
251 L'esistenza di vari tipi di informazioni è un altro dei motivi per cui il
252 \textit{resolver} prevede, rispetto a quelle relative alla semplice
253 risoluzione dei nomi, un insieme di funzioni specifiche dedicate
254 all'interrogazione di un server DNS; la prima di queste funzioni è
255 \funcd{res\_init}, il cui prototipo è:
257 \headdecl{netinet/in.h} \headdecl{arpa/nameser.h} \headdecl{resolv.h}
258 \funcdecl{int res\_init(void)}
260 Inizializza il sistema del \textit{resolver}.
262 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
266 La funzione legge il contenuto dei file di configurazione (i già citati
267 \file{resolv.conf} e \file{host.conf}) per impostare il dominio di default,
268 gli indirizzi dei server DNS da contattare e l'ordine delle ricerche; se non
269 sono specificati server verrà utilizzato l'indirizzo locale, e se non è
270 definito un dominio di default sarà usato quello associato con l'indirizzo
271 locale (ma questo può essere sovrascritto con l'uso della variabile di
272 ambiente \envvar{LOCALDOMAIN}). In genere non è necessario eseguire questa
273 funzione direttamente in quanto viene automaticamente chiamata la prima volta
274 che si esegue una delle altre.
276 Le impostazioni e lo stato del \textit{resolver} vengono mantenuti in una
277 serie di variabili raggruppate nei campi di una apposita struttura \var{\_res}
278 usata da tutte queste funzioni. Essa viene definita in \headfile{resolv.h} ed
279 è utilizzata internamente alle funzioni essendo definita come variabile
280 globale; questo consente anche di accedervi direttamente all'interno di un
281 qualunque programma, una volta che la sia opportunamente dichiarata come:
282 \includecodesnip{listati/resolv_option.c}
284 Tutti i campi della struttura sono ad uso interno, e vengono usualmente
285 inizializzati da \func{res\_init} in base al contenuto dei file di
286 configurazione e ad una serie di valori di default. L'unico campo che può
287 essere utile modificare è \var{\_res.options}, una maschera binaria che
288 contiene una serie di bit di opzione che permettono di controllare il
289 comportamento del \textit{resolver}.
294 \begin{tabular}[c]{|l|p{8cm}|}
296 \textbf{Costante} & \textbf{Significato} \\
299 \const{RES\_INIT} & Viene attivato se è stata chiamata
301 \const{RES\_DEBUG} & Stampa dei messaggi di debug.\\
302 \const{RES\_AAONLY} & Accetta solo risposte autoritative.\\
303 \const{RES\_USEVC} & Usa connessioni TCP per contattare i server
304 invece che l'usuale UDP.\\
305 \const{RES\_PRIMARY} & Interroga soltanto server DNS primari.
307 \const{RES\_IGNTC} & Ignora gli errori di troncamento, non ritenta la
308 richiesta con una connessione TCP.\\
309 \const{RES\_RECURSE} & Imposta il bit che indica che si desidera
310 eseguire una interrogazione ricorsiva.\\
311 \const{RES\_DEFNAMES} & Se attivo \func{res\_search} aggiunge il nome
312 del dominio di default ai nomi singoli (che non
313 contengono cioè un ``\texttt{.}'').\\
314 \const{RES\_STAYOPEN} & Usato con \const{RES\_USEVC} per mantenere
315 aperte le connessioni TCP fra interrogazioni
317 \const{RES\_DNSRCH} & Se attivo \func{res\_search} esegue le ricerche
318 di nomi di macchine nel dominio corrente o nei
319 domini ad esso sovrastanti.\\
320 \const{RES\_INSECURE1} & Blocca i controlli di sicurezza di tipo 1.\\
321 \const{RES\_INSECURE2} & Blocca i controlli di sicurezza di tipo 2.\\
322 \const{RES\_NOALIASES} & Blocca l'uso della variabile di ambiente
323 \envvar{HOSTALIASES}.\\
324 \const{RES\_USE\_INET6} & Restituisce indirizzi IPv6 con
325 \func{gethostbyname}. \\
326 \const{RES\_ROTATE} & Ruota la lista dei server DNS dopo ogni
328 \const{RES\_NOCHECKNAME}& Non controlla i nomi per verificarne la
329 correttezza sintattica. \\
330 \const{RES\_KEEPTSIG} & Non elimina i record di tipo \texttt{TSIG}.\\
331 \const{RES\_BLAST} & Effettua un ``\textit{blast}'' inviando
332 simultaneamente le richieste a tutti i server;
333 non ancora implementata. \\
334 \const{RES\_DEFAULT} & Combinazione di \const{RES\_RECURSE},
335 \const{RES\_DEFNAMES} e \const{RES\_DNSRCH}.\\
338 \caption{Costanti utilizzabili come valori per \var{\_res.options}.}
339 \label{tab:resolver_option}
342 Per utilizzare questa funzionalità per modificare le impostazioni direttamente
343 da programma occorrerà impostare un opportuno valore per questo campo ed
344 invocare esplicitamente \func{res\_init}, dopo di che le altre funzioni
345 prenderanno le nuove impostazioni. Le costanti che definiscono i vari bit di
346 questo campo, ed il relativo significato sono illustrate in
347 tab.~\ref{tab:resolver_option}; trattandosi di una maschera binaria un valore
348 deve essere espresso con un opportuno OR aritmetico di dette costanti; ad
349 esempio il valore di default delle opzioni, espresso dalla costante
350 \const{RES\_DEFAULT}, è definito come:
351 \includecodesnip{listati/resolv_option_def.c}
353 Non tratteremo il significato degli altri campi non essendovi necessità di
354 modificarli direttamente; gran parte di essi sono infatti impostati dal
355 contenuto dei file di configurazione, mentre le funzionalità controllate da
356 alcuni di esse possono essere modificate con l'uso delle opportune variabili
357 di ambiente come abbiamo visto per \envvar{LOCALDOMAIN}. In particolare con
358 \envvar{RES\_RETRY} si soprassiede il valore del campo \var{retry} che
359 controlla quante volte viene ripetuto il tentativo di connettersi ad un server
360 DNS prima di dichiarare fallimento; il valore di default è 4, un valore nullo
361 significa bloccare l'uso del DNS. Infine con \envvar{RES\_TIMEOUT} si
362 soprassiede il valore del campo \var{retrans},\footnote{preimpostato al valore
363 della omonima costante \const{RES\_TIMEOUT} di \headfile{resolv.h}.} che è
364 il valore preso come base (in numero di secondi) per definire la scadenza di
365 una richiesta, ciascun tentativo di richiesta fallito viene ripetuto
366 raddoppiando il tempo di scadenza per il numero massimo di volte stabilito da
369 La funzione di interrogazione principale è \funcd{res\_query}, che serve ad
370 eseguire una richiesta ad un server DNS per un nome a dominio
371 \textsl{completamente specificato} (quello che si chiama
372 \itindex{Fully~Qualified~Domain~Name~(FQDN)} FQDN, \textit{Fully Qualified
373 Domain Name}); il suo prototipo è:
376 \headdecl{netinet/in.h}
377 \headdecl{arpa/nameser.h}
379 \funcdecl{int res\_query(const char *dname, int class, int type,
380 unsigned char *answer, int anslen)}
382 Esegue una interrogazione al DNS.
384 \bodydesc{La funzione restituisce un valore positivo pari alla lunghezza dei
385 dati scritti nel buffer \param{answer} in caso di successo e -1 in caso di
389 La funzione esegue una interrogazione ad un server DNS relativa al nome da
390 risolvere passato nella stringa indirizzata da \param{dname}, inoltre deve
391 essere specificata la classe di indirizzi in cui eseguire la ricerca con
392 \param{class}, ed il tipo di \textit{resource record} che si vuole ottenere
393 con \param{type}. Il risultato della ricerca verrà scritto nel buffer di
394 lunghezza \param{anslen} puntato da \param{answer} che si sarà opportunamente
395 allocato in precedenza.
398 Una seconda funzione di ricerca, analoga a \func{res\_query}, che prende gli
399 stessi argomenti, ma che esegue l'interrogazione con le funzionalità
400 addizionali previste dalle due opzioni \const{RES\_DEFNAMES} e
401 \const{RES\_DNSRCH}, è \funcd{res\_search}, il cui prototipo è:
403 \headdecl{netinet/in.h}
404 \headdecl{arpa/nameser.h}
406 \funcdecl{int res\_search(const char *dname, int class, int type,
407 unsigned char *answer, int anslen)}
409 Esegue una interrogazione al DNS.
411 \bodydesc{La funzione restituisce un valore positivo pari alla lunghezza dei
412 dati scritti nel buffer \param{answer} in caso di successo e -1 in caso di
416 In sostanza la funzione ripete una serie di chiamate a \func{res\_query}
417 aggiungendo al nome contenuto nella stringa \param{dname} il dominio di
418 default da cercare, fermandosi non appena trova un risultato. Il risultato di
419 entrambe le funzioni viene scritto nel formato opportuno (che sarà diverso a
420 seconda del tipo di record richiesto) nel buffer di ritorno; sarà compito del
421 programma (o di altre funzioni) estrarre i relativi dati, esistono una serie
422 di funzioni interne usate per la scansione di questi dati, per chi fosse
423 interessato una trattazione dettagliata è riportata nel quattordicesimo
424 capitolo di \cite{DNSbind}.
426 Le classi di indirizzi supportate da un server DNS sono tre, ma di queste in
427 pratica oggi viene utilizzata soltanto quella degli indirizzi internet; le
428 costanti che identificano dette classi, da usare come valore per l'argomento
429 \param{class} delle precedenti funzioni, sono riportate in
430 tab.~\ref{tab:DNS_address_class}.\footnote{esisteva in realtà anche una classe
431 \const{C\_CSNET} per la omonima rete, ma è stata dichiarata obsoleta.}
436 \begin{tabular}[c]{|l|p{8cm}|}
438 \textbf{Costante} & \textbf{Significato} \\
441 \const{C\_IN} & Indirizzi internet, in pratica i soli utilizzati oggi.\\
442 \const{C\_HS} & Indirizzi \textit{Hesiod}, utilizzati solo al MIT, oggi
443 completamente estinti. \\
444 \const{C\_CHAOS}& Indirizzi per la rete \textit{Chaosnet}, un'altra rete
445 sperimentale nata al MIT. \\
446 \const{C\_ANY} & Indica un indirizzo di classe qualunque.\\
449 \caption{Costanti identificative delle classi di indirizzi per l'argomento
450 \param{class} di \func{res\_query}.}
451 \label{tab:DNS_address_class}
454 Come accennato le tipologie di dati che sono mantenibili su un server DNS sono
455 diverse, ed a ciascuna di essa corrisponde un diverso tipo di \textit{resource
456 record}. L'elenco delle costanti\footnote{ripreso dai file di dichiarazione
457 \headfile{arpa/nameser.h} e \headfile{arpa/nameser\_compat.h}.} che
458 definiscono i valori che si possono usare per l'argomento \param{type} per
459 specificare il tipo di \textit{resource record} da richiedere è riportato in
460 tab.~\ref{tab:DNS_record_type}; le costanti (tolto il \texttt{T\_} iniziale)
461 hanno gli stessi nomi usati per identificare i record nei file di zona di
462 BIND,\footnote{BIND, acronimo di \textit{Berkley Internet Name Domain}, è una
463 implementazione di un server DNS, ed, essendo utilizzata nella stragrande
464 maggioranza dei casi, fa da riferimento; i dati relativi ad un certo dominio
465 (cioè i suoi \textit{resource record} vengono mantenuti in quelli che sono
466 usualmente chiamati \textsl{file di zona}, e in essi ciascun tipo di dominio
467 è identificato da un nome che è appunto identico a quello delle costanti di
468 tab.~\ref{tab:DNS_record_type} senza il \texttt{T\_} iniziale.} e che
469 normalmente sono anche usati come nomi per indicare i record.
474 \begin{tabular}[c]{|l|l|}
476 \textbf{Costante} & \textbf{Significato} \\
479 \const{T\_A} & Indirizzo di una stazione.\\
480 \const{T\_NS} & Server DNS autoritativo per il dominio richiesto.\\
481 \const{T\_MD} & Destinazione per la posta elettronica.\\
482 \const{T\_MF} & Redistributore per la posta elettronica.\\
483 \const{T\_CNAME} & Nome canonico.\\
484 \const{T\_SOA} & Inizio di una zona di autorità.\\
485 \const{T\_MB} & Nome a dominio di una casella di posta.\\
486 \const{T\_MG} & Nome di un membro di un gruppo di posta.\\
487 \const{T\_MR} & Nome di un cambiamento di nome per la posta.\\
488 \const{T\_NULL} & Record nullo.\\
489 \const{T\_WKS} & Servizio noto.\\
490 \const{T\_PTR} & Risoluzione inversa di un indirizzo numerico.\\
491 \const{T\_HINFO} & Informazione sulla stazione.\\
492 \const{T\_MINFO} & Informazione sulla casella di posta.\\
493 \const{T\_MX} & Server cui instradare la posta per il dominio.\\
494 \const{T\_TXT} & Stringhe di testo (libere).\\
495 \const{T\_RP} & Nome di un responsabile (\textit{responsible person}).\\
496 \const{T\_AFSDB} & Database per una cella AFS.\\
497 \const{T\_X25} & Indirizzo di chiamata per X.25.\\
498 \const{T\_ISDN} & Indirizzo di chiamata per ISDN.\\
499 \const{T\_RT} & Router.\\
500 \const{T\_NSAP} & Indirizzo NSAP.\\
501 \const{T\_NSAP\_PTR}& Risoluzione inversa per NSAP (deprecato).\\
502 \const{T\_SIG} & Firma digitale di sicurezza.\\
503 \const{T\_KEY} & Chiave per firma.\\
504 \const{T\_PX} & Corrispondenza per la posta X.400.\\
505 \const{T\_GPOS} & Posizione geografica.\\
506 \const{T\_AAAA} & Indirizzo IPv6.\\
507 \const{T\_LOC} & Informazione di collocazione.\\
508 \const{T\_NXT} & Dominio successivo.\\
509 \const{T\_EID} & Identificatore di punto conclusivo.\\
510 \const{T\_NIMLOC}& Posizionatore \textit{nimrod}.\\
511 \const{T\_SRV} & Servizio.\\
512 \const{T\_ATMA} & Indirizzo ATM.\\
513 \const{T\_NAPTR} & Puntatore ad una \textit{naming authority}.\\
514 \const{T\_TSIG} & Firma di transazione.\\
515 \const{T\_IXFR} & Trasferimento di zona incrementale.\\
516 \const{T\_AXFR} & Trasferimento di zona di autorità.\\
517 \const{T\_MAILB} & Trasferimento di record di caselle di posta.\\
518 \const{T\_MAILA} & Trasferimento di record di server di posta.\\
519 \const{T\_ANY} & Valore generico.\\
522 \caption{Costanti identificative del tipo di record per l'argomento
523 \param{type} di \func{res\_query}.}
524 \label{tab:DNS_record_type}
528 L'elenco di tab.~\ref{tab:DNS_record_type} è quello di \textsl{tutti} i
529 \textit{resource record} definiti, con una breve descrizione del relativo
530 significato. Di tutti questi però viene impiegato correntemente solo un
531 piccolo sottoinsieme, alcuni sono obsoleti ed altri fanno riferimento a dati
532 applicativi che non ci interessano non avendo nulla a che fare con la
533 risoluzione degli indirizzi IP, pertanto non entreremo nei dettagli del
534 significato di tutti i \textit{resource record}, ma solo di quelli usati dalle
535 funzioni del \textit{resolver}. Questi sono sostanzialmente i seguenti (per
536 indicarli si è usata la notazione dei file di zona di BIND):
537 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
538 \item[\texttt{A}] viene usato per indicare la corrispondenza fra un nome a
539 dominio ed un indirizzo IPv4; ad esempio la corrispondenza fra
540 \texttt{dodds.truelite.it} e l'indirizzo IP \texttt{62.48.34.25}.
541 \item[\texttt{AAAA}] viene usato per indicare la corrispondenza fra un nome a
542 dominio ed un indirizzo IPv6; è chiamato in questo modo dato che la
543 dimensione di un indirizzo IPv6 è quattro volte quella di un indirizzo IPv4.
544 \item[\texttt{PTR}] per fornire la corrispondenza inversa fra un indirizzo IP
545 ed un nome a dominio ad esso associato si utilizza questo tipo di record (il
546 cui nome sta per \textit{pointer}).
547 \item[\texttt{CNAME}] qualora si abbiamo più nomi che corrispondono allo
548 stesso indirizzo (come ad esempio \texttt{www.truelite.it} e
549 \texttt{sources.truelite.it}, che fanno entrambi riferimento alla stessa
550 macchina (nel caso \texttt{dodds.truelite.it}) si può usare questo tipo di
551 record per creare degli \textit{alias} in modo da associare un qualunque
552 altro nome al \textsl{nome canonico} della macchina (si chiama così quello
553 associato al record \texttt{A}).
556 Come accennato in caso di successo le due funzioni di richiesta restituiscono
557 il risultato della interrogazione al server, in caso di insuccesso l'errore
558 invece viene segnalato da un valore di ritorno pari a -1, ma in questo caso,
559 non può essere utilizzata la variabile \var{errno} per riportare un codice di
560 errore, in quanto questo viene impostato per ciascuna delle chiamate al
561 sistema utilizzate dalle funzioni del \textit{resolver}, non avrà alcun
562 significato nell'indicare quale parte del procedimento di risoluzione è
565 Per questo motivo è stata definita una variabile di errore separata,
566 \var{h\_errno}, che viene utilizzata dalle funzioni del \textit{resolver} per
567 indicare quale problema ha causato il fallimento della risoluzione del nome.
568 Ad essa si può accedere una volta che la si dichiara con:
569 \includecodesnip{listati/herrno.c}
570 ed i valori che può assumere, con il relativo significato, sono riportati in
571 tab.~\ref{tab:h_errno_values}.
576 \begin{tabular}[c]{|l|p{11cm}|}
578 \textbf{Costante} & \textbf{Significato} \\
581 \const{HOST\_NOT\_FOUND} & L'indirizzo richiesto non è valido e la
582 macchina indicata è sconosciuta.\\
583 \const{NO\_ADDRESS} & Il nome a dominio richiesto è valido, ma non ha
584 un indirizzo associato ad esso
585 (alternativamente può essere indicato come
587 \const{NO\_RECOVERY} & Si è avuto un errore non recuperabile
588 nell'interrogazione di un server DNS.\\
589 \const{TRY\_AGAIN} & Si è avuto un errore temporaneo
590 nell'interrogazione di un server DNS, si può
591 ritentare l'interrogazione in un secondo
595 \caption{Valori possibili della variabile \var{h\_errno}.}
596 \label{tab:h_errno_values}
599 Insieme alla nuova variabile vengono definite anche due nuove funzioni per
600 stampare l'errore a video, analoghe a quelle di sez.~\ref{sec:sys_strerror}
601 per \var{errno}, ma che usano il valore di \var{h\_errno}; la prima è
602 \funcd{herror} ed il suo prototipo è:
605 \funcdecl{void herror(const char *string)}
607 Stampa un errore di risoluzione.
610 La funzione è l'analoga di \func{perror} e stampa sullo standard error un
611 messaggio di errore corrispondente al valore corrente di \var{h\_errno}, a cui
612 viene anteposta la stringa \param{string} passata come argomento. La seconda
613 funzione è \funcd{hstrerror} ed il suo prototipo è:
616 \funcdecl{const char *hstrerror(int err)}
618 Restituisce una stringa corrispondente ad un errore di risoluzione.
620 \noindent che, come l'analoga \func{strerror}, restituisce una stringa con un
621 messaggio di errore già formattato, corrispondente al codice passato come
622 argomento (che si presume sia dato da \var{h\_errno}).
627 \subsection{La risoluzione dei nomi a dominio}
628 \label{sec:sock_name_services}
630 La principale funzionalità del \itindex{resolver} \textit{resolver} resta
631 quella di risolvere i nomi a dominio in indirizzi IP, per cui non ci
632 dedicheremo oltre alle funzioni di richiesta generica ed esamineremo invece le
633 funzioni a questo dedicate. La prima funzione è \funcd{gethostbyname} il cui
634 scopo è ottenere l'indirizzo di una stazione noto il suo nome a dominio, il
636 \begin{prototype}{netdb.h}
637 {struct hostent *gethostbyname(const char *name)}
639 Determina l'indirizzo associato al nome a dominio \param{name}.
641 \bodydesc{La funzione restituisce in caso di successo il puntatore ad una
642 struttura di tipo \struct{hostent} contenente i dati associati al nome a
643 dominio, o un puntatore nullo in caso di errore.}
646 La funzione prende come argomento una stringa \param{name} contenente il nome
647 a dominio che si vuole risolvere, in caso di successo i dati ad esso relativi
648 vengono memorizzati in una opportuna struttura \struct{hostent} la cui
649 definizione è riportata in fig.~\ref{fig:sock_hostent_struct}.
652 \footnotesize \centering
653 \begin{minipage}[c]{\textwidth}
654 \includestruct{listati/hostent.h}
656 \caption{La struttura \structd{hostent} per la risoluzione dei nomi a
657 dominio e degli indirizzi IP.}
658 \label{fig:sock_hostent_struct}
661 Quando un programma chiama \func{gethostbyname} e questa usa il DNS per
662 effettuare la risoluzione del nome, è con i valori contenuti nei relativi
663 record che vengono riempite le varie parti della struttura \struct{hostent}.
664 Il primo campo della struttura, \var{h\_name} contiene sempre il \textsl{nome
665 canonico}, che nel caso del DNS è appunto il nome associato ad un record
666 \texttt{A}. Il secondo campo della struttura, \var{h\_aliases}, invece è un
667 puntatore ad vettore di puntatori, terminato da un puntatore nullo. Ciascun
668 puntatore del vettore punta ad una stringa contenente uno degli altri
669 possibili nomi associati allo stesso \textsl{nome canonico} (quelli che nel
670 DNS vengono inseriti come record di tipo \texttt{CNAME}).
672 Il terzo campo della struttura, \var{h\_addrtype}, indica il tipo di indirizzo
673 che è stato restituito, e può assumere soltanto i valori \const{AF\_INET} o
674 \const{AF\_INET6}, mentre il quarto campo, \var{h\_length}, indica la
675 lunghezza dell'indirizzo stesso in byte.
677 Infine il campo \var{h\_addr\_list} è il puntatore ad un vettore di puntatori
678 ai singoli indirizzi; il vettore è terminato da un puntatore nullo. Inoltre,
679 come illustrato in fig.~\ref{fig:sock_hostent_struct}, viene definito il campo
680 \var{h\_addr} come sinonimo di \code{h\_addr\_list[0]}, cioè un riferimento
681 diretto al primo indirizzo della lista.
683 Oltre ai normali nomi a dominio la funzione accetta come argomento
684 \param{name} anche indirizzi numerici, in formato dotted decimal per IPv4 o
685 con la notazione illustrata in sez.~\ref{sec:IP_ipv6_notation} per IPv6. In
686 tal caso \func{gethostbyname} non eseguirà nessuna interrogazione remota, ma
687 si limiterà a copiare la stringa nel campo \var{h\_name} ed a creare la
688 corrispondente struttura \var{in\_addr} da indirizzare con
689 \code{h\_addr\_list[0]}.
691 Con l'uso di \func{gethostbyname} normalmente si ottengono solo gli indirizzi
692 IPv4, se si vogliono ottenere degli indirizzi IPv6 occorrerà prima impostare
693 l'opzione \const{RES\_USE\_INET6} nel campo \texttt{\_res.options} e poi
694 chiamare \func{res\_init} (vedi sez.~\ref{sec:sock_resolver_functions}) per
695 modificare le opzioni del \itindex{resolver} \textit{resolver}; dato che
696 questo non è molto comodo è stata definita\footnote{questa è una estensione
697 fornita dalle \acr{glibc}, disponibile anche in altri sistemi unix-like.}
698 un'altra funzione, \funcd{gethostbyname2}, il cui prototipo è:
701 \headdecl{sys/socket.h}
702 \funcdecl{struct hostent *gethostbyname2(const char *name, int af)}
704 Determina l'indirizzo di tipo \param{af} associato al nome a dominio
707 \bodydesc{La funzione restituisce in caso di successo il puntatore ad una
708 struttura di tipo \struct{hostent} contenente i dati associati al nome a
709 dominio, o un puntatore nullo in caso di errore.}
712 In questo caso la funzione prende un secondo argomento \param{af} che indica
713 (i soli valori consentiti sono \const{AF\_INET} o \const{AF\_INET6}, per
714 questo è necessario l'uso di \headfile{sys/socket.h}) la famiglia di indirizzi
715 che dovrà essere utilizzata nei risultati restituiti dalla funzione. Per tutto
716 il resto la funzione è identica a \func{gethostbyname}, ed identici sono i
719 \begin{figure}[!htbp]
720 \footnotesize \centering
721 \begin{minipage}[c]{\codesamplewidth}
722 \includecodesample{listati/mygethost.c}
725 \caption{Esempio di codice per la risoluzione di un indirizzo.}
726 \label{fig:mygethost_example}
729 Vediamo allora un primo esempio dell'uso delle funzioni di risoluzione, in
730 fig.~\ref{fig:mygethost_example} è riportato un estratto del codice di un
731 programma che esegue una semplice interrogazione al
732 \itindex{resolver} \textit{resolver} usando \func{gethostbyname} e poi ne
733 stampa a video i risultati. Al solito il sorgente completo, che comprende il
734 trattamento delle opzioni ed una funzione per stampare un messaggio di aiuto,
735 è nel file \texttt{mygethost.c} dei sorgenti allegati alla guida.
737 Il programma richiede un solo argomento che specifichi il nome da cercare,
738 senza il quale (\texttt{\small 15--18}) esce con un errore. Dopo di che
739 (\texttt{\small 20}) si limita a chiamare \func{gethostbyname}, ricevendo il
740 risultato nel puntatore \var{data}. Questo (\texttt{\small 21--24}) viene
741 controllato per rilevare eventuali errori, nel qual caso il programma esce
742 dopo aver stampato un messaggio con \func{herror}.
744 Se invece la risoluzione è andata a buon fine si inizia (\texttt{\small 25})
745 con lo stampare il nome canonico, dopo di che (\texttt{\small 26--30}) si
746 stampano eventuali altri nomi. Per questo prima (\texttt{\small 26}) si prende
747 il puntatore alla cima della lista che contiene i nomi e poi (\texttt{\small
748 27--30}) si esegue un ciclo che sarà ripetuto fin tanto che nella lista si
749 troveranno dei puntatori validi\footnote{si ricordi che la lista viene
750 terminata da un puntatore nullo.} per le stringhe dei nomi; prima
751 (\texttt{\small 28}) si stamperà la stringa e poi (\texttt{\small 29}) si
752 provvederà ad incrementare il puntatore per passare al successivo elemento
755 Una volta stampati i nomi si passerà a stampare gli indirizzi, il primo passo
756 (\texttt{\small 31--38}) è allora quello di riconoscere il tipo di indirizzo
757 sulla base del valore del campo \var{h\_addrtype}, stampandolo a video. Si è
758 anche previsto di stampare un errore nel caso (che non dovrebbe mai accadere)
759 di un indirizzo non valido.
761 Infine (\texttt{\small 39--44}) si stamperanno i valori degli indirizzi, di
762 nuovo (\texttt{\small 39}) si inizializzerà un puntatore alla cima della lista
763 e si eseguirà un ciclo fintanto che questo punterà ad indirizzi validi in
764 maniera analoga a quanto fatto in precedenza per i nomi a dominio. Si noti
765 come, essendo il campo \var{h\_addr\_list} un puntatore ad strutture di
766 indirizzi generiche, questo sia ancora di tipo \texttt{char **} e si possa
767 riutilizzare lo stesso puntatore usato per i nomi.
769 Per ciascun indirizzo valido si provvederà (\texttt{\small 41}) ad una
770 conversione con la funzione \func{inet\_ntop} (vedi
771 sez.~\ref{sec:sock_addr_func}) passandole gli opportuni argomenti, questa
772 restituirà la stringa da stampare (\texttt{\small 42}) con il valore
773 dell'indirizzo in \var{buffer}, che si è avuto la cura di dichiarare
774 inizialmente (\texttt{\small 10}) con dimensioni adeguate; dato che la
775 funzione è in grado di tenere conto automaticamente del tipo di indirizzo non
776 ci sono precauzioni particolari da prendere.\footnote{volendo essere pignoli
777 si dovrebbe controllarne lo stato di uscita, lo si è tralasciato per non
778 appesantire il codice, dato che in caso di indirizzi non validi si sarebbe
779 avuto un errore con \func{gethostbyname}, ma si ricordi che la sicurezza non
782 Le funzioni illustrate finora hanno un difetto: utilizzando una area di
783 memoria interna per allocare i contenuti della struttura \struct{hostent} non
784 possono essere\index{funzioni!rientranti} rientranti. Questo comporta anche
785 che in due successive chiamate i dati potranno essere sovrascritti. Si tenga
786 presente poi che copiare il contenuto della sola struttura non è sufficiente
787 per salvare tutti i dati, in quanto questa contiene puntatori ad altri dati,
788 che pure possono essere sovrascritti; per questo motivo, se si vuole salvare
789 il risultato di una chiamata, occorrerà eseguire quella che si chiama una
790 \itindex{deep~copy} \textit{deep copy}.\footnote{si chiama così quella tecnica
791 per cui, quando si deve copiare il contenuto di una struttura complessa (con
792 puntatori che puntano ad altri dati, che a loro volta possono essere
793 puntatori ad altri dati) si deve copiare non solo il contenuto della
794 struttura, ma eseguire una scansione per risolvere anche tutti i puntatori
795 contenuti in essa (e così via se vi sono altre sotto-strutture con altri
796 puntatori) e copiare anche i dati da questi referenziati.}
798 Per ovviare a questi problemi nelle \acr{glibc} sono definite anche delle
799 versioni \index{funzioni!rientranti} rientranti delle precedenti funzioni, al
800 solito queste sono caratterizzate dall'avere un suffisso \texttt{\_r},
801 pertanto avremo le due funzioni \funcd{gethostbyname\_r} e
802 \funcd{gethostbyname2\_r} i cui prototipi sono:
805 \headdecl{sys/socket.h}
806 \funcdecl{int gethostbyname\_r(const char *name, struct hostent *ret,
807 char *buf, size\_t buflen, struct hostent **result, int *h\_errnop)}
808 \funcdecl{int gethostbyname2\_r(const char *name, int af,
809 struct hostent *ret, char *buf, size\_t buflen,
810 struct hostent **result, int *h\_errnop)}
812 Versioni rientranti delle funzioni \func{gethostbyname} e
813 \func{gethostbyname2}.
815 \bodydesc{Le funzioni restituiscono 0 in caso di successo ed un valore
816 negativo in caso di errore.}
819 Gli argomenti \param{name} (e \param{af} per \func{gethostbyname2\_r}) hanno
820 lo stesso significato visto in precedenza. Tutti gli altri argomenti hanno lo
821 stesso significato per entrambe le funzioni. Per evitare l'uso di variabili
822 globali si dovrà allocare preventivamente una struttura \struct{hostent} in
823 cui ricevere il risultato, passandone l'indirizzo alla funzione nell'argomento
824 \param{ret}. Inoltre, dato che \struct{hostent} contiene dei puntatori, dovrà
825 essere allocato anche un buffer in cui le funzioni possano scrivere tutti i
826 dati del risultato dell'interrogazione da questi puntati; l'indirizzo e la
827 lunghezza di questo buffer devono essere indicati con gli argomenti
828 \param{buf} e \param{buflen}.
830 Gli ultimi due argomenti vengono utilizzati per avere indietro i risultati
831 come \itindex{value~result~argument} \textit{value result argument}, si deve
832 specificare l'indirizzo della variabile su cui la funzione dovrà salvare il
833 codice di errore con \param{h\_errnop} e quello su cui dovrà salvare il
834 puntatore che si userà per accedere i dati con \param{result}.
836 In caso di successo entrambe le funzioni restituiscono un valore nullo,
837 altrimenti restituiscono un codice di errore negativo e all'indirizzo puntato
838 da \param{result} sarà salvato un puntatore nullo, mentre a quello puntato da
839 \param{h\_errnop} sarà salvato il valore del codice di errore, dato che per
840 essere \index{funzioni!rientranti} rientrante la funzione non può la variabile
841 globale \var{h\_errno}. In questo caso il codice di errore, oltre ai valori di
842 tab.~\ref{tab:h_errno_values}, può avere anche quello di \errcode{ERANGE}
843 qualora il buffer allocato su \param{buf} non sia sufficiente a contenere i
844 dati, in tal caso si dovrà semplicemente ripetere l'esecuzione della funzione
845 con un buffer di dimensione maggiore.
847 Una delle caratteristiche delle interrogazioni al servizio DNS è che queste
848 sono normalmente eseguite con il protocollo UDP, ci sono casi in cui si
849 preferisce che vengano usate connessioni permanenti con il protocollo TCP. Per
850 ottenere questo\footnote{si potrebbero impostare direttamente le opzioni di
851 \var{\_\_res.options}, ma queste funzioni permettono di semplificare la
852 procedura.} sono previste delle funzioni apposite; la prima è
853 \funcd{sethostent}, il cui prototipo è:
854 \begin{prototype}{netdb.h}
855 {void sethostent(int stayopen)}
857 Richiede l'uso di connessioni per le interrogazioni ad un server DNS.
859 \bodydesc{La funzione non restituisce nulla.}
862 La funzione permette di richiedere l'uso di connessioni TCP per la richiesta
863 dei dati, e che queste restino aperte per successive richieste. Il valore
864 dell'argomento \param{stayopen} indica se attivare questa funzionalità, un
865 valore pari a 1 (o diverso da zero), che indica una condizione vera in C,
866 attiva la funzionalità. Come si attiva l'uso delle connessioni TCP lo si può
867 disattivare con la funzione \funcd{endhostent}; il suo prototipo è:
868 \begin{prototype}{netdb.h}
869 {void endhostent(void)}
871 Disattiva l'uso di connessioni per le interrogazioni ad un server DNS.
873 \bodydesc{La funzione non restituisce nulla.}
875 \noindent e come si può vedere la funzione è estremamente semplice, non
876 richiedendo nessun argomento.
878 % TODO manca gethostent (e gethostent_r) e altro ? (vedi man page)
880 Infine si può richiedere la risoluzione inversa di un indirizzo IP od IPv6,
881 per ottenerne il nome a dominio ad esso associato, per fare questo si può
882 usare la funzione \funcd{gethostbyaddr}, il cui prototipo è:
885 \headdecl{sys/socket.h}
886 \funcdecl{struct hostent *gethostbyaddr(const char *addr, int len, int type)}
888 Richiede la risoluzione inversa di un indirizzo IP.
890 \bodydesc{La funzione restituisce l'indirizzo ad una struttura
891 \struct{hostent} in caso di successo ed \val{NULL} in caso di errore.}
894 In questo caso l'argomento \param{addr} dovrà essere il puntatore ad una
895 appropriata struttura contenente il valore dell'indirizzo IP (o IPv6) che si
896 vuole risolvere. L'uso del tipo \texttt{char *} per questo argomento è
897 storico, il dato dovrà essere fornito in una struttura
898 \struct{in\_addr}\footnote{si ricordi che, come illustrato in
899 fig.~\ref{fig:sock_sa_ipv4_struct}, questo in realtà corrisponde ad un
900 numero intero, da esprimere comunque in \textit{network order}, non
901 altrettanto avviene però per \struct{in6\_addr}, pertanto è sempre opportuno
902 inizializzare questi indirizzi con \func{inet\_pton} (vedi
903 sez.~\ref{sec:sock_conv_func_gen}).} per un indirizzo IPv4 ed una struttura
904 \struct{in6\_addr} per un indirizzo IPv6, mentre in \param{len} se ne dovrà
905 specificare la dimensione (rispettivamente 4 o 16), infine l'argomento
906 \param{type} indica il tipo di indirizzo e dovrà essere o \const{AF\_INET} o
909 La funzione restituisce, in caso di successo, un puntatore ad una struttura
910 \struct{hostent}, solo che in questo caso la ricerca viene eseguita
911 richiedendo al DNS un record di tipo \texttt{PTR} corrispondente all'indirizzo
912 specificato. In caso di errore al solito viene usata la variabile
913 \var{h\_errno} per restituire un opportuno codice. In questo caso l'unico
914 campo del risultato che interessa è \var{h\_name} che conterrà il nome a
915 dominio, la funziona comunque inizializza anche il primo campo della lista
916 \var{h\_addr\_list} col valore dell'indirizzo passato come argomento.
918 Per risolvere il problema dell'uso da parte delle due funzioni
919 \func{gethostbyname} e \func{gethostbyaddr} di memoria statica che può essere
920 sovrascritta fra due chiamate successive, e per avere sempre la possibilità di
921 indicare esplicitamente il tipo di indirizzi voluto (cosa che non è possibile
922 con \func{gethostbyname}), vennero introdotte due nuove funzioni di
923 risoluzione,\footnote{le funzioni sono presenti nelle \acr{glibc} versione
924 2.1.96, ma essendo considerate deprecate (vedi
925 sez.~\ref{sec:sock_advanced_name_services}) sono state rimosse nelle
926 versioni successive.} \funcd{getipnodebyname} e \funcd{getipnodebyaddr}, i
930 \headdecl{sys/types.h}
931 \headdecl{sys/socket.h}
933 \funcdecl{struct hostent *getipnodebyname(const char *name, int af, int
934 flags, int *error\_num)}
936 \funcdecl{struct hostent *getipnodebyaddr(const void *addr, size\_t len,
937 int af, int *error\_num)}
939 Richiedono rispettivamente la risoluzione e la risoluzione inversa di un
942 \bodydesc{Entrambe le funzioni restituiscono l'indirizzo ad una struttura
943 \struct{hostent} in caso di successo ed \val{NULL} in caso di errore.}
946 Entrambe le funzioni supportano esplicitamente la scelta di una famiglia di
947 indirizzi con l'argomento \param{af} (che può assumere i valori
948 \const{AF\_INET} o \const{AF\_INET6}), e restituiscono un codice di errore
949 (con valori identici a quelli precedentemente illustrati in
950 tab.~\ref{tab:h_errno_values}) nella variabile puntata da \param{error\_num}.
951 La funzione \func{getipnodebyaddr} richiede poi che si specifichi l'indirizzo
952 come per \func{gethostbyaddr} passando anche la lunghezza dello stesso
953 nell'argomento \param{len}.
955 La funzione \func{getipnodebyname} prende come primo argomento il nome da
956 risolvere, inoltre prevede un apposito argomento \param{flags}, da usare come
957 maschera binaria, che permette di specificarne il comportamento nella
958 risoluzione dei diversi tipi di indirizzi (IPv4 e IPv6); ciascun bit
959 dell'argomento esprime una diversa opzione, e queste possono essere specificate
960 con un OR aritmetico delle costanti riportate in
961 tab.~\ref{tab:sock_getipnodebyname_flags}.
966 \begin{tabular}[c]{|l|p{8cm}|}
968 \textbf{Costante} & \textbf{Significato} \\
971 \const{AI\_V4MAPPED} & Usato con \const{AF\_INET6} per richiedere una
972 ricerca su un indirizzo IPv4 invece che IPv6; gli
973 eventuali risultati saranno rimappati su indirizzi
975 \const{AI\_ALL} & Usato con \const{AI\_V4MAPPED}; richiede sia
976 indirizzi IPv4 che IPv6, e gli indirizzi IPv4
977 saranno rimappati in IPv6.\\
978 \const{AI\_ADDRCONFIG}& Richiede che una richiesta IPv4 o IPv6 venga
979 eseguita solo se almeno una interfaccia del
980 sistema è associata ad un indirizzo di tale tipo.\\
981 \const{AI\_DEFAULT} & Il valore di default, è equivalente alla
982 combinazione di \const{AI\_ADDRCONFIG} e di
983 \const{AI\_V4MAPPED}.\\
986 \caption{Valori possibili per i bit dell'argomento \param{flags} della
987 funzione \func{getipnodebyname}.}
988 \label{tab:sock_getipnodebyname_flags}
991 Entrambe le funzioni restituiscono un puntatore ad una struttura \var{hostent}
992 che contiene i risultati della ricerca, che viene allocata dinamicamente
993 insieme a tutto lo spazio necessario a contenere i dati in essa referenziati;
994 per questo motivo queste funzioni non soffrono dei problemi dovuti all'uso di
995 una sezione statica di memoria presenti con le precedenti \func{gethostbyname}
996 e \func{gethostbyaddr}. L'uso di una allocazione dinamica però comporta anche
997 la necessità di disallocare esplicitamente la memoria occupata dai risultati
998 una volta che questi non siano più necessari; a tale scopo viene fornita la
999 funzione \funcd{freehostent}, il cui prototipo è:
1002 \headdecl{sys/types.h}
1003 \headdecl{sys/socket.h}
1005 \funcdecl{void freehostent(struct hostent *ip)}
1007 Disalloca una struttura \var{hostent}.
1009 \bodydesc{La funzione non ritorna nulla.}
1012 La funzione permette di disallocare una struttura \var{hostent}
1013 precedentemente allocata in una chiamata di \func{getipnodebyname} o
1014 \func{getipnodebyaddr}, e prende come argomento l'indirizzo restituito da una
1017 Infine per concludere la nostra panoramica sulle funzioni di risoluzione dei
1018 nomi dobbiamo citare le funzioni che permettono di interrogare gli altri
1019 servizi di risoluzione dei nomi illustrati in sez.~\ref{sec:sock_resolver}; in
1020 generale infatti ci sono una serie di funzioni nella forma
1021 \texttt{getXXXbyname} e \texttt{getXXXbyaddr} (dove \texttt{XXX} indica il
1022 servizio) per ciascuna delle informazioni di rete mantenute dal
1023 \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch} che permettono
1024 rispettivamente di trovare una corrispondenza cercando per nome o per numero.
1026 L'elenco di queste funzioni è riportato nelle colonne finali di
1027 tab.~\ref{tab:name_resolution_functions}, dove le si sono suddivise rispetto
1028 al tipo di informazione che forniscono (riportato in prima colonna). Nella
1029 tabella si è anche riportato il file su cui vengono ordinariamente mantenute
1030 queste informazioni, che però può essere sostituito da un qualunque supporto
1031 interno al \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch}
1032 (anche se usualmente questo avviene solo per la risoluzione degli indirizzi).
1033 Ciascuna funzione fa riferimento ad una sua apposita struttura che contiene i
1034 relativi dati, riportata in terza colonna.
1039 \begin{tabular}[c]{|l|l|l|l|l|}
1041 \textbf{Informazione}&\textbf{File}&\textbf{Struttura}&
1042 \multicolumn{2}{|c|}{\textbf{Funzioni}}\\
1045 indirizzo &\conffile{/etc/hosts}&\struct{hostent}&\func{gethostbyname}&
1046 \func{gethostbyaddr}\\
1047 servizio &\conffile{/etc/services}&\struct{servent}&\func{getservbyname}&
1048 \func{getservbyport}\\
1049 rete &\conffile{/etc/networks}&\struct{netent}&\funcm{getnetbyname}&
1050 \funcm{getnetbyaddr}\\
1051 protocollo&\conffile{/etc/protocols}&\struct{protoent}&
1052 \funcm{getprotobyname}&\funcm{getprotobyaddr}\\
1055 \caption{Funzioni di risoluzione dei nomi per i vari servizi del
1056 \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch}.}
1057 \label{tab:name_resolution_functions}
1060 Delle funzioni di tab.~\ref{tab:name_resolution_functions} abbiamo trattato
1061 finora soltanto quelle relative alla risoluzione dei nomi, dato che sono le
1062 più usate, e prevedono praticamente da sempre la necessità di rivolgersi ad
1063 una entità esterna; per le altre invece, estensioni fornite dal
1064 \itindex{Name~Service~Switch~(NSS)} NSS a parte, si fa sempre riferimento ai
1065 dati mantenuti nei rispettivi file.
1067 Dopo la risoluzione dei nomi a dominio una delle ricerche più comuni è quella
1068 sui nomi dei servizi di rete più comuni (cioè \texttt{http}, \texttt{smtp},
1069 ecc.) da associare alle rispettive porte. Le due funzioni da utilizzare per
1070 questo sono \funcd{getservbyname} e \funcd{getservbyport}, che permettono
1071 rispettivamente di ottenere il numero di porta associato ad un servizio dato
1072 il nome e viceversa; i loro prototipi sono:
1075 \funcdecl{struct servent *getservbyname(const char *name, const char *proto)}
1076 \funcdecl{struct servent *getservbyport(int port, const char *proto)}
1078 Risolvono il nome di un servizio nel rispettivo numero di porta e viceversa.
1080 \bodydesc{Ritornano il puntatore ad una struttura \struct{servent} con i
1081 risultati in caso di successo, o \val{NULL} in caso di errore.}
1084 Entrambe le funzioni prendono come ultimo argomento una stringa \param{proto}
1085 che indica il protocollo per il quale si intende effettuare la
1086 ricerca,\footnote{le informazioni mantenute in \conffile{/etc/services}
1087 infatti sono relative sia alle porte usate su UDP che su TCP, occorre quindi
1088 specificare a quale dei due protocolli si fa riferimento.} che nel caso si
1089 IP può avere come valori possibili solo \texttt{udp} o
1090 \texttt{tcp};\footnote{in teoria si potrebbe avere un qualunque protocollo fra
1091 quelli citati in \conffile{/etc/protocols}, posto che lo stesso supporti il
1092 concetto di \textsl{porta}, in pratica questi due sono gli unici presenti.}
1093 se si specifica un puntatore nullo la ricerca sarà eseguita su un protocollo
1096 Il primo argomento è il nome del servizio per \func{getservbyname},
1097 specificato tramite la stringa \param{name}, mentre \func{getservbyport}
1098 richiede il numero di porta in \param{port}. Entrambe le funzioni eseguono una
1099 ricerca sul file \conffile{/etc/services}\footnote{il
1100 \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch} astrae il
1101 concetto a qualunque supporto su cui si possano mantenere i suddetti dati.}
1102 ed estraggono i dati dalla prima riga che corrisponde agli argomenti
1103 specificati; se la risoluzione ha successo viene restituito un puntatore ad
1104 una apposita struttura \struct{servent} contenente tutti i risultati,
1105 altrimenti viene restituito un puntatore nullo. Si tenga presente che anche
1106 in questo caso i dati vengono mantenuti in una area di memoria statica e che
1107 quindi la funzione non è \index{funzioni!rientranti} rientrante.
1109 \begin{figure}[!htb]
1110 \footnotesize \centering
1111 \begin{minipage}[c]{\textwidth}
1112 \includestruct{listati/servent.h}
1114 \caption{La struttura \structd{servent} per la risoluzione dei nomi dei
1115 servizi e dei numeri di porta.}
1116 \label{fig:sock_servent_struct}
1119 La definizione della struttura \struct{servent} è riportata in
1120 fig.~\ref{fig:sock_servent_struct}, il primo campo, \var{s\_name} contiene
1121 sempre il nome canonico del servizio, mentre \var{s\_aliases} è un puntatore
1122 ad un vettore di stringhe contenenti gli eventuali nomi alternativi
1123 utilizzabili per identificare lo stesso servizio. Infine \var{s\_port}
1124 contiene il numero di porta e \var{s\_proto} il nome del protocollo.
1126 Come riportato in tab.~\ref{tab:name_resolution_functions} ci sono analoghe
1127 funzioni per la risoluzione del nome dei protocolli e delle reti; non staremo
1128 a descriverle nei dettagli, in quanto il loro uso è molto limitato, esse
1129 comunque utilizzano una loro struttura dedicata del tutto analoga alle
1130 precedenti: tutti i dettagli relativi al loro funzionamento possono essere
1131 trovati nelle rispettive pagine di manuale.
1133 Oltre alle funzioni di ricerca esistono delle ulteriori funzioni che prevedono
1134 una lettura sequenziale delle informazioni mantenute nel
1135 \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch} (in sostanza
1136 permettono di leggere i file contenenti le informazioni riga per riga), che
1137 sono analoghe a quelle elencate in tab.~\ref{tab:sys_passwd_func} per le
1138 informazioni relative ai dati degli utenti e dei gruppi. Nel caso specifico
1139 dei servizi avremo allora le tre funzioni \funcd{setservent},
1140 \funcd{getservent} e \funcd{endservent} i cui prototipi sono:
1143 \funcdecl{void setservent(int stayopen)}
1144 Apre il file \conffile{/etc/services} e si posiziona al suo inizio.
1146 \funcdecl{struct servent *getservent(void)}
1147 Legge la voce successiva nel file \conffile{/etc/services}.
1149 \funcdecl{void endservent(void)}
1150 Chiude il file \conffile{/etc/services}.
1152 \bodydesc{Le due funzioni \func{setservent} e \func{endservent} non
1153 restituiscono nulla, \func{getservent} restituisce il puntatore ad una
1154 struttura \struct{servent} in caso di successo e \val{NULL} in caso di
1155 errore o fine del file.}
1158 La prima funzione, \func{getservent}, legge una singola voce a partire dalla
1159 posizione corrente in \conffile{/etc/services}, pertanto si può eseguire una
1160 lettura sequenziale dello stesso invocandola più volte. Se il file non è
1161 aperto provvede automaticamente ad aprirlo, nel qual caso leggerà la prima
1162 voce. La seconda funzione, \func{setservent}, permette di aprire il file
1163 \conffile{/etc/services} per una successiva lettura, ma se il file è già stato
1164 aperto riporta la posizione di lettura alla prima voce del file, in questo
1165 modo si può far ricominciare da capo una lettura sequenziale. L'argomento
1166 \param{stayopen}, se diverso da zero, fa sì che il file resti aperto anche fra
1167 diverse chiamate a \func{getservbyname} e \func{getservbyport}.\footnote{di
1168 default dopo una chiamata a queste funzioni il file viene chiuso, cosicché
1169 una successiva chiamata a \func{getservent} riparte dall'inizio.} La terza
1170 funzione, \funcd{endservent}, provvede semplicemente a chiudere il file.
1172 Queste tre funzioni per la lettura sequenziale di nuovo sono presenti per
1173 ciascuno dei vari tipi di informazione relative alle reti di
1174 tab.~\ref{tab:name_resolution_functions}; questo significa che esistono
1175 altrettante funzioni nella forma \texttt{setXXXent}, \texttt{getXXXent} e
1176 \texttt{endXXXent}, analoghe alle precedenti per la risoluzione dei servizi,
1177 che abbiamo riportato in tab.~\ref{tab:name_sequential_read}. Essendo, a
1178 parte il tipo di informazione che viene trattato, sostanzialmente identiche
1179 nel funzionamento e di scarso utilizzo, non staremo a trattarle una per una,
1180 rimandando alle rispettive pagine di manuale.
1185 \begin{tabular}[c]{|l|l|l|l|}
1187 \textbf{Informazione}&\multicolumn{3}{|c|}{\textbf{Funzioni}}\\
1190 indirizzo &\func{sethostent} &\func{gethostent} &\func{endhostent} \\
1191 servizio &\func{setservent} &\func{getservent} &\func{endservent}\\
1192 rete &\funcm{setnetent} &\funcm{getnetent} &\funcm{endnetent}\\
1193 protocollo&\funcm{setprotoent}&\funcm{getprotoent}&\funcm{endprotoent}\\
1196 \caption{Funzioni lettura sequenziale dei dati del
1197 \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch}.}
1198 \label{tab:name_sequential_read}
1205 \subsection{Le funzioni avanzate per la risoluzione dei nomi}
1206 \label{sec:sock_advanced_name_services}
1208 Quelle illustrate nella sezione precedente sono le funzioni classiche per la
1209 risoluzione di nomi ed indirizzi IP, ma abbiamo già visto come esse soffrano
1210 di vari inconvenienti come il fatto che usano informazioni statiche, e non
1211 prevedono la possibilità di avere diverse classi di indirizzi. Anche se sono
1212 state create delle estensioni o metodi diversi che permettono di risolvere
1213 alcuni di questi inconvenienti,\footnote{rimane ad esempio il problema
1214 generico che si deve sapere in anticipo quale tipo di indirizzi IP (IPv4 o
1215 IPv6) corrispondono ad un certo nome a dominio.} comunque esse non
1216 forniscono una interfaccia sufficientemente generica.
1218 Inoltre in genere quando si ha a che fare con i socket non esiste soltanto il
1219 problema della risoluzione del nome che identifica la macchina, ma anche
1220 quello del servizio a cui ci si vuole rivolgere. Per questo motivo con lo
1221 standard POSIX 1003.1-2001 sono state indicate come deprecate le varie
1222 funzioni \func{gethostbyaddr}, \func{gethostbyname}, \var{getipnodebyname} e
1223 \var{getipnodebyaddr} ed è stata introdotta una interfaccia completamente
1226 La prima funzione di questa interfaccia è \funcd{getaddrinfo},\footnote{la
1227 funzione è definita, insieme a \func{getnameinfo} che vedremo più avanti,
1228 nell'\href{http://www.ietf.org/rfc/rfc2553.txt}{RFC~2553}.} che combina le
1229 funzionalità delle precedenti \func{getipnodebyname}, \func{getipnodebyaddr},
1230 \func{getservbyname} e \func{getservbyport}, consentendo di ottenere
1231 contemporaneamente sia la risoluzione di un indirizzo simbolico che del nome
1232 di un servizio; il suo prototipo è:
1235 \headdecl{sys/socket.h}
1238 \funcdecl{int getaddrinfo(const char *node, const char *service, const
1239 struct addrinfo *hints, struct addrinfo **res)}
1241 Esegue una risoluzione di un nome a dominio e di un nome di servizio.
1243 \bodydesc{La funzione restituisce 0 in caso di successo o un codice di
1244 errore diverso da zero in caso di fallimento.}
1247 La funzione prende come primo argomento il nome della macchina che si vuole
1248 risolvere, specificato tramite la stringa \param{node}. Questo argomento,
1249 oltre ad un comune nome a dominio, può indicare anche un indirizzo numerico in
1250 forma \textit{dotted-decimal} per IPv4 o in formato esadecimale per IPv6. Si
1251 può anche specificare il nome di una rete invece che di una singola macchina.
1252 Il secondo argomento, \param{service}, specifica invece il nome del servizio
1253 che si intende risolvere. Per uno dei due argomenti si può anche usare il
1254 valore \val{NULL}, nel qual caso la risoluzione verrà effettuata soltanto
1255 sulla base del valore dell'altro.
1257 Il terzo argomento, \param{hints}, deve essere invece un puntatore ad una
1258 struttura \struct{addrinfo} usata per dare dei \textsl{suggerimenti} al
1259 procedimento di risoluzione riguardo al protocollo o del tipo di socket che si
1260 intenderà utilizzare; \func{getaddrinfo} infatti permette di effettuare
1261 ricerche generiche sugli indirizzi, usando sia IPv4 che IPv6, e richiedere
1262 risoluzioni sui nomi dei servizi indipendentemente dal protocollo (ad esempio
1263 TCP o UDP) che questi possono utilizzare.
1265 Come ultimo argomento in \param{res} deve essere passato un puntatore ad una
1266 variabile (di tipo puntatore ad una struttura \struct{addrinfo}) che verrà
1267 utilizzata dalla funzione per riportare (come \itindex{value~result~argument}
1268 \textit{value result argument}) i propri risultati. La funzione infatti è
1269 \index{funzioni!rientranti} rientrante, ed alloca autonomamente tutta la
1270 memoria necessaria in cui verranno riportati i risultati della risoluzione.
1271 La funzione scriverà all'indirizzo puntato da \param{res} il puntatore
1272 iniziale ad una \itindex{linked~list} \textit{linked list} di strutture di
1273 tipo \struct{addrinfo} contenenti tutte le informazioni ottenute.
1275 \begin{figure}[!htb]
1276 \footnotesize \centering
1277 \begin{minipage}[c]{\textwidth}
1278 \includestruct{listati/addrinfo.h}
1280 \caption{La struttura \structd{addrinfo} usata nella nuova interfaccia POSIX
1281 per la risoluzione di nomi a dominio e servizi.}
1282 \label{fig:sock_addrinfo_struct}
1285 Come illustrato la struttura \struct{addrinfo}, la cui definizione\footnote{la
1286 definizione è ripresa direttamente dal file \headfile{netdb.h} in questa
1287 struttura viene dichiarata, la pagina di manuale riporta \type{size\_t} come
1288 tipo di dato per il campo \var{ai\_addrlen}, qui viene usata quanto previsto
1289 dallo standard POSIX, in cui viene utilizzato \type{socklen\_t}; i due tipi
1290 di dati sono comunque equivalenti.} è riportata in
1291 fig.~\ref{fig:sock_addrinfo_struct}, viene usata sia in ingresso, per passare
1292 dei valori di controllo alla funzione, che in uscita, per ricevere i
1293 risultati. Il primo campo, \var{ai\_flags}, è una maschera binaria di bit che
1294 permettono di controllare le varie modalità di risoluzione degli indirizzi,
1295 che viene usato soltanto in ingresso. I tre campi successivi \var{ai\_family},
1296 \var{ai\_socktype}, e \var{ai\_protocol} contengono rispettivamente la
1297 famiglia di indirizzi, il tipo di socket e il protocollo, in ingresso vengono
1298 usati per impostare una selezione (impostandone il valore nella struttura
1299 puntata da \param{hints}), mentre in uscita indicano il tipo di risultato
1300 contenuto nella struttura.
1302 Tutti i campi seguenti vengono usati soltanto in uscita; il campo
1303 \var{ai\_addrlen} indica la dimensione della struttura degli indirizzi
1304 ottenuta come risultato, il cui contenuto sarà memorizzato nella struttura
1305 \struct{sockaddr} posta all'indirizzo puntato dal campo \var{ai\_addr}. Il
1306 campo \var{ai\_canonname} è un puntatore alla stringa contenente il nome
1307 canonico della macchina, ed infine, quando la funzione restituisce più di un
1308 risultato, \var{ai\_next} è un puntatore alla successiva struttura
1309 \struct{addrinfo} della lista.
1311 Ovviamente non è necessario dare dei suggerimenti in ingresso, ed usando
1312 \val{NULL} come valore per l'argomento \param{hints} si possono compiere
1313 ricerche generiche. Se però si specifica un valore non nullo questo deve
1314 puntare ad una struttura \struct{addrinfo} precedentemente allocata nella
1315 quale siano stati opportunamente impostati i valori dei campi
1316 \var{ai\_family}, \var{ai\_socktype}, \var{ai\_protocol} ed \var{ai\_flags}.
1318 I due campi \var{ai\_family} e \var{ai\_socktype} prendono gli stessi valori
1319 degli analoghi argomenti della funzione \func{socket}; in particolare per
1320 \var{ai\_family} si possono usare i valori di tab.~\ref{tab:net_pf_names} ma
1321 sono presi in considerazione solo \const{PF\_INET} e \const{PF\_INET6}, mentre
1322 se non si vuole specificare nessuna famiglia di indirizzi si può usare il
1323 valore \const{PF\_UNSPEC}. Allo stesso modo per \var{ai\_socktype} si possono
1324 usare i valori illustrati in sez.~\ref{sec:sock_type} per indicare per quale
1325 tipo di socket si vuole risolvere il servizio indicato, anche se i soli
1326 significativi sono \const{SOCK\_STREAM} e \const{SOCK\_DGRAM}; in questo caso,
1327 se non si vuole effettuare nessuna risoluzione specifica, si potrà usare un
1330 Il campo \var{ai\_protocol} permette invece di effettuare la selezione dei
1331 risultati per il nome del servizio usando il numero identificativo del
1332 rispettivo protocollo di trasporto (i cui valori possibili sono riportati in
1333 \conffile{/etc/protocols}); di nuovo i due soli valori utilizzabili sono quelli
1334 relativi a UDP e TCP, o il valore nullo che indica di ignorare questo campo
1340 \begin{tabular}[c]{|l|p{10cm}|}
1342 \textbf{Costante} & \textbf{Significato} \\
1345 \const{AI\_PASSIVE} & Viene utilizzato per ottenere un indirizzo in
1346 formato adatto per una successiva chiamata a
1347 \func{bind}. Se specificato quando si è usato
1348 \val{NULL} come valore per \param{node} gli
1349 indirizzi restituiti saranno inizializzati al
1350 valore generico (\const{INADDR\_ANY} per IPv4 e
1351 \const{IN6ADDR\_ANY\_INIT} per IPv6), altrimenti
1352 verrà usato l'indirizzo dell'interfaccia di
1353 \textit{loopback}. Se invece non è impostato gli
1354 indirizzi verranno restituiti in formato adatto ad
1355 una chiamata a \func{connect} o \func{sendto}.\\
1356 \const{AI\_CANONNAME} & Richiede la restituzione del nome canonico della
1357 macchina, che verrà salvato in una stringa il cui
1358 indirizzo sarà restituito nel campo
1359 \var{ai\_canonname} della prima struttura
1360 \struct{addrinfo} dei risultati. Se il nome
1361 canonico non è disponibile al suo posto
1362 viene restituita una copia di \param{node}. \\
1363 \const{AI\_NUMERICHOST}& Se impostato il nome della macchina specificato
1364 con \param{node} deve essere espresso in forma
1365 numerica, altrimenti sarà restituito un errore
1366 \const{EAI\_NONAME} (vedi
1367 tab.~\ref{tab:addrinfo_error_code}), in questo
1368 modo si evita ogni chiamata alle funzioni di
1370 \const{AI\_V4MAPPED} & Stesso significato dell'analoga di
1371 tab.~\ref{tab:sock_getipnodebyname_flags}.\\
1372 \const{AI\_ALL} & Stesso significato dell'analoga di
1373 tab.~\ref{tab:sock_getipnodebyname_flags}.\\
1374 \const{AI\_ADDRCONFIG} & Stesso significato dell'analoga di
1375 tab.~\ref{tab:sock_getipnodebyname_flags}.\\
1378 \caption{Costanti associate ai bit del campo \var{ai\_flags} della struttura
1380 \label{tab:ai_flags_values}
1384 Infine l'ultimo campo è \var{ai\_flags}; che deve essere impostato come una
1385 maschera binaria; i bit di questa variabile infatti vengono usati per dare
1386 delle indicazioni sul tipo di risoluzione voluta, ed hanno valori analoghi a
1387 quelli visti in sez.~\ref{sec:sock_name_services} per \func{getipnodebyname};
1388 il valore di \var{ai\_flags} può essere impostata con un OR aritmetico delle
1389 costanti di tab.~\ref{tab:ai_flags_values}, ciascuna delle quali identifica un
1392 La funzione restituisce un valore nullo in caso di successo, o un codice in
1393 caso di errore. I valori usati come codice di errore sono riportati in
1394 tab.~\ref{tab:addrinfo_error_code}; dato che la funzione utilizza altre
1395 funzioni e chiamate al sistema per ottenere il suo risultato in generale il
1396 valore di \var{errno} non è significativo, eccetto il caso in cui si sia
1397 ricevuto un errore di \const{EAI\_SYSTEM}, nel qual caso l'errore
1398 corrispondente è riportato tramite \var{errno}.
1403 \begin{tabular}[c]{|l|p{10cm}|}
1405 \textbf{Costante} & \textbf{Significato} \\
1408 \const{EAI\_FAMILY} & La famiglia di indirizzi richiesta non è
1410 \const{EAI\_SOCKTYPE}& Il tipo di socket richiesto non è supportato. \\
1411 \const{EAI\_BADFLAGS}& Il campo \var{ai\_flags} contiene dei valori non
1413 \const{EAI\_NONAME} & Il nome a dominio o il servizio non sono noti,
1414 viene usato questo errore anche quando si specifica
1415 il valore \val{NULL} per entrambi gli argomenti
1416 \param{node} e \param{service}. \\
1417 \const{EAI\_SERVICE} & Il servizio richiesto non è disponibile per il tipo
1418 di socket richiesto, anche se può esistere per
1419 altri tipi di socket. \\
1420 \const{EAI\_ADDRFAMILY}& La rete richiesta non ha nessun indirizzo di rete
1421 per la famiglia di indirizzi specificata. \\
1422 \const{EAI\_NODATA} & La macchina specificata esiste, ma non ha nessun
1423 indirizzo di rete definito. \\
1424 \const{EAI\_MEMORY} & È stato impossibile allocare la memoria necessaria
1426 \const{EAI\_FAIL} & Il DNS ha restituito un errore di risoluzione
1428 \const{EAI\_AGAIN} & Il DNS ha restituito un errore di risoluzione
1429 temporaneo, si può ritentare in seguito. \\
1430 \const{EAI\_SYSTEM} & C'è stato un errore di sistema, si può controllare
1431 \var{errno} per i dettagli. \\
1433 % TODO estensioni GNU, trovarne la documentazione
1434 % \const{EAI\_INPROGRESS}& Richiesta in corso. \\
1435 % \const{EAI\_CANCELED}& La richiesta è stata cancellata.\\
1436 % \const{EAI\_NOTCANCELED}& La richiesta non è stata cancellata. \\
1437 % \const{EAI\_ALLDONE} & Tutte le richieste sono complete. \\
1438 % \const{EAI\_INTR} & Richiesta interrotta. \\
1441 \caption{Costanti associate ai valori dei codici di errore della funzione
1442 \func{getaddrinfo}.}
1443 \label{tab:addrinfo_error_code}
1446 Come per i codici di errore di \func{gethostbyname} anche in questo caso è
1447 fornita una apposita funzione, analoga di \func{strerror}, che consente di
1448 utilizzarli direttamente per stampare a video un messaggio esplicativo; la
1449 funzione è \funcd{gai\_strerror} ed il suo prototipo è:
1453 \funcdecl{const char *gai\_strerror(int errcode)}
1455 Fornisce il messaggio corrispondente ad un errore di \func{getaddrinfo}.
1457 \bodydesc{La funzione restituisce il puntatore alla stringa contenente il
1458 messaggio di errore.}
1461 La funzione restituisce un puntatore alla stringa contenente il messaggio
1462 corrispondente dal codice di errore \param{errcode} ottenuto come valore di
1463 ritorno di \func{getaddrinfo}. La stringa è allocata staticamente, ma essendo
1464 costante, ed accessibile in sola lettura, questo non comporta nessun problema
1465 di rientranza della funzione.
1467 Dato che ad un certo nome a dominio possono corrispondere più indirizzi IP
1468 (sia IPv4 che IPv6), e che un certo servizio può essere fornito su protocolli
1469 e tipi di socket diversi, in generale, a meno di non aver eseguito una
1470 selezione specifica attraverso l'uso di \param{hints}, si otterrà una diversa
1471 struttura \struct{addrinfo} per ciascuna possibilità. Ad esempio se si
1472 richiede la risoluzione del servizio \textit{echo} per l'indirizzo
1473 \texttt{www.truelite.it}, e si imposta \const{AI\_CANONNAME} per avere anche
1474 la risoluzione del nome canonico, si avrà come risposta della funzione la
1475 lista illustrata in fig.~\ref{fig:sock_addrinfo_list}.
1477 \begin{figure}[!htb]
1479 \includegraphics[width=10cm]{img/addrinfo_list}
1480 \caption{La \itindex{linked~list} \textit{linked list} delle strutture
1481 \struct{addrinfo} restituite da \func{getaddrinfo}.}
1482 \label{fig:sock_addrinfo_list}
1485 Come primo esempio di uso di \func{getaddrinfo} vediamo un programma
1486 elementare di interrogazione del \itindex{resolver} \textit{resolver} basato
1487 questa funzione, il cui corpo principale è riportato in
1488 fig.~\ref{fig:mygetaddr_example}. Il codice completo del programma, compresa
1489 la gestione delle opzioni in cui è gestita l'eventuale inizializzazione
1490 dell'argomento \var{hints} per restringere le ricerche su protocolli, tipi di
1491 socket o famiglie di indirizzi, è disponibile nel file \texttt{mygetaddr.c}
1492 dei sorgenti allegati alla guida.
1494 \begin{figure}[!htbp]
1495 \footnotesize \centering
1496 \begin{minipage}[c]{\codesamplewidth}
1497 \includecodesample{listati/mygetaddr.c}
1500 \caption{Esempio di codice per la risoluzione di un indirizzo.}
1501 \label{fig:mygetaddr_example}
1504 Il corpo principale inizia controllando (\texttt{\small 1--5}) il numero di
1505 argomenti passati, che devono essere sempre due, e corrispondere
1506 rispettivamente all'indirizzo ed al nome del servizio da risolvere. A questo
1507 segue la chiamata (\texttt{\small 7}) alla funzione \func{getaddrinfo}, ed il
1508 successivo controllo (\texttt{\small 8--11}) del suo corretto funzionamento,
1509 senza il quale si esce immediatamente stampando il relativo codice di errore.
1511 Se la funzione ha restituito un valore nullo il programma prosegue
1512 inizializzando (\texttt{\small 12}) il puntatore \var{ptr} che sarà usato nel
1513 successivo ciclo (\texttt{\small 14--35}) di scansione della lista delle
1514 strutture \struct{addrinfo} restituite dalla funzione. Prima di eseguire
1515 questa scansione (\texttt{\small 12}) viene stampato il valore del nome
1516 canonico che è presente solo nella prima struttura.
1518 La scansione viene ripetuta (\texttt{\small 14}) fintanto che si ha un
1519 puntatore valido. La selezione principale è fatta sul campo \var{ai\_family},
1520 che stabilisce a quale famiglia di indirizzi fa riferimento la struttura in
1521 esame. Le possibilità sono due, un indirizzo IPv4 o IPv6, se nessuna delle due
1522 si verifica si provvede (\texttt{\small 27--30}) a stampare un messaggio di
1523 errore ed uscire.\footnote{questa eventualità non dovrebbe mai verificarsi,
1524 almeno fintanto che la funzione \func{getaddrinfo} lavora correttamente.}
1526 Per ciascuno delle due possibili famiglie di indirizzi si estraggono le
1527 informazioni che poi verranno stampate alla fine del ciclo (\texttt{\small
1528 31--34}). Il primo caso esaminato (\texttt{\small 15--21}) è quello degli
1529 indirizzi IPv4, nel qual caso prima se ne stampa l'identificazione
1530 (\texttt{\small 16}) poi si provvede a ricavare la struttura degli indirizzi
1531 (\texttt{\small 17}) indirizzata dal campo \var{ai\_addr}, eseguendo un
1532 opportuno casting del puntatore per poter estrarre da questa la porta
1533 (\texttt{\small 18}) e poi l'indirizzo (\texttt{\small 19}) che verrà
1534 convertito con una chiamata ad \func{inet\_ntop}.
1536 La stessa operazione (\texttt{\small 21--27}) viene ripetuta per gli indirizzi
1537 IPv6, usando la rispettiva struttura degli indirizzi. Si noti anche come in
1538 entrambi i casi per la chiamata a \func{inet\_ntop} si sia dovuto passare il
1539 puntatore al campo contenente l'indirizzo IP nella struttura puntata dal campo
1540 \var{ai\_addr}.\footnote{il meccanismo è complesso a causa del fatto che al
1541 contrario di IPv4, in cui l'indirizzo IP può essere espresso con un semplice
1542 numero intero, in IPv6 questo deve essere necessariamente fornito come
1543 struttura, e pertanto anche se nella struttura puntata da \var{ai\_addr}
1544 sono presenti direttamente i valori finali, per l'uso con \func{inet\_ntop}
1545 occorre comunque passare un puntatore agli stessi (ed il costrutto
1546 \code{\&addr6->sin6\_addr} è corretto in quanto l'operatore \texttt{->} ha
1547 on questo caso precedenza su \texttt{\&}).}
1549 Una volta estratte dalla struttura \struct{addrinfo} tutte le informazioni
1550 relative alla risoluzione richiesta e stampati i relativi valori, l'ultimo
1551 passo (\texttt{\small 34}) è di estrarre da \var{ai\_next} l'indirizzo della
1552 eventuale successiva struttura presente nella lista e ripetere il ciclo, fin
1553 tanto che, completata la scansione, questo avrà un valore nullo e si potrà
1554 terminare (\texttt{\small 36}) il programma.
1556 Si tenga presente che \func{getaddrinfo} non garantisce nessun particolare
1557 ordinamento della lista delle strutture \struct{addrinfo} restituite, anche se
1558 usualmente i vari indirizzi IP (se ne è presente più di uno) sono forniti
1559 nello stesso ordine in cui vengono inviati dal server DNS. In particolare
1560 nulla garantisce che vengano forniti prima i dati relativi ai servizi di un
1561 determinato protocollo o tipo di socket, se ne sono presenti di diversi. Se
1562 allora utilizziamo il nostro programma potremo verificare il risultato:
1564 [piccardi@gont sources]$ ./mygetaddr -c gapil.truelite.it echo
1565 Canonical name sources2.truelite.it
1567 Indirizzo 62.48.34.25
1571 Indirizzo 62.48.34.25
1577 Una volta estratti i risultati dalla \itindex{linked~list} \textit{linked list}
1578 puntata da \param{res} se questa non viene più utilizzata si dovrà avere cura
1579 di disallocare opportunamente tutta la memoria, per questo viene fornita
1580 l'apposita funzione \funcd{freeaddrinfo}, il cui prototipo è:
1584 \funcdecl{void freeaddrinfo(struct addrinfo *res)}
1586 Libera la memoria allocata da una precedente chiamata a \func{getaddrinfo}.
1588 \bodydesc{La funzione non restituisce nessun codice di errore.}
1591 La funzione prende come unico argomento il puntatore \param{res}, ottenuto da
1592 una precedente chiamata a \func{getaddrinfo}, e scandisce la lista delle
1593 strutture per liberare tutta la memoria allocata. Dato che la funzione non ha
1594 valori di ritorno deve essere posta molta cura nel passare un valore valido
1597 Si tenga presente infine che se si copiano i risultati da una delle strutture
1598 \struct{addrinfo} restituite nella lista indicizzata da \param{res}, occorre
1599 avere cura di eseguire una \itindex{deep~copy} \textit{deep copy} in cui
1600 si copiano anche tutti i dati presenti agli indirizzi contenuti nella
1601 struttura \struct{addrinfo}, perché una volta disallocati i dati con
1602 \func{freeaddrinfo} questi non sarebbero più disponibili.
1604 Anche la nuova interfaccia definita da POSIX prevede una nuova funzione per
1605 eseguire la risoluzione inversa e determinare nomi di servizi e di dominio
1606 dati i rispettivi valori numerici. La funzione che sostituisce le varie
1607 \func{gethostbyname}, \func{getipnodebyname} e \func{getservbyname} è
1608 \funcd{getnameinfo}, ed il suo prototipo è:
1610 \headdecl{sys/socket.h}
1613 \funcdecl{int getnameinfo(const struct sockaddr *sa, socklen\_t salen, char
1614 *host, size\_t hostlen, char *serv, size\_t servlen, int flags)}
1616 Risolve il contenuto di una struttura degli indirizzi in maniera
1617 indipendente dal protocollo.
1619 \bodydesc{La funzione restituisce 0 in caso di successo e un codice di
1620 errore diverso da zero altrimenti.}
1623 La principale caratteristica di \func{getnameinfo} è che la funzione è in
1624 grado di eseguire una risoluzione inversa in maniera indipendente dal
1625 protocollo; il suo primo argomento \param{sa} infatti è il puntatore ad una
1626 struttura degli indirizzi generica, che può contenere sia indirizzi IPv4 che
1627 IPv6, la cui dimensione deve comunque essere specificata con l'argomento
1630 I risultati della funzione saranno restituiti nelle due stringhe puntate da
1631 \param{host} e \param{serv}, che dovranno essere state precedentemente
1632 allocate per una lunghezza massima che deve essere specificata con gli altri
1633 due argomenti \param{hostlen} e \param{servlen}. Si può, quando non si è
1634 interessati ad uno dei due, passare il valore \val{NULL} come argomento,
1635 così che la corrispondente informazione non verrà richiesta. Infine l'ultimo
1636 argomento \param{flags} è una maschera binaria i cui bit consentono di
1637 impostare le modalità con cui viene eseguita la ricerca, e deve essere
1638 specificato attraverso l'OR aritmetico dei valori illustrati in
1639 tab.~\ref{tab:getnameinfo_flags}.
1644 \begin{tabular}[c]{|l|p{10cm}|}
1646 \textbf{Costante} & \textbf{Significato} \\
1649 \const{NI\_NOFQDN} & Richiede che venga restituita solo il nome della
1650 macchina all'interno del dominio al posto del
1651 nome completo (FQDN).\\
1652 \const{NI\_NUMERICHOST}& Richiede che venga restituita la forma numerica
1653 dell'indirizzo (questo succede sempre se il nome
1654 non può essere ottenuto).\\
1655 \const{NI\_NAMEREQD} & Richiede la restituzione di un errore se il nome
1656 non può essere risolto.\\
1657 \const{NI\_NUMERICSERV}& Richiede che il servizio venga restituito in
1658 forma numerica (attraverso il numero di porta).\\
1659 \const{NI\_DGRAM} & Richiede che venga restituito il nome del
1660 servizio su UDP invece che quello su TCP per quei
1661 pichi servizi (porte 512-214) che soni diversi
1662 nei due protocolli.\\
1665 \caption{Costanti associate ai bit dell'argomento \param{flags} della
1666 funzione \func{getnameinfo}.}
1667 \label{tab:getnameinfo_flags}
1670 La funzione ritorna zero in caso di successo, e scrive i propri risultati agli
1671 indirizzi indicati dagli argomenti \param{host} e \param{serv} come stringhe
1672 terminate dal carattere NUL, a meno che queste non debbano essere troncate
1673 qualora la loro dimensione ecceda quelle specificate dagli argomenti
1674 \param{hostlen} e \param{servlen}. Sono comunque definite le due costanti
1675 \const{NI\_MAXHOST} e \const{NI\_MAXSERV}\footnote{in Linux le due costanti
1676 sono definite in \headfile{netdb.h} ed hanno rispettivamente il valore 1024
1677 e 12.} che possono essere utilizzate come limiti massimi. In caso di
1678 errore viene restituito invece un codice che assume gli stessi valori
1679 illustrati in tab.~\ref{tab:addrinfo_error_code}.
1681 A questo punto possiamo fornire degli esempi di utilizzo della nuova
1682 interfaccia, adottandola per le precedenti implementazioni del client e del
1683 server per il servizio \textit{echo}; dato che l'uso delle funzioni appena
1684 illustrate (in particolare di \func{getaddrinfo}) è piuttosto complesso,
1685 essendo necessaria anche una impostazione diretta dei campi dell'argomento
1686 \param{hints}, provvederemo una interfaccia semplificata per i due casi visti
1687 finora, quello in cui si specifica nel client un indirizzo remoto per la
1688 connessione al server, e quello in cui si specifica nel server un indirizzo
1689 locale su cui porsi in ascolto.
1691 La prima funzione della nostra interfaccia semplificata è \texttt{sockconn}
1692 che permette di ottenere un socket, connesso all'indirizzo ed al servizio
1693 specificati. Il corpo della funzione è riportato in
1694 fig.~\ref{fig:sockconn_code}, il codice completo è nel file \file{SockUtil.c}
1695 dei sorgenti allegati alla guida, che contiene varie funzioni di utilità per
1698 \begin{figure}[!htbp]
1699 \footnotesize \centering
1700 \begin{minipage}[c]{\codesamplewidth}
1701 \includecodesample{listati/sockconn.c}
1704 \caption{Il codice della funzione \texttt{sockconn}.}
1705 \label{fig:sockconn_code}
1708 La funzione prende quattro argomenti, i primi due sono le stringhe che
1709 indicano il nome della macchina a cui collegarsi ed il relativo servizio su
1710 cui sarà effettuata la risoluzione; seguono il protocollo da usare (da
1711 specificare con il valore numerico di \conffile{/etc/protocols}) ed il tipo di
1712 socket (al solito specificato con i valori illustrati in
1713 sez.~\ref{sec:sock_type}). La funzione ritorna il valore del file descriptor
1714 associato al socket (un numero positivo) in caso di successo, o -1 in caso di
1715 errore; per risolvere il problema di non poter passare indietro i valori di
1716 ritorno di \func{getaddrinfo} contenenti i relativi codici di
1717 errore\footnote{non si può avere nessuna certezza che detti valori siano
1718 negativi, è questo è invece necessario per evitare ogni possibile ambiguità
1719 nei confronti del valore di ritorno in caso di successo.} si sono stampati i
1720 messaggi d'errore direttamente nella funzione.
1722 Una volta definite le variabili necessarie (\texttt{\small 3--5}) la funzione
1723 prima (\texttt{\small 6}) azzera il contenuto della struttura \var{hint} e poi
1724 provvede (\texttt{\small 7--9}) ad inizializzarne i valori necessari per la
1725 chiamata (\texttt{\small 10}) a \func{getaddrinfo}. Di quest'ultima si
1726 controlla (\texttt{\small 12--16}) il codice di ritorno, in modo da stampare un
1727 avviso di errore, azzerare \var{errno} ed uscire in caso di errore. Dato che
1728 ad una macchina possono corrispondere più indirizzi IP, e di tipo diverso (sia
1729 IPv4 che IPv6), mentre il servizio può essere in ascolto soltanto su uno solo
1730 di questi, si provvede a tentare la connessione per ciascun indirizzo
1731 restituito all'interno di un ciclo (\texttt{\small 18--40}) di scansione della
1732 lista restituita da \func{getaddrinfo}, ma prima (\texttt{\small 17}) si salva
1733 il valore del puntatore per poterlo riutilizzare alla fine per disallocare la
1736 Il ciclo viene ripetuto (\texttt{\small 18}) fintanto che si hanno indirizzi
1737 validi, ed inizia (\texttt{\small 19}) con l'apertura del socket; se questa
1738 fallisce si controlla (\texttt{\small 20}) se sono disponibili altri
1739 indirizzi, nel qual caso si passa al successivo (\texttt{\small 21}) e si
1740 riprende (\texttt{\small 22}) il ciclo da capo; se non ve ne sono si stampa
1741 l'errore ritornando immediatamente (\texttt{\small 24--27}). Quando la
1742 creazione del socket ha avuto successo si procede (\texttt{\small 29})
1743 direttamente con la connessione, di nuovo in caso di fallimento viene ripetuto
1744 (\texttt{\small 30--38}) il controllo se vi sono o no altri indirizzi da
1745 provare nella stessa modalità fatta in precedenza, aggiungendovi però in
1746 entrambi i casi (\texttt{\small 32} e (\texttt{\small 36}) la chiusura del
1747 socket precedentemente aperto, che non è più utilizzabile.
1749 Se la connessione ha avuto successo invece si termina (\texttt{\small 39})
1750 direttamente il ciclo, e prima di ritornare (\texttt{\small 31}) il valore del
1751 file descriptor del socket si provvede (\texttt{\small 30}) a liberare le
1752 strutture \struct{addrinfo} allocate da \func{getaddrinfo} utilizzando il
1753 valore del relativo puntatore precedentemente (\texttt{\small 17}) salvato.
1754 Si noti come per la funzione sia del tutto irrilevante se la struttura
1755 ritornata contiene indirizzi IPv6 o IPv4, in quanto si fa uso direttamente dei
1756 dati relativi alle strutture degli indirizzi di \struct{addrinfo} che sono
1757 \index{tipo!opaco} opachi rispetto all'uso della funzione \func{connect}.
1759 \begin{figure}[!htbp]
1760 \footnotesize \centering
1761 \begin{minipage}[c]{\codesamplewidth}
1762 \includecodesample{listati/TCP_echo_fifth.c}
1765 \caption{Il nuovo codice per la connessione del client \textit{echo}.}
1766 \label{fig:TCP_echo_fifth}
1769 Per usare questa funzione possiamo allora modificare ulteriormente il nostro
1770 programma client per il servizio \textit{echo}; in questo caso rispetto al
1771 codice usato finora per collegarsi (vedi fig.~\ref{fig:TCP_echo_client_1})
1772 avremo una semplificazione per cui il corpo principale del nostro client
1773 diventerà quello illustrato in fig.~\ref{fig:TCP_echo_fifth}, in cui le
1774 chiamate a \func{socket}, \func{inet\_pton} e \func{connect} sono sostituite
1775 da una singola chiamata a \texttt{sockconn}. Inoltre il nuovo client (il cui
1776 codice completo è nel file \file{TCP\_echo\_fifth.c} dei sorgenti allegati)
1777 consente di utilizzare come argomento del programma un nome a dominio al posto
1778 dell'indirizzo numerico, e può utilizzare sia indirizzi IPv4 che IPv6.
1780 \begin{figure}[!htbp]
1781 \footnotesize \centering
1782 \begin{minipage}[c]{\codesamplewidth}
1783 \includecodesample{listati/sockbind.c}
1786 \caption{Il codice della funzione \texttt{sockbind}.}
1787 \label{fig:sockbind_code}
1790 La seconda funzione di ausilio è \texttt{sockbind}, il cui corpo principale è
1791 riportato in fig.~\ref{fig:sockbind_code} (al solito il sorgente completo è
1792 nel file \file{sockbind.c} dei sorgenti allegati alla guida). Come si può
1793 notare la funzione è del tutto analoga alla precedente \texttt{sockconn}, e
1794 prende gli stessi argomenti, però invece di eseguire una connessione con
1795 \func{connect} si limita a chiamare \func{bind} per collegare il socket ad una
1798 Dato che la funzione è pensata per essere utilizzata da un server ci si può
1799 chiedere a quale scopo mantenere l'argomento \param{host} quando l'indirizzo
1800 di questo è usualmente noto. Si ricordi però quanto detto in
1801 sez.~\ref{sec:TCP_func_bind}, relativamente al significato della scelta di un
1802 indirizzo specifico come argomento di \func{bind}, che consente di porre il
1803 server in ascolto su uno solo dei possibili diversi indirizzi presenti su di
1804 una macchina. Se non si vuole che la funzione esegua \func{bind} su un
1805 indirizzo specifico, ma utilizzi l'indirizzo generico, occorrerà avere cura di
1806 passare un valore \val{NULL} come valore per l'argomento \var{host}; l'uso
1807 del valore \const{AI\_PASSIVE} serve ad ottenere il valore generico nella
1808 rispettiva struttura degli indirizzi.
1810 Come già detto la funzione è analoga a \texttt{sockconn} ed inizia azzerando
1811 ed inizializzando (\texttt{\small 6--11}) opportunamente la struttura
1812 \var{hint} con i valori ricevuti come argomenti, soltanto che in questo caso
1813 si è usata (\texttt{\small 8}) una impostazione specifica dei flag di
1814 \var{hint} usando \const{AI\_PASSIVE} per indicare che il socket sarà usato
1815 per una apertura passiva. Per il resto la chiamata (\texttt{\small 12--18}) a
1816 \func{getaddrinfo} e ed il ciclo principale (\texttt{\small 20--42}) sono
1817 identici, solo che si è sostituita (\texttt{\small 31}) la chiamata a
1818 \func{connect} con una chiamata a \func{bind}. Anche la conclusione
1819 (\texttt{\small 43--44}) della funzione è identica.
1821 Si noti come anche in questo caso si siano inserite le stampe degli errori
1822 sullo standard error, nonostante la funzione possa essere invocata da un
1823 demone. Nel nostro caso questo non è un problema in quanto se la funzione non
1824 ha successo il programma deve uscire immediatamente prima di essere posto in
1825 background, e può quindi scrivere gli errori direttamente sullo standard
1828 \begin{figure}[!htbp]
1829 \footnotesize \centering
1830 \begin{minipage}[c]{\codesamplewidth}
1831 \includecodesample{listati/TCP_echod_third.c}
1834 \caption{Nuovo codice per l'apertura passiva del server \textit{echo}.}
1835 \label{fig:TCP_echod_third}
1838 Con l'uso di questa funzione si può modificare anche il codice del nostro
1839 server \textit{echo}, che rispetto a quanto illustrato nella versione iniziale
1840 di fig.~\ref{fig:TCP_echo_server_first_code} viene modificato nella forma
1841 riportata in fig.~\ref{fig:TCP_echod_third}. In questo caso il socket su cui
1842 porsi in ascolto viene ottenuto (\texttt{\small 15--18}) da \texttt{sockbind}
1843 che si cura anche della eventuale risoluzione di un indirizzo specifico sul
1844 quale si voglia far ascoltare il server.
1848 \section{Le opzioni dei socket}
1849 \label{sec:sock_options}
1851 Benché dal punto di vista del loro uso come canali di trasmissione di dati i
1852 socket siano trattati allo stesso modo dei file, ed acceduti tramite i file
1853 descriptor, la normale interfaccia usata per la gestione dei file non è
1854 sufficiente a poterne controllare tutte le caratteristiche, che variano tra
1855 l'altro a seconda del loro tipo (e della relativa forma di comunicazione
1856 sottostante). In questa sezione vedremo allora quali sono le funzioni dedicate
1857 alla gestione delle caratteristiche specifiche dei vari tipi di socket, le
1858 cosiddette \textit{socket options}.
1861 \subsection{Le funzioni \func{setsockopt} e \func{getsockopt}}
1862 \label{sec:sock_setsockopt}
1864 Le varie caratteristiche dei socket possono essere gestite attraverso l'uso di
1865 due funzioni generiche che permettono rispettivamente di impostarle e di
1866 recuperarne il valore corrente. La prima di queste due funzioni, quella usata
1867 per impostare le \textit{socket options}, è \funcd{setsockopt}, ed il suo
1870 \headdecl{sys/socket.h}
1871 \headdecl{sys/types.h}
1873 \funcdecl{int setsockopt(int sock, int level, int optname, const void
1874 *optval, socklen\_t optlen)}
1875 Imposta le opzioni di un socket.
1877 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1878 errore, nel qual caso \var{errno} assumerà i valori:
1880 \item[\errcode{EBADF}] il file descriptor \param{sock} non è valido.
1881 \item[\errcode{EFAULT}] l'indirizzo \param{optval} non è valido.
1882 \item[\errcode{EINVAL}] il valore di \param{optlen} non è valido.
1883 \item[\errcode{ENOPROTOOPT}] l'opzione scelta non esiste per il livello
1885 \item[\errcode{ENOTSOCK}] il file descriptor \param{sock} non corrisponde ad
1892 Il primo argomento della funzione, \param{sock}, indica il socket su cui si
1893 intende operare; per indicare l'opzione da impostare si devono usare i due
1894 argomenti successivi, \param{level} e \param{optname}. Come abbiamo visto in
1895 sez.~\ref{sec:net_protocols} i protocolli di rete sono strutturati su vari
1896 livelli, ed l'interfaccia dei socket può usarne più di uno. Si avranno allora
1897 funzionalità e caratteristiche diverse per ciascun protocollo usato da un
1898 socket, e quindi saranno anche diverse le opzioni che si potranno impostare
1899 per ciascun socket, a seconda del \textsl{livello} (trasporto, rete, ecc.) su
1900 cui si vuole andare ad operare.
1902 Il valore di \param{level} seleziona allora il protocollo su cui vuole
1903 intervenire, mentre \param{optname} permette di scegliere su quale delle
1904 opzioni che sono definite per quel protocollo si vuole operare. In sostanza la
1905 selezione di una specifica opzione viene fatta attraverso una coppia di valori
1906 \param{level} e \param{optname} e chiaramente la funzione avrà successo
1907 soltanto se il protocollo in questione prevede quella opzione ed è utilizzato
1908 dal socket. Infine \param{level} prevede anche il valore speciale
1909 \const{SOL\_SOCKET} usato per le opzioni generiche che sono disponibili per
1910 qualunque tipo di socket.
1912 I valori usati per \param{level}, corrispondenti ad un dato protocollo usato
1913 da un socket, sono quelli corrispondenti al valore numerico che identifica il
1914 suddetto protocollo in \conffile{/etc/protocols}; dato che la leggibilità di un
1915 programma non trarrebbe certo beneficio dall'uso diretto dei valori numerici,
1916 più comunemente si indica il protocollo tramite le apposite costanti
1917 \texttt{SOL\_*} riportate in tab.~\ref{tab:sock_option_levels}, dove si sono
1918 riassunti i valori che possono essere usati per l'argomento
1919 \param{level}.\footnote{la notazione in questo caso è, purtroppo, abbastanza
1920 confusa: infatti in Linux il valore si può impostare sia usando le costanti
1921 \texttt{SOL\_*}, che le analoghe \texttt{IPPROTO\_*} (citate anche da
1922 Stevens in \cite{UNP1}); entrambe hanno gli stessi valori che sono
1923 equivalenti ai numeri di protocollo di \conffile{/etc/protocols}, con una
1924 eccezione specifica, che è quella del protocollo ICMP, per la quale non
1925 esista una costante, il che è comprensibile dato che il suo valore, 1, è
1926 quello che viene assegnato a \const{SOL\_SOCKET}.}
1931 \begin{tabular}[c]{|l|l|}
1933 \textbf{Livello} & \textbf{Significato} \\
1936 \const{SOL\_SOCKET}& Opzioni generiche dei socket.\\
1937 \const{SOL\_IP} & Opzioni specifiche per i socket che usano IPv4.\\
1938 \const{SOL\_TCP} & Opzioni per i socket che usano TCP.\\
1939 \const{SOL\_IPV6} & Opzioni specifiche per i socket che usano IPv6.\\
1940 \const{SOL\_ICMPV6}& Opzioni specifiche per i socket che usano ICMPv6.\\
1943 \caption{Possibili valori dell'argomento \param{level} delle
1944 funzioni \func{setsockopt} e \func{getsockopt}.}
1945 \label{tab:sock_option_levels}
1948 Il quarto argomento, \param{optval} è un puntatore ad una zona di memoria che
1949 contiene i dati che specificano il valore dell'opzione che si vuole passare al
1950 socket, mentre l'ultimo argomento \param{optlen},\footnote{questo argomento è
1951 in realtà sempre di tipo \ctyp{int}, come era nelle \acr{libc4} e
1952 \acr{libc5}; l'uso di \type{socklen\_t} è stato introdotto da POSIX (valgono
1953 le stesse considerazioni per l'uso di questo tipo di dato fatte in
1954 sez.~\ref{sec:TCP_func_accept}) ed adottato dalle \acr{glibc}.} è la
1955 dimensione in byte dei dati presenti all'indirizzo indicato da \param{optval}.
1956 Dato che il tipo di dati varia a seconda dell'opzione scelta, occorrerà
1957 individuare qual è quello che deve essere usato, ed utilizzare le opportune
1960 La gran parte delle opzioni utilizzano per \param{optval} un valore intero, se
1961 poi l'opzione esprime una condizione logica, il valore è sempre un intero, ma
1962 si dovrà usare un valore non nullo per abilitarla ed un valore nullo per
1963 disabilitarla. Se invece l'opzione non prevede di dover ricevere nessun tipo
1964 di valore si deve impostare \param{optval} a \val{NULL}. Un piccolo numero
1965 di opzioni però usano dei tipi di dati peculiari, è questo il motivo per cui
1966 \param{optval} è stato definito come puntatore generico.
1968 La seconda funzione usata per controllare le proprietà dei socket è
1969 \funcd{getsockopt}, che serve a leggere i valori delle opzioni dei socket ed a
1970 farsi restituire i dati relativi al loro funzionamento; il suo prototipo è:
1972 \headdecl{sys/socket.h}
1973 \headdecl{sys/types.h}
1975 \funcdecl{int getsockopt(int s, int level, int optname, void *optval,
1976 socklen\_t *optlen)} Legge le opzioni di un socket.
1978 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1979 errore, nel qual caso \var{errno} assumerà i valori:
1981 \item[\errcode{EBADF}] il file descriptor \param{sock} non è valido.
1982 \item[\errcode{EFAULT}] l'indirizzo \param{optval} o quello di
1983 \param{optlen} non è valido.
1984 \item[\errcode{ENOPROTOOPT}] l'opzione scelta non esiste per il livello
1986 \item[\errcode{ENOTSOCK}] il file descriptor \param{sock} non corrisponde ad
1992 I primi tre argomenti sono identici ed hanno lo stesso significato di quelli
1993 di \func{setsockopt}, anche se non è detto che tutte le opzioni siano definite
1994 per entrambe le funzioni. In questo caso \param{optval} viene usato per
1995 ricevere le informazioni ed indica l'indirizzo a cui andranno scritti i dati
1996 letti dal socket, infine \param{optlen} diventa un puntatore ad una variabile
1997 che viene usata come \itindex{value~result~argument} \textit{value result
1998 argument} per indicare, prima della chiamata della funzione, la lunghezza
1999 del buffer allocato per \param{optval} e per ricevere indietro, dopo la
2000 chiamata della funzione, la dimensione effettiva dei dati scritti su di esso.
2001 Se la dimensione del buffer allocato per \param{optval} non è sufficiente si
2006 \subsection{Le opzioni generiche}
2007 \label{sec:sock_generic_options}
2009 Come accennato esiste un insieme generico di opzioni dei socket che possono
2010 applicarsi a qualunque tipo di socket,\footnote{una descrizione di queste
2011 opzioni è generalmente disponibile nella settima sezione delle pagine di
2012 manuale, nel caso specifico la si può consultare con \texttt{man 7 socket}.}
2013 indipendentemente da quale protocollo venga poi utilizzato. Se si vuole
2014 operare su queste opzioni generiche il livello da utilizzare è
2015 \const{SOL\_SOCKET}; si è riportato un elenco di queste opzioni in
2016 tab.~\ref{tab:sock_opt_socklevel}.
2022 \begin{tabular}[c]{|l|c|c|c|l|l|}
2024 \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
2025 \textbf{Descrizione}\\
2028 \const{SO\_KEEPALIVE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2029 Controlla l'attività della connessione.\\
2030 \const{SO\_OOBINLINE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2031 Lascia in linea i dati \itindex{out-of-band}
2032 \textit{out-of-band}.\\
2033 \const{SO\_RCVLOWAT} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2034 Basso livello sul buffer di ricezione.\\
2035 \const{SO\_SNDLOWAT} &$\bullet$&$\bullet$& &\texttt{int}&
2036 Basso livello sul buffer di trasmissione.\\
2037 \const{SO\_RCVTIMEO} &$\bullet$&$\bullet$& &\texttt{timeval}&
2038 Timeout in ricezione.\\
2039 \const{SO\_SNDTIMEO} &$\bullet$&$\bullet$& &\texttt{timeval}&
2040 Timeout in trasmissione.\\
2041 \const{SO\_BSDCOMPAT}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2042 Abilita la compatibilità con BSD.\\
2043 \const{SO\_PASSCRED} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2044 Abilita la ricezione di credenziali.\\
2045 \const{SO\_PEERCRED} &$\bullet$& & &\texttt{ucred}&
2046 Restituisce le credenziali del processo remoto.\\
2047 \const{SO\_BINDTODEVICE}&$\bullet$&$\bullet$& &\texttt{char *}&
2048 Lega il socket ad un dispositivo.\\
2049 \const{SO\_DEBUG} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2050 Abilita il debugging sul socket.\\
2051 \const{SO\_REUSEADDR}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2052 Consente il riutilizzo di un indirizzo locale.\\
2053 \const{SO\_TYPE} &$\bullet$& & &\texttt{int}&
2054 Restituisce il tipo di socket.\\
2055 \const{SO\_ACCEPTCONN}&$\bullet$& & &\texttt{int}&
2056 Indica se il socket è in ascolto.\\
2057 \const{SO\_DONTROUTE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2058 Non invia attraverso un gateway.\\
2059 \const{SO\_BROADCAST}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2060 Attiva o disattiva il \itindex{broadcast}
2061 \textit{broadcast}.\\
2062 \const{SO\_SNDBUF} &$\bullet$&$\bullet$& &\texttt{int}&
2063 Imposta dimensione del buffer di trasmissione.\\
2064 \const{SO\_RCVBUF} &$\bullet$&$\bullet$& &\texttt{int}&
2065 Imposta dimensione del buffer di ricezione.\\
2066 \const{SO\_LINGER} &$\bullet$&$\bullet$& &\texttt{linger}&
2067 Indugia nella chiusura con dati da spedire.\\
2068 \const{SO\_PRIORITY} &$\bullet$&$\bullet$& &\texttt{int}&
2069 Imposta la priorità del socket.\\
2070 \const{SO\_ERROR} &$\bullet$& & &\texttt{int}&
2071 Riceve e cancella gli errori pendenti.\\
2074 \caption{Le opzioni disponibili al livello \const{SOL\_SOCKET}.}
2075 \label{tab:sock_opt_socklevel}
2078 % TODO aggiungere e documentare SO_ATTACH_BPF, introdotta con il kernel 3.19,
2079 % vedi http://lwn.net/Articles/625224/
2080 % TODO aggiungere e documentare SO_INCOMING_CPU, introdotta con il kernel 3.19,
2081 % vedi https://lwn.net/Articles/626150/
2083 La tabella elenca le costanti che identificano le singole opzioni da usare
2084 come valore per \param{optname}; le due colonne seguenti indicano per quali
2085 delle due funzioni (\func{getsockopt} o \func{setsockopt}) l'opzione è
2086 disponibile, mentre la colonna successiva indica, quando di ha a che fare con
2087 un valore di \param{optval} intero, se l'opzione è da considerare un numero o
2088 un valore logico. Si è inoltre riportato sulla quinta colonna il tipo di dato
2089 usato per \param{optval} ed una breve descrizione del significato delle
2090 singole opzioni sulla sesta.
2092 Le descrizioni delle opzioni presenti in tab.~\ref{tab:sock_opt_socklevel}
2093 sono estremamente sommarie, è perciò necessario fornire un po' più di
2094 informazioni. Alcune opzioni inoltre hanno una notevole rilevanza nella
2095 gestione dei socket, e pertanto il loro utilizzo sarà approfondito
2096 separatamente in sez.~\ref{sec:sock_options_main}. Quello che segue è quindi
2097 soltanto un elenco più dettagliato della breve descrizione di
2098 tab.~\ref{tab:sock_opt_socklevel} sul significato delle varie opzioni:
2099 \begin{basedescript}{\desclabelwidth{2.5cm}\desclabelstyle{\nextlinelabel}}
2101 \item[\const{SO\_KEEPALIVE}] questa opzione abilita un meccanismo di verifica
2102 della persistenza di una connessione associata al socket (ed è pertanto
2103 effettiva solo sui socket che supportano le connessioni, ed è usata
2104 principalmente con il TCP). L'opzione utilizza per \param{optval} un intero
2105 usato come valore logico. Maggiori dettagli sul suo funzionamento sono
2106 forniti in sez.~\ref{sec:sock_options_main}.
2108 \item[\const{SO\_OOBINLINE}] se questa opzione viene abilitata i dati
2109 \itindex{out-of-band} \textit{out-of-band} vengono inviati direttamente nel
2110 flusso di dati del socket (e sono quindi letti con una normale \func{read})
2111 invece che restare disponibili solo per l'accesso con l'uso del flag
2112 \const{MSG\_OOB} di \func{recvmsg}. L'argomento è trattato in dettaglio in
2113 sez.~\ref{sec:TCP_urgent_data}. L'opzione funziona soltanto con socket che
2114 supportino i dati \itindex{out-of-band} \textit{out-of-band} (non ha senso
2115 per socket UDP ad esempio), ed utilizza per \param{optval} un intero usato
2118 \item[\const{SO\_RCVLOWAT}] questa opzione imposta il valore che indica il
2119 numero minimo di byte che devono essere presenti nel buffer di ricezione
2120 perché il kernel passi i dati all'utente, restituendoli ad una \func{read} o
2121 segnalando ad una \func{select} (vedi sez.~\ref{sec:TCP_sock_select}) che ci
2122 sono dati in ingresso. L'opzione utilizza per \param{optval} un intero che
2123 specifica il numero di byte, ma con Linux questo valore è sempre 1 e non può
2124 essere cambiato; \func{getsockopt} leggerà questo valore mentre
2125 \func{setsockopt} darà un errore di \errcode{ENOPROTOOPT}.
2127 \item[\const{SO\_SNDLOWAT}] questa opzione imposta il valore che indica il
2128 numero minimo di byte che devono essere presenti nel buffer di trasmissione
2129 perché il kernel li invii al protocollo successivo, consentendo ad una
2130 \func{write} di ritornare o segnalando ad una \func{select} (vedi
2131 sez.~\ref{sec:TCP_sock_select}) che è possibile eseguire una scrittura.
2132 L'opzione utilizza per \param{optval} un intero che specifica il numero di
2133 byte, come per la precedente \const{SO\_RCVLOWAT} con Linux questo valore è
2134 sempre 1 e non può essere cambiato; \func{getsockopt} leggerà questo valore
2135 mentre \func{setsockopt} darà un errore di \errcode{ENOPROTOOPT}.
2137 \item[\const{SO\_RCVTIMEO}] l'opzione permette di impostare un tempo massimo
2138 sulle operazioni di lettura da un socket, e prende per \param{optval} una
2139 struttura di tipo \struct{timeval} (vedi fig.~\ref{fig:sys_timeval_struct})
2140 identica a quella usata con \func{select}. Con \func{getsockopt} si può
2141 leggere il valore attuale, mentre con \func{setsockopt} si imposta il tempo
2142 voluto, usando un valore nullo per \struct{timeval} il timeout viene
2145 Se l'opzione viene attivata tutte le volte che una delle funzioni di lettura
2146 (\func{read}, \func{readv}, \func{recv}, \func{recvfrom} e \func{recvmsg})
2147 si blocca in attesa di dati per un tempo maggiore di quello impostato, essa
2148 ritornerà un valore -1 e la variabile \var{errno} sarà impostata con un
2149 errore di \errcode{EAGAIN} e \errcode{EWOULDBLOCK}, così come sarebbe
2150 avvenuto se si fosse aperto il socket in modalità non bloccante.\footnote{in
2151 teoria, se il numero di byte presenti nel buffer di ricezione fosse
2152 inferiore a quello specificato da \const{SO\_RCVLOWAT}, l'effetto potrebbe
2153 essere semplicemente quello di provocare l'uscita delle funzioni di
2154 lettura restituendo il numero di byte fino ad allora ricevuti; dato che
2155 con Linux questo valore è sempre 1 questo caso non esiste.}
2157 In genere questa opzione non è molto utilizzata se si ha a che fare con la
2158 lettura dei dati, in quanto è sempre possibile usare una \func{select} che
2159 consente di specificare un \textit{timeout}; l'uso di \func{select} non
2160 consente però di impostare il timeout per l'uso di \func{connect}, per avere
2161 il quale si può ricorrere a questa opzione.
2163 % TODO verificare il timeout con un programma di test
2165 \item[\const{SO\_SNDTIMEO}] l'opzione permette di impostare un tempo massimo
2166 sulle operazioni di scrittura su un socket, ed usa gli stessi valori di
2167 \const{SO\_RCVTIMEO}. In questo caso però si avrà un errore di
2168 \errcode{EAGAIN} o \errcode{EWOULDBLOCK} per le funzioni di scrittura
2169 \func{write}, \func{writev}, \func{send}, \func{sendto} e \func{sendmsg}
2170 qualora queste restino bloccate per un tempo maggiore di quello specificato.
2172 \item[\const{SO\_BSDCOMPAT}] questa opzione abilita la compatibilità con il
2173 comportamento di BSD (in particolare ne riproduce i bug). Attualmente è una
2174 opzione usata solo per il protocollo UDP e ne è prevista la rimozione in
2175 futuro. L'opzione utilizza per \param{optval} un intero usato come valore
2178 Quando viene abilitata gli errori riportati da messaggi ICMP per un socket
2179 UDP non vengono passati al programma in user space. Con le versioni 2.0.x
2180 del kernel erano anche abilitate altre opzioni per i socket raw, che sono
2181 state rimosse con il passaggio al 2.2; è consigliato correggere i programmi
2182 piuttosto che usare questa funzione.
2184 \item[\const{SO\_PASSCRED}] questa opzione abilita sui socket unix-domain
2185 (vedi sez.~\ref{sec:unix_socket}) la ricezione dei messaggi di controllo di
2186 tipo \const{SCM\_CREDENTIALS}. Prende come \param{optval} un intero usato
2189 \item[\const{SO\_PEERCRED}] questa opzione restituisce le credenziali del
2190 processo remoto connesso al socket; l'opzione è disponibile solo per socket
2191 unix-domain e può essere usata solo con \func{getsockopt}. Utilizza per
2192 \param{optval} una apposita struttura \struct{ucred} (vedi
2193 sez.~\ref{sec:unix_socket}).
2195 \item[\const{SO\_BINDTODEVICE}] questa opzione permette di \textsl{legare} il
2196 socket ad una particolare interfaccia, in modo che esso possa ricevere ed
2197 inviare pacchetti solo su quella. L'opzione richiede per \param{optval} il
2198 puntatore ad una stringa contenente il nome dell'interfaccia (ad esempio
2199 \texttt{eth0}); utilizzando una stringa nulla o un valore nullo per
2200 \param{optlen} si può rimuovere un precedente collegamento.
2202 Il nome della interfaccia deve essere specificato con una stringa terminata
2203 da uno zero e di lunghezza massima pari a \const{IFNAMSIZ}; l'opzione è
2204 effettiva solo per alcuni tipi di socket, ed in particolare per quelli della
2205 famiglia \const{AF\_INET}; non è invece supportata per i \textit{packet
2206 socket} (vedi sez.~\ref{sec:socket_raw}).
2208 \item[\const{SO\_DEBUG}] questa opzione abilita il debugging delle operazioni
2209 dei socket; l'opzione utilizza per \param{optval} un intero usato come
2210 valore logico, e può essere utilizzata solo da un processo con i privilegi
2211 di amministratore (in particolare con la \itindex{capabilities}
2212 \textit{capability} \const{CAP\_NET\_ADMIN}). L'opzione necessita inoltre
2213 dell'opportuno supporto nel kernel;\footnote{deve cioè essere definita la
2214 macro di preprocessore \macro{SOCK\_DEBUGGING} nel file
2215 \file{include/net/sock.h} dei sorgenti del kernel, questo è sempre vero
2216 nei kernel delle serie superiori alla 2.3, per i kernel delle serie
2217 precedenti invece è necessario aggiungere a mano detta definizione; è
2218 inoltre possibile abilitare anche il tracciamento degli stati del TCP
2219 definendo la macro \macro{STATE\_TRACE} in \file{include/net/tcp.h}.}
2220 quando viene abilitata una serie di messaggi con le informazioni di debug
2221 vengono inviati direttamente al sistema del kernel log.\footnote{si tenga
2222 presente che il comportamento è diverso da quanto avviene con BSD, dove
2223 l'opzione opera solo sui socket TCP, causando la scrittura di tutti i
2224 pacchetti inviati sulla rete su un buffer circolare che viene letto da un
2225 apposito programma, \cmd{trpt}.}
2227 \item[\const{SO\_REUSEADDR}] questa opzione permette di eseguire la funzione
2228 \func{bind} su indirizzi locali che siano già in uso da altri socket;
2229 l'opzione utilizza per \param{optval} un intero usato come valore logico.
2230 Questa opzione modifica il comportamento normale dell'interfaccia dei socket
2231 che fa fallire l'esecuzione della funzione \func{bind} con un errore di
2232 \errcode{EADDRINUSE} quando l'indirizzo locale\footnote{più propriamente il
2233 controllo viene eseguito sulla porta.} è già in uso da parte di un altro
2234 socket. Maggiori dettagli sul suo funzionamento sono forniti in
2235 sez.~\ref{sec:sock_options_main}.
2237 \item[\const{SO\_TYPE}] questa opzione permette di leggere il tipo di socket
2238 su cui si opera; funziona solo con \func{getsockopt}, ed utilizza per
2239 \param{optval} un intero in cui verrà restituito il valore numerico che lo
2240 identifica (ad esempio \const{SOCK\_STREAM}).
2242 \item[\const{SO\_ACCEPTCONN}] questa opzione permette di rilevare se il socket
2243 su cui opera è stato posto in modalità di ricezione di eventuali connessioni
2244 con una chiamata a \func{listen}. L'opzione può essere usata soltanto con
2245 \func{getsockopt} e utilizza per \param{optval} un intero in cui viene
2246 restituito 1 se il socket è in ascolto e 0 altrimenti.
2248 \item[\const{SO\_DONTROUTE}] questa opzione forza l'invio diretto dei
2249 pacchetti del socket, saltando ogni processo relativo all'uso della tabella
2250 di routing del kernel. Prende per \param{optval} un intero usato come valore
2253 \item[\const{SO\_BROADCAST}] questa opzione abilita il \itindex{broadcast}
2254 \textit{broadcast}; quanto abilitata i socket di tipo \const{SOCK\_DGRAM}
2255 riceveranno i pacchetti inviati all'indirizzo di \textit{broadcast}, e
2256 potranno scrivere pacchetti su tale indirizzo. Prende per \param{optval} un
2257 intero usato come valore logico. L'opzione non ha effetti su un socket di
2258 tipo \const{SOCK\_STREAM}.
2260 \item[\const{SO\_SNDBUF}] questa opzione imposta la dimensione del buffer di
2261 trasmissione del socket. Prende per \param{optval} un intero indicante il
2262 numero di byte. Il valore di default ed il valore massimo che si possono
2263 specificare come argomento per questa opzione sono impostabili
2264 rispettivamente tramite gli opportuni valori di \func{sysctl} (vedi
2265 sez.~\ref{sec:sock_sysctl}).
2267 \item[\const{SO\_RCVBUF}] questa opzione imposta la dimensione del buffer di
2268 ricezione del socket. Prende per \param{optval} un intero indicante il
2269 numero di byte. Il valore di default ed il valore massimo che si può
2270 specificare come argomento per questa opzione sono impostabili tramiti gli
2271 opportuni valori di \func{sysctl} (vedi sez.~\ref{sec:sock_sysctl}).
2273 Si tenga presente che nel caso di socket TCP, per entrambe le opzioni
2274 \const{SO\_RCVBUF} e \const{SO\_SNDBUF}, il kernel alloca effettivamente una
2275 quantità di memoria doppia rispetto a quanto richiesto con
2276 \func{setsockopt}. Questo comporta che una successiva lettura con
2277 \func{getsockopt} riporterà un valore diverso da quello impostato con
2278 \func{setsockopt}. Questo avviene perché TCP necessita dello spazio in più
2279 per mantenere dati amministrativi e strutture interne, e solo una parte
2280 viene usata come buffer per i dati, mentre il valore letto da
2281 \func{getsockopt} e quello riportato nei vari parametri di
2282 \textit{sysctl}\footnote{cioè \sysctlrelfile{net/core}{wmem\_max} e
2283 \sysctlrelfile{net/core}{rmem\_max} in \texttt{/proc/sys/net/core}
2284 e \sysctlrelfile{net/ipv4}{tcp\_wmem} e
2285 \sysctlrelfile{net/ipv4}{tcp\_rmem} in
2286 \texttt{/proc/sys/net/ipv4}, vedi sez.~\ref{sec:sock_sysctl}.} indica la
2287 memoria effettivamente impiegata. Si tenga presente inoltre che le
2288 modifiche alle dimensioni dei buffer di ricezione e trasmissione, per poter
2289 essere effettive, devono essere impostate prima della chiamata alle funzioni
2290 \func{listen} o \func{connect}.
2292 \item[\const{SO\_LINGER}] questa opzione controlla le modalità con cui viene
2293 chiuso un socket quando si utilizza un protocollo che supporta le
2294 connessioni (è pertanto usata con i socket TCP ed ignorata per UDP) e
2295 modifica il comportamento delle funzioni \func{close} e \func{shutdown}.
2296 L'opzione richiede che l'argomento \param{optval} sia una struttura di tipo
2297 \struct{linger}, definita in \headfile{sys/socket.h} ed illustrata in
2298 fig.~\ref{fig:sock_linger_struct}. Maggiori dettagli sul suo funzionamento
2299 sono forniti in sez.~\ref{sec:sock_options_main}.
2301 \item[\const{SO\_PRIORITY}] questa opzione permette di impostare le priorità
2302 per tutti i pacchetti che sono inviati sul socket, prende per \param{optval}
2303 un valore intero. Con questa opzione il kernel usa il valore per ordinare le
2304 priorità sulle code di rete,\footnote{questo richiede che sia abilitato il
2305 sistema di \textit{Quality of Service} disponibile con le opzioni di
2306 routing avanzato.} i pacchetti con priorità più alta vengono processati
2307 per primi, in modalità che dipendono dalla disciplina di gestione della
2308 coda. Nel caso di protocollo IP questa opzione permette anche di impostare i
2309 valori del campo \textit{type of service} (noto come TOS, vedi
2310 sez.~\ref{sec:IP_header}) per i pacchetti uscenti. Per impostare una
2311 priorità al di fuori dell'intervallo di valori fra 0 e 6 sono richiesti i
2312 privilegi di amministratore con la \itindex{capabilities} capability
2313 \const{CAP\_NET\_ADMIN}.
2315 \item[\const{SO\_ERROR}] questa opzione riceve un errore presente sul socket;
2316 può essere utilizzata soltanto con \func{getsockopt} e prende per
2317 \param{optval} un valore intero, nel quale viene restituito il codice di
2318 errore, e la condizione di errore sul socket viene cancellata. Viene
2319 usualmente utilizzata per ricevere il codice di errore, come accennato in
2320 sez.~\ref{sec:TCP_sock_select}, quando si sta osservando il socket con una
2321 \func{select} che ritorna a causa dello stesso.
2323 \item[\const{SO\_ATTACH\_FILTER}] questa opzione permette di agganciare ad un
2324 socket un filtro di pacchetti che consente di selezionare quali pacchetti,
2325 fra tutti quelli ricevuti, verranno letti. Viene usato principalmente con i
2326 socket di tipo \const{PF\_PACKET} con la libreria \texttt{libpcap} per
2327 implementare programmi di cattura dei pacchetti, torneremo su questo in
2328 sez.~\ref{sec:packet_socket}.
2330 \item[\const{SO\_DETACH\_FILTER}] consente di distaccare un filtro
2331 precedentemente aggiunto ad un socket.
2333 % TODO documentare SO_ATTACH_FILTER e SO_DETACH_FILTER
2334 % riferimenti http://www.rcpt.to/lsfcc/lsf.html
2335 % Documentation/networking/filter.txt
2337 % TODO documentare SO_MARK, introdotta nel 2.6.25, richiede CAP_NET_ADMIN
2338 %A userspace program may wish to set the mark for each packets its send
2339 %without using the netfilter MARK target. Changing the mark can be used
2340 %for mark based routing without netfilter or for packet filtering.
2343 % TODO documentare SO_TIMESTAMP e le altre opzioni di timestamping dei
2344 % pacchetti, introdotte nel 2.6.30, vedi nei sorgenti del kernel:
2345 % Documentation/networking/timestamping.txt
2348 % TOFO documentare SO_REUSEPORT introdotta con il kernel 3.9, vedi
2349 % http://git.kernel.org/linus/c617f398edd4db2b8567a28e899a88f8f574798d
2354 \subsection{L'uso delle principali opzioni dei socket}
2355 \label{sec:sock_options_main}
2357 La descrizione sintetica del significato delle opzioni generiche dei socket,
2358 riportata nell'elenco in sez.~\ref{sec:sock_generic_options}, è
2359 necessariamente sintetica, alcune di queste però possono essere utilizzate
2360 per controllare delle funzionalità che hanno una notevole rilevanza nella
2361 programmazione dei socket. Per questo motivo faremo in questa sezione un
2362 approfondimento sul significato delle opzioni generiche più importanti.
2365 \index{costante!{SO\_KEEPALIVE}@{{\tt {SO\_KEEPALIVE}}}|(}
2366 \subsubsection{L'opzione \const{SO\_KEEPALIVE}}
2368 La prima opzione da approfondire è \const{SO\_KEEPALIVE} che permette di
2369 tenere sotto controllo lo stato di una connessione. Una connessione infatti
2370 resta attiva anche quando non viene effettuato alcun traffico su di essa; è
2371 allora possibile, in caso di una interruzione completa della rete, che la
2372 caduta della connessione non venga rilevata, dato che sulla stessa non passa
2373 comunque alcun traffico.
2375 Se si imposta questa opzione, è invece cura del kernel inviare degli appositi
2376 messaggi sulla rete, detti appunto \textit{keep-alive}, per verificare se la
2377 connessione è attiva. L'opzione funziona soltanto con i socket che supportano
2378 le connessioni (non ha senso per socket UDP ad esempio) e si applica
2379 principalmente ai socket TCP.
2381 Con le impostazioni di default (che sono riprese da BSD) Linux emette un
2382 messaggio di \textit{keep-alive}\footnote{in sostanza un segmento ACK vuoto,
2383 cui sarà risposto con un altro segmento ACK vuoto.} verso l'altro capo della
2384 connessione se questa è rimasta senza traffico per più di due ore. Se è tutto
2385 a posto il messaggio viene ricevuto e verrà emesso un segmento ACK di
2386 risposta, alla cui ricezione ripartirà un altro ciclo di attesa per altre due
2387 ore di inattività; il tutto avviene all'interno del kernel e le applicazioni
2388 non riceveranno nessun dato.
2390 Qualora ci siano dei problemi di rete si possono invece verificare i due casi
2391 di terminazione precoce del server già illustrati in
2392 sez.~\ref{sec:TCP_conn_crash}. Il primo è quello in cui la macchina remota ha
2393 avuto un crollo del sistema ed è stata riavviata, per cui dopo il riavvio la
2394 connessione non esiste più.\footnote{si ricordi che un normale riavvio o il
2395 crollo dell'applicazione non ha questo effetto, in quanto in tal caso si
2396 passa sempre per la chiusura del processo, e questo, come illustrato in
2397 sez.~\ref{sec:file_open_close}, comporta anche la regolare chiusura del
2398 socket con l'invio di un segmento FIN all'altro capo della connessione.} In
2399 questo caso all'invio del messaggio di \textit{keep-alive} si otterrà come
2400 risposta un segmento RST che indica che l'altro capo non riconosce più
2401 l'esistenza della connessione ed il socket verrà chiuso riportando un errore
2402 di \errcode{ECONNRESET}.
2404 Se invece non viene ricevuta nessuna risposta (indice che la macchina non è
2405 più raggiungibile) l'emissione dei messaggi viene ripetuta ad intervalli di 75
2406 secondi per un massimo di 9 volte\footnote{entrambi questi valori possono
2407 essere modificati a livello di sistema (cioè per tutti i socket) con gli
2408 opportuni parametri illustrati in sez.~\ref{sec:sock_sysctl} ed a livello di
2409 singolo socket con le opzioni \texttt{TCP\_KEEP*} di
2410 sez.~\ref{sec:sock_tcp_udp_options}.} (per un totale di 11 minuti e 15
2411 secondi) dopo di che, se non si è ricevuta nessuna risposta, il socket viene
2412 chiuso dopo aver impostato un errore di \errcode{ETIMEDOUT}. Qualora la
2413 connessione si sia ristabilita e si riceva un successivo messaggio di risposta
2414 il ciclo riparte come se niente fosse avvenuto. Infine se si riceve come
2415 risposta un pacchetto ICMP di destinazione irraggiungibile (vedi
2416 sez.~\ref{sec:ICMP_protocol}), verrà restituito l'errore corrispondente.
2418 In generale questa opzione serve per individuare una caduta della connessione
2419 anche quando non si sta facendo traffico su di essa. Viene usata
2420 principalmente sui server per evitare di mantenere impegnate le risorse che
2421 verrebbero dedicate a trattare delle connessioni che in realtà sono già
2422 terminate (quelle che vengono anche chiamate connessioni
2423 \textsl{semi-aperte}); in tutti quei casi cioè in cui il server si trova in
2424 attesa di dati in ingresso su una connessione che non arriveranno mai o perché
2425 il client sull'altro capo non è più attivo o perché non è più in grado di
2426 comunicare con il server via rete.
2428 \begin{figure}[!htbp]
2429 \footnotesize \centering
2430 \begin{minipage}[c]{\codesamplewidth}
2431 \includecodesample{listati/TCP_echod_fourth.c}
2434 \caption{La sezione della nuova versione del server del servizio
2435 \textit{echo} che prevede l'attivazione del \textit{keepalive} sui
2437 \label{fig:echod_keepalive_code}
2440 Abilitandola dopo un certo tempo le connessioni effettivamente terminate
2441 verranno comunque chiuse per cui, utilizzando ad esempio una \func{select}, se
2442 be potrà rilevare la conclusione e ricevere il relativo errore. Si tenga
2443 presente però che non può avere la certezza assoluta che un errore di
2444 \errcode{ETIMEDOUT} ottenuto dopo aver abilitato questa opzione corrisponda
2445 necessariamente ad una reale conclusione della connessione, il problema
2446 potrebbe anche essere dovuto ad un problema di routing che perduri per un
2447 tempo maggiore di quello impiegato nei vari tentativi di ritrasmissione del
2448 \textit{keep-alive} (anche se questa non è una condizione molto probabile).
2450 Come esempio dell'utilizzo di questa opzione introduciamo all'interno del
2451 nostro server per il servizio \textit{echo} la nuova opzione \texttt{-k} che
2452 permette di attivare il \textit{keep-alive} sui socket; tralasciando la parte
2453 relativa alla gestione di detta opzione (che si limita ad assegnare ad 1 la
2454 variabile \var{keepalive}) tutte le modifiche al server sono riportate in
2455 fig.~\ref{fig:echod_keepalive_code}. Al solito il codice completo è contenuto
2456 nel file \texttt{TCP\_echod\_fourth.c} dei sorgenti allegati alla guida.
2458 Come si può notare la variabile \var{keepalive} è preimpostata (\texttt{\small
2459 8}) ad un valore nullo; essa viene utilizzata sia come variabile logica per
2460 la condizione (\texttt{\small 14}) che controlla l'attivazione del
2461 \textit{keep-alive} che come valore dell'argomento \param{optval} della
2462 chiamata a \func{setsockopt} (\texttt{\small 16}). A seconda del suo valore
2463 tutte le volte che un processo figlio viene eseguito in risposta ad una
2464 connessione verrà pertanto eseguita o meno la sezione (\texttt{\small 14--17})
2465 che esegue l'impostazione di \const{SO\_KEEPALIVE} sul socket connesso,
2466 attivando il relativo comportamento.
2467 \index{costante!{SO\_KEEPALIVE}@{{\tt {SO\_KEEPALIVE}}}|)}
2471 \index{costante!{SO\_REUSEADDR}@{{\tt {SO\_REUSEADDR}}}|(}
2472 \subsubsection{L'opzione \const{SO\_REUSEADDR}}
2474 La seconda opzione da approfondire è \const{SO\_REUSEADDR}, che consente di
2475 eseguire \func{bind} su un socket anche quando la porta specificata è già in
2476 uso da parte di un altro socket. Si ricordi infatti che, come accennato in
2477 sez.~\ref{sec:TCP_func_bind}, normalmente la funzione \func{bind} fallisce con
2478 un errore di \errcode{EADDRINUSE} se la porta scelta è già utilizzata da un
2479 altro socket, proprio per evitare che possano essere lanciati due server sullo
2480 stesso indirizzo e la stessa porta, che verrebbero a contendersi i pacchetti
2481 aventi quella destinazione.
2483 Esistono però situazioni ed esigenze particolari in cui non si vuole che
2484 questo comportamento di salvaguardia accada, ed allora si può fare ricorso a
2485 questa opzione. La questione è comunque abbastanza complessa in quanto, come
2486 sottolinea Stevens in \cite{UNP1}, si distinguono ben quattro casi diversi in
2487 cui è prevista la possibilità di un utilizzo di questa opzione, il che la
2488 rende una delle più difficili da capire.
2490 Il primo caso, che è anche il più comune, in cui si fa ricorso a
2491 \const{SO\_REUSEADDR} è quello in cui un server è terminato ma esistono ancora
2492 dei processi figli che mantengono attiva almeno una connessione remota che
2493 utilizza l'indirizzo locale, mantenendo occupata la porta. Quando si riesegue
2494 il server allora questo riceve un errore sulla chiamata a \func{bind} dato che
2495 la porta è ancora utilizzata in una connessione esistente.\footnote{questa è
2496 una delle domande più frequenti sui newsgroup dedicati allo sviluppo, in
2497 quanto è piuttosto comune trovarsi in questa situazione quando si sta
2498 sviluppando un server che si ferma e si riavvia in continuazione dopo aver
2499 fatto modifiche.} Inoltre se si usa il protocollo TCP questo può avvenire
2500 anche dopo tutti i processi figli sono terminati, dato che una connessione può
2501 restare attiva anche dopo la chiusura del socket, mantenendosi nello stato
2502 \texttt{TIME\_WAIT} (vedi sez.~\ref{sec:TCP_time_wait}).
2504 Usando \const{SO\_REUSEADDR} fra la chiamata a \func{socket} e quella a
2505 \func{bind} si consente a quest'ultima di avere comunque successo anche se la
2506 connessione è attiva (o nello stato \texttt{TIME\_WAIT}). È bene però
2507 ricordare (si riveda quanto detto in sez.~\ref{sec:TCP_time_wait}) che la
2508 presenza dello stato \texttt{TIME\_WAIT} ha una ragione, ed infatti se si usa
2509 questa opzione esiste sempre una probabilità, anche se estremamente
2510 remota,\footnote{perché ciò avvenga infatti non solo devono coincidere gli
2511 indirizzi IP e le porte degli estremi della nuova connessione, ma anche i
2512 numeri di sequenza dei pacchetti, e questo è estremamente improbabile.} che
2513 eventuali pacchetti rimasti intrappolati in una precedente connessione possano
2514 finire fra quelli di una nuova.
2516 Come esempio di uso di questa connessione abbiamo predisposto una nuova
2517 versione della funzione \texttt{sockbind} (vedi fig.~\ref{fig:sockbind_code})
2518 che consenta l'impostazione di questa opzione. La nuova funzione è
2519 \texttt{sockbindopt}, e le principali differenze rispetto alla precedente sono
2520 illustrate in fig.~\ref{fig:sockbindopt_code}, dove si sono riportate le
2521 sezioni di codice modificate rispetto alla versione precedente. Il codice
2522 completo della funzione si trova, insieme alle altre funzioni di servizio dei
2523 socket, all'interno del file \texttt{SockUtils.c} dei sorgenti allegati alla
2526 \begin{figure}[!htbp]
2527 \footnotesize \centering
2528 \begin{minipage}[c]{\codesamplewidth}
2529 \includecodesample{listati/sockbindopt.c}
2532 \caption{Le sezioni della funzione \texttt{sockbindopt} modificate rispetto al
2533 codice della precedente \texttt{sockbind}.}
2534 \label{fig:sockbindopt_code}
2537 In realtà tutto quello che si è fatto è stato introdurre nella nuova funzione
2538 (\texttt{\small 1}) un nuovo argomento intero, \param{reuse}, che conterrà il
2539 valore logico da usare nella successiva chiamata (\texttt{\small 14}) a
2540 \func{setsockopt}. Si è poi aggiunta una sezione (\texttt{\small 13--17}) che
2541 esegue l'impostazione dell'opzione fra la chiamata a \func{socket} e quella a
2545 A questo punto basterà modificare il server per utilizzare la nuova
2546 funzione; in fig.~\ref{fig:TCP_echod_fifth} abbiamo riportato le sezioni
2547 modificate rispetto alla precedente versione di
2548 fig.~\ref{fig:TCP_echod_third}. Al solito il codice completo è coi sorgenti
2549 allegati alla guida, nel file \texttt{TCP\_echod\_fifth.c}.
2551 Anche in questo caso si è introdotta (\texttt{\small 8}) una nuova variabile
2552 \var{reuse} che consente di controllare l'uso dell'opzione e che poi sarà
2553 usata (\texttt{\small 14}) come ultimo argomento di \func{setsockopt}. Il
2554 valore di default di questa variabile è nullo, ma usando l'opzione \texttt{-r}
2555 nell'invocazione del server (al solito la gestione delle opzioni non è
2556 riportata in fig.~\ref{fig:TCP_echod_fifth}) se ne potrà impostare ad 1 il
2557 valore, per cui in tal caso la successiva chiamata (\texttt{\small 13--17}) a
2558 \func{setsockopt} attiverà l'opzione \const{SO\_REUSEADDR}.
2560 \begin{figure}[!htbp]
2561 \footnotesize \centering
2562 \begin{minipage}[c]{\codesamplewidth}
2563 \includecodesample{listati/TCP_echod_fifth.c}
2566 \caption{Il nuovo codice per l'apertura passiva del server \textit{echo} che
2567 usa la nuova funzione \texttt{sockbindopt}.}
2568 \label{fig:TCP_echod_fifth}
2571 Il secondo caso in cui viene usata \const{SO\_REUSEADDR} è quando si ha una
2572 macchina cui sono assegnati diversi numeri IP (o come suol dirsi
2573 \textit{multi-homed}) e si vuole porre in ascolto sulla stessa porta un
2574 programma diverso (o una istanza diversa dello stesso programma) per indirizzi
2575 IP diversi. Si ricordi infatti che è sempre possibile indicare a \func{bind}
2576 di collegarsi solo su di un indirizzo specifico; in tal caso se un altro
2577 programma cerca di riutilizzare la stessa porta (anche specificando un
2578 indirizzo diverso) otterrà un errore, a meno di non aver preventivamente
2579 impostato \const{SO\_REUSEADDR}.
2581 Usando questa opzione diventa anche possibile eseguire \func{bind}
2582 sull'indirizzo generico, e questo permetterà il collegamento per tutti gli
2583 indirizzi (di quelli presenti) per i quali la porta non risulti occupata da
2584 una precedente chiamata più specifica. Infine si tenga presente che con il
2585 protocollo TCP non è mai possibile far partire server che eseguano \func{bind}
2586 sullo stesso indirizzo e la stessa porta, cioè ottenere quello che viene
2587 chiamato un \textit{completely duplicate binding}.
2589 Il terzo impiego è simile al precedente e prevede l'uso di \func{bind}
2590 all'interno dello stesso programma per associare indirizzi locali diversi a
2591 socket diversi. In genere questo viene fatto per i socket UDP quando è
2592 necessario ottenere l'indirizzo a cui sono rivolte le richieste del client ed
2593 il sistema non supporta l'opzione \const{IP\_RECVDSTADDR};\footnote{nel caso
2594 di Linux questa opzione è stata supportata per in certo periodo nello
2595 sviluppo del kernel 2.1.x, ma è in seguito stata soppiantata dall'uso di
2596 \const{IP\_PKTINFO} (vedi sez.~\ref{sec:sock_ipv4_options}).} in tale modo
2597 si può sapere a quale socket corrisponde un certo indirizzo. Non ha senso
2598 fare questa operazione per un socket TCP dato che su di essi si può sempre
2599 invocare \func{getsockname} una volta che si è completata la connessione.
2601 Infine il quarto caso è quello in cui si vuole effettivamente ottenere un
2602 \textit{completely duplicate binding}, quando cioè si vuole eseguire
2603 \func{bind} su un indirizzo ed una porta che sono già \textsl{legati} ad un
2604 altro socket. Questo ovviamente non ha senso per il normale traffico di rete,
2605 in cui i pacchetti vengono scambiati direttamente fra due applicazioni; ma
2606 quando un sistema supporta il traffico in \itindex{multicast}
2607 \textit{multicast}, in cui una applicazione invia i pacchetti a molte altre
2608 (vedi sez.~\ref{sec:xxx_multicast}), allora ha senso che su una macchina i
2609 pacchetti provenienti dal traffico in \itindex{multicast} \textit{multicast}
2610 possano essere ricevuti da più applicazioni\footnote{l'esempio classico di
2611 traffico in \textit{multicast} è quello di uno streaming di dati (audio,
2612 video, ecc.), l'uso del \textit{multicast} consente in tal caso di
2613 trasmettere un solo pacchetto, che potrà essere ricevuto da tutti i
2614 possibili destinatari (invece di inviarne un duplicato a ciascuno); in
2615 questo caso è perfettamente logico aspettarsi che sulla stessa macchina più
2616 utenti possano lanciare un programma che permetta loro di ricevere gli
2617 stessi dati.} o da diverse istanze della stessa applicazione.
2620 In questo caso utilizzando \const{SO\_REUSEADDR} si consente ad una
2621 applicazione eseguire \func{bind} sulla stessa porta ed indirizzo usata da
2622 un'altra, così che anche essa possa ricevere gli stessi pacchetti (chiaramente
2623 la cosa non ha alcun senso per i socket TCP, ed infatti in questo tipo di
2624 applicazione è normale l'uso del protocollo UDP). La regola è che quando si
2625 hanno più applicazioni che hanno eseguito \func{bind} sulla stessa porta, di
2626 tutti pacchetti destinati ad un indirizzo di \itindex{broadcast}
2627 \textit{broadcast} o di \itindex{multicast} \textit{multicast} viene inviata
2628 una copia a ciascuna applicazione. Non è definito invece cosa accade qualora
2629 il pacchetto sia destinato ad un indirizzo normale (unicast).
2631 Essendo questo un caso particolare in alcuni sistemi (come BSD) è stata
2632 introdotta una opzione ulteriore, \const{SO\_REUSEPORT} che richiede che detta
2633 opzione sia specificata per tutti i socket per i quali si vuole eseguire il
2634 \textit{completely duplicate binding}. Nel caso di Linux questa opzione non
2635 esisteva fino al kernel 3.9, ma il comportamento di \const{SO\_REUSEADDR} è
2636 analogo, sarà cioè possibile effettuare un \textit{completely duplicate
2637 binding} ed ottenere il successo di \func{bind} su un socket legato allo
2638 stesso indirizzo e porta solo se il programma che ha eseguito per primo
2639 \func{bind} su di essi ha impostato questa opzione.\footnote{questa
2640 restrizione permette di evitare parzialmente il cosiddetto \textit{port
2641 stealing}, in cui un programma, usando \const{SO\_REUSEADDR}, può
2642 collegarsi ad una porta già in uso e ricevere i pacchetti destinati ad un
2643 altro programma; con questa caratteristica ciò è possibile soltanto se il
2644 primo programma a consentirlo, avendo usato fin dall'inizio
2645 \const{SO\_REUSEADDR}.}
2647 % TODO documentare SO_REUSEPORT, vedi https://lwn.net/Articles/542260/
2650 \index{costante!{SO\_REUSEADDR}@{{\tt {SO\_REUSEADDR}}}|)}
2652 \index{costante!{SO\_LINGER}@{{\tt {SO\_LINGER}}}|(}
2653 \subsubsection{L'opzione \const{SO\_LINGER}}
2655 La terza opzione da approfondire è \const{SO\_LINGER}; essa, come il nome
2656 suggerisce, consente di ``\textsl{indugiare}'' nella chiusura di un socket. Il
2657 comportamento standard sia di \func{close} che \func{shutdown} è infatti
2658 quello di terminare immediatamente dopo la chiamata, mentre il procedimento di
2659 chiusura della connessione (o di un lato di essa) ed il rispettivo invio sulla
2660 rete di tutti i dati ancora presenti nei buffer, viene gestito in sottofondo
2663 \begin{figure}[!htb]
2664 \footnotesize \centering
2665 \begin{minipage}[c]{\textwidth}
2666 \includestruct{listati/linger.h}
2668 \caption{La struttura \structd{linger} richiesta come valore dell'argomento
2669 \param{optval} per l'impostazione dell'opzione dei socket
2670 \const{SO\_LINGER}.}
2671 \label{fig:sock_linger_struct}
2674 L'uso di \const{SO\_LINGER} con \func{setsockopt} permette di modificare (ed
2675 eventualmente ripristinare) questo comportamento in base ai valori passati nei
2676 campi della struttura \struct{linger}, illustrata in
2677 fig.~\ref{fig:sock_linger_struct}. Fintanto che il valore del campo
2678 \var{l\_onoff} di \struct{linger} è nullo la modalità che viene impostata
2679 (qualunque sia il valore di \var{l\_linger}) è quella standard appena
2680 illustrata; questa combinazione viene utilizzata per riportarsi al
2681 comportamento normale qualora esso sia stato cambiato da una precedente
2684 Se si utilizza un valore di \var{l\_onoff} diverso da zero, il comportamento
2685 alla chiusura viene a dipendere dal valore specificato per il campo
2686 \var{l\_linger}; se quest'ultimo è nullo l'uso delle funzioni \func{close} e
2687 \func{shutdown} provoca la terminazione immediata della connessione: nel caso
2688 di TCP cioè non viene eseguito il procedimento di chiusura illustrato in
2689 sez.~\ref{sec:TCP_conn_term}, ma tutti i dati ancora presenti nel buffer
2690 vengono immediatamente scartati e sulla rete viene inviato un segmento di RST
2691 che termina immediatamente la connessione.
2693 Un esempio di questo comportamento si può abilitare nel nostro client del
2694 servizio \textit{echo} utilizzando l'opzione \texttt{-r}; riportiamo in
2695 fig.~\ref{fig:TCP_echo_sixth} la sezione di codice che permette di introdurre
2696 questa funzionalità,; al solito il codice completo è disponibile nei sorgenti
2699 \begin{figure}[!htbp]
2700 \footnotesize \centering
2701 \begin{minipage}[c]{\codesamplewidth}
2702 \includecodesample{listati/TCP_echo_sixth.c}
2705 \caption{La sezione del codice del client \textit{echo} che imposta la
2706 terminazione immediata della connessione in caso di chiusura.}
2707 \label{fig:TCP_echo_sixth}
2710 La sezione indicata viene eseguita dopo aver effettuato la connessione e prima
2711 di chiamare la funzione di gestione, cioè fra le righe (\texttt{\small 12}) e
2712 (\texttt{\small 13}) del precedente esempio di fig.~\ref{fig:TCP_echo_fifth}.
2713 Il codice si limita semplicemente a controllare (\texttt{\small 3}) il
2714 valore della variabile \var{reset} che assegnata nella gestione delle opzioni
2715 in corrispondenza all'uso di \texttt{-r} nella chiamata del client. Nel caso
2716 questa sia diversa da zero vengono impostati (\texttt{\small 5--6}) i valori
2717 della struttura \var{ling} che permettono una terminazione immediata della
2718 connessione. Questa viene poi usata nella successiva (\texttt{\small 7})
2719 chiamata a \func{setsockopt}. Al solito si controlla (\texttt{\small 7--10})
2720 il valore di ritorno e si termina il programma in caso di errore, stampandone
2723 Infine l'ultima possibilità, quella in cui si utilizza effettivamente
2724 \const{SO\_LINGER} per \textsl{indugiare} nella chiusura, è quella in cui sia
2725 \var{l\_onoff} che \var{l\_linger} hanno un valore diverso da zero. Se si
2726 esegue l'impostazione con questi valori sia \func{close} che \func{shutdown}
2727 si bloccano, nel frattempo viene eseguita la normale procedura di conclusione
2728 della connessione (quella di sez.~\ref{sec:TCP_conn_term}) ma entrambe le
2729 funzioni non ritornano fintanto che non si sia concluso il procedimento di
2730 chiusura della connessione, o non sia passato un numero di
2731 secondi\footnote{questa è l'unità di misura indicata da POSIX ed adottata da
2732 Linux, altri kernel possono usare unità di misura diverse, oppure usare il
2733 campo \var{l\_linger} come valore logico (ignorandone il valore) per rendere
2734 (quando diverso da zero) \func{close} e \func{shutdown} bloccanti fino al
2735 completamento della trasmissione dei dati sul buffer.} pari al valore
2736 specificato in \var{l\_linger}.
2738 \index{costante!{SO\_LINGER}@{{\tt {SO\_LINGER}}}|)}
2742 \subsection{Le opzioni per il protocollo IPv4}
2743 \label{sec:sock_ipv4_options}
2745 Il secondo insieme di opzioni dei socket che tratteremo è quello relativo ai
2746 socket che usano il protocollo IPv4.\footnote{come per le precedenti opzioni
2747 generiche una descrizione di esse è disponibile nella settima sezione delle
2748 pagine di manuale, nel caso specifico la documentazione si può consultare
2749 con \texttt{man 7 ip}.} Se si vuole operare su queste opzioni generiche il
2750 livello da utilizzare è \const{SOL\_IP} (o l'equivalente \const{IPPROTO\_IP});
2751 si è riportato un elenco di queste opzioni in tab.~\ref{tab:sock_opt_iplevel}.
2752 Le costanti indicanti le opzioni e tutte le altre costanti ad esse collegate
2753 sono definite in \headfile{netinet/ip.h}, ed accessibili includendo detto
2759 \begin{tabular}[c]{|l|c|c|c|l|l|}
2761 \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
2762 \textbf{Descrizione}\\
2765 \const{IP\_OPTIONS} &$\bullet$&$\bullet$&&\texttt{void *}& %???
2766 Imposta o riceve le opzioni di IP.\\
2767 \const{IP\_PKTINFO} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2768 Passa un messaggio di informazione.\\
2769 \const{IP\_RECVTOS} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2770 Passa un messaggio col campo TOS.\\
2771 \const{IP\_RECVTTL} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2772 Passa un messaggio col campo TTL.\\
2773 \const{IP\_RECVOPTS} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2774 Passa un messaggio con le opzioni IP.\\
2775 \const{IP\_RETOPTS} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2776 Passa un messaggio con le opzioni IP non trattate.\\
2777 \const{IP\_TOS} &$\bullet$&$\bullet$& &\texttt{int}&
2778 Imposta il valore del campo TOS.\\
2779 \const{IP\_TTL} &$\bullet$&$\bullet$& &\texttt{int}&
2780 Imposta il valore del campo TTL.\\
2781 \const{IP\_MINTTL} &$\bullet$&$\bullet$& &\texttt{int}&
2782 Imposta il valore minimo del TTL per i pacchetti accettati.\\
2783 \const{IP\_HDRINCL} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2784 Passa l'intestazione di IP nei dati.\\
2785 \const{IP\_RECVERR} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2786 Abilita la gestione degli errori.\\
2787 \const{IP\_MTU\_DISCOVER} &$\bullet$&$\bullet$& &\texttt{int}&
2788 Imposta il Path MTU \itindex{Maximum~Transfer~Unit~(MTU)} Discovery.\\
2789 \const{IP\_MTU} &$\bullet$& & &\texttt{int}&
2790 Legge il valore attuale della \itindex{Maximum~Transfer~Unit~(MTU)} MTU.\\
2791 \const{IP\_ROUTER\_ALERT} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2792 Imposta l'opzione \textit{IP router alert} sui pacchetti.\\
2793 \const{IP\_MULTICAST\_TTL} &$\bullet$&$\bullet$& &\texttt{int}&
2794 Imposta il TTL per i pacchetti \itindex{multicast} \textit{multicast}.\\
2795 \const{IP\_MULTICAST\_LOOP} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2796 Controlla il reinvio a se stessi dei dati di \itindex{multicast}
2797 \textit{multicast}.\\
2798 \const{IP\_ADD\_MEMBERSHIP} & &$\bullet$& &\struct{ip\_mreqn}&
2799 Si unisce a un gruppo di \itindex{multicast} \textit{multicast}.\\
2800 \const{IP\_DROP\_MEMBERSHIP}& &$\bullet$& &\struct{ip\_mreqn}&
2801 Si sgancia da un gruppo di \textit{multicast}.\\
2802 \const{IP\_MULTICAST\_IF} & &$\bullet$& &\struct{ip\_mreqn}&
2803 Imposta l'interfaccia locale di un socket \itindex{multicast}
2804 \textit{multicast}.\\
2807 \caption{Le opzioni disponibili al livello \const{SOL\_IP}.}
2808 \label{tab:sock_opt_iplevel}
2811 Le descrizioni riportate in tab.~\ref{tab:sock_opt_iplevel} sono estremamente
2812 succinte, una maggiore quantità di dettagli sulle varie opzioni è fornita nel
2814 \begin{basedescript}{\desclabelwidth{2.5cm}\desclabelstyle{\nextlinelabel}}
2817 \item[\const{IP\_OPTIONS}] l'opzione permette di impostare o leggere le
2818 opzioni del protocollo IP (si veda sez.~\ref{sec:IP_options}). L'opzione
2819 prende come valore dell'argomento \param{optval} un puntatore ad un buffer
2820 dove sono mantenute le opzioni, mentre \param{optlen} indica la dimensione
2821 di quest'ultimo. Quando la si usa con \func{getsockopt} vengono lette le
2822 opzioni IP utilizzate per la spedizione, quando la si usa con
2823 \func{setsockopt} vengono impostate le opzioni specificate. L'uso di questa
2824 opzione richiede una profonda conoscenza del funzionamento del protocollo,
2825 torneremo in parte sull'argomento in sez.~\ref{sec:sock_IP_options}.
2828 \item[\const{IP\_PKTINFO}] Quando abilitata l'opzione permette di ricevere
2829 insieme ai pacchetti un messaggio ancillare (vedi
2830 sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_PKTINFO} contenente
2831 una struttura \struct{pktinfo} (vedi fig.~\ref{fig:sock_pktinfo_struct}) che
2832 mantiene una serie di informazioni riguardo i pacchetti in arrivo. In
2833 particolare è possibile conoscere l'interfaccia su cui è stato ricevuto un
2834 pacchetto (nel campo \var{ipi\_ifindex}),\footnote{in questo campo viene
2835 restituito il valore numerico dell'indice dell'interfaccia,
2836 sez.~\ref{sec:sock_ioctl_netdevice}.} l'indirizzo locale da esso
2837 utilizzato (nel campo \var{ipi\_spec\_dst}) e l'indirizzo remoto dello
2838 stesso (nel campo \var{ipi\_addr}).
2840 \begin{figure}[!htb]
2841 \footnotesize \centering
2842 \begin{minipage}[c]{\textwidth}
2843 \includestruct{listati/pktinfo.h}
2845 \caption{La struttura \structd{pktinfo} usata dall'opzione
2846 \const{IP\_PKTINFO} per ricavare informazioni sui pacchetti di un socket
2847 di tipo \const{SOCK\_DGRAM}.}
2848 \label{fig:sock_pktinfo_struct}
2852 L'opzione è utilizzabile solo per socket di tipo \const{SOCK\_DGRAM}. Questa è
2853 una opzione introdotta con i kernel della serie 2.2.x, ed è specifica di
2854 Linux;\footnote{non dovrebbe pertanto essere utilizzata se si ha a cuore la
2855 portabilità.} essa permette di sostituire le opzioni \const{IP\_RECVDSTADDR}
2856 e \const{IP\_RECVIF} presenti in altri Unix (la relativa informazione è quella
2857 ottenibile rispettivamente dai campi \var{ipi\_addr} e \var{ipi\_ifindex} di
2860 L'opzione prende per \param{optval} un intero usato come valore logico, che
2861 specifica soltanto se insieme al pacchetto deve anche essere inviato o
2862 ricevuto il messaggio \const{IP\_PKTINFO} (vedi
2863 sez.~\ref{sec:net_ancillary_data}); il messaggio stesso dovrà poi essere
2864 letto o scritto direttamente con \func{recvmsg} e \func{sendmsg} (vedi
2865 sez.~\ref{sec:net_sendmsg}).
2868 \item[\const{IP\_RECVTOS}] Quando abilitata l'opzione permette di ricevere
2869 insieme ai pacchetti un messaggio ancillare (vedi
2870 sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_TOS}, che contiene un
2871 byte con il valore del campo \textit{Type of Service} dell'intestazione IP
2872 del pacchetto stesso (vedi sez.~\ref{sec:IP_header}). Prende per
2873 \param{optval} un intero usato come valore logico.
2875 \item[\const{IP\_RECVTTL}] Quando abilitata l'opzione permette di ricevere
2876 insieme ai pacchetti un messaggio ancillare (vedi
2877 sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_RECVTTL}, contenente
2878 un byte con il valore del campo \textit{Time to Live} dell'intestazione IP
2879 (vedi sez.~\ref{sec:IP_header}). L'opzione richiede per \param{optval} un
2880 intero usato come valore logico. L'opzione non è supportata per socket di
2881 tipo \const{SOCK\_STREAM}.
2883 \item[\const{IP\_RECVOPTS}] Quando abilitata l'opzione permette di ricevere
2884 insieme ai pacchetti un messaggio ancillare (vedi
2885 sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_OPTIONS}, contenente
2886 le opzioni IP del protocollo (vedi sez.~\ref{sec:IP_options}). Le
2887 intestazioni di instradamento e le altre opzioni sono già riempite con i
2888 dati locali. L'opzione richiede per \param{optval} un intero usato come
2889 valore logico. L'opzione non è supportata per socket di tipo
2890 \const{SOCK\_STREAM}.
2892 \item[\const{IP\_RETOPTS}] Identica alla precedente \const{IP\_RECVOPTS}, ma
2893 in questo caso restituisce i dati grezzi delle opzioni, senza che siano
2894 riempiti i capi di instradamento e le marche temporali. L'opzione richiede
2895 per \param{optval} un intero usato come valore logico. L'opzione non è
2896 supportata per socket di tipo \const{SOCK\_STREAM}.
2898 \item[\const{IP\_TOS}] L'opzione consente di leggere o impostare il campo
2899 \textit{Type of Service} dell'intestazione IP (per una trattazione più
2900 dettagliata, che riporta anche i valori possibili e le relative costanti di
2901 definizione si veda sez.~\ref{sec:IP_header}) che permette di indicare le
2902 priorità dei pacchetti. Se impostato il valore verrà mantenuto per tutti i
2903 pacchetti del socket; alcuni valori (quelli che aumentano la priorità)
2904 richiedono i privilegi di amministrazione con la \itindex{capabilities}
2905 capability \const{CAP\_NET\_ADMIN}.
2907 Il campo TOS è di 8 bit e l'opzione richiede per \param{optval} un intero
2908 che ne contenga il valore. Sono definite anche alcune costanti che
2909 definiscono alcuni valori standardizzati per il \textit{Type of Service},
2910 riportate in tab.~\ref{tab:IP_TOS_values}, il valore di default usato da
2911 Linux è \const{IPTOS\_LOWDELAY}, ma esso può essere modificato con le
2912 funzionalità del cosiddetto \textit{Advanced Routing}. Si ricordi che la
2913 priorità dei pacchetti può essere impostata anche in maniera indipendente
2914 dal protocollo utilizzando l'opzione \const{SO\_PRIORITY} illustrata in
2915 sez.~\ref{sec:sock_generic_options}.
2917 \item[\const{IP\_TTL}] L'opzione consente di leggere o impostare per tutti i
2918 pacchetti associati al socket il campo \textit{Time to Live}
2919 dell'intestazione IP che indica il numero massimo di \textit{hop} (passaggi
2920 da un router ad un altro) restanti al paccheto (per una trattazione più
2921 estesa si veda sez.~\ref{sec:IP_header}). Il campo TTL è di 8 bit e
2922 l'opzione richiede che \param{optval} sia un intero, che ne conterrà il
2925 \item[\const{IP\_MINTTL}] L'opzione, introdotta con il kernel 2.6.34, imposta
2926 un valore minimo per il campo \textit{Time to Live} dei pacchetti associati
2927 al socket su cui è attivata, che se non rispettato ne causa lo scarto
2928 automatico. L'opzione è nata per implementare
2929 l'\href{http://www.ietf.org/rfc/rfc5082.txt}{RFC~5082} che la prevede come
2930 forma di protezione per i router che usano il protocollo BGP poiché questi,
2931 essendo in genere adiacenti, possono, impostando un valore di 255, scartare
2932 automaticamente tutti gli eventuali pacchetti falsi creati da un attacco a
2933 questo protocollo, senza doversi curare di verificarne la
2934 validità.\footnote{l'attacco viene in genere portato per causare un
2935 \textit{Denial of Service} aumentando il consumo di CPU del router nella
2936 verifica dell'autenticità di un gran numero di pacchetti di pacchetti
2937 falsi; questi, arrivando da sorgenti diverse da un router adiacente, non
2938 potrebbero più avere un TTL di 255 anche qualora questo fosse stato il
2939 valore di partenza, e l'impostazione dell'opzione consente di scartarli
2940 senza carico aggiuntivo sulla CPU (che altrimenti dovrebbe calcolare una
2943 \item[\const{IP\_HDRINCL}] Se abilitata l'utente deve fornire lui stesso
2944 l'intestazione IP in cima ai propri dati. L'opzione è valida soltanto per
2945 socket di tipo \const{SOCK\_RAW}, e quando utilizzata eventuali valori
2946 impostati con \const{IP\_OPTIONS}, \const{IP\_TOS} o \const{IP\_TTL} sono
2947 ignorati. In ogni caso prima della spedizione alcuni campi
2948 dell'intestazione vengono comunque modificati dal kernel, torneremo
2949 sull'argomento in sez.~\ref{sec:socket_raw}
2951 \item[\const{IP\_RECVERR}] Questa è una opzione introdotta con i kernel della
2952 serie 2.2.x, ed è specifica di Linux. Essa permette di usufruire di un
2953 meccanismo affidabile per ottenere un maggior numero di informazioni in caso
2954 di errori. Se l'opzione è abilitata tutti gli errori generati su un socket
2955 vengono memorizzati su una coda, dalla quale poi possono essere letti con
2956 \func{recvmsg} (vedi sez.~\ref{sec:net_sendmsg}) come messaggi ancillari
2957 (torneremo su questo in sez.~\ref{sec:net_ancillary_data}) di tipo
2958 \const{IP\_RECVERR}. L'opzione richiede per \param{optval} un intero usato
2959 come valore logico e non è applicabile a socket di tipo
2960 \const{SOCK\_STREAM}.
2962 \itindbeg{Maximum~Transfer~Unit~(MTU)}
2963 \item[\const{IP\_MTU\_DISCOVER}] Questa è una opzione introdotta con i kernel
2964 della serie 2.2.x, ed è specifica di Linux. L'opzione permette di scrivere
2965 o leggere le impostazioni della modalità usata per la determinazione della
2966 \textit{Path Maximum Transfer Unit} (vedi sez.~\ref{sec:net_lim_dim}) del
2967 socket. L'opzione prende per \param{optval} un valore intero che indica la
2968 modalità usata, da specificare con una delle costanti riportate in
2969 tab.~\ref{tab:sock_ip_mtu_discover}.
2974 \begin{tabular}[c]{|l|r|p{7cm}|}
2976 \multicolumn{2}{|c|}{\textbf{Valore}}&\textbf{Significato} \\
2979 \const{IP\_PMTUDISC\_DONT}&0& Non effettua la ricerca dalla \textit{Path
2981 \const{IP\_PMTUDISC\_WANT}&1& Utilizza il valore impostato per la rotta
2982 utilizzata dai pacchetti (dal comando
2984 \const{IP\_PMTUDISC\_DO} &2& Esegue la procedura di determinazione
2985 della \textit{Path MTU} come richiesto
2986 dall'\href{http://www.ietf.org/rfc/rfc1191.txt}{RFC~1191}.\\
2989 \caption{Valori possibili per l'argomento \param{optval} di
2990 \const{IP\_MTU\_DISCOVER}.}
2991 \label{tab:sock_ip_mtu_discover}
2994 Il valore di default applicato ai socket di tipo \const{SOCK\_STREAM} è
2995 determinato dal parametro \texttt{ip\_no\_pmtu\_disc} (vedi
2996 sez.~\ref{sec:sock_sysctl}), mentre per tutti gli altri socket di default la
2997 ricerca è disabilitata ed è responsabilità del programma creare pacchetti di
2998 dimensioni appropriate e ritrasmettere eventuali pacchetti persi. Se
2999 l'opzione viene abilitata, il kernel si incaricherà di tenere traccia
3000 automaticamente della \textit{Path MTU} verso ciascuna destinazione, e
3001 rifiuterà immediatamente la trasmissione di pacchetti di dimensioni maggiori
3002 della MTU con un errore di \errval{EMSGSIZE}.\footnote{in caso contrario la
3003 trasmissione del pacchetto sarebbe effettuata, ottenendo o un fallimento
3004 successivo della trasmissione, o la frammentazione dello stesso.}
3006 \item[\const{IP\_MTU}] Permette di leggere il valore della \textit{Path MTU}
3007 di percorso del socket. L'opzione richiede per \param{optval} un intero che
3008 conterrà il valore della \textit{Path MTU} in byte. Questa è una opzione
3009 introdotta con i kernel della serie 2.2.x, ed è specifica di Linux.
3011 È tramite questa opzione che un programma può leggere, quando si è avuto un
3012 errore di \errval{EMSGSIZE}, il valore della MTU corrente del socket. Si
3013 tenga presente che per poter usare questa opzione, oltre ad avere abilitato
3014 la scoperta della \textit{Path MTU}, occorre che il socket sia stato
3015 esplicitamente connesso con \func{connect}.
3017 Ad esempio con i socket UDP si potrà ottenere una stima iniziale della
3018 \textit{Path MTU} eseguendo prima una \func{connect} verso la destinazione,
3019 e poi usando \func{getsockopt} con questa opzione. Si può anche avviare
3020 esplicitamente il procedimento di scoperta inviando un pacchetto di grosse
3021 dimensioni (che verrà scartato) e ripetendo l'invio coi dati aggiornati. Si
3022 tenga infine conto che durante il procedimento i pacchetti iniziali possono
3023 essere perduti, ed è compito dell'applicazione gestirne una eventuale
3026 \itindend{Maximum~Transfer~Unit~(MTU)}
3028 \item[\const{IP\_ROUTER\_ALERT}] Questa è una opzione introdotta con i
3029 kernel della serie 2.2.x, ed è specifica di Linux. Prende per
3030 \param{optval} un intero usato come valore logico. Se abilitata
3031 passa tutti i pacchetti con l'opzione \textit{IP Router Alert} (vedi
3032 sez.~\ref{sec:IP_options}) che devono essere inoltrati al socket
3033 corrente. Può essere usata soltanto per socket di tipo raw.
3035 \itindbeg{multicast}
3036 \item[\const{IP\_MULTICAST\_TTL}] L'opzione permette di impostare o leggere il
3037 valore del campo TTL per i pacchetti \textit{multicast} in uscita associati
3038 al socket. È importante che questo valore sia il più basso possibile, ed il
3039 default è 1, che significa che i pacchetti non potranno uscire dalla rete
3040 locale. Questa opzione consente ai programmi che lo richiedono di superare
3041 questo limite. L'opzione richiede per
3042 \param{optval} un intero che conterrà il valore del TTL.
3044 \item[\const{IP\_MULTICAST\_LOOP}] L'opzione consente di decidere se i dati
3045 che si inviano su un socket usato con il \textit{multicast} vengano ricevuti
3046 anche sulla stessa macchina da cui li si stanno inviando. Prende per
3047 \param{optval} un intero usato come valore logico.
3049 In generale se si vuole che eventuali client possano ricevere i dati che si
3050 inviano occorre che questa funzionalità sia abilitata (come avviene di
3051 default). Qualora però non si voglia generare traffico per dati che già sono
3052 disponibili in locale l'uso di questa opzione permette di disabilitare
3053 questo tipo di traffico.
3055 \item[\const{IP\_ADD\_MEMBERSHIP}] L'opzione consente di unirsi ad gruppo di
3056 \textit{multicast}, e può essere usata solo con \func{setsockopt}.
3057 L'argomento \param{optval} in questo caso deve essere una struttura di tipo
3058 \struct{ip\_mreqn}, illustrata in fig.~\ref{fig:ip_mreqn_struct}, che
3059 permette di indicare, con il campo \var{imr\_multiaddr} l'indirizzo del
3060 gruppo di \textit{multicast} a cui ci si vuole unire, con il campo
3061 \var{imr\_address} l'indirizzo dell'interfaccia locale con cui unirsi al
3062 gruppo di \textit{multicast} e con \var{imr\_ifindex} l'indice
3063 dell'interfaccia da utilizzare (un valore nullo indica una interfaccia
3066 Per compatibilità è possibile utilizzare anche un argomento di tipo
3067 \struct{ip\_mreq}, una precedente versione di \struct{ip\_mreqn}, che
3068 differisce da essa soltanto per l'assenza del campo \var{imr\_ifindex}.
3070 \begin{figure}[!htb]
3071 \footnotesize \centering
3072 \begin{minipage}[c]{\textwidth}
3073 \includestruct{listati/ip_mreqn.h}
3075 \caption{La struttura \structd{ip\_mreqn} utilizzata dalle opzioni dei
3076 socket per le operazioni concernenti l'appartenenza ai gruppi di
3077 \textit{multicast}.}
3078 \label{fig:ip_mreqn_struct}
3081 \item[\const{IP\_DROP\_MEMBERSHIP}] Lascia un gruppo di \textit{multicast},
3082 prende per \param{optval} la stessa struttura \struct{ip\_mreqn} (o
3083 \struct{ip\_mreq}) usata anche per \const{IP\_ADD\_MEMBERSHIP}.
3085 \item[\const{IP\_MULTICAST\_IF}] Imposta l'interfaccia locale per l'utilizzo
3086 del \textit{multicast}, ed utilizza come \param{optval} le stesse strutture
3087 \struct{ip\_mreqn} o \struct{ip\_mreq} delle due precedenti opzioni.
3089 % TODO chiarire quale è la struttura \struct{ip\_mreq}
3092 \itindend{multicast}
3097 \subsection{Le opzioni per i protocolli TCP e UDP}
3098 \label{sec:sock_tcp_udp_options}
3100 In questa sezione tratteremo le varie opzioni disponibili per i socket che
3101 usano i due principali protocolli di comunicazione del livello di trasporto;
3102 UDP e TCP.\footnote{come per le precedenti, una descrizione di queste opzioni
3103 è disponibile nella settima sezione delle pagine di manuale, che si può
3104 consultare rispettivamente con \texttt{man 7 tcp} e \texttt{man 7 udp}; le
3105 pagine di manuale però, alla stesura di questa sezione (Agosto 2006) sono
3106 alquanto incomplete.} Dato che questi due protocolli sono entrambi
3107 trasportati su IP,\footnote{qui si sottintende IPv4, ma le opzioni per TCP e
3108 UDP sono le stesse anche quando si usa IPv6.} oltre alle opzioni generiche
3109 di sez.~\ref{sec:sock_generic_options} saranno comunque disponibili anche le
3110 precedenti opzioni di sez.~\ref{sec:sock_ipv4_options}.\footnote{in realtà in
3111 sez.~\ref{sec:sock_ipv4_options} si sono riportate le opzioni per IPv4, al
3112 solito, qualora si stesse utilizzando IPv6, si potrebbero utilizzare le
3113 opzioni di quest'ultimo.}
3115 Il protocollo che supporta il maggior numero di opzioni è TCP; per poterle
3116 utilizzare occorre specificare \const{SOL\_TCP} (o l'equivalente
3117 \const{IPPROTO\_TCP}) come valore per l'argomento \param{level}. Si sono
3118 riportate le varie opzioni disponibili in tab.~\ref{tab:sock_opt_tcplevel},
3119 dove sono elencate le rispettive costanti da utilizzare come valore per
3120 l'argomento \param{optname}. Dette costanti e tutte le altre costanti e
3121 strutture collegate all'uso delle opzioni TCP sono definite in
3122 \headfile{netinet/tcp.h}, ed accessibili includendo detto file.\footnote{in
3123 realtà questo è il file usato dalle librerie; la definizione delle opzioni
3124 effettivamente supportate da Linux si trova nel file
3125 \texttt{include/linux/tcp.h} dei sorgenti del kernel, dal quale si sono
3126 estratte le costanti di tab.~\ref{tab:sock_opt_tcplevel}.}
3131 \begin{tabular}[c]{|l|c|c|c|l|l|}
3133 \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
3134 \textbf{Descrizione}\\
3137 \const{TCP\_NODELAY} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3138 Spedisce immediatamente i dati in segmenti singoli.\\
3139 \const{TCP\_MAXSEG} &$\bullet$&$\bullet$& &\texttt{int}&
3140 Valore della \itindex{Maximum~Segment~Size~(MSS)} MSS per i segmenti in
3142 \const{TCP\_CORK} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3143 Accumula i dati in un unico segmento.\\
3144 \const{TCP\_KEEPIDLE} &$\bullet$&$\bullet$& &\texttt{int}&
3145 Tempo in secondi prima di inviare un \textit{keepalive}.\\
3146 \const{TCP\_KEEPINTVL} &$\bullet$&$\bullet$& &\texttt{int}&
3147 Tempo in secondi prima fra \textit{keepalive} successivi.\\
3148 \const{TCP\_KEEPCNT} &$\bullet$&$\bullet$& &\texttt{int}&
3149 Numero massimo di \textit{keepalive} inviati.\\
3150 \const{TCP\_SYNCNT} &$\bullet$&$\bullet$& &\texttt{int}&
3151 Numero massimo di ritrasmissioni di un SYN.\\
3152 \const{TCP\_LINGER2} &$\bullet$&$\bullet$& &\texttt{int}&
3153 Tempo di vita in stato \texttt{FIN\_WAIT2}.\\
3154 \const{TCP\_DEFER\_ACCEPT}&$\bullet$&$\bullet$& &\texttt{int}&
3155 Ritorna da \func{accept} solo in presenza di dati.\\
3156 \const{TCP\_WINDOW\_CLAMP}&$\bullet$&$\bullet$& &\texttt{int}&
3157 Valore della \itindex{advertised~window} \textit{advertised window}.\\
3158 \const{TCP\_INFO} &$\bullet$& & &\struct{tcp\_info}&
3159 Restituisce informazioni sul socket.\\
3160 \const{TCP\_QUICKACK} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3161 Abilita la modalità \textit{quickack}.\\
3162 \const{TCP\_CONGESTION} &$\bullet$&$\bullet$& &\texttt{char *}&
3163 Imposta l'algoritmo per il controllo della congestione.\\
3166 \caption{Le opzioni per i socket TCP disponibili al livello
3168 \label{tab:sock_opt_tcplevel}
3171 Le descrizioni delle varie opzioni riportate in
3172 tab.~\ref{tab:sock_opt_tcplevel} sono estremamente sintetiche ed indicative,
3173 la spiegazione del funzionamento delle singole opzioni con una maggiore
3174 quantità di dettagli è fornita nel seguente elenco:
3175 \begin{basedescript}{\desclabelwidth{2.5cm}\desclabelstyle{\nextlinelabel}}
3178 \item[\const{TCP\_NODELAY}] il protocollo TCP utilizza un meccanismo di
3179 bufferizzazione dei dati uscenti, per evitare la trasmissione di tanti
3180 piccoli segmenti con un utilizzo non ottimale della banda
3181 disponibile.\footnote{il problema è chiamato anche \textit{silly window
3182 syndrome}, per averne un'idea si pensi al risultato che si ottiene
3183 quando un programma di terminale invia un segmento TCP per ogni tasto
3184 premuto, 40 byte di intestazione di protocollo con 1 byte di dati
3185 trasmessi; per evitare situazioni del genere è stato introdotto
3186 \index{algoritmo~di~Nagle} l'\textsl{algoritmo di Nagle}.} Questo
3187 meccanismo è controllato da un apposito algoritmo (detto
3188 \index{algoritmo~di~Nagle} \textsl{algoritmo di Nagle}, vedi
3189 sez.~\ref{sec:tcp_protocol_xxx}). Il comportamento normale del protocollo
3190 prevede che i dati siano accumulati fintanto che non si raggiunge una
3191 quantità considerata adeguata per eseguire la trasmissione di un singolo
3194 Ci sono però delle situazioni in cui questo comportamento può non essere
3195 desiderabile, ad esempio quando si sa in anticipo che l'applicazione invierà
3196 soltanto un piccolo quantitativo di dati;\footnote{è il caso classico di una
3197 richiesta HTTP.} in tal caso l'attesa introdotta dall'algoritmo di
3198 bufferizzazione non soltanto è inutile, ma peggiora le prestazioni
3199 introducendo un ritardo. Impostando questa opzione si disabilita l'uso
3200 \index{algoritmo~di~Nagle} dell'\textsl{algoritmo di Nagle} ed i dati
3201 vengono inviati immediatamente in singoli segmenti, qualunque sia la loro
3202 dimensione. Ovviamente l'uso di questa opzione è dedicato a chi ha esigenze
3203 particolari come quella illustrata, che possono essere stabilite solo per la
3204 singola applicazione.
3206 Si tenga conto che questa opzione viene sovrascritta dall'eventuale
3207 impostazione dell'opzione \const{TCP\_CORK} (il cui scopo è sostanzialmente
3208 l'opposto) che blocca l'invio immediato. Tuttavia quando la si abilita viene
3209 sempre forzato lo scaricamento della coda di invio (con conseguente
3210 trasmissione di tutti i dati pendenti), anche qualora si fosse già abilitata
3211 \const{TCP\_CORK}.\footnote{si tenga presente però che \const{TCP\_CORK} può
3212 essere specificata insieme a \const{TCP\_NODELAY} soltanto a partire dal
3215 \item[\const{TCP\_MAXSEG}] con questa opzione si legge o si imposta il valore
3216 della \itindex{Maximum~Segment~Size~(MSS)} MSS
3217 (\textit{Maximum~Segment~Size}, vedi sez.~\ref{sec:net_lim_dim} e
3218 sez.~\ref{sec:tcp_protocol_xxx}) dei segmenti TCP uscenti. Se l'opzione è
3219 impostata prima di stabilire la connessione, si cambia anche il valore della
3220 \itindex{Maximum~Segment~Size~(MSS)} MSS annunciata all'altro capo della
3221 connessione. Se si specificano valori maggiori della
3222 \itindex{Maximum~Transfer~Unit~(MTU)} MTU questi verranno ignorati, inoltre
3223 TCP imporrà anche i suoi limiti massimo e minimo per questo valore.
3225 \item[\const{TCP\_CORK}] questa opzione è il complemento naturale di
3226 \const{TCP\_NODELAY} e serve a gestire a livello applicativo la situazione
3227 opposta, cioè quella in cui si sa fin dal principio che si dovranno inviare
3228 grosse quantità di dati. Anche in questo caso \index{algoritmo~di~Nagle}
3229 l'\textsl{algoritmo di Nagle} tenderà a suddividerli in dimensioni da lui
3230 ritenute opportune,\footnote{l'algoritmo cerca di tenere conto di queste
3231 situazioni, ma essendo un algoritmo generico tenderà comunque ad
3232 introdurre delle suddivisioni in segmenti diversi, anche quando potrebbero
3233 non essere necessarie, con conseguente spreco di banda.} ma sapendo fin
3234 dall'inizio quale è la dimensione dei dati si potranno di nuovo ottenere
3235 delle migliori prestazioni disabilitandolo, e gestendo direttamente l'invio
3236 del nostro blocco di dati in soluzione unica.
3238 Quando questa opzione viene abilitata non vengono inviati segmenti di dati
3239 fintanto che essa non venga disabilitata; a quel punto tutti i dati rimasti
3240 in coda saranno inviati in un solo segmento TCP. In sostanza con questa
3241 opzione si può controllare il flusso dei dati mettendo una sorta di
3242 ``\textsl{tappo}'' (da cui il nome in inglese) al flusso di uscita, in modo
3243 ottimizzare a mano l'uso della banda. Si tenga presente che per l'effettivo
3244 funzionamento ci si deve ricordare di disattivare l'opzione al termine
3245 dell'invio del blocco dei dati.
3247 Si usa molto spesso \const{TCP\_CORK} quando si effettua il trasferimento
3248 diretto di un blocco di dati da un file ad un socket con \func{sendfile}
3249 (vedi sez.~\ref{sec:file_sendfile_splice}), per inserire una intestazione
3250 prima della chiamata a questa funzione; senza di essa l'intestazione
3251 potrebbe venire spedita in un segmento a parte, che a seconda delle
3252 condizioni potrebbe richiedere anche una risposta di ACK, portando ad una
3253 notevole penalizzazione delle prestazioni.
3255 Si tenga presente che l'implementazione corrente di \const{TCP\_CORK} non
3256 consente di bloccare l'invio dei dati per più di 200 millisecondi, passati i
3257 quali i dati accumulati in coda sanno inviati comunque. Questa opzione è
3258 tipica di Linux\footnote{l'opzione è stata introdotta con i kernel della
3259 serie 2.4.x.} e non è disponibile su tutti i kernel unix-like, pertanto
3260 deve essere evitata se si vuole scrivere codice portabile.
3262 \item[\const{TCP\_KEEPIDLE}] con questa opzione si legge o si imposta
3263 l'intervallo di tempo, in secondi, che deve trascorrere senza traffico sul
3264 socket prima che vengano inviati, qualora si sia attivata su di esso
3265 l'opzione \const{SO\_KEEPALIVE}, i messaggi di \textit{keep-alive} (si veda
3266 la trattazione relativa al \textit{keep-alive} in
3267 sez.~\ref{sec:sock_options_main}). Anche questa opzione non è disponibile
3268 su tutti i kernel unix-like e deve essere evitata se si vuole scrivere
3271 \item[\const{TCP\_KEEPINTVL}] con questa opzione si legge o si imposta
3272 l'intervallo di tempo, in secondi, fra due messaggi di \textit{keep-alive}
3273 successivi (si veda sempre quanto illustrato in
3274 sez.~\ref{sec:sock_options_main}). Come la precedente non è disponibile su
3275 tutti i kernel unix-like e deve essere evitata se si vuole scrivere codice
3278 \item[\const{TCP\_KEEPCNT}] con questa opzione si legge o si imposta il numero
3279 totale di messaggi di \textit{keep-alive} da inviare prima di concludere che
3280 la connessione è caduta per assenza di risposte ad un messaggio di
3281 \textit{keep-alive} (di nuovo vedi sez.~\ref{sec:sock_options_main}). Come
3282 la precedente non è disponibile su tutti i kernel unix-like e deve essere
3283 evitata se si vuole scrivere codice portabile.
3285 \item[\const{TCP\_SYNCNT}] con questa opzione si legge o si imposta il numero
3286 di tentativi di ritrasmissione dei segmenti SYN usati nel
3287 \itindex{three~way~handshake} \textit{three way handshake} prima che il
3288 tentativo di connessione venga abortito (si ricordi quanto accennato in
3289 sez.~\ref{sec:TCP_func_connect}). Sovrascrive per il singolo socket il valore
3290 globale impostato con la \textit{sysctl} \texttt{tcp\_syn\_retries} (vedi
3291 sez.~\ref{sec:sock_ipv4_sysctl}). Non vengono accettati valori maggiori di
3292 255; anche questa opzione non è standard e deve essere evitata se si vuole
3293 scrivere codice portabile.
3295 \item[\const{TCP\_LINGER2}] con questa opzione si legge o si imposta, in
3296 numero di secondi, il tempo di sussistenza dei socket terminati nello stato
3297 \texttt{FIN\_WAIT2} (si ricordi quanto visto in
3298 sez.~\ref{sec:TCP_conn_term}).\footnote{si tenga ben presente che questa
3299 opzione non ha nulla a che fare con l'opzione \const{SO\_LINGER} che
3300 abbiamo visto in sez.~\ref{sec:sock_options_main}.} Questa opzione
3301 consente di sovrascrivere per il singolo socket il valore globale impostato
3302 con la \textit{sysctl} \texttt{tcp\_fin\_timeout} (vedi
3303 sez.~\ref{sec:sock_ipv4_sysctl}). Anche questa opzione è da evitare se si
3304 ha a cuore la portabilità del codice.
3306 \item[\const{TCP\_DEFER\_ACCEPT}] questa opzione consente di modificare il
3307 comportamento standard del protocollo TCP nello stabilirsi di una
3308 connessione; se ricordiamo il meccanismo del \itindex{three~way~handshake}
3309 \textit{three way handshake} illustrato in fig.~\ref{fig:TCP_TWH} possiamo
3310 vedere che in genere un client inizierà ad inviare i dati ad un server solo
3311 dopo l'emissione dell'ultimo segmento di ACK.
3313 Di nuovo esistono situazioni (e la più tipica è quella di una richiesta
3314 HTTP) in cui sarebbe utile inviare immediatamente la richiesta all'interno
3315 del segmento con l'ultimo ACK del \itindex{three~way~handshake}
3316 \textit{three way handshake}; si potrebbe così risparmiare l'invio di un
3317 segmento successivo per la richiesta e il ritardo sul server fra la
3318 ricezione dell'ACK e quello della richiesta.
3320 Se si invoca \const{TCP\_DEFER\_ACCEPT} su un socket dal lato client (cioè
3321 dal lato da cui si invoca \func{connect}) si istruisce il kernel a non
3322 inviare immediatamente l'ACK finale del \itindex{three~way~handshake}
3323 \textit{three way handshake}, attendendo per un po' di tempo la prima
3324 scrittura, in modo da inviare i dati di questa insieme col segmento ACK.
3325 Chiaramente la correttezza di questo comportamento dipende in maniera
3326 diretta dal tipo di applicazione che usa il socket; con HTTP, che invia una
3327 breve richiesta, permette di risparmiare un segmento, con FTP, in cui invece
3328 si attende la ricezione del prompt del server, introduce un inutile ritardo.
3330 Allo stesso tempo il protocollo TCP prevede che sul lato del server la
3331 funzione \func{accept} ritorni dopo la ricezione dell'ACK finale, in tal
3332 caso quello che si fa usualmente è lanciare un nuovo processo per leggere i
3333 successivi dati, che si bloccherà su una \func{read} se questi non sono
3334 disponibili; in questo modo si saranno impiegate delle risorse (per la
3335 creazione del nuovo processo) che non vengono usate immediatamente. L'uso
3336 di \const{TCP\_DEFER\_ACCEPT} consente di intervenire anche in questa
3337 situazione; quando la si invoca sul lato server (vale a dire su un socket in
3338 ascolto) l'opzione fa sì che \func{accept} ritorni soltanto quando sono
3339 presenti dei dati sul socket, e non alla ricezione dell'ACK conclusivo del
3340 \itindex{three~way~handshake} \textit{three way handshake}.
3342 L'opzione prende un valore intero che indica il numero massimo di secondi
3343 per cui mantenere il ritardo, sia per quanto riguarda il ritorno di
3344 \func{accept} su un server, che per l'invio dell'ACK finale insieme ai dati
3345 su un client. L'opzione è specifica di Linux non deve essere utilizzata in
3346 codice che vuole essere portabile.\footnote{su FreeBSD è presente una
3347 opzione \texttt{SO\_ACCEPTFILTER} che consente di ottenere lo stesso
3348 comportamento di \const{TCP\_DEFER\_ACCEPT} per quanto riguarda il lato
3351 \item[\const{TCP\_WINDOW\_CLAMP}] con questa opzione si legge o si imposta
3352 alla dimensione specificata, in byte, il valore dichiarato della
3353 \itindex{advertised~window} \textit{advertised window} (vedi
3354 sez.~\ref{sec:tcp_protocol_xxx}). Il kernel impone comunque una dimensione
3355 minima pari a \texttt{SOCK\_MIN\_RCVBUF/2}. Questa opzione non deve essere
3356 utilizzata in codice che vuole essere portabile.
3358 \begin{figure}[!htb]
3359 \footnotesize \centering
3360 \begin{minipage}[c]{\textwidth}
3361 \includestruct{listati/tcp_info.h}
3363 \caption{La struttura \structd{tcp\_info} contenente le informazioni sul
3364 socket restituita dall'opzione \const{TCP\_INFO}.}
3365 \label{fig:tcp_info_struct}
3368 \item[\const{TCP\_INFO}] questa opzione, specifica di Linux, ma introdotta
3369 anche in altri kernel (ad esempio FreeBSD) permette di controllare lo stato
3370 interno di un socket TCP direttamente da un programma in user space.
3371 L'opzione restituisce in una speciale struttura \struct{tcp\_info}, la cui
3372 definizione è riportata in fig.~\ref{fig:tcp_info_struct}, tutta una serie
3373 di dati che il kernel mantiene, relativi al socket. Anche questa opzione
3374 deve essere evitata se si vuole scrivere codice portabile.
3376 Con questa opzione diventa possibile ricevere una serie di informazioni
3377 relative ad un socket TCP così da poter effettuare dei controlli senza dover
3378 passare attraverso delle operazioni di lettura. Ad esempio si può verificare
3379 se un socket è stato chiuso usando una funzione analoga a quella illustrata
3380 in fig.~\ref{fig:is_closing}, in cui si utilizza il valore del campo
3381 \var{tcpi\_state} di \struct{tcp\_info} per controllare lo stato del socket.
3383 \begin{figure}[!htbp]
3384 \footnotesize \centering
3385 \begin{minipage}[c]{\codesamplewidth}
3386 \includecodesample{listati/is_closing.c}
3388 \caption{Codice della funzione \texttt{is\_closing.c}, che controlla lo stato
3389 di un socket TCP per verificare se si sta chiudendo.}
3390 \label{fig:is_closing}
3393 %Si noti come nell'esempio si sia (
3396 \item[\const{TCP\_QUICKACK}] con questa opzione è possibile eseguire una forma
3397 di controllo sull'invio dei segmenti ACK all'interno di in flusso di dati su
3398 TCP. In genere questo invio viene gestito direttamente dal kernel, il
3399 comportamento standard, corrispondente la valore logico di vero (in genere
3400 1) per questa opzione, è quello di inviare immediatamente i segmenti ACK, in
3401 quanto normalmente questo significa che si è ricevuto un blocco di dati e si
3402 può passare all'elaborazione del blocco successivo.
3404 Qualora però la nostra applicazione sappia in anticipo che alla ricezione di
3405 un blocco di dati seguirà immediatamente l'invio di un altro
3406 blocco,\footnote{caso tipico ad esempio delle risposte alle richieste HTTP.}
3407 poter accorpare quest'ultimo al segmento ACK permette di risparmiare sia in
3408 termini di dati inviati che di velocità di risposta. Per far questo si può
3409 utilizzare \const{TCP\_QUICKACK} impostando un valore logico falso (cioè 0),
3410 in questo modo il kernel attenderà così da inviare il prossimo segmento di
3411 ACK insieme ai primi dati disponibili.
3413 Si tenga presente che l'opzione non è permanente, vale a dire che una volta
3414 che la si sia impostata a 0 il kernel la riporterà al valore di default dopo
3415 il suo primo utilizzo. Sul lato server la si può impostare anche una volta
3416 sola su un socket in ascolto, ed essa verrà ereditata da tutti i socket che
3417 si otterranno da esso al ritorno di \func{accept}.
3419 % TODO trattare con gli esempi di apache
3421 \item[\const{TCP\_CONGESTION}] questa opzione permette di impostare quale
3422 algoritmo per il controllo della congestione\footnote{il controllo della
3423 congestione è un meccanismo previsto dal protocollo TCP (vedi
3424 sez.~\ref{sec:tcp_protocol_xxx}) per evitare di trasmettere inutilmente
3425 dati quando una connessione è congestionata; un buon algoritmo è
3426 fondamentale per il funzionamento del protocollo, dato che i pacchetti
3427 persi andrebbero ritrasmessi, per cui inviare un pacchetto su una linea
3428 congestionata potrebbe causare facilmente un peggioramento della
3429 situazione.} utilizzare per il singolo socket. L'opzione è stata
3430 introdotta con il kernel 2.6.13,\footnote{alla data di stesura di queste
3431 note (Set. 2006) è pure scarsamente documentata, tanto che non è neanche
3432 definita nelle intestazioni delle \acr{glibc} per cui occorre definirla a
3433 mano al suo valore che è 13.} e prende come per \param{optval} il
3434 puntatore ad un buffer contenente il nome dell'algoritmo di controllo che
3437 L'uso di un nome anziché di un valore numerico è dovuto al fatto che gli
3438 algoritmi di controllo della congestione sono realizzati attraverso
3439 altrettanti moduli del kernel, e possono pertanto essere attivati a
3440 richiesta; il nome consente di caricare il rispettivo modulo e di introdurre
3441 moduli aggiuntivi che implementino altri meccanismi.
3443 Per poter disporre di questa funzionalità occorre aver compilato il kernel
3444 attivando l'opzione di configurazione generale
3445 \texttt{TCP\_CONG\_ADVANCED},\footnote{disponibile come \textit{TCP:
3446 advanced congestion control} nel menù \textit{Network->Networking
3447 options}, che a sua volta renderà disponibile un ulteriore menù con gli
3448 algoritmi presenti.} e poi abilitare i singoli moduli voluti con le varie
3449 \texttt{TCP\_CONG\_*} presenti per i vari algoritmi disponibili; un elenco
3450 di quelli attualmente supportati nella versione ufficiale del kernel è
3451 riportato in tab.~\ref{tab:sock_tcp_congestion_algo}.\footnote{la lista è
3452 presa dalla versione 2.6.17.}
3455 Si tenga presente che prima della implementazione modulare alcuni di questi
3456 algoritmi erano disponibili soltanto come caratteristiche generali del
3457 sistema, attivabili per tutti i socket, questo è ancora possibile con la
3458 \textit{sysctl} \texttt{tcp\_congestion\_control} (vedi
3459 sez.~\ref{sec:sock_ipv4_sysctl}) che ha sostituito le precedenti
3460 \textit{sysctl}.\footnote{riportate anche, alla data di stesura di queste
3461 pagine (Set. 2006) nelle pagine di manuale, ma non più presenti.}
3466 \begin{tabular}[c]{|l|l|p{10cm}|}
3468 \textbf{Nome}&\textbf{Configurazione}&\textbf{Riferimento} \\
3471 reno& -- &Algoritmo tradizionale, usato in caso di assenza degli altri.\\
3472 \texttt{bic} &\texttt{TCP\_CONG\_BIC} &
3473 \url{http://www.csc.ncsu.edu/faculty/rhee/export/bitcp/index.htm}.\\
3474 \texttt{cubic} &\texttt{TCP\_CONG\_CUBIC} &
3475 \url{http://www.csc.ncsu.edu/faculty/rhee/export/bitcp/index.htm}.\\
3476 \texttt{highspeed}&\texttt{TCP\_CONG\_HSTCP} &