Modifiche rimaste indietro.
[gapil.git] / sockctrl.tex
1 %% sockctrl.tex
2 %%
3 %% Copyright (C) 2004-2017 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione dei socket}
13 \label{cha:sock_generic_management}
14
15 Esamineremo in questo capitolo una serie di funzionalità aggiuntive relative
16 alla gestione dei socket, come la gestione della risoluzione di nomi e
17 indirizzi, le impostazioni delle varie proprietà ed opzioni relative ai
18 socket, e le funzioni di controllo che permettono di modificarne il
19 comportamento.
20
21
22 \section{La risoluzione dei nomi}
23 \label{sec:sock_name_resolution}
24
25 Negli esempi dei capitoli precedenti abbiamo sempre identificato le singole
26 macchine attraverso indirizzi numerici, sfruttando al più le funzioni di
27 conversione elementare illustrate in sez.~\ref{sec:sock_addr_func} che
28 permettono di passare da un indirizzo espresso in forma \textit{dotted
29   decimal} ad un numero. Vedremo in questa sezione le funzioni utilizzate per
30 poter utilizzare dei nomi simbolici al posto dei valori numerici, e viceversa
31 quelle che permettono di ottenere i nomi simbolici associati ad indirizzi,
32 porte o altre proprietà del sistema.
33
34
35 \subsection{La struttura del \textit{resolver}}
36 \label{sec:sock_resolver}
37
38 \itindbeg{resolver} La risoluzione dei nomi è associata tradizionalmente al
39 servizio del \itindex{Domain~Name~Service} \textit{Domain Name Service} che
40 permette di identificare le macchine su internet invece che per numero IP
41 attraverso il relativo \textsl{nome a dominio}.\footnote{non staremo ad
42   entrare nei dettagli della definizione di cosa è un nome a dominio, dandolo
43   per noto, una introduzione alla problematica si trova in \cite{AGL} (cap.~9)
44   mentre per una trattazione approfondita di tutte le problematiche relative
45   al DNS si può fare riferimento a \cite{DNSbind}.} In realtà per DNS si
46 intendono spesso i server che forniscono su internet questo servizio, mentre
47 nel nostro caso affronteremo la problematica dal lato client, di un qualunque
48 programma che necessita di compiere questa operazione.
49
50 \begin{figure}[!htb]
51   \centering \includegraphics[width=11cm]{img/resolver}
52   \caption{Schema di funzionamento delle funzioni del \textit{resolver}.}
53   \label{fig:sock_resolver_schema}
54 \end{figure}
55
56 Inoltre quella fra nomi a dominio e indirizzi IP non è l'unica corrispondenza
57 possibile fra nomi simbolici e valori numerici, come abbiamo visto anche in
58 sez.~\ref{sec:sys_user_group} per le corrispondenze fra nomi di utenti e
59 gruppi e relativi identificatori numerici; per quanto riguarda però tutti i
60 nomi associati a identificativi o servizi relativi alla rete il servizio di
61 risoluzione è gestito in maniera unificata da un insieme di funzioni fornite
62 con le librerie del C, detto appunto \textit{resolver}.
63
64 Lo schema di funzionamento del \textit{resolver} è illustrato in
65 fig.~\ref{fig:sock_resolver_schema}; in sostanza i programmi hanno a
66 disposizione un insieme di funzioni di libreria con cui chiamano il
67 \textit{resolver}, indicate con le frecce nere. Ricevuta la richiesta è
68 quest'ultimo che, sulla base della sua configurazione, esegue le operazioni
69 necessarie a fornire la risposta, che possono essere la lettura delle
70 informazioni mantenute nei relativi dei file statici presenti sulla macchina,
71 una interrogazione ad un DNS (che a sua volta, per il funzionamento del
72 protocollo, può interrogarne altri) o la richiesta ad altri server per i quali
73 sia fornito il supporto, come LDAP.\footnote{la sigla LDAP fa riferimento ad
74   un protocollo, il \textit{Lightweight Directory Access Protocol}, che
75   prevede un meccanismo per la gestione di \textsl{elenchi} di informazioni
76   via rete; il contenuto di un elenco può essere assolutamente generico, e
77   questo permette il mantenimento dei più vari tipi di informazioni su una
78   infrastruttura di questo tipo.}
79
80 La configurazione del \textit{resolver} attiene più alla amministrazione di
81 sistema che alla programmazione, ciò non di meno, prima di trattare le varie
82 funzioni di librerie utilizzate dai programmi, vale la pena fare una
83 panoramica generale.  Originariamente la configurazione del \textit{resolver}
84 riguardava esclusivamente le questioni relative alla gestione dei nomi a
85 dominio, e prevedeva solo l'utilizzo del DNS e del file statico
86 \conffile{/etc/hosts}.
87
88 Per questo aspetto il file di configurazione principale del sistema è
89 \conffile{/etc/resolv.conf} che contiene in sostanza l'elenco degli indirizzi
90 IP dei server DNS da contattare; a questo si affiancava (fino alle \acr{glibc}
91 2.4) il file \conffile{/etc/host.conf} il cui scopo principale era indicare
92 l'ordine in cui eseguire la risoluzione dei nomi (se usare prima i valori di
93 \conffile{/etc/hosts} o quelli del DNS). Tralasciamo i dettagli relativi alle
94 varie direttive che possono essere usate in questi file, che si trovano nelle
95 rispettive pagine di manuale.
96
97 Con il tempo però è divenuto possibile fornire diversi sostituti per
98 l'utilizzo delle associazione statiche in \conffile{/etc/hosts}, inoltre oltre
99 alla risoluzione dei nomi a dominio ci sono anche altri nomi da risolvere,
100 come quelli che possono essere associati ad una rete (invece che ad una
101 singola macchina) o ai gruppi di macchine definiti dal servizio
102 NIS,\footnote{il \textit{Network Information Service} è un servizio, creato da
103   Sun, e poi diffuso su tutte le piattaforme unix-like, che permette di
104   raggruppare all'interno di una rete (in quelli che appunto vengono chiamati
105   \textit{netgroup}) varie macchine, centralizzando i servizi di definizione
106   di utenti e gruppi e di autenticazione, oggi è sempre più spesso sostituito
107   da LDAP.} o come quelli dei protocolli e dei servizi che sono mantenuti nei
108 file statici \conffile{/etc/protocols} e \conffile{/etc/services}.  
109
110 Molte di queste informazioni non si trovano su un DNS, ma in una rete locale
111 può essere molto utile centralizzare il mantenimento di alcune di esse su
112 opportuni server.  Inoltre l'uso di diversi supporti possibili per le stesse
113 informazioni (ad esempio il nome delle macchine può essere mantenuto sia
114 tramite \conffile{/etc/hosts}, che con il DNS, che con NIS) comporta il
115 problema dell'ordine in cui questi vengono interrogati. Con le implementazioni
116 classiche i vari supporti erano introdotti modificando direttamente le
117 funzioni di libreria, prevedendo un ordine di interrogazione predefinito e non
118 modificabile (a meno di una ricompilazione delle librerie stesse).
119
120 \itindbeg{Name~Service~Switch~(NSS)} 
121
122 Per risolvere questa serie di problemi la risoluzione dei nomi a dominio
123 eseguità dal \textit{resolver} è stata inclusa all'interno di un meccanismo
124 generico per la risoluzione di corrispondenze fra nomi ed informazioni ad essi
125 associate chiamato \textit{Name Service Switch}, cui abbiamo accennato anche in
126 sez.~\ref{sec:sys_user_group} per quanto riguarda la gestione dei dati
127 associati a utenti e gruppi. Il sistema è stato introdotto la prima volta
128 nelle librerie standard di Solaris e le \acr{glibc} hanno ripreso lo stesso
129 schema; si tenga presente che questo sistema non esiste per altre librerie
130 standard come le \acr{libc5} o le \acr{uclib}.
131
132 Il \textit{Name Service Switch} (cui spesso si fa riferimento con l'acronimo
133 NSS) è un sistema di librerie dinamiche che permette di definire in maniera
134 generica sia i supporti su cui mantenere i dati di corrispondenza fra nomi e
135 valori numerici, sia l'ordine in cui effettuare le ricerche sui vari supporti
136 disponibili. Il sistema prevede una serie di possibili classi di
137 corrispondenza, quelle attualmente definite sono riportate in
138 tab.~\ref{tab:sys_NSS_classes}.
139
140 \begin{table}[htb]
141   \footnotesize
142   \centering
143   \begin{tabular}[c]{|l|p{8cm}|}
144     \hline
145     \textbf{Classe} & \textbf{Tipo di corrispondenza}\\
146     \hline
147     \hline
148     \texttt{passwd}   & Corrispondenze fra nome dell'utente e relative
149                         proprietà (\ids{UID}, gruppo principale, ecc.).\\  
150     \texttt{shadow}   & Corrispondenze fra username e password dell'utente
151                         (e altre informazioni relative alle password).\\  
152     \texttt{group}    & Corrispondenze fra nome del gruppo e proprietà dello 
153                         stesso.\\  
154     \texttt{aliases}  & Alias per la posta elettronica.\\ 
155     \texttt{ethers}   & Corrispondenze fra numero IP e MAC address della
156                         scheda di rete.\\ 
157     \texttt{hosts}    & Corrispondenze fra nome a dominio e numero IP.\\ 
158     \texttt{netgroup} & Corrispondenze fra gruppo di rete e macchine che lo
159                         compongono.\\  
160     \texttt{networks} & Corrispondenze fra nome di una rete e suo indirizzo
161                         IP.\\  
162     \texttt{protocols}& Corrispondenze fra nome di un protocollo e relativo
163                         numero identificativo.\\ 
164     \texttt{rpc}      & Corrispondenze fra nome di un servizio RPC e relativo 
165                         numero identificativo.\\ 
166     \texttt{publickey}& Chiavi pubbliche e private usate per gli RFC sicuri,
167                         utilizzate da NFS e NIS+. \\ 
168     \texttt{services} & Corrispondenze fra nome di un servizio e numero di
169                         porta. \\ 
170     \hline
171   \end{tabular}
172   \caption{Le diverse classi di corrispondenze definite
173     all'interno del \textit{Name Service Switch}.} 
174   \label{tab:sys_NSS_classes}
175 \end{table}
176
177 % TODO rivedere meglio la tabella
178
179 Il sistema del \textit{Name Service Switch} è controllato dal contenuto del
180 file \conffile{/etc/nsswitch.conf}; questo contiene una riga di configurazione
181 per ciascuna di queste classi, che viene inizia col nome di
182 tab.~\ref{tab:sys_NSS_classes} seguito da un carattere ``\texttt{:}'' e
183 prosegue con la lista dei \textsl{servizi} su cui le relative informazioni
184 sono raggiungibili, scritti nell'ordine in cui si vuole siano interrogati.
185 Pertanto nelle versioni recenti delle librerie è questo file e non
186 \conffile{/etc/host.conf}  a indicare l'ordine con cui si esegue la
187 risoluzione dei nomi.
188
189 Ogni servizio è specificato a sua volta da un nome, come \texttt{file},
190 \texttt{dns}, \texttt{db}, ecc.  che identifica la libreria dinamica che
191 realizza l'interfaccia con esso. Per ciascun servizio se \texttt{NAME} è il
192 nome utilizzato dentro \conffile{/etc/nsswitch.conf}, dovrà essere presente
193 (usualmente in \file{/lib}) una libreria \texttt{libnss\_NAME} che ne
194 implementa le funzioni.
195
196 In ogni caso, qualunque sia la modalità con cui ricevono i dati o il supporto
197 su cui vengono mantenuti, e che si usino o meno funzionalità aggiuntive
198 fornite dal sistema del \textit{Name Service Switch}, dal punto di vista di un
199 programma che deve effettuare la risoluzione di un nome a dominio, tutto
200 quello che conta sono le funzioni classiche che il \textit{resolver} mette a
201 disposizione (è cura delle \acr{glibc} tenere conto della presenza del
202 \textit{Name Service Switch}) e sono queste quelle che tratteremo nelle
203 sezioni successive.  
204
205 \itindend{Name~Service~Switch~(NSS)}
206
207
208 \subsection{Le funzioni di interrogazione del DNS}
209 \label{sec:sock_resolver_functions}
210
211 Prima di trattare le funzioni usate normalmente nella risoluzione dei nomi a
212 dominio conviene trattare in maniera più dettagliata il servizio DNS. Come
213 accennato questo, benché esso in teoria sia solo uno dei possibili supporti su
214 cui mantenere le informazioni, in pratica costituisce il meccanismo principale
215 con cui vengono risolti i nomi a dominio. Inolte esso può fornire anche
216 ulteriori informazioni oltre relative alla risoluzione dei nomi a dominio.
217 Per questo motivo esistono una serie di funzioni di libreria che servono
218 specificamente ad eseguire delle interrogazioni verso un server DNS, funzioni
219 che poi vengono utilizzate anche per realizzare le funzioni generiche di
220 libreria usate dal sistema del \textit{resolver}.
221
222 Il sistema del DNS è in sostanza di un database distribuito organizzato in
223 maniera gerarchica, i dati vengono mantenuti in tanti server distinti ciascuno
224 dei quali si occupa della risoluzione del proprio \textsl{dominio}; i nomi a
225 dominio sono organizzati in una struttura ad albero analoga a quella
226 dell'albero dei file, con domini di primo livello (come i \texttt{.org}),
227 secondo livello (come \texttt{.truelite.it}), ecc.  In questo caso le
228 separazioni sono fra i vari livelli sono definite dal carattere ``\texttt{.}''
229 ed i nomi devono essere risolti da destra verso sinistra.\footnote{per chi si
230   stia chiedendo quale sia la radice di questo albero, cioè l'equivalente di
231   ``\texttt{/}'', la risposta è il dominio speciale ``\texttt{.}'', che in
232   genere non viene mai scritto esplicitamente, ma che, come chiunque abbia
233   configurato un server DNS sa bene, esiste ed è gestito dai cosiddetti
234   \textit{root DNS} che risolvono i domini di primo livello.} Il meccanismo
235 funziona con il criterio della \textsl{delegazione}, un server responsabile
236 per un dominio di primo livello può delegare la risoluzione degli indirizzi
237 per un suo dominio di secondo livello ad un altro server, il quale a sua volta
238 potrà delegare la risoluzione di un eventuale sotto-dominio di terzo livello ad
239 un altro server ancora.
240
241 Come accennato un server DNS è in grado di fare molto altro rispetto alla
242 risoluzione di un nome a dominio in un indirizzo IP: ciascuna voce nel
243 database viene chiamata \textit{resource record}, e può contenere diverse
244 informazioni. In genere i \textit{resource record} vengono classificati per la
245 \textsl{classe di indirizzi} cui i dati contenuti fanno riferimento, e per il
246 \textsl{tipo} di questi ultimi (ritroveremo classi di indirizzi e tipi di
247 record più avanti in tab.~\ref{tab:DNS_address_class} e
248 tab.~\ref{tab:DNS_record_type}).  Oggigiorno i dati mantenuti nei server DNS
249 sono quasi esclusivamente relativi ad indirizzi internet, per cui in pratica
250 viene utilizzata soltanto una classe di indirizzi; invece le corrispondenze
251 fra un nome a dominio ed un indirizzo IP sono solo uno fra i vari tipi di
252 informazione che un server DNS fornisce normalmente.
253
254 L'esistenza di vari tipi di informazioni è un altro dei motivi per cui il
255 \textit{resolver} prevede, oltre a quelle relative alla semplice risoluzione
256 dei nomi, un insieme di funzioni specifiche dedicate all'interrogazione di un
257 server DNS, tutte nella forma \texttt{res\_}\textsl{\texttt{nome}}. La prima
258 di queste funzioni è \funcd{res\_init}, il cui prototipo è:
259
260 \begin{funcproto}{
261 \fhead{netinet/in.h} 
262 \fhead{arpa/nameser.h} 
263 \fhead{resolv.h}
264 \fdecl{int res\_init(void)}
265 \fdesc{Inizializza il sistema del \textit{resolver}.} 
266 }
267 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore.
268 }
269 \end{funcproto}
270
271 La funzione legge il contenuto dei file di configurazione per impostare il
272 dominio di default, gli indirizzi dei server DNS da contattare e l'ordine
273 delle ricerche; se non sono specificati server verrà utilizzato l'indirizzo
274 locale, e se non è definito un dominio di default sarà usato quello associato
275 con l'indirizzo locale (ma questo può essere sovrascritto con l'uso della
276 variabile di ambiente \envvar{LOCALDOMAIN}). In genere non è necessario
277 eseguire questa funzione esplicitamente, in quanto viene automaticamente
278 chiamata la prima volta che si esegue una qualunque delle altre.
279
280 Le impostazioni e lo stato del \textit{resolver} inizializzati da
281 \func{res\_init} vengono mantenuti in una serie di variabili raggruppate nei
282 campi di una apposita struttura. Questa struttura viene definita in
283 \headfiled{resolv.h} e mantenuta nella variabile globale \var{\_res}, che
284 viene utilizzata internamente da tutte le funzioni dell'interfaccia. Questo
285 consente anche di accedere direttamente al contenuto della variabile
286 all'interno di un qualunque programma, una volta che la sia opportunamente
287 dichiarata con:
288 \includecodesnip{listati/resolv_option.c}
289
290 Dato che l'uso di una variabile globale rende tutte le funzioni
291 dell'interfaccia classica non rientranti, queste sono state deprecate in
292 favore di una nuova interfaccia in cui esse sono state sostituite da
293 altrettante nuove funzioni, il cui nome è ottenuto apponendo una
294 ``\texttt{n}'' al nome di quella tradizionale (cioè nella forma
295 \texttt{res\_n\textsl{nome}}). Tutte le nuove funzioni sono identiche alle
296 precedenti, ma hanno un primo argomento aggiuntivo, \param{statep}, puntatore
297 ad una struttura dello stesso tipo di \var{\_res}. Questo consente di usare
298 una variabile locale per mantenere lo stato del \textit{resolver}, rendendo le
299 nuove funzioni rientranti.  In questo caso per poter utilizzare il nuovo
300 argomento occorrerà una opportuna dichiarazione del relativo tipo di dato con:
301 \includecodesnip{listati/resolv_newoption.c}
302
303 Così la nuova funzione utilizzata per inizializzare il \textit{resolver} (che
304 come la precedente viene chiamata automaticamente da tutte altre funzioni) è
305 \funcd{res\_ninit}, ed il suo prototipo è:
306
307 \begin{funcproto}{
308 \fhead{netinet/in.h} 
309 \fhead{arpa/nameser.h} 
310 \fhead{resolv.h}
311 \fdecl{int res\_ninit(res\_state statep)}
312 \fdesc{Inizializza il sistema del \textit{resolver}.} 
313 }
314 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore.
315 }
316 \end{funcproto}
317
318 Indipendentemente da quale versione delle funzioni si usino, tutti i campi
319 della struttura (\var{\_res} o la variabile puntata da \param{statep}) sono ad
320 uso interno, e vengono usualmente inizializzate da \func{res\_init} o
321 \func{res\_ninit} in base al contenuto dei file di configurazione e ad una
322 serie di valori di default. L'unico campo che può essere utile modificare è
323 \var{\_res.options} (o l'equivalente della variabile puntata
324 da\param{statep}), una maschera binaria che contiene una serie di bit che
325 esprimono le opzioni che permettono di controllare il comportamento del
326 \textit{resolver}.
327
328 \begin{table}[htb]
329   \centering
330   \footnotesize
331   \begin{tabular}[c]{|l|p{8cm}|}
332     \hline
333     \textbf{Costante} & \textbf{Significato} \\
334     \hline
335     \hline
336     \constd{RES\_INIT}       & Viene attivato se è stata chiamata
337                                \func{res\_init}. \\
338     \constd{RES\_DEBUG}      & Stampa dei messaggi di debug.\\
339     \constd{RES\_AAONLY}     & Accetta solo risposte autoritative.\\
340     \constd{RES\_USEVC}      & Usa connessioni TCP per contattare i server 
341                                invece che l'usuale UDP.\\
342     \constd{RES\_PRIMARY}    & Interroga soltanto server DNS primari.\\
343     \constd{RES\_IGNTC}      & Ignora gli errori di troncamento, non ritenta la
344                                richiesta con una connessione TCP.\\
345     \constd{RES\_RECURSE}    & Imposta il bit che indica che si desidera
346                                eseguire una interrogazione ricorsiva.\\
347     \constd{RES\_DEFNAMES}   & Se attivo \func{res\_search} aggiunge il nome
348                                del dominio di default ai nomi singoli (che non
349                                contengono cioè un ``\texttt{.}'').\\
350     \constd{RES\_STAYOPEN}   & Usato con \const{RES\_USEVC} per mantenere
351                                aperte le connessioni TCP fra interrogazioni
352                                diverse.\\
353     \constd{RES\_DNSRCH}     & Se attivo \func{res\_search} esegue le ricerche
354                                di nomi di macchine nel dominio corrente o nei
355                                domini ad esso sovrastanti.\\
356     \constd{RES\_INSECURE1}  & Blocca i controlli di sicurezza di tipo 1.\\
357     \constd{RES\_INSECURE2}  & Blocca i controlli di sicurezza di tipo 2.\\
358     \constd{RES\_NOALIASES}  & Blocca l'uso della variabile di ambiente
359                                \envvar{HOSTALIASES}.\\ 
360     \constd{RES\_USE\_INET6} & Restituisce indirizzi IPv6 con
361                                \func{gethostbyname}. \\
362     \constd{RES\_ROTATE}     & Ruota la lista dei server DNS dopo ogni
363                                interrogazione.\\
364     \constd{RES\_NOCHECKNAME}& Non controlla i nomi per verificarne la
365                                correttezza sintattica. \\
366     \constd{RES\_KEEPTSIG}   & Non elimina i record di tipo \texttt{TSIG}.\\
367     \constd{RES\_BLAST}      & Effettua un ``\textit{blast}'' inviando
368                                simultaneamente le richieste a tutti i server;
369                                non ancora implementata. \\
370     \constd{RES\_DEFAULT}    & Combinazione di \const{RES\_RECURSE},
371                                \const{RES\_DEFNAMES} e \const{RES\_DNSRCH}.\\
372     \hline
373   \end{tabular}
374   \caption{Costanti utilizzabili come valori per \var{\_res.options}.}
375   \label{tab:resolver_option}
376 \end{table}
377
378 Per utilizzare questa funzionalità per modificare le impostazioni direttamente
379 da programma occorrerà impostare un opportuno valore per questo campo ed
380 invocare esplicitamente \func{res\_init} o \func{res\_ninit}, dopo di che le
381 altre funzioni prenderanno le nuove impostazioni. Le costanti che definiscono
382 i vari bit di questo campo, ed il relativo significato sono illustrate in
383 tab.~\ref{tab:resolver_option}; trattandosi di una maschera binaria un valore
384 deve essere espresso con un opportuno OR aritmetico di dette costanti; ad
385 esempio il valore di default delle opzioni, espresso dalla costante
386 \const{RES\_DEFAULT}, è definito come:
387 \includecodesnip{listati/resolv_option_def.c}
388
389 Non tratteremo il significato degli altri campi non essendovi necessità di
390 modificarli direttamente; gran parte di essi sono infatti impostati dal
391 contenuto dei file di configurazione, mentre le funzionalità controllate da
392 alcuni di esse possono essere modificate con l'uso delle opportune variabili
393 di ambiente come abbiamo visto per \envvar{LOCALDOMAIN}. In particolare con
394 \envvar{RES\_RETRY} si soprassiede il valore del campo \var{retry} che
395 controlla quante volte viene ripetuto il tentativo di connettersi ad un server
396 DNS prima di dichiarare fallimento; il valore di default è 4, un valore nullo
397 significa bloccare l'uso del DNS. Infine con \envvar{RES\_TIMEOUT} si
398 soprassiede il valore del campo \var{retrans} (preimpostato al valore della
399 omonima costante \const{RES\_TIMEOUT} di \headfile{resolv.h}) che è il valore
400 preso come base (in numero di secondi) per definire la scadenza di una
401 richiesta, ciascun tentativo di richiesta fallito viene ripetuto raddoppiando
402 il tempo di scadenza per il numero massimo di volte stabilito da
403 \texttt{RES\_RETRY}.
404
405 La funzione di interrogazione principale è \funcd{res\_query}
406 (\funcd{res\_nquery} per la nuova interfaccia), che serve ad eseguire una
407 richiesta ad un server DNS per un nome a dominio \textsl{completamente
408   specificato} (quello che si chiama
409 \itindex{Fully~Qualified~Domain~Name~(FQDN)} FQDN, \textit{Fully Qualified 
410   Domain Name}); il loro prototipo è:
411
412 \begin{funcproto}{
413 \fhead{netinet/in.h} 
414 \fhead{arpa/nameser.h} 
415 \fhead{resolv.h}
416 \fdecl{int res\_query(const char *dname, int class, int type,
417               unsigned char *answer, int anslen)}
418 \fdecl{int res\_nquery(res\_state statep, const char *dname, int class, int
419   type, \\
420   \phantom{int res\_nquery(}unsigned char *answer, int anslen)}
421 \fdesc{Esegue una interrogazione al DNS.} 
422 }
423 {Le funzioni ritornano un valore positivo pari alla lunghezza dei dati scritti
424   nel buffer \param{answer} in caso di successo e $-1$ per un errore.
425 }
426 \end{funcproto}
427
428 Le funzioni eseguono una interrogazione ad un server DNS relativa al nome da
429 risolvere passato nella stringa indirizzata da \param{dname}, inoltre deve
430 essere specificata la classe di indirizzi in cui eseguire la ricerca con
431 \param{class}, ed il tipo di \textit{resource record} che si vuole ottenere
432 con \param{type}. Il risultato della ricerca verrà scritto nel buffer di
433 lunghezza \param{anslen} puntato da \param{answer} che si sarà opportunamente
434 allocato in precedenza.
435
436 Una seconda funzione di ricerca analoga a \func{res\_query}, che prende gli
437 stessi argomenti ma che esegue l'interrogazione con le funzionalità
438 addizionali previste dalle due opzioni \const{RES\_DEFNAMES} e
439 \const{RES\_DNSRCH}, è \funcd{res\_search} (\funcd{res\_nsearch} per la nuova
440 interfaccia), il cui prototipo è:
441
442 \begin{funcproto}{
443 \fhead{netinet/in.h} 
444 \fhead{arpa/nameser.h} 
445 \fhead{resolv.h}
446 \fdecl{int res\_search(const char *dname, int class, int type,
447   unsigned char *answer, \\
448   \phantom{int res\_search}int anslen)}
449 \fdecl{int res\_nsearch(res\_state statep, const char *dname, int class, 
450   int type, \\
451   \phantom{int res\_nsearch(}unsigned char *answer, int anslen)}
452 \fdesc{Esegue una interrogazione al DNS.} 
453 }
454 {Le funzioni ritornano un valore positivo pari alla lunghezza dei dati scritti
455   nel buffer \param{answer} in caso di successo e $-1$ per un errore.
456 }
457 \end{funcproto}
458
459 In sostanza la funzione ripete una serie di chiamate a \func{res\_query}
460 (\func{res\_nquery}) aggiungendo al nome contenuto nella stringa \param{dname}
461 il dominio di default da cercare, fermandosi non appena trova un risultato.
462 Il risultato di entrambe le funzioni viene scritto nel formato opportuno (che
463 sarà diverso a seconda del tipo di record richiesto) nel buffer di ritorno;
464 sarà compito del programma (o di altre funzioni) estrarre i relativi dati,
465 esistono una serie di funzioni interne usate per la scansione di questi dati,
466 per chi fosse interessato una trattazione dettagliata è riportata nel
467 quattordicesimo capitolo di \cite{DNSbind}.
468
469 Le classi di indirizzi supportate da un server DNS sono tre, ma di queste in
470 pratica oggi viene utilizzata soltanto quella degli indirizzi internet; le
471 costanti che identificano dette classi, da usare come valore per l'argomento
472 \param{class} delle precedenti funzioni, sono riportate in
473 tab.~\ref{tab:DNS_address_class} (esisteva in realtà anche una classe
474 \constd{C\_CSNET} per la omonima rete, ma è stata dichiarata obsoleta).
475
476 \begin{table}[htb]
477   \centering
478   \footnotesize
479   \begin{tabular}[c]{|l|p{8cm}|}
480     \hline
481     \textbf{Costante} & \textbf{Significato} \\
482     \hline
483     \hline
484     \constd{C\_IN}   & Indirizzi internet, in pratica i soli utilizzati oggi.\\
485     \constd{C\_HS}   & Indirizzi \textit{Hesiod}, utilizzati solo al MIT, oggi
486                        completamente estinti. \\
487     \constd{C\_CHAOS}& Indirizzi per la rete \textit{Chaosnet}, un'altra rete
488                        sperimentale nata al MIT. \\
489     \constd{C\_ANY}  & Indica un indirizzo di classe qualunque.\\
490     \hline
491   \end{tabular}
492   \caption{Costanti identificative delle classi di indirizzi per l'argomento
493     \param{class} di \func{res\_query}.}
494   \label{tab:DNS_address_class}
495 \end{table}
496
497 Come accennato le tipologie di dati che sono mantenibili su un server DNS sono
498 diverse, ed a ciascuna di essa corrisponde un diverso tipo di \textit{resource
499   record}. L'elenco delle costanti, ripreso dai file di dichiarazione
500 \headfiled{arpa/nameser.h} e \headfiled{arpa/nameser\_compat.h}, che
501 definiscono i valori che si possono usare per l'argomento \param{type} per
502 specificare il tipo di \textit{resource record} da richiedere è riportato in
503 tab.~\ref{tab:DNS_record_type}; le costanti (tolto il \texttt{T\_} iniziale)
504 hanno gli stessi nomi usati per identificare i record nei file di zona di
505 BIND,\footnote{BIND, acronimo di \textit{Berkley Internet Name Domain}, è una
506   implementazione di un server DNS, ed, essendo utilizzata nella stragrande
507   maggioranza dei casi, fa da riferimento; i dati relativi ad un certo dominio
508   (cioè i suoi \textit{resource record} vengono mantenuti in quelli che sono
509   usualmente chiamati \textsl{file di zona}, e in essi ciascun tipo di dominio
510   è identificato da un nome che è appunto identico a quello delle costanti di
511   tab.~\ref{tab:DNS_record_type} senza il \texttt{T\_} iniziale.} e che
512 normalmente sono anche usati come nomi per indicare i record.
513
514 \begin{table}[!htb]
515   \centering
516   \footnotesize
517   \begin{tabular}[c]{|l|l|}
518     \hline
519     \textbf{Costante} & \textbf{Significato} \\
520     \hline
521     \hline
522     \constd{T\_A}     & Indirizzo di una stazione.\\
523     \constd{T\_NS}    & Server DNS autoritativo per il dominio richiesto.\\
524     \constd{T\_MD}    & Destinazione per la posta elettronica.\\
525     \constd{T\_MF}    & Redistributore per la posta elettronica.\\
526     \constd{T\_CNAME} & Nome canonico.\\
527     \constd{T\_SOA}   & Inizio di una zona di autorità.\\
528     \constd{T\_MB}    & Nome a dominio di una casella di posta.\\
529     \constd{T\_MG}    & Nome di un membro di un gruppo di posta.\\
530     \constd{T\_MR}    & Nome di un cambiamento di nome per la posta.\\
531     \constd{T\_NULL}  & Record nullo.\\
532     \constd{T\_WKS}   & Servizio noto.\\
533     \constd{T\_PTR}   & Risoluzione inversa di un indirizzo numerico.\\
534     \constd{T\_HINFO} & Informazione sulla stazione.\\
535     \constd{T\_MINFO} & Informazione sulla casella di posta.\\
536     \constd{T\_MX}    & Server cui instradare la posta per il dominio.\\
537     \constd{T\_TXT}   & Stringhe di testo (libere).\\
538     \constd{T\_RP}    & Nome di un responsabile (\textit{responsible person}).\\
539     \constd{T\_AFSDB} & Database per una cella AFS.\\
540     \constd{T\_X25}   & Indirizzo di chiamata per X.25.\\
541     \constd{T\_ISDN}  & Indirizzo di chiamata per ISDN.\\
542     \constd{T\_RT}    & Router.\\
543     \constd{T\_NSAP}  & Indirizzo NSAP.\\
544     \constd{T\_NSAP\_PTR}& Risoluzione inversa per NSAP (deprecato).\\
545     \constd{T\_SIG}   & Firma digitale di sicurezza.\\
546     \constd{T\_KEY}   & Chiave per firma.\\
547     \constd{T\_PX}    & Corrispondenza per la posta X.400.\\
548     \constd{T\_GPOS}  & Posizione geografica.\\
549     \constd{T\_AAAA}  & Indirizzo IPv6.\\
550     \constd{T\_LOC}   & Informazione di collocazione.\\
551     \constd{T\_NXT}   & Dominio successivo.\\
552     \constd{T\_EID}   & Identificatore di punto conclusivo.\\
553     \constd{T\_NIMLOC}& Posizionatore \textit{nimrod}.\\
554     \constd{T\_SRV}   & Servizio.\\
555     \constd{T\_ATMA}  & Indirizzo ATM.\\
556     \constd{T\_NAPTR} & Puntatore ad una \textit{naming authority}.\\
557     \constd{T\_TSIG}  & Firma di transazione.\\
558     \constd{T\_IXFR}  & Trasferimento di zona incrementale.\\
559     \constd{T\_AXFR}  & Trasferimento di zona di autorità.\\
560     \constd{T\_MAILB} & Trasferimento di record di caselle di posta.\\
561     \constd{T\_MAILA} & Trasferimento di record di server di posta.\\
562     \constd{T\_ANY}   & Valore generico.\\
563     \hline
564   \end{tabular}
565   \caption{Costanti identificative del tipo di record per l'argomento
566     \param{type} di \func{res\_query}.}
567   \label{tab:DNS_record_type}
568 \end{table}
569
570
571 L'elenco di tab.~\ref{tab:DNS_record_type} è quello di \textsl{tutti} i
572 \textit{resource record} definiti, con una breve descrizione del relativo
573 significato.  Di tutti questi però viene impiegato correntemente solo un
574 piccolo sottoinsieme, alcuni sono obsoleti ed altri fanno riferimento a dati
575 applicativi che non ci interessano non avendo nulla a che fare con la
576 risoluzione degli indirizzi IP, pertanto non entreremo nei dettagli del
577 significato di tutti i \textit{resource record}, ma solo di quelli usati dalle
578 funzioni del \textit{resolver}. Questi sono sostanzialmente i seguenti (per
579 indicarli si è usata la notazione dei file di zona di BIND):
580 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
581 \item[\texttt{A}] viene usato per indicare la corrispondenza fra un nome a
582   dominio ed un indirizzo IPv4; ad esempio la corrispondenza fra
583   \texttt{jojo.truelite.it} e l'indirizzo IP \texttt{62.48.34.25}.
584 \item[\texttt{AAAA}] viene usato per indicare la corrispondenza fra un nome a
585   dominio ed un indirizzo IPv6; è chiamato in questo modo dato che la
586   dimensione di un indirizzo IPv6 è quattro volte quella di un indirizzo IPv4.
587 \item[\texttt{PTR}] per fornire la corrispondenza inversa fra un indirizzo IP
588   ed un nome a dominio ad esso associato si utilizza questo tipo di record (il
589   cui nome sta per \textit{pointer}).
590 \item[\texttt{CNAME}] qualora si abbiamo più nomi che corrispondono allo
591   stesso indirizzo (come ad esempio \texttt{www.truelite.it} e
592   \texttt{sources.truelite.it}, che fanno entrambi riferimento alla stessa
593   macchina (nel caso \texttt{dodds.truelite.it}) si può usare questo tipo di
594   record per creare degli \textit{alias} in modo da associare un qualunque
595   altro nome al \textsl{nome canonico} della macchina (si chiama così quello
596   associato al record \texttt{A}).
597 \end{basedescript}
598
599 Come accennato in caso di successo le due funzioni di richiesta restituiscono
600 il risultato della interrogazione al server, in caso di insuccesso l'errore
601 invece viene segnalato da un valore di ritorno pari a $-1$, ma in questo caso,
602 non può essere utilizzata la variabile \var{errno} per riportare un codice di
603 errore, in quanto questo viene impostato per ciascuna delle chiamate al
604 sistema utilizzate dalle funzioni del \textit{resolver}, non avrà alcun
605 significato nell'indicare quale parte del procedimento di risoluzione è
606 fallita.
607
608 Per questo motivo è stata definita una variabile di errore separata,
609 \var{h\_errno}, che viene utilizzata dalle funzioni del \textit{resolver} per
610 indicare quale problema ha causato il fallimento della risoluzione del nome.
611 Ad essa si può accedere una volta che la si dichiara con:
612 \includecodesnip{listati/herrno.c} 
613 ed i valori che può assumere, con il relativo significato, sono riportati in
614 tab.~\ref{tab:h_errno_values}.
615
616 \begin{table}[!htb]
617   \centering
618   \footnotesize
619   \begin{tabular}[c]{|l|p{9cm}|}
620     \hline
621     \textbf{Costante} & \textbf{Significato} \\
622     \hline
623     \hline
624     \constd{HOST\_NOT\_FOUND}& L'indirizzo richiesto non è valido e la
625                                macchina indicata è sconosciuta.\\
626     \constd{NO\_ADDRESS}     & Il nome a dominio richiesto è valido, ma non ha
627                                un indirizzo associato ad esso
628                                (alternativamente può essere indicato come 
629                                \constd{NO\_DATA}).\\
630     \constd{NO\_RECOVERY}    & Si è avuto un errore non recuperabile
631                                nell'interrogazione di un server DNS.\\
632     \constd{TRY\_AGAIN}      & Si è avuto un errore temporaneo
633                                nell'interrogazione di un server DNS, si può
634                                ritentare l'interrogazione in un secondo
635                                tempo.\\
636     \hline
637   \end{tabular}
638   \caption{Valori possibili della variabile \var{h\_errno}.}
639   \label{tab:h_errno_values}
640 \end{table}
641
642 Insieme alla nuova variabile vengono definite anche delle nuove funzioni per
643 stampare l'errore a video, analoghe a quelle di sez.~\ref{sec:sys_strerror}
644 per \var{errno}, ma che usano il valore di \var{h\_errno}; la prima è
645 \funcd{herror} ed il suo prototipo è:
646
647 {\centering
648 \vspace{3pt}
649 \begin{funcbox}{
650 \fhead{netdb.h}
651 \fdecl{void herror(const char *string)}
652 \fdesc{Stampa un errore di risoluzione.} 
653 }
654 \end{funcbox}}
655
656 La funzione è l'analoga di \func{perror} e stampa sullo \textit{standard error} un
657 messaggio di errore corrispondente al valore corrente di \var{h\_errno}, a cui
658 viene anteposta la stringa \param{string} passata come argomento.  La seconda
659 funzione è \funcd{hstrerror} ed il suo prototipo è:
660
661 {\centering
662 \vspace{3pt}
663 \begin{funcbox}{
664 \fhead{netdb.h}
665 \fdecl{const char *hstrerror(int err)}
666 \fdesc{Restituisce una stringa corrispondente ad un errore di risoluzione.}
667 }
668 \end{funcbox}}
669
670 \noindent che, come  l'analoga \func{strerror}, restituisce una stringa con un
671 messaggio di errore già formattato, corrispondente al codice passato come
672 argomento (che si presume sia dato da \var{h\_errno}).
673
674 \itindend{resolver}
675
676
677 \subsection{La vecchia interfaccia per la risoluzione dei nomi a dominio}
678 \label{sec:sock_name_services}
679
680 La principale funzionalità del \textit{resolver} resta quella di risolvere i
681 nomi a dominio in indirizzi IP, per cui non ci dedicheremo oltre alle funzioni
682 per effetture delle richieste generiche al DNS ed esamineremo invece le
683 funzioni del \textit{resolver} dedicate specificamente a questo. Tratteremo in
684 questa sezione l'interfaccia tradizionale, che ormai è deprecata, mentre
685 vedremo nella sezione seguente la nuova interfaccia.
686
687 La prima funzione dell'interfaccia tradizionale è \funcd{gethostbyname} il cui
688 scopo è ottenere l'indirizzo di una stazione noto il suo nome a dominio, il
689 suo prototipo è:
690
691 \begin{funcproto}{
692 \fhead{netdb.h}
693 \fdecl{struct hostent *gethostbyname(const char *name)}
694 \fdesc{Determina l'indirizzo associato ad un nome a dominio.} 
695 }
696
697 {La funzione ritorna il puntatore ad una
698   struttura di tipo \struct{hostent} contenente i dati associati al nome a
699   dominio in caso di successo o un puntatore nullo per un errore.}
700 \end{funcproto}
701
702 La funzione prende come argomento una stringa \param{name} contenente il nome
703 a dominio che si vuole risolvere, in caso di successo i dati ad esso relativi
704 vengono memorizzati in una opportuna struttura \struct{hostent} la cui
705 definizione è riportata in fig.~\ref{fig:sock_hostent_struct}. 
706
707 \begin{figure}[!htb]
708   \footnotesize \centering
709   \begin{minipage}[c]{0.80\textwidth}
710     \includestruct{listati/hostent.h}
711   \end{minipage}
712   \caption{La struttura \structd{hostent} per la risoluzione dei nomi a
713     dominio e degli indirizzi IP.}
714   \label{fig:sock_hostent_struct}
715 \end{figure}
716
717 Quando un programma chiama \func{gethostbyname} e questa usa il DNS per
718 effettuare la risoluzione del nome, è con i valori contenuti nei relativi
719 record che vengono riempite le varie parti della struttura \struct{hostent}.
720 Il primo campo della struttura, \var{h\_name} contiene sempre il \textsl{nome
721   canonico}, che nel caso del DNS è appunto il nome associato ad un record
722 \texttt{A}. Il secondo campo della struttura, \var{h\_aliases}, invece è un
723 puntatore ad vettore di puntatori, terminato da un puntatore nullo. Ciascun
724 puntatore del vettore punta ad una stringa contenente uno degli altri
725 possibili nomi associati allo stesso \textsl{nome canonico} (quelli che nel
726 DNS vengono inseriti come record di tipo \texttt{CNAME}).
727
728 Il terzo campo della struttura, \var{h\_addrtype}, indica il tipo di indirizzo
729 che è stato restituito, e può assumere soltanto i valori \const{AF\_INET} o
730 \const{AF\_INET6}, mentre il quarto campo, \var{h\_length}, indica la
731 lunghezza dell'indirizzo stesso in byte. 
732
733 Infine il campo \var{h\_addr\_list} è il puntatore ad un vettore di puntatori
734 ai singoli indirizzi; il vettore è terminato da un puntatore nullo.  Inoltre,
735 come illustrato in fig.~\ref{fig:sock_hostent_struct}, viene definito il campo
736 \var{h\_addr} come sinonimo di \code{h\_addr\_list[0]}, cioè un riferimento
737 diretto al primo indirizzo della lista.
738
739 Oltre ai normali nomi a dominio la funzione accetta come argomento
740 \param{name} anche indirizzi numerici, in formato dotted decimal per IPv4 o
741 con la notazione illustrata in sez.~\ref{sec:IP_ipv6_notation} per IPv6. In
742 tal caso \func{gethostbyname} non eseguirà nessuna interrogazione remota, ma
743 si limiterà a copiare la stringa nel campo \var{h\_name} ed a creare la
744 corrispondente struttura \var{in\_addr} da indirizzare con
745 \code{h\_addr\_list[0]}.
746
747 Con l'uso di \func{gethostbyname} si ottengono solo gli indirizzi IPv4, se si
748 vogliono ottenere degli indirizzi IPv6 occorrerà prima impostare l'opzione
749 \const{RES\_USE\_INET6} nel campo \texttt{\_res.options} e poi chiamare
750 \func{res\_init} (vedi sez.~\ref{sec:sock_resolver_functions}) per modificare
751 le opzioni del \textit{resolver}; dato che questo non è molto comodo è stata
752 definita (è una estensione fornita dalle \acr{glibc}, disponibile anche in
753 altri sistemi unix-like) un'altra funzione, \funcd{gethostbyname2}, il cui
754 prototipo è:
755
756 \begin{funcproto}{
757 \fhead{netdb.h}
758 \fhead{sys/socket.h}
759 \fdecl{struct hostent *gethostbyname2(const char *name, int af)}
760 \fdesc{Determina l'indirizzo del tipo scelto associato ad un nome a dominio.} 
761 }
762
763 {La funzione ritorna il puntatore ad una
764   struttura di tipo \struct{hostent} contenente i dati associati al nome a
765   dominio in caso di successo e  un puntatore nullo per un errore.}
766 \end{funcproto}
767
768 In questo caso la funzione prende un secondo argomento \param{af} che indica
769 quale famiglia di indirizzi è quella che dovrà essere utilizzata per
770 selezionare i risultati restituiti dalla funzione; i soli valori consentiti
771 sono \const{AF\_INET} o \const{AF\_INET6} per indicare rispettivamente IPv4 e
772 IPv6 (per questo è necessario l'uso di \headfile{sys/socket.h}). Per tutto il
773 resto la funzione è identica a \func{gethostbyname}, ed identici sono i suoi
774 risultati.
775
776 \begin{figure}[!htb]
777   \footnotesize \centering
778   \begin{minipage}[c]{\codesamplewidth}
779     \includecodesample{listati/mygethost.c}
780   \end{minipage}
781   \normalsize
782   \caption{Esempio di codice per la risoluzione di un indirizzo.}
783   \label{fig:mygethost_example}
784 \end{figure}
785
786 Vediamo allora un primo esempio dell'uso delle funzioni di risoluzione, in
787 fig.~\ref{fig:mygethost_example} è riportato un estratto del codice di un
788 programma che esegue una semplice interrogazione al \textit{resolver} usando
789 \func{gethostbyname} e poi ne stampa a video i risultati. Al solito il
790 sorgente completo, che comprende il trattamento delle opzioni ed una funzione
791 per stampare un messaggio di aiuto, è nel file \texttt{mygethost.c} dei
792 sorgenti allegati alla guida.
793
794 Il programma richiede un solo argomento che specifichi il nome da cercare,
795 senza il quale (\texttt{\small 15--18}) esce con un errore. Dopo di che
796 (\texttt{\small 20}) si limita a chiamare \func{gethostbyname}, ricevendo il
797 risultato nel puntatore \var{data}. Questo (\texttt{\small 21--24}) viene
798 controllato per rilevare eventuali errori, nel qual caso il programma esce
799 dopo aver stampato un messaggio con \func{herror}. 
800
801 Se invece la risoluzione è andata a buon fine si inizia (\texttt{\small 25})
802 con lo stampare il nome canonico, dopo di che (\texttt{\small 26--30}) si
803 stampano eventuali altri nomi. Per questo prima (\texttt{\small 26}) si prende
804 il puntatore alla cima della lista che contiene i nomi e poi (\texttt{\small
805   27--30}) si esegue un ciclo che sarà ripetuto fin tanto che nella lista si
806 troveranno dei puntatori validi per le stringhe dei nomi (si ricordi che la
807 lista viene terminata da un puntatore nullo); prima (\texttt{\small 28}) si
808 stamperà la stringa e poi (\texttt{\small 29}) si provvederà ad incrementare
809 il puntatore per passare al successivo elemento della lista.
810
811 Una volta stampati i nomi si passerà a stampare gli indirizzi, il primo passo
812 (\texttt{\small 31--38}) è allora quello di riconoscere il tipo di indirizzo
813 sulla base del valore del campo \var{h\_addrtype}, stampandolo a video. Si è
814 anche previsto di stampare un errore nel caso (che non dovrebbe mai accadere)
815 di un indirizzo non valido.
816
817 Infine (\texttt{\small 39--44}) si stamperanno i valori degli indirizzi, di
818 nuovo (\texttt{\small 39}) si inizializzerà un puntatore alla cima della lista
819 e si eseguirà un ciclo fintanto che questo punterà ad indirizzi validi in
820 maniera analoga a quanto fatto in precedenza per i nomi a dominio. Si noti
821 come, essendo il campo \var{h\_addr\_list} un puntatore ad strutture di
822 indirizzi generiche, questo sia ancora di tipo \texttt{char **} e si possa
823 riutilizzare lo stesso puntatore usato per i nomi.
824
825 Per ciascun indirizzo valido si provvederà (\texttt{\small 41}) ad una
826 conversione con la funzione \func{inet\_ntop} (vedi
827 sez.~\ref{sec:sock_addr_func}) passandole gli opportuni argomenti, questa
828 restituirà la stringa da stampare (\texttt{\small 42}) con il valore
829 dell'indirizzo in \var{buffer}, che si è avuto la cura di dichiarare
830 inizialmente (\texttt{\small 10}) con dimensioni adeguate; dato che la
831 funzione è in grado di tenere conto automaticamente del tipo di indirizzo non
832 ci sono precauzioni particolari da prendere.\footnote{volendo essere pignoli
833   si dovrebbe controllarne lo stato di uscita, lo si è tralasciato per non
834   appesantire il codice, dato che in caso di indirizzi non validi si sarebbe
835   avuto un errore con \func{gethostbyname}, ma si ricordi che la sicurezza non
836   è mai troppa.}
837
838 Le funzioni illustrate finora hanno un difetto: utilizzano tutte una area di
839 memoria interna per allocare i contenuti della struttura \struct{hostent} e
840 per questo non possono essere rientranti. L'uso della memoria interna inoltre
841 comporta anche che in due successive chiamate i dati potranno essere
842 sovrascritti.
843
844 Si tenga presente poi che copiare il contenuto della sola struttura non è
845 sufficiente per salvare tutti i dati, in quanto questa contiene puntatori ad
846 altri dati, che pure possono essere sovrascritti; per questo motivo, se si
847 vuole salvare il risultato di una chiamata, occorrerà eseguire quella che si
848 chiama una \itindex{deep~copy} \textit{deep copy}.\footnote{si chiama così
849   quella tecnica per cui, quando si deve copiare il contenuto di una struttura
850   complessa (con puntatori che puntano ad altri dati, che a loro volta possono
851   essere puntatori ad altri dati) si deve copiare non solo il contenuto della
852   struttura, ma eseguire una scansione per risolvere anche tutti i puntatori
853   contenuti in essa (e così via se vi sono altre sotto-strutture con altri
854   puntatori) e copiare anche i dati da questi referenziati.}
855
856 Per ovviare a questi problemi nelle \acr{glibc} sono definite anche delle
857 versioni rientranti delle precedenti funzioni, al solito queste sono
858 caratterizzate dall'avere un suffisso \texttt{\_r}, pertanto avremo le due
859 funzioni \funcd{gethostbyname\_r} e \funcd{gethostbyname2\_r} i cui prototipi
860 sono:
861
862 \begin{funcproto}{
863 \fhead{netdb.h}
864 \fhead{sys/socket.h}
865 \fdecl{int gethostbyname\_r(const char *name, struct hostent *ret, 
866     char *buf, size\_t buflen,\\
867 \phantom{int gethostbyname\_r(}struct hostent **result, int *h\_errnop)}
868 \fdecl{int gethostbyname2\_r(const char *name, int af,
869          struct hostent *ret, char *buf,\\
870 \phantom{int gethostbyname2\_r(}size\_t buflen, struct hostent **result, int *h\_errnop)}
871
872 \fdesc{Versioni rientranti delle funzioni \func{gethostbyname} e
873   \func{gethostbyname2}.} 
874 }
875
876 {Le funzioni ritornano $0$ in caso di successo ed un valore diverso da zero per
877   un errore.}
878 \end{funcproto}
879
880 Gli argomenti \param{name} (e \param{af} per \func{gethostbyname2\_r}) hanno
881 lo stesso significato visto in precedenza. Tutti gli altri argomenti hanno lo
882 stesso significato per entrambe le funzioni. Per evitare l'uso di variabili
883 globali si dovrà allocare preventivamente una struttura \struct{hostent} in
884 cui ricevere il risultato, passandone l'indirizzo alla funzione nell'argomento
885 \param{ret}.  Inoltre, dato che \struct{hostent} contiene dei puntatori, dovrà
886 essere allocato anche un buffer in cui le funzioni possano scrivere tutti i
887 dati del risultato dell'interrogazione da questi puntati; l'indirizzo e la
888 lunghezza di questo buffer devono essere indicati con gli argomenti
889 \param{buf} e \param{buflen}.
890
891 Gli ultimi due argomenti vengono utilizzati per avere indietro i risultati
892 come \textit{value result argument}, si deve specificare l'indirizzo della
893 variabile su cui la funzione dovrà salvare il codice di errore
894 con \param{h\_errnop} e quello su cui dovrà salvare il puntatore che si userà
895 per accedere i dati con \param{result}.
896
897 In caso di successo entrambe le funzioni restituiscono un valore nullo,
898 altrimenti restituiscono un valore non nulla e all'indirizzo puntato
899 da \param{result} sarà salvato un puntatore nullo, mentre a quello puntato da
900 \param{h\_errnop} sarà salvato il valore del codice di errore, dato che per
901 essere rientrante la funzione non può la variabile globale \var{h\_errno}. In
902 questo caso il codice di errore, oltre ai valori di
903 tab.~\ref{tab:h_errno_values}, può avere anche quello di \errcode{ERANGE}
904 qualora il buffer allocato su \param{buf} non sia sufficiente a contenere i
905 dati, in tal caso si dovrà semplicemente ripetere l'esecuzione della funzione
906 con un buffer di dimensione maggiore.
907
908 Una delle caratteristiche delle interrogazioni al servizio DNS è che queste
909 sono normalmente eseguite con il protocollo UDP, ci sono casi in cui si
910 preferisce che vengano usate connessioni permanenti con il protocollo TCP. Per
911 ottenere questo sono previste delle funzioni apposite (si potrebbero impostare
912 direttamente le opzioni di \var{\_\_res.options}, ma queste funzioni
913 permettono di semplificare la procedura); la prime sono \funcd{sethostent} e
914 \func{endhostent}, il cui prototipo è:
915
916 \begin{funcproto}{
917 \fhead{netdb.h}
918 \fdecl{void sethostent(int stayopen)}
919 \fdesc{Richiede l'uso di connessioni TCP per le interrogazioni ad un server DNS.} 
920 \fdecl{void endhostent(void)}
921 \fdesc{Disattiva l'uso di connessioni TCP per le interrogazioni ad un server DNS.} 
922 }
923
924 {Le funzioni non restituiscono nulla, e non danno errori.}
925 \end{funcproto}
926
927 La funzione \func{sethostent} permette di richiedere l'uso di connessioni TCP
928 per la richiesta dei dati, e che queste restino aperte per successive
929 richieste; il valore dell'argomento \param{stayopen} indica se attivare questa
930 funzionalità, un valore diverso da zero, che indica una condizione vera in C,
931 attiva la funzionalità.  Per disattivare l'uso delle connessioni TCP si può
932 invece usare \func{endhostent}, e come si vede la funzione è estremamente
933 semplice, non richiedendo nessun argomento.
934
935 Infine si può richiedere la risoluzione inversa di un indirizzo IP od IPv6,
936 per ottenerne il nome a dominio ad esso associato, per fare questo si può
937 usare la funzione \funcd{gethostbyaddr}, il cui prototipo è:
938
939 \begin{funcproto}{
940 \fhead{netdb.h}
941 \fhead{sys/socket.h} 
942 \fdecl{struct hostent *gethostbyaddr(const char *addr, int len, int type)}
943 \fdesc{Richiede la risoluzione inversa di un indirizzo IP.} 
944 }
945
946 {La funzione ritorna l'indirizzo ad una struttura \struct{hostent} in caso di
947   successo e \val{NULL} per un errore.}
948 \end{funcproto}
949
950 In questo caso l'argomento \param{addr} dovrà essere il puntatore ad una
951 appropriata struttura contenente il valore dell'indirizzo IP (o IPv6) che si
952 vuole risolvere. L'uso del tipo \texttt{char *} per questo argomento è
953 storico, il dato dovrà essere fornito in una struttura \struct{in\_addr} per
954 un indirizzo IPv4 ed una struttura \struct{in6\_addr} per un indirizzo IPv6.
955
956 Si ricordi inoltre, come illustrato in fig.~\ref{fig:sock_sa_ipv4_struct}, che
957 mentre \struct{in\_addr} corrisponde in realtà ad un oridinario numero intero
958 a 32 bit  (da esprimere comunque in \textit{network order}) non altrettanto
959 avviene per \struct{in6\_addr}, pertanto è sempre opportuno inizializzare
960 questi indirizzi con \func{inet\_pton} (vedi
961 sez.~\ref{sec:sock_conv_func_gen}).
962
963 Nell'argomento \param{len} se ne dovrà poi specificare la dimensione
964 (rispettivamente 4 o 16), infine l'argomento
965 \param{type} deve indicare il tipo di indirizzo, e dovrà essere o
966 \const{AF\_INET} o \const{AF\_INET6}.
967
968 La funzione restituisce, in caso di successo, un puntatore ad una struttura
969 \struct{hostent}, solo che in questo caso la ricerca viene eseguita
970 richiedendo al DNS un record di tipo \texttt{PTR} corrispondente all'indirizzo
971 specificato. In caso di errore al solito viene usata la variabile
972 \var{h\_errno} per restituire un opportuno codice. In questo caso l'unico
973 campo del risultato che interessa è \var{h\_name} che conterrà il nome a
974 dominio, la funzione comunque inizializza anche il primo campo della lista
975 \var{h\_addr\_list} col valore dell'indirizzo passato come argomento.
976
977 Dato che \func{gethostbyaddr} usa un buffer statico, anche di questa funzione
978 esiste una versione rientrante \funcd{gethostbyaddr\_r} fornita come
979 estensione dalle \acr{glibc}, il cui prototipo è:
980
981 \begin{funcproto}{
982 \fhead{netdb.h}
983 \fhead{sys/socket.h} 
984 \fdecl{struct hostent *gethostbyaddr\_r(const void *addr, socklen\_t len, int type,\\
985 \phantom{struct hostent *gethostbyaddr\_r(}struct hostent *ret, char *buf, size\_t buflen,\\
986 \phantom{struct hostent *gethostbyaddr\_r(}struct hostent **result, int *h\_errnop);}
987 \fdesc{Richiede la risoluzione inversa di un indirizzo IP.} 
988 }
989
990 {La funzione ritorna $0$ in caso di successo e un valore non nullo per un errore.}
991 \end{funcproto}
992
993 La funzione prende per gli argomenti \param{addr}, \param{len} e \param{type}
994 gli stessi valori di \func{gethostbyaddr} con lo stesso significato, gli
995 argomenti successivi vengono utilizzati per restituire i dati, sono identici a
996 quelli già illustrati in per \func{gethostbyname\_r} e
997 \func{gethostbyname2\_r} e devono essere usati allo stesso modo.
998
999 Infine lo standard POSIX prevede la presenza della funzione
1000 \funcd{gethostent}, il cui prototipo è:
1001
1002 \begin{funcproto}{
1003 \fhead{netdb.h}
1004 \fdecl{struct hostent *gethostent(void)}
1005 \fdesc{Ottiene la voce successiva nel database dei nomi a dominio.} 
1006 }
1007
1008 {La funzione ritorna l'indirizzo ad una struttura \struct{hostent} in caso di
1009   successo e \val{NULL} per un errore.}
1010 \end{funcproto}
1011
1012 La funzione dovrebbe ritornare (come puntatore alla solita struttura
1013 \struct{hostent} allocata internamente) la voce successiva nel database dei
1014 nomi a dominio, ma questo ha un significato soltato quando è relativo alla
1015 lettura dei dati da un file come \conffile{/etc/hosts} e non per i risultati
1016 del DNS. Nel caso della \acr{glibc} questa viene usata allora solo per la
1017 lettura delle voci presenti in quest'ultimo, come avviene anche in altri
1018 sistemi unix-like, ed inoltre ignora le voci relative ad indirizzi IPv6.
1019
1020 Della stessa funzione le \acr{glibc} forniscono anche una versione rientrante
1021 \funcd{gethostent\_r}, il cui prototipo è:
1022
1023 \begin{funcproto}{
1024 \fhead{netdb.h}
1025 \fdecl{struct hostent *gethostent\_r(struct hostent *ret, char *buf, size\_t buflen,\\
1026 \phantom{struct hostent *gethostent\_r(}struct hostent **result, int *h\_errnop);}
1027 \fdesc{Ottiene la voce successiva nel database dei nomi a dominio.} 
1028 }
1029
1030 {La funzione ritorna $0$ in caso di successo e un valore non nullo per un errore.}
1031 \end{funcproto}
1032
1033 La funzione ha lo stesso effetto di \func{gethostent}; gli argomenti servono a
1034 restituire i risultati in maniera rientrante e vanno usati secondo le modalità
1035 già illustrate per \func{gethostbyname\_r} e \func{gethostbyname2\_r}.
1036
1037 Dati i limiti delle funzioni \func{gethostbyname} e \func{gethostbyaddr} con
1038 l'uso di memoria statica che può essere sovrascritta fra due chiamate
1039 successive, e per avere sempre la possibilità di indicare esplicitamente il
1040 tipo di indirizzi voluto (cosa che non è possibile con \func{gethostbyname}),
1041 è stata successivamente proposta,
1042 nell'\href{http://www.ietf.org/rfc/rfc2553.txt}{RFC~2553} un diversa
1043 interfaccia con l'introduzione due nuove funzioni di
1044 risoluzione,\footnote{dette funzioni sono presenti nelle \acr{glibc} versione
1045   2.1.96, ma essendo considerate deprecate (vedi
1046   sez.~\ref{sec:sock_advanced_name_services}) sono state rimosse nelle
1047   versioni successive.} \funcd{getipnodebyname} e \funcd{getipnodebyaddr}, i
1048 cui prototipi sono:
1049
1050 \begin{funcproto}{
1051 \fhead{netdb.h}
1052 \fhead{sys/types.h}
1053 \fhead{sys/socket.h}
1054 \fdecl{struct hostent *getipnodebyname(const char *name, int af, int
1055     flags, int *error\_num)} 
1056 \fdesc{Richiede la risoluzione di un nome a dominio.} 
1057 \fdecl{struct hostent *getipnodebyaddr(const void *addr, size\_t len,
1058     int af, int *error\_num)}
1059 \fdesc{Richiede la risoluzione inversa di un indirizzo IP.} 
1060 }
1061
1062 {Le funzioni ritornano l'indirizzo ad una struttura \struct{hostent} in caso
1063   di successo e \val{NULL} per un errore.}
1064 \end{funcproto}
1065
1066 Entrambe le funzioni supportano esplicitamente la scelta di una famiglia di
1067 indirizzi con l'argomento \param{af} (che può assumere i valori
1068 \const{AF\_INET} o \const{AF\_INET6}), e restituiscono un codice di errore
1069 (con valori identici a quelli precedentemente illustrati in
1070 tab.~\ref{tab:h_errno_values}) nella variabile puntata da \param{error\_num}.
1071 La funzione \func{getipnodebyaddr} richiede poi che si specifichi l'indirizzo
1072 come per \func{gethostbyaddr} passando anche la lunghezza dello stesso
1073 nell'argomento \param{len}.
1074
1075 La funzione \func{getipnodebyname} prende come primo argomento il nome da
1076 risolvere, inoltre prevede un apposito argomento \param{flags}, da usare come
1077 maschera binaria, che permette di specificarne il comportamento nella
1078 risoluzione dei diversi tipi di indirizzi (IPv4 e IPv6); ciascun bit
1079 dell'argomento esprime una diversa opzione, e queste possono essere specificate
1080 con un OR aritmetico delle costanti riportate in
1081 tab.~\ref{tab:sock_getipnodebyname_flags}.
1082
1083 \begin{table}[!htb]
1084   \centering
1085   \footnotesize
1086   \begin{tabular}[c]{|l|p{8cm}|}
1087     \hline
1088     \textbf{Costante} & \textbf{Significato} \\
1089     \hline
1090     \hline
1091     \constd{AI\_V4MAPPED}  & Usato con \const{AF\_INET6} per richiedere una
1092                              ricerca su un indirizzo IPv4 invece che IPv6; gli
1093                              eventuali risultati saranno rimappati su indirizzi 
1094                              IPv6.\\
1095     \constd{AI\_ALL}       & Usato con \const{AI\_V4MAPPED}; richiede sia
1096                              indirizzi IPv4 che IPv6, e gli indirizzi IPv4
1097                              saranno rimappati in IPv6.\\
1098     \constd{AI\_ADDRCONFIG}& Richiede che una richiesta IPv4 o IPv6 venga
1099                              eseguita solo se almeno una interfaccia del
1100                              sistema è associata ad un indirizzo di tale tipo.\\
1101     \constd{AI\_DEFAULT}   & Il valore di default, è equivalente alla
1102                              combinazione di \const{AI\_ADDRCONFIG} e di
1103                              \const{AI\_V4MAPPED}.\\  
1104     \hline
1105   \end{tabular}
1106   \caption{Valori possibili per i bit dell'argomento \param{flags} della
1107     funzione \func{getipnodebyname}.}
1108   \label{tab:sock_getipnodebyname_flags}
1109 \end{table}
1110
1111 Entrambe le funzioni restituiscono un puntatore ad una struttura \var{hostent}
1112 che contiene i risultati della ricerca, che viene allocata dinamicamente
1113 insieme a tutto lo spazio necessario a contenere i dati in essa referenziati;
1114 per questo motivo queste funzioni non soffrono dei problemi dovuti all'uso di
1115 una sezione statica di memoria presenti con le precedenti \func{gethostbyname}
1116 e \func{gethostbyaddr}.  L'uso di una allocazione dinamica però comporta anche
1117 la necessità di disallocare esplicitamente la memoria occupata dai risultati
1118 una volta che questi non siano più necessari; a tale scopo viene fornita la
1119 funzione \funcd{freehostent}, il cui prototipo è:
1120
1121 \begin{funcproto}{
1122 \fhead{netdb.h}
1123 \fhead{sys/types.h}
1124 \fhead{sys/socket.h}
1125 \fdecl{void freehostent(struct hostent *ip)}
1126 \fdesc{Disalloca una struttura \var{hostent}.} 
1127 }
1128
1129 {La funzione non ritorna nulla, e non da errori.}
1130 \end{funcproto}
1131
1132 La funzione permette di disallocare una struttura \var{hostent}
1133 precedentemente allocata in una chiamata di \func{getipnodebyname} o
1134 \func{getipnodebyaddr}, e prende come argomento l'indirizzo restituito da una
1135 di queste funzioni.
1136
1137 Infine per concludere la nostra panoramica sulle funzioni di risoluzione dei
1138 nomi dobbiamo citare le funzioni che permettono di interrogare gli altri
1139 servizi di risoluzione dei nomi illustrati in sez.~\ref{sec:sock_resolver}; in
1140 generale infatti ci sono una serie di funzioni nella forma
1141 \texttt{get\textsl{XXX}byname} e \texttt{get\textsl{XXX}byaddr} (dove
1142 \texttt{\textsl{XXX}} indica il servizio) per ciascuna delle informazioni di
1143 rete mantenute dal \textit{Name Service Switch} che permettono rispettivamente
1144 di trovare una corrispondenza cercando per nome o per numero.
1145
1146 L'elenco di queste funzioni è riportato nelle colonne finali di
1147 tab.~\ref{tab:name_resolution_functions}, dove le si sono suddivise rispetto
1148 al tipo di informazione che forniscono (riportato in prima colonna). Nella
1149 tabella si è anche riportato il file su cui vengono ordinariamente mantenute
1150 queste informazioni, che però può essere sostituito da un qualunque supporto
1151 interno al \textit{Name Service Switch} (anche se usualmente questo avviene
1152 solo per la risoluzione degli indirizzi).  Ciascuna funzione fa riferimento ad
1153 una sua apposita struttura che contiene i relativi dati, riportata in terza
1154 colonna.
1155
1156 \begin{table}[!htb]
1157   \centering
1158   \footnotesize
1159   \begin{tabular}[c]{|l|l|l|l|l|}
1160     \hline
1161     \textbf{Informazione}&\textbf{File}&\textbf{Struttura}&
1162     \multicolumn{2}{|c|}{\textbf{Funzioni}}\\
1163     \hline
1164     \hline
1165     indirizzo &\conffile{/etc/hosts}&\struct{hostent}&\func{gethostbyname}&
1166                \func{gethostbyaddr}\\ 
1167     servizio  &\conffile{/etc/services}&\struct{servent}&\func{getservbyname}&
1168                \func{getservbyport}\\ 
1169     rete      &\conffile{/etc/networks}&\struct{netent}&\funcm{getnetbyname}&
1170                \funcm{getnetbyaddr}\\ 
1171     protocollo&\conffile{/etc/protocols}&\struct{protoent}&
1172                \funcm{getprotobyname}&\funcm{getprotobyaddr}\\ 
1173     \hline
1174   \end{tabular}
1175   \caption{Funzioni di risoluzione dei nomi per i vari servizi del
1176     \textit{Name Service Switch} riguardanti la rete.}
1177   \label{tab:name_resolution_functions}
1178 \end{table}
1179
1180 Delle funzioni di tab.~\ref{tab:name_resolution_functions} abbiamo trattato
1181 finora soltanto quelle relative alla risoluzione dei nomi, dato che sono le
1182 più usate, e prevedono praticamente da sempre la necessità di rivolgersi ad
1183 una entità esterna; per le altre invece, estensioni fornite dal \textit{Name
1184   Service Switch} a parte, si fa sempre riferimento ai dati mantenuti nei
1185 rispettivi file.
1186
1187 Dopo la risoluzione dei nomi a dominio una delle ricerche più comuni è quella
1188 sui nomi dei servizi di rete più comuni (cioè \texttt{http}, \texttt{smtp},
1189 ecc.) da associare alle rispettive porte. Le due funzioni da utilizzare per
1190 questo sono \funcd{getservbyname} e \funcd{getservbyport}, che permettono
1191 rispettivamente di ottenere il numero di porta associato ad un servizio dato
1192 il nome e viceversa; i loro prototipi sono:
1193
1194
1195
1196 \begin{funcproto}{
1197 \fhead{netdb.h} 
1198 \fdecl{struct servent *getservbyname(const char *name, const char *proto)}
1199 \fdecl{struct servent *getservbyport(int port, const char *proto)} 
1200 \fdesc{Risolvono il nome di un servizio nel rispettivo numero di porta e viceversa.} 
1201 }
1202
1203 {Le funzioni ritornano il puntatore ad una struttura \struct{servent} con i
1204     risultati in caso di successo e \val{NULL} per un errore.}
1205 \end{funcproto}
1206
1207 Entrambe le funzioni prendono come ultimo argomento una stringa \param{proto}
1208 che indica il protocollo per il quale si intende effettuare la ricerca (le
1209 informazioni mantenute in \conffile{/etc/services} infatti sono relative sia
1210 alle porte usate su UDP che su TCP, occorre quindi specificare a quale dei due
1211 protocolli si fa riferimento) che nel caso di IP può avere come valori
1212 possibili solo \texttt{udp} o \texttt{tcp};\footnote{in teoria si potrebbe
1213   avere un qualunque protocollo fra quelli citati in
1214   \conffile{/etc/protocols}, posto che lo stesso supporti il concetto di
1215   \textsl{porta}, in pratica questi due sono gli unici presenti.}  se si
1216 specifica un puntatore nullo la ricerca sarà eseguita su un protocollo
1217 qualsiasi.
1218
1219 Il primo argomento è il nome del servizio per \func{getservbyname},
1220 specificato tramite la stringa \param{name}, mentre \func{getservbyport}
1221 richiede il numero di porta in \param{port}. Entrambe le funzioni eseguono una
1222 ricerca sul file \conffile{/etc/services}\footnote{il \textit{Name Service
1223     Switch} astrae il concetto a qualunque supporto su cui si possano
1224   mantenere i suddetti dati.}  ed estraggono i dati dalla prima riga che
1225 corrisponde agli argomenti specificati; se la risoluzione ha successo viene
1226 restituito un puntatore ad una apposita struttura \struct{servent} contenente
1227 tutti i risultati, altrimenti viene restituito un puntatore nullo.  Si tenga
1228 presente che anche in questo caso i dati vengono mantenuti in una area di
1229 memoria statica e che quindi la funzione non è rientrante.
1230
1231 \begin{figure}[!htb]
1232   \footnotesize \centering
1233   \begin{minipage}[c]{0.80\textwidth}
1234     \includestruct{listati/servent.h}
1235   \end{minipage}
1236   \caption{La struttura \structd{servent} per la risoluzione dei nomi dei
1237     servizi e dei numeri di porta.}
1238   \label{fig:sock_servent_struct}
1239 \end{figure}
1240
1241 La definizione della struttura \struct{servent} è riportata in
1242 fig.~\ref{fig:sock_servent_struct}, il primo campo, \var{s\_name} contiene
1243 sempre il nome canonico del servizio, mentre \var{s\_aliases} è un puntatore
1244 ad un vettore di stringhe contenenti gli eventuali nomi alternativi
1245 utilizzabili per identificare lo stesso servizio. Infine \var{s\_port}
1246 contiene il numero di porta e \var{s\_proto} il nome del protocollo.
1247
1248 Come riportato in tab.~\ref{tab:name_resolution_functions} ci sono analoghe
1249 funzioni per la risoluzione del nome dei protocolli e delle reti; non staremo
1250 a descriverle nei dettagli, in quanto il loro uso è molto limitato, esse
1251 comunque utilizzano una loro struttura dedicata del tutto analoga alle
1252 precedenti: tutti i dettagli relativi al loro funzionamento possono essere
1253 trovati nelle rispettive pagine di manuale.
1254
1255 Oltre alle funzioni di ricerca esistono delle ulteriori funzioni che prevedono
1256 una lettura sequenziale delle informazioni mantenute nel \textit{Name Service
1257   Switch} (in sostanza permettono di leggere i file contenenti le informazioni
1258 riga per riga), che sono analoghe a quelle elencate in
1259 tab.~\ref{tab:sys_passwd_func} per le informazioni relative ai dati degli
1260 utenti e dei gruppi. Nel caso specifico dei servizi avremo allora le tre
1261 funzioni \funcd{setservent}, \funcd{getservent} e \funcd{endservent} i cui
1262 prototipi sono:
1263
1264 \begin{funcproto}{
1265 \fhead{netdb.h} 
1266 \fdecl{struct servent *getservent(void)}
1267 \fdesc{Legge la voce successiva nel file \conffile{/etc/services}.} 
1268 \fdecl{void setservent(int stayopen)} 
1269 \fdesc{Apre il file \conffile{/etc/services} e si posiziona al suo inizio.} 
1270 \fdecl{void endservent(void)}
1271 \fdesc{Chiude il file \conffile{/etc/services}.} 
1272 }
1273
1274 {Le due funzioni \func{setservent} e \func{endservent} non ritornano nulla,
1275   \func{getservent} restituisce il puntatore ad una struttura \struct{servent}
1276   in caso di successo e \val{NULL} per un errore o fine del file.}
1277 \end{funcproto}
1278
1279 La prima funzione, \func{getservent}, legge una singola voce a partire dalla
1280 posizione corrente in \conffile{/etc/services}, pertanto si può eseguire una
1281 lettura sequenziale dello stesso invocandola più volte. Se il file non è
1282 aperto provvede automaticamente ad aprirlo, nel qual caso leggerà la prima
1283 voce. La seconda funzione, \func{setservent}, permette di aprire il file
1284 \conffile{/etc/services} per una successiva lettura, ma se il file è già stato
1285 aperto riporta la posizione di lettura alla prima voce del file, in questo
1286 modo si può far ricominciare da capo una lettura sequenziale. 
1287
1288 \begin{table}[!htb]
1289   \centering
1290   \footnotesize
1291   \begin{tabular}[c]{|l|l|l|l|}
1292     \hline
1293     \textbf{Informazione}&\multicolumn{3}{|c|}{\textbf{Funzioni}}\\
1294     \hline
1295     \hline
1296     indirizzo &\func{sethostent} &\func{gethostent} &\func{endhostent} \\
1297     servizio  &\func{setservent} &\func{getservent} &\func{endservent}\\ 
1298     rete      &\funcm{setnetent}  &\funcm{getnetent}  &\funcm{endnetent}\\ 
1299     protocollo&\funcm{setprotoent}&\funcm{getprotoent}&\funcm{endprotoent}\\ 
1300     \hline
1301   \end{tabular}
1302   \caption{Funzioni lettura sequenziale dei dati del
1303     \textit{Name Service Switch}.} 
1304   \label{tab:name_sequential_read}
1305 \end{table}
1306
1307 L'argomento \param{stayopen} di \func{setservent}, se diverso da zero, fa sì
1308 che il file resti aperto anche fra diverse chiamate a \func{getservbyname} e
1309 \func{getservbyport}; di default dopo una chiamata a queste funzioni il file
1310 viene chiuso, cosicché una successiva chiamata a \func{getservent} riparte
1311 dall'inizio.  La terza funzione, \func{endservent}, provvede semplicemente a
1312 chiudere il file.
1313
1314 Queste tre funzioni per la lettura sequenziale di nuovo sono presenti per
1315 ciascuno dei vari tipi di informazione relative alle reti di
1316 tab.~\ref{tab:name_resolution_functions}; questo significa che esistono
1317 altrettante funzioni nella forma \texttt{setXXXent}, \texttt{getXXXent} e
1318 \texttt{endXXXent}, analoghe alle precedenti per la risoluzione dei servizi,
1319 che abbiamo riportato in tab.~\ref{tab:name_sequential_read}.  Essendo, a
1320 parte il tipo di informazione che viene trattato, sostanzialmente identiche
1321 nel funzionamento e di scarso utilizzo, non staremo a trattarle una per una,
1322 rimandando alle rispettive pagine di manuale.
1323
1324
1325 \subsection{Le funzioni avanzate per la risoluzione dei nomi}
1326 \label{sec:sock_advanced_name_services}
1327
1328 Quelle illustrate nella sezione precedente sono le funzioni classiche per la
1329 risoluzione di nomi ed indirizzi IP, ma abbiamo già visto come esse soffrano
1330 di vari inconvenienti come il fatto che usano informazioni statiche, e non
1331 prevedono la possibilità di avere diverse classi di indirizzi. Anche se sono
1332 state create delle estensioni o metodi diversi che permettono di risolvere
1333 alcuni di questi inconvenienti, comunque esse non forniscono una interfaccia
1334 sufficientemente generica.\footnote{rimane ad esempio il problema generico che
1335   si deve sapere in anticipo quale tipo di indirizzi IP (IPv4 o IPv6)
1336   corrispondono ad un certo nome a dominio.}
1337
1338 Inoltre in genere quando si ha a che fare con i socket non esiste soltanto il
1339 problema della risoluzione del nome che identifica la macchina, ma anche
1340 quello del servizio a cui ci si vuole rivolgere.  Per questo motivo con lo
1341 standard POSIX 1003.1-2001 sono state indicate come deprecate le varie
1342 funzioni \func{gethostbyaddr}, \func{gethostbyname}, \var{getipnodebyname} e
1343 \var{getipnodebyaddr} ed è stata introdotta una interfaccia completamente
1344 nuova.
1345
1346 La prima funzione di questa interfaccia è \funcd{getaddrinfo}, che combina le
1347 funzionalità delle precedenti \func{getipnodebyname}, \func{getipnodebyaddr},
1348 \func{getservbyname} e \func{getservbyport}, consentendo di ottenere
1349 contemporaneamente sia la risoluzione di un indirizzo simbolico che del nome
1350 di un servizio; la funzione è stata introdotta, insieme a \func{getnameinfo}
1351 che vedremo più avanti,
1352 nell'\href{http://www.ietf.org/rfc/rfc2553.txt}{RFC~2553} ed il suo prototipo è:
1353
1354
1355 \begin{funcproto}{
1356 \fhead{netdb.h}
1357 \fhead{sys/socket.h} 
1358 \fdecl{int getaddrinfo(const char *node, const char *service, const
1359     struct addrinfo *hints, \\
1360 \phantom{int getaddrinfo(}struct addrinfo **res)}
1361 \fdesc{Esegue una risoluzione di un nome a dominio e di un nome di servizio.} 
1362 }
1363
1364 {La funzione ritorna $0$ in caso di successo e un codice di errore diverso da
1365   zero per un errore.}
1366 \end{funcproto}
1367
1368 La funzione prende come primo argomento il nome della macchina che si vuole
1369 risolvere, specificato tramite la stringa \param{node}. Questo argomento,
1370 oltre ad un comune nome a dominio, può indicare anche un indirizzo numerico in
1371 forma \textit{dotted-decimal} per IPv4 o in formato esadecimale per IPv6.  Si
1372 può anche specificare il nome di una rete invece che di una singola macchina.
1373 Il secondo argomento, \param{service}, specifica invece il nome del servizio
1374 che si intende risolvere. Per uno dei due argomenti si può anche usare il
1375 valore \val{NULL}, nel qual caso la risoluzione verrà effettuata soltanto
1376 sulla base del valore dell'altro.
1377
1378 Il terzo argomento, \param{hints}, deve essere invece un puntatore ad una
1379 struttura \struct{addrinfo} usata per dare dei \textsl{suggerimenti} al
1380 procedimento di risoluzione riguardo al protocollo o del tipo di socket che si
1381 intenderà utilizzare; \func{getaddrinfo} infatti permette di effettuare
1382 ricerche generiche sugli indirizzi, usando sia IPv4 che IPv6, e richiedere
1383 risoluzioni sui nomi dei servizi indipendentemente dal protocollo (ad esempio
1384 TCP o UDP) che questi possono utilizzare.
1385
1386 Come ultimo argomento in \param{res} deve essere passato un puntatore ad una
1387 variabile (di tipo puntatore ad una struttura \struct{addrinfo}) che verrà
1388 utilizzata dalla funzione per riportare (come \textit{value result argument})
1389 i propri risultati. La funzione infatti è rientrante, ed alloca autonomamente
1390 tutta la memoria necessaria in cui verranno riportati i risultati della
1391 risoluzione.  La funzione scriverà all'indirizzo puntato da \param{res} il
1392 puntatore iniziale ad una \textit{linked list} di strutture di tipo
1393 \struct{addrinfo} contenenti tutte le informazioni ottenute.
1394
1395 \begin{figure}[!htb]
1396   \footnotesize \centering
1397   \begin{minipage}[c]{0.90\textwidth}
1398     \includestruct{listati/addrinfo.h}
1399   \end{minipage}
1400   \caption{La struttura \structd{addrinfo} usata nella nuova interfaccia POSIX
1401     per la risoluzione di nomi a dominio e servizi.}
1402   \label{fig:sock_addrinfo_struct}
1403 \end{figure}
1404
1405 Come illustrato la struttura \struct{addrinfo}, la cui definizione è riportata
1406 in fig.~\ref{fig:sock_addrinfo_struct}, viene usata sia in ingresso, per
1407 passare dei valori di controllo alla funzione, che in uscita, per ricevere i
1408 risultati. La definizione è ripresa direttamente dal file \headfiled{netdb.h}
1409 in cui questa struttura viene dichiarata, la pagina di manuale riporta
1410 \type{size\_t} come tipo di dato per il campo \var{ai\_addrlen}, qui viene
1411 usata quanto previsto dallo standard POSIX, in cui viene utilizzato
1412 \type{socklen\_t}; i due tipi di dati sono comunque equivalenti.
1413
1414 Il primo campo, \var{ai\_flags}, è una maschera binaria di bit che
1415 permettono di controllare le varie modalità di risoluzione degli indirizzi,
1416 che viene usato soltanto in ingresso. I tre campi successivi \var{ai\_family},
1417 \var{ai\_socktype}, e \var{ai\_protocol} contengono rispettivamente la
1418 famiglia di indirizzi, il tipo di socket e il protocollo, in ingresso vengono
1419 usati per impostare una selezione (impostandone il valore nella struttura
1420 puntata da \param{hints}), mentre in uscita indicano il tipo di risultato
1421 contenuto nella struttura.
1422
1423 Tutti i campi seguenti vengono usati soltanto in uscita e devono essere nulli
1424 o \val{NULL} in ingresso; il campo \var{ai\_addrlen} indica la dimensione
1425 della struttura degli indirizzi ottenuta come risultato, il cui contenuto sarà
1426 memorizzato nella struttura \struct{sockaddr} posta all'indirizzo puntato dal
1427 campo \var{ai\_addr}. Il campo \var{ai\_canonname} è un puntatore alla stringa
1428 contenente il nome canonico della macchina, ed infine, quando la funzione
1429 restituisce più di un risultato, \var{ai\_next} è un puntatore alla successiva
1430 struttura \struct{addrinfo} della lista.
1431
1432 Ovviamente non è necessario dare dei suggerimenti in ingresso, ed usando
1433 \val{NULL} come valore per l'argomento \param{hints} si possono compiere
1434 ricerche generiche.  Se però si specifica un valore non nullo questo deve
1435 puntare ad una struttura \struct{addrinfo} precedentemente allocata nella
1436 quale siano stati opportunamente impostati i valori dei campi
1437 \var{ai\_family}, \var{ai\_socktype}, \var{ai\_protocol} ed \var{ai\_flags}.
1438
1439 I due campi \var{ai\_family} e \var{ai\_socktype} prendono gli stessi valori
1440 degli analoghi argomenti della funzione \func{socket}; in particolare per
1441 \var{ai\_family} si possono usare i valori di tab.~\ref{tab:net_pf_names} ma
1442 sono presi in considerazione solo \const{AF\_INET} e \const{AF\_INET6}, mentre
1443 se non si vuole specificare nessuna famiglia di indirizzi si può usare il
1444 valore \const{AF\_UNSPEC}.  Allo stesso modo per \var{ai\_socktype} si possono
1445 usare i valori illustrati in sez.~\ref{sec:sock_type} per indicare per quale
1446 tipo di socket si vuole risolvere il servizio indicato, anche se i soli
1447 significativi sono \const{SOCK\_STREAM} e \const{SOCK\_DGRAM}; in questo caso,
1448 se non si vuole effettuare nessuna risoluzione specifica, si potrà usare un
1449 valore nullo.
1450
1451 Il campo \var{ai\_protocol} permette invece di effettuare la selezione dei
1452 risultati per il nome del servizio usando il numero identificativo del
1453 rispettivo protocollo di trasporto (i cui valori possibili sono riportati in
1454 \conffile{/etc/protocols}); di nuovo i due soli valori utilizzabili sono quelli
1455 relativi a UDP e TCP, o il valore nullo che indica di ignorare questo campo
1456 nella selezione.
1457
1458 \begin{table}[!htb]
1459   \centering
1460   \footnotesize
1461   \begin{tabular}[c]{|l|p{8cm}|}
1462     \hline
1463     \textbf{Costante} & \textbf{Significato} \\
1464     \hline
1465     \hline
1466     \const{AI\_ADDRCONFIG} & Stesso significato dell'analoga di
1467                              tab.~\ref{tab:sock_getipnodebyname_flags}.\\ 
1468     \const{AI\_ALL}        & Stesso significato dell'analoga di
1469                              tab.~\ref{tab:sock_getipnodebyname_flags}.\\ 
1470     \constd{AI\_CANONNAME}  & Richiede la restituzione del nome canonico della
1471                               macchina, che verrà salvato in una stringa il cui
1472                               indirizzo sarà restituito nel campo
1473                               \var{ai\_canonname} della prima struttura
1474                               \struct{addrinfo} dei risultati. Se il nome
1475                               canonico non è disponibile al suo posto
1476                               viene restituita una copia di \param{node}. \\ 
1477     \constd{AI\_NUMERICHOST}& Se impostato il nome della macchina specificato
1478                               con \param{node} deve essere espresso in forma
1479                               numerica, altrimenti sarà restituito un errore
1480                               \const{EAI\_NONAME} (vedi
1481                               tab.~\ref{tab:addrinfo_error_code}), in questo
1482                               modo si evita ogni chiamata alle funzioni di
1483                               risoluzione.\\ 
1484     \constd{AI\_NUMERICSERVICE}& Analogo di \const{AI\_NUMERICHOST} per la
1485                                  risoluzione di un servizio, con 
1486                                  \param{service} che deve essere espresso in forma
1487                                  numerica.\\ 
1488     \constd{AI\_PASSIVE}    & Viene utilizzato per ottenere un indirizzo in
1489                               formato adatto per una successiva chiamata a
1490                               \func{bind}. Se specificato quando si è usato 
1491                               \val{NULL} come valore per \param{node} gli
1492                               indirizzi restituiti saranno inizializzati al
1493                               valore generico (\const{INADDR\_ANY} per IPv4 e
1494                               \const{IN6ADDR\_ANY\_INIT} per IPv6), altrimenti
1495                               verrà usato l'indirizzo dell'interfaccia di
1496                               \textit{loopback}. Se invece non è impostato gli
1497                               indirizzi verranno restituiti in formato adatto ad
1498                               una chiamata a \func{connect} o \func{sendto}.\\
1499     \const{AI\_V4MAPPED}   & Stesso significato dell'analoga di
1500                              tab.~\ref{tab:sock_getipnodebyname_flags}.\\  
1501     \hline
1502     \const{AI\_CANONIDN}   & Se il nome canonico richiesto con
1503                              \const{AI\_CANONNAME} è codificato con questo
1504                              flag la codifica viene convertita in forma
1505                              leggibile nella localizzazione corrente.\\ 
1506     \const{AI\_IDN}        & Se specificato il nome viene convertito, se
1507                              necessario, nella codifica IDN, usando la
1508                              localizzazione corrente.\\ 
1509     \const{AI\_IDN\_ALLOW\_UNASSIGNED} & attiva il controllo 
1510                                          \texttt{IDNA\_ALLOW\_UNASSIGNED}.\\ 
1511     \const{AI\_AI\_IDN\_USE\_STD3\_ASCII\_RULES} & attiva il controllo
1512                                             \texttt{IDNA\_USE\_STD3\_ASCII\_RULES}\\ 
1513     \hline
1514   \end{tabular}
1515   \caption{Costanti associate ai bit del campo \var{ai\_flags} della struttura 
1516     \struct{addrinfo}.} 
1517   \label{tab:ai_flags_values}
1518 \end{table}
1519
1520 % TODO mettere riferimento a IDNA_ALLOW_UNASSIGNED e IDNA_USE_STD3_ASCII_RULES
1521
1522 Infine gli ultimi dettagli si controllano con il campo \var{ai\_flags}; che
1523 deve essere impostato come una maschera binaria; i bit di questa variabile
1524 infatti vengono usati per dare delle indicazioni sul tipo di risoluzione
1525 voluta, ed hanno valori analoghi a quelli visti in
1526 sez.~\ref{sec:sock_name_services} per \func{getipnodebyname}; il valore di
1527 \var{ai\_flags} può essere impostata con un OR aritmetico delle costanti di
1528 tab.~\ref{tab:ai_flags_values}, ciascuna delle quali identifica un bit della
1529 maschera. 
1530
1531 Nella seconda parte della tabella si sono riportati i valori delle costanti
1532 aggiunte a partire dalle \acr{glibc} 2.3.4 per gestire la
1533 internazionalizazione dei nomi a dominio (IDN o \textit{Internationalized
1534   Domain Names}) secondo quanto specificato
1535 nell'\href{http://www.ietf.org/rfc/rfc3490.txt}{RFC~3490} (potendo cioè usare
1536 codifiche di caratteri che consentono l'espressione di nomi a dominio in
1537 qualunque lingua).
1538
1539 Come accennato passando un valore \val{NULL} per l'argomento \param{hints} si
1540 effettua una risuluzione generica, equivalente ad aver impostato un valore
1541 nullo per \var{ai\_family} e \var{ai\_socktype}, un valore \const{AF\_UNSPEC}
1542 per \var{ai\_family} e il valore \code{(AI\_V4MAPPED|AI\_ADDRCONFIG)} per
1543 \var{ai\_flags}. 
1544
1545 La funzione restituisce un valore nullo in caso di successo, o un codice in
1546 caso di errore. I valori usati come codice di errore sono riportati in
1547 tab.~\ref{tab:addrinfo_error_code}; dato che la funzione utilizza altre
1548 funzioni e chiamate al sistema per ottenere il suo risultato in generale il
1549 valore di \var{errno} non è significativo, eccetto il caso in cui si sia
1550 ricevuto un errore di \const{EAI\_SYSTEM}, nel qual caso l'errore
1551 corrispondente è riportato tramite \var{errno}.
1552
1553 \begin{table}[!htb]
1554   \centering
1555   \footnotesize
1556   \begin{tabular}[c]{|l|p{10cm}|}
1557     \hline
1558     \textbf{Costante} & \textbf{Significato} \\
1559     \hline
1560     \hline
1561     \constd{EAI\_ADDRFAMILY}& La richiesta non ha nessun indirizzo di rete
1562                               per la famiglia di indirizzi specificata. \\
1563     \constd{EAI\_AGAIN}   & Il DNS ha restituito un errore di risoluzione  
1564                             temporaneo, si può ritentare in seguito. \\
1565     \constd{EAI\_BADFLAGS}& Il campo \var{ai\_flags} contiene dei valori non
1566                             validi per i flag o si è richiesto
1567                             \const{AI\_CANONNAME} con \param{name} nullo. \\
1568     \constd{EAI\_FAIL}    & Il DNS ha restituito un errore di risoluzione  
1569                             permanente. \\
1570     \constd{EAI\_FAMILY}  & La famiglia di indirizzi richiesta non è
1571                             supportata. \\ 
1572     \constd{EAI\_MEMORY}  & È stato impossibile allocare la memoria necessaria
1573                             alle operazioni. \\
1574     \constd{EAI\_NODATA}  & La macchina specificata esiste, ma non ha nessun
1575                             indirizzo di rete definito. \\
1576     \constd{EAI\_NONAME}  & Il nome a dominio o il servizio non sono noti,
1577                             viene usato questo errore anche quando si specifica
1578                             il valore \val{NULL} per entrambi gli argomenti
1579                             \param{node} e \param{service}. \\
1580     \constd{EAI\_SERVICE} & Il servizio richiesto non è disponibile per il tipo
1581                             di socket richiesto, anche se può esistere per
1582                             altri tipi di socket. \\
1583     \constd{EAI\_SOCKTYPE}& Il tipo di socket richiesto non è supportato. \\
1584     \constd{EAI\_SYSTEM}  & C'è stato un errore di sistema, si può controllare
1585                             \var{errno} per i dettagli. \\
1586 %    \hline
1587 % TODO estensioni GNU, trovarne la documentazione
1588 %    \constd{EAI\_INPROGRESS}& Richiesta in corso. \\
1589 %    \constd{EAI\_CANCELED}& La richiesta è stata cancellata.\\
1590 %    \constd{EAI\_NOTCANCELED}& La richiesta non è stata cancellata. \\
1591 %    \constd{EAI\_ALLDONE} & Tutte le richieste sono complete. \\
1592 %    \constd{EAI\_INTR}    & Richiesta interrotta. \\
1593     \hline
1594   \end{tabular}
1595   \caption{Costanti associate ai valori dei codici di errore della funzione
1596     \func{getaddrinfo}.} 
1597   \label{tab:addrinfo_error_code}
1598 \end{table}
1599
1600 Come per i codici di errore di \func{gethostbyname} anche in questo caso è
1601 fornita una apposita funzione, simile a \func{strerror}, che consente di
1602 utilizzare direttamente il codice restituito dalla funzione per stampare a
1603 video un messaggio esplicativo; la funzione è \funcd{gai\_strerror} ed il suo
1604 prototipo è:
1605
1606 \begin{funcproto}{
1607 \fhead{netdb.h} 
1608 \fdecl{const char *gai\_strerror(int errcode)}
1609 \fdesc{Fornisce il messaggio corrispondente ad un errore di \func{getaddrinfo}.} 
1610 }
1611
1612 {La funzione ritorna il puntatore alla stringa contenente il messaggio di
1613   errore.}
1614 \end{funcproto}
1615
1616 La funzione restituisce un puntatore alla stringa contenente il messaggio
1617 corrispondente dal codice di errore \param{errcode} ottenuto come valore di
1618 ritorno di \func{getaddrinfo}.  La stringa è allocata staticamente, ma essendo
1619 costante ed accessibile in sola lettura, la funzione è rientrante.
1620
1621 Dato che ad un certo nome a dominio possono corrispondere più indirizzi IP
1622 (sia IPv4 che IPv6), e che un certo servizio può essere fornito su protocolli
1623 e tipi di socket diversi, in generale, a meno di non aver eseguito una
1624 selezione specifica attraverso l'uso di \param{hints}, si otterrà una diversa
1625 struttura \struct{addrinfo} per ciascuna possibilità.  
1626
1627 Ad esempio se si richiede la risoluzione del servizio \textit{echo} per
1628 l'indirizzo \texttt{www.truelite.it}, e si imposta \const{AI\_CANONNAME} per
1629 avere anche la risoluzione del nome canonico, si avrà come risposta della
1630 funzione la lista illustrata in fig.~\ref{fig:sock_addrinfo_list}.
1631
1632 \begin{figure}[!htb]
1633   \centering
1634   \includegraphics[width=10cm]{img/addrinfo_list}
1635   \caption{La \textit{linked list} delle strutture \struct{addrinfo}
1636     restituite da \func{getaddrinfo}.}
1637   \label{fig:sock_addrinfo_list}
1638 \end{figure}
1639
1640 Come primo esempio di uso di \func{getaddrinfo} vediamo un programma
1641 elementare di interrogazione del \textit{resolver} basato questa funzione, il
1642 cui corpo principale è riportato in fig.~\ref{fig:mygetaddr_example}. Il
1643 codice completo del programma, compresa la gestione delle opzioni in cui è
1644 gestita l'eventuale inizializzazione dell'argomento \var{hints} per
1645 restringere le ricerche su protocolli, tipi di socket o famiglie di indirizzi,
1646 è disponibile nel file \texttt{mygetaddr.c} dei sorgenti allegati alla guida.
1647
1648 \begin{figure}[!htb]
1649   \footnotesize \centering
1650   \begin{minipage}[c]{\codesamplewidth}
1651     \includecodesample{listati/mygetaddr.c}
1652   \end{minipage}
1653   \normalsize
1654   \caption{Esempio di codice per la risoluzione di un indirizzo.}
1655   \label{fig:mygetaddr_example}
1656 \end{figure}
1657
1658 Il corpo principale inizia controllando (\texttt{\small 1--5}) il numero di
1659 argomenti passati, che devono essere sempre due, e corrispondere
1660 rispettivamente all'indirizzo ed al nome del servizio da risolvere. A questo
1661 segue la chiamata (\texttt{\small 7}) alla funzione \func{getaddrinfo}, ed il
1662 successivo controllo (\texttt{\small 8--11}) del suo corretto funzionamento,
1663 senza il quale si esce immediatamente stampando il relativo codice di errore.
1664
1665 Se la funzione ha restituito un valore nullo il programma prosegue
1666 inizializzando (\texttt{\small 12}) il puntatore \var{ptr} che sarà usato nel
1667 successivo ciclo (\texttt{\small 14--35}) di scansione della lista delle
1668 strutture \struct{addrinfo} restituite dalla funzione. Prima di eseguire
1669 questa scansione (\texttt{\small 12}) viene stampato il valore del nome
1670 canonico che è presente solo nella prima struttura.
1671
1672 La scansione viene ripetuta (\texttt{\small 14}) fintanto che si ha un
1673 puntatore valido. La selezione principale è fatta sul campo \var{ai\_family},
1674 che stabilisce a quale famiglia di indirizzi fa riferimento la struttura in
1675 esame. Le possibilità sono due, un indirizzo IPv4 o IPv6, se nessuna delle due
1676 si verifica si provvede (\texttt{\small 27--30}) a stampare un messaggio di
1677 errore ed uscire (questa eventualità non dovrebbe comunque mai verificarsi,
1678 almeno fintanto che la funzione \func{getaddrinfo} lavora correttamente).
1679
1680 Per ciascuno delle due possibili famiglie di indirizzi si estraggono le
1681 informazioni che poi verranno stampate alla fine del ciclo (\texttt{\small
1682   31--34}). Il primo caso esaminato (\texttt{\small 15--21}) è quello degli
1683 indirizzi IPv4, nel qual caso prima se ne stampa l'identificazione
1684 (\texttt{\small 16}) poi si provvede a ricavare la struttura degli indirizzi
1685 (\texttt{\small 17}) indirizzata dal campo \var{ai\_addr}, eseguendo un
1686 opportuno casting del puntatore per poter estrarre da questa la porta
1687 (\texttt{\small 18}) e poi l'indirizzo (\texttt{\small 19}) che verrà
1688 convertito con una chiamata ad \func{inet\_ntop}.
1689
1690 La stessa operazione (\texttt{\small 21--27}) viene ripetuta per gli indirizzi
1691 IPv6, usando la rispettiva struttura degli indirizzi. Si noti anche come in
1692 entrambi i casi per la chiamata a \func{inet\_ntop} si sia dovuto passare il
1693 puntatore al campo contenente l'indirizzo IP nella struttura puntata dal campo
1694 \var{ai\_addr}.\footnote{il meccanismo è complesso a causa del fatto che al
1695   contrario di IPv4, in cui l'indirizzo IP può essere espresso con un semplice
1696   numero intero, in IPv6 questo deve essere necessariamente fornito come
1697   struttura, e pertanto anche se nella struttura puntata da \var{ai\_addr}
1698   sono presenti direttamente i valori finali, per l'uso con \func{inet\_ntop}
1699   occorre comunque passare un puntatore agli stessi (ed il costrutto
1700   \code{\&addr6->sin6\_addr} è corretto in quanto l'operatore \texttt{->} ha
1701   in questo caso precedenza su \texttt{\&}).}
1702
1703 Una volta estratte dalla struttura \struct{addrinfo} tutte le informazioni
1704 relative alla risoluzione richiesta e stampati i relativi valori, l'ultimo
1705 passo (\texttt{\small 34}) è di estrarre da \var{ai\_next} l'indirizzo della
1706 eventuale successiva struttura presente nella lista e ripetere il ciclo, fin
1707 tanto che, completata la scansione, questo avrà un valore nullo e si potrà
1708 terminare (\texttt{\small 36}) il programma.
1709
1710 Si tenga presente che \func{getaddrinfo} non garantisce nessun particolare
1711 ordinamento della lista delle strutture \struct{addrinfo} restituite, anche se
1712 usualmente i vari indirizzi IP (se ne è presente più di uno) sono forniti
1713 nello stesso ordine in cui vengono inviati dal server DNS. In particolare
1714 nulla garantisce che vengano forniti prima i dati relativi ai servizi di un
1715 determinato protocollo o tipo di socket, se ne sono presenti di diversi.  Se
1716 allora utilizziamo il nostro programma potremo verificare il risultato:
1717 \begin{Console}
1718 [piccardi@gont sources]$ \textbf{./mygetaddr -c  gapil.truelite.it echo}
1719 Canonical name sources2.truelite.it
1720 IPv4 address:
1721         Indirizzo 62.48.34.25
1722         Protocollo 6
1723         Porta 7
1724 IPv4 address:
1725         Indirizzo 62.48.34.25
1726         Protocollo 17
1727         Porta 7
1728 \end{Console}
1729 %$
1730
1731 Una volta estratti i risultati dalla \textit{linked list} puntata
1732 da \param{res} se questa non viene più utilizzata si dovrà avere cura di
1733 disallocare opportunamente tutta la memoria, per questo viene fornita
1734 l'apposita funzione \funcd{freeaddrinfo}, il cui prototipo è:
1735
1736
1737 \begin{funcproto}{
1738 \fhead{netdb.h}
1739 \fdecl{void freeaddrinfo(struct addrinfo *res)}
1740 \fdesc{Libera la memoria allocata da una precedente chiamata a \func{getaddrinfo}.} 
1741 }
1742
1743 {La funzione non restituisce nessun codice di errore.}
1744 \end{funcproto}
1745
1746 La funzione prende come unico argomento il puntatore \param{res}, ottenuto da
1747 una precedente chiamata a \func{getaddrinfo}, e scandisce la lista delle
1748 strutture per liberare tutta la memoria allocata. Dato che la funzione non ha
1749 valori di ritorno deve essere posta molta cura nel passare un valore valido
1750 per \param{res} ed usare un indirizzo non valido o già liberato può avere
1751 conseguenze non prevedibili.
1752
1753 Si tenga presente infine che se si copiano i risultati da una delle strutture
1754 \struct{addrinfo} restituite nella lista indicizzata da \param{res}, occorre
1755 avere cura di eseguire una \textit{deep copy} in cui si copiano anche tutti i
1756 dati presenti agli indirizzi contenuti nella struttura \struct{addrinfo},
1757 perché una volta disallocati i dati con \func{freeaddrinfo} questi non
1758 sarebbero più disponibili.
1759
1760 Anche la nuova interfaccia definita da POSIX prevede una nuova funzione per
1761 eseguire la risoluzione inversa e determinare nomi di servizi e di dominio
1762 dati i rispettivi valori numerici. La funzione che sostituisce le varie
1763 \func{gethostbyname}, \func{getipnodebyname} e \func{getservbyname} è
1764 \funcd{getnameinfo}, ed il suo prototipo è:
1765
1766 \begin{funcproto}{
1767 \fhead{netdb.h}
1768 \fhead{sys/socket.h}
1769 \fdecl{int getnameinfo(const struct sockaddr *sa, socklen\_t salen, \\
1770 \phantom{int getnameinfo(}char *host, size\_t hostlen, char *serv, size\_t
1771 servlen, int flags)} 
1772 \fdesc{Effettua una risoluzione di un indirizzo di rete in maniera
1773   indipendente dal protocollo.} 
1774 }
1775
1776 {La funzione ritorna $0$ in caso di successo e un codice di errore diverso da
1777   zero per un errore.}
1778 \end{funcproto}
1779
1780 La principale caratteristica di \func{getnameinfo} è che la funzione è in
1781 grado di eseguire una risoluzione inversa in maniera indipendente dal
1782 protocollo; il suo primo argomento \param{sa} infatti è il puntatore ad una
1783 struttura degli indirizzi generica, che può contenere sia indirizzi IPv4 che
1784 IPv6, la cui dimensione deve comunque essere specificata con l'argomento
1785 \param{salen}. 
1786
1787 I risultati della funzione saranno restituiti nelle due stringhe puntate da
1788 \param{host} e \param{serv}, che dovranno essere state precedentemente
1789 allocate per una lunghezza massima che deve essere specificata con gli altri
1790 due argomenti \param{hostlen} e \param{servlen}. Quando non si è
1791 interessati ad uno dei due, si può passare il valore \val{NULL} come argomento,
1792 così che la corrispondente informazione non venga richiesta. Infine l'ultimo
1793 argomento \param{flags} è una maschera binaria i cui bit consentono di
1794 impostare le modalità con cui viene eseguita la ricerca, e deve essere
1795 specificato attraverso l'OR aritmetico dei valori illustrati in
1796 tab.~\ref{tab:getnameinfo_flags}, nella seconda parte della tabella si sono
1797 aggiunti i valori introdotto con le \acr{glibc} 2.3.4 per gestire la
1798 internazionalizzione dei nomi a dominio.
1799
1800 \begin{table}[!htb]
1801   \centering
1802   \footnotesize
1803   \begin{tabular}[c]{|l|p{8cm}|}
1804     \hline
1805     \textbf{Costante} & \textbf{Significato} \\
1806     \hline
1807     \hline
1808     \constd{NI\_DGRAM}      & Richiede che venga restituito il nome del
1809                               servizio su UDP invece che quello su TCP per quei
1810                               pichi servizi (porte 512-214) che soni diversi
1811                               nei due protocolli.\\
1812     \constd{NI\_NOFQDN}     & Richiede che venga restituita solo il nome della
1813                               macchina all'interno del dominio al posto del
1814                               nome completo (FQDN).\\
1815     \constd{NI\_NAMEREQD}   & Richiede la restituzione di un errore se il nome
1816                               non può essere risolto.\\
1817     \constd{NI\_NUMERICHOST}& Richiede che venga restituita la forma numerica
1818                               dell'indirizzo (questo succede sempre se il nome
1819                               non può essere ottenuto).\\ 
1820     \constd{NI\_NUMERICSERV}& Richiede che il servizio venga restituito in
1821                               forma numerica (attraverso il numero di
1822                               porta).\\
1823     \hline
1824     \const{NI\_IDN}        & Se specificato il nome restituito viene convertito usando la
1825                              localizzazione corrente, se necessario, nella
1826                              codifica IDN.\\ 
1827     \const{NI\_IDN\_ALLOW\_UNASSIGNED} & attiva il controllo 
1828                                        \texttt{IDNA\_ALLOW\_UNASSIGNED}.\\ 
1829     \const{NI\_AI\_IDN\_USE\_STD3\_ASCII\_RULES} & attiva il controllo
1830                                        \texttt{IDNA\_USE\_STD3\_ASCII\_RULES}\\ 
1831     \hline
1832   \end{tabular}
1833   \caption{Costanti associate ai bit dell'argomento \param{flags} della  
1834     funzione \func{getnameinfo}.} 
1835   \label{tab:getnameinfo_flags}
1836 \end{table}
1837
1838 La funzione ritorna zero in caso di successo, e scrive i propri risultati agli
1839 indirizzi indicati dagli argomenti \param{host} e \param{serv} come stringhe
1840 terminate dal carattere NUL, a meno che queste non debbano essere troncate
1841 qualora la loro dimensione ecceda quelle specificate dagli argomenti
1842 \param{hostlen} e \param{servlen}. Sono comunque definite le due costanti
1843 \constd{NI\_MAXHOST} e \constd{NI\_MAXSERV}\footnote{in Linux le due costanti
1844   sono definite in \headfile{netdb.h} ed hanno rispettivamente il valore 1024
1845   e 12.}  che possono essere utilizzate come limiti massimi.  In caso di
1846 errore viene restituito invece un codice che assume gli stessi valori
1847 illustrati in tab.~\ref{tab:addrinfo_error_code}.
1848
1849 A questo punto possiamo fornire degli esempi di utilizzo della nuova
1850 interfaccia, adottandola per le precedenti implementazioni del client e del
1851 server per il servizio \textit{echo}; dato che l'uso delle funzioni appena
1852 illustrate (in particolare di \func{getaddrinfo}) è piuttosto complesso,
1853 essendo necessaria anche una impostazione diretta dei campi dell'argomento
1854 \param{hints}, provvederemo una interfaccia semplificata per i due casi visti
1855 finora, quello in cui si specifica nel client un indirizzo remoto per la
1856 connessione al server, e quello in cui si specifica nel server un indirizzo
1857 locale su cui porsi in ascolto.
1858
1859 La prima funzione della nostra interfaccia semplificata è \texttt{sockconn}
1860 che permette di ottenere un socket, connesso all'indirizzo ed al servizio
1861 specificati. Il corpo della funzione è riportato in
1862 fig.~\ref{fig:sockconn_code}, il codice completo è nel file \file{SockUtil.c}
1863 dei sorgenti allegati alla guida, che contiene varie funzioni di utilità per
1864 l'uso dei socket.
1865
1866 \begin{figure}[!htb]
1867   \footnotesize \centering
1868   \begin{minipage}[c]{\codesamplewidth}
1869     \includecodesample{listati/sockconn.c}
1870   \end{minipage}
1871   \normalsize
1872   \caption{Il codice della funzione \texttt{sockconn}.}
1873   \label{fig:sockconn_code}
1874 \end{figure}
1875
1876 La funzione prende quattro argomenti, i primi due sono le stringhe che
1877 indicano il nome della macchina a cui collegarsi ed il relativo servizio su
1878 cui sarà effettuata la risoluzione; seguono il protocollo da usare (da
1879 specificare con il valore numerico di \conffile{/etc/protocols}) ed il tipo di
1880 socket (al solito specificato con i valori illustrati in
1881 sez.~\ref{sec:sock_type}).  La funzione ritorna il valore del file descriptor
1882 associato al socket (un numero positivo) in caso di successo, o $-1$ in caso
1883 di errore.
1884
1885 Per risolvere il problema di non poter passare indietro i valori di ritorno di
1886 \func{getaddrinfo} contenenti i relativi codici di errore si sono stampati i
1887 messaggi d'errore direttamente nella funzione; infatti non si può avere
1888 nessuna certezza che detti valori siano negativi e per cui stampare subito
1889 l'errore diventa necessario per evitare ogni possibile ambiguità nei confronti
1890 del valore di ritorno in caso di successo.
1891
1892 Una volta definite le variabili occorrenti (\texttt{\small 3--5}) la funzione
1893 prima (\texttt{\small 6}) azzera il contenuto della struttura \var{hint} e poi
1894 provvede (\texttt{\small 7--9}) ad inizializzarne i valori necessari per la
1895 chiamata (\texttt{\small 10}) a \func{getaddrinfo}. Di quest'ultima si
1896 controlla (\texttt{\small 12--16}) il codice di ritorno, in modo da stampare
1897 un avviso di errore, azzerare \var{errno} ed uscire in caso di errore.  
1898
1899 Dato che ad una macchina possono corrispondere più indirizzi IP, e di tipo
1900 diverso (sia IPv4 che IPv6), mentre il servizio può essere in ascolto soltanto
1901 su uno solo di questi, si provvede a tentare la connessione per ciascun
1902 indirizzo restituito all'interno di un ciclo (\texttt{\small 18--40}) di
1903 scansione della lista restituita da \func{getaddrinfo}, ma prima
1904 (\texttt{\small 17}) si salva il valore del puntatore per poterlo riutilizzare
1905 alla fine per disallocare la lista.
1906
1907 Il ciclo viene ripetuto (\texttt{\small 18}) fintanto che si hanno indirizzi
1908 validi, ed inizia (\texttt{\small 19}) con l'apertura del socket; se questa
1909 fallisce si controlla (\texttt{\small 20}) se sono disponibili altri
1910 indirizzi, nel qual caso si passa al successivo (\texttt{\small 21}) e si
1911 riprende (\texttt{\small 22}) il ciclo da capo; se non ve ne sono si stampa
1912 l'errore ritornando immediatamente (\texttt{\small 24--27}). 
1913
1914 Quando la creazione del socket ha avuto successo si procede (\texttt{\small
1915   29}) direttamente con la connessione, di nuovo in caso di fallimento viene
1916 ripetuto (\texttt{\small 30--38}) il controllo se vi sono o no altri indirizzi
1917 da provare nella stessa modalità fatta in precedenza, aggiungendovi però in
1918 entrambi i casi (\texttt{\small 32} e (\texttt{\small 36}) la chiusura del
1919 socket precedentemente aperto, che non è più utilizzabile.
1920
1921 Se la connessione ha avuto successo invece si termina (\texttt{\small 39})
1922 direttamente il ciclo, e prima di ritornare (\texttt{\small 31}) il valore del
1923 file descriptor del socket si provvede (\texttt{\small 30}) a liberare le
1924 strutture \struct{addrinfo} allocate da \func{getaddrinfo} utilizzando il
1925 valore del relativo puntatore precedentemente (\texttt{\small 17}) salvato.
1926 Si noti come per la funzione sia del tutto irrilevante se la struttura
1927 ritornata contiene indirizzi IPv6 o IPv4, in quanto si fa uso direttamente dei
1928 dati relativi alle strutture degli indirizzi di \struct{addrinfo} che sono
1929 opachi rispetto all'uso della funzione \func{connect}.
1930
1931 Per usare questa funzione possiamo allora modificare ulteriormente il nostro
1932 programma client per il servizio \textit{echo}; in questo caso rispetto al
1933 codice usato finora per collegarsi (vedi fig.~\ref{fig:TCP_echo_client_1})
1934 avremo una semplificazione per cui il corpo principale del nostro client
1935 diventerà quello illustrato in fig.~\ref{fig:TCP_echo_fifth}, in cui le
1936 chiamate a \func{socket}, \func{inet\_pton} e \func{connect} sono sostituite
1937 da una singola chiamata a \texttt{sockconn}. Inoltre il nuovo client (il cui
1938 codice completo è nel file \file{TCP\_echo\_fifth.c} dei sorgenti allegati)
1939 consente di utilizzare come argomento del programma un nome a dominio al posto
1940 dell'indirizzo numerico, e può utilizzare sia indirizzi IPv4 che IPv6.
1941
1942 \begin{figure}[!htb]
1943   \footnotesize \centering
1944   \begin{minipage}[c]{\codesamplewidth}
1945     \includecodesample{listati/TCP_echo_fifth.c}
1946   \end{minipage}
1947   \normalsize
1948   \caption{Il nuovo codice per la connessione del client \textit{echo}.}
1949   \label{fig:TCP_echo_fifth}
1950 \end{figure}
1951
1952 La seconda funzione di ausilio che abbiamo creato è \texttt{sockbind}, il cui
1953 corpo principale è riportato in fig.~\ref{fig:sockbind_code} (al solito il
1954 sorgente completo è nel file \file{sockbind.c} dei sorgenti allegati alla
1955 guida). Come si può notare la funzione è del tutto analoga alla precedente
1956 \texttt{sockconn}, e prende gli stessi argomenti, però invece di eseguire una
1957 connessione con \func{connect} si limita a chiamare \func{bind} per collegare
1958 il socket ad una porta.
1959
1960 \begin{figure}[!htb]
1961   \footnotesize \centering
1962   \begin{minipage}[c]{\codesamplewidth}
1963     \includecodesample{listati/sockbind.c}
1964   \end{minipage}
1965   \normalsize
1966   \caption{Il codice della funzione \texttt{sockbind}.}
1967   \label{fig:sockbind_code}
1968 \end{figure}
1969
1970 Dato che la funzione è pensata per essere utilizzata da un server ci si può
1971 chiedere a quale scopo mantenere l'argomento \param{host} quando l'indirizzo
1972 di questo è usualmente noto. Si ricordi però quanto detto in
1973 sez.~\ref{sec:TCP_func_bind}, relativamente al significato della scelta di un
1974 indirizzo specifico come argomento di \func{bind}, che consente di porre il
1975 server in ascolto su uno solo dei possibili diversi indirizzi presenti su di
1976 una macchina.  Se non si vuole che la funzione esegua \func{bind} su un
1977 indirizzo specifico, ma utilizzi l'indirizzo generico, occorrerà avere cura di
1978 passare un valore \val{NULL} come valore per l'argomento \var{host}; l'uso
1979 del valore \const{AI\_PASSIVE} serve ad ottenere il valore generico nella
1980 rispettiva struttura degli indirizzi.
1981
1982 Come già detto la funzione è analoga a \texttt{sockconn} ed inizia azzerando
1983 ed inizializzando (\texttt{\small 6--11}) opportunamente la struttura
1984 \var{hint} con i valori ricevuti come argomenti, soltanto che in questo caso
1985 si è usata (\texttt{\small 8}) una impostazione specifica dei flag di
1986 \var{hint} usando \const{AI\_PASSIVE} per indicare che il socket sarà usato
1987 per una apertura passiva. Per il resto la chiamata (\texttt{\small 12--18}) a
1988 \func{getaddrinfo} e ed il ciclo principale (\texttt{\small 20--42}) sono
1989 identici, solo che si è sostituita (\texttt{\small 31}) la chiamata a
1990 \func{connect} con una chiamata a \func{bind}. Anche la conclusione
1991 (\texttt{\small 43--44}) della funzione è identica.
1992
1993 Si noti come anche in questo caso si siano inserite le stampe degli errori
1994 sullo \textit{standard error}, nonostante la funzione possa essere invocata da
1995 un demone. Nel nostro caso questo non è un problema in quanto se la funzione
1996 non ha successo il programma deve uscire immediatamente prima di essere posto
1997 in background, e può quindi scrivere gli errori direttamente sullo
1998 \textit{standard error}.
1999
2000 \begin{figure}[!htbp]
2001   \footnotesize \centering
2002   \begin{minipage}[c]{\codesamplewidth}
2003     \includecodesample{listati/TCP_echod_third.c}
2004   \end{minipage}
2005   \normalsize
2006   \caption{Nuovo codice per l'apertura passiva del server \textit{echo}.}
2007   \label{fig:TCP_echod_third}
2008 \end{figure}
2009
2010 Con l'uso di questa funzione si può modificare anche il codice del nostro
2011 server \textit{echo}, che rispetto a quanto illustrato nella versione iniziale
2012 di fig.~\ref{fig:TCP_echo_server_first_code} viene modificato nella forma
2013 riportata in fig.~\ref{fig:TCP_echod_third}. In questo caso il socket su cui
2014 porsi in ascolto viene ottenuto (\texttt{\small 15--18}) da \texttt{sockbind}
2015 che si cura anche della eventuale risoluzione di un indirizzo specifico sul
2016 quale si voglia far ascoltare il server.
2017
2018
2019 \section{Le opzioni dei socket}
2020 \label{sec:sock_options}
2021
2022 Benché dal punto di vista del loro uso come canali di trasmissione di dati i
2023 socket vengano trattati allo stesso modo dei file, acceduti tramite i file
2024 descriptor, e gestiti con le ordinarie funzioni di lettura e scrittura dei
2025 file, l'interfaccia standard usata per la gestione dei file generici non è
2026 comunque sufficiente a controllare la moltitudine di caratteristiche
2027 specifiche che li contraddistinguono, considerato tra l'altro che queste
2028 possono essere completamente diverse fra loro a seconda del tipo di socket e
2029 della relativa forma di comunicazione sottostante.
2030
2031 In questa sezione vedremo allora quali sono le funzioni dedicate alla gestione
2032 delle caratteristiche specifiche dei vari tipi di socket, che vengono
2033 raggruppate sotto il nome generico di ``\textit{socket options}'', ma
2034 soprattutto analizzaremo quali sono queste opzioni e quali caretteristiche e
2035 comportamenti dei socket permettono di controllare.
2036
2037
2038 \subsection{Le funzioni di gestione delle opzioni dei socket}
2039 \label{sec:sock_setsockopt}
2040
2041 La modalità principale con cui si possono gestire le caratteristiche dei
2042 socket (ne vedremo delle ulteriori nelle prossime sezioni) è quella che passa
2043 attraverso l'uso di due funzioni di sistema generiche che permettono
2044 rispettivamente di impostarle e di recuperarne il valore corrente. La prima di
2045 queste due funzioni, quella usata per impostare le \textit{socket options}, è
2046 \funcd{setsockopt}, ed il suo prototipo è:
2047
2048 \begin{funcproto}{
2049 \fhead{sys/socket.h}
2050 \fhead{sys/types.h}
2051 \fdecl{int setsockopt(int sock, int level, int optname, const void
2052     *optval, socklen\_t optlen)}
2053 \fdesc{Imposta le opzioni di un socket.} 
2054 }
2055
2056 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2057   caso \var{errno} assumerà uno dei valori: 
2058   \begin{errlist}
2059   \item[\errcode{EBADF}]  il file descriptor \param{sock} non è valido.
2060   \item[\errcode{EFAULT}] l'indirizzo \param{optval} non è valido.
2061   \item[\errcode{EINVAL}] il valore di \param{optlen} non è valido.
2062   \item[\errcode{ENOPROTOOPT}] l'opzione scelta non esiste per il livello
2063     indicato. 
2064   \item[\errcode{ENOTSOCK}] il file descriptor \param{sock} non corrisponde ad
2065     un socket.
2066   \end{errlist}
2067 }
2068 \end{funcproto}
2069
2070 Il primo argomento della funzione, \param{sock}, indica il socket su cui si
2071 intende operare; per indicare l'opzione da impostare si devono usare i due
2072 argomenti successivi, \param{level} e \param{optname}.  Come abbiamo visto in
2073 sez.~\ref{sec:net_protocols} i protocolli di rete sono strutturati su vari
2074 livelli, ed l'interfaccia dei socket può usarne più di uno. Si avranno allora
2075 funzionalità e caratteristiche diverse per ciascun protocollo usato da un
2076 socket, e quindi saranno anche diverse le opzioni che si potranno impostare
2077 per ciascun socket, a seconda del \textsl{livello} (trasporto, rete, ecc.) su
2078 cui si vuole andare ad operare.
2079
2080 Il valore di \param{level} seleziona allora il protocollo su cui vuole
2081 intervenire, mentre \param{optname} permette di scegliere su quale delle
2082 opzioni che sono definite per quel protocollo si vuole operare. In sostanza la
2083 selezione di una specifica opzione viene fatta attraverso una coppia di valori
2084 \param{level} e \param{optname} e chiaramente la funzione avrà successo
2085 soltanto se il protocollo in questione prevede quella opzione ed è utilizzato
2086 dal socket.  Infine \param{level} prevede anche il valore speciale
2087 \const{SOL\_SOCKET} usato per le opzioni generiche che sono disponibili per
2088 qualunque tipo di socket.
2089
2090 \begin{table}[!htb]
2091   \centering
2092   \footnotesize
2093   \begin{tabular}[c]{|l|l|}
2094     \hline
2095     \textbf{Livello} & \textbf{Significato} \\
2096     \hline
2097     \hline
2098     \constd{SOL\_SOCKET}& Opzioni generiche dei socket.\\
2099     \constd{SOL\_IP}    & Opzioni specifiche per i socket che usano IPv4.\\
2100     \constd{SOL\_TCP}   & Opzioni per i socket che usano TCP.\\
2101     \constd{SOL\_IPV6}  & Opzioni specifiche per i socket che usano IPv6.\\
2102     \constd{SOL\_ICMPV6}& Opzioni specifiche per i socket che usano ICMPv6.\\
2103     \hline
2104   \end{tabular}
2105   \caption{Possibili valori dell'argomento \param{level} delle 
2106     funzioni \func{setsockopt} e \func{getsockopt}.} 
2107   \label{tab:sock_option_levels}
2108 \end{table}
2109
2110 I valori usati per \param{level}, corrispondenti ad un dato protocollo usato
2111 da un socket, sono quelli corrispondenti al valore numerico che identifica il
2112 suddetto protocollo in \conffile{/etc/protocols}; dato che la leggibilità di un
2113 programma non trarrebbe certo beneficio dall'uso diretto dei valori numerici,
2114 più comunemente si indica il protocollo tramite le apposite costanti
2115 \texttt{SOL\_*} riportate in tab.~\ref{tab:sock_option_levels}, dove si sono
2116 riassunti i valori che possono essere usati per l'argomento
2117 \param{level}. 
2118
2119 La notazione in questo caso è, purtroppo, abbastanza confusa: infatti in Linux
2120 il valore si può impostare sia usando le costanti \texttt{SOL\_*}, che le
2121 analoghe \texttt{IPPROTO\_*} (citate anche da Stevens in \cite{UNP1});
2122 entrambe hanno gli stessi valori che sono equivalenti ai numeri di protocollo
2123 di \conffile{/etc/protocols}, con una eccezione specifica, che è quella del
2124 protocollo ICMP, per la quale non esiste una costante, il che è comprensibile
2125 dato che il suo valore, 1, è quello che viene assegnato a \const{SOL\_SOCKET}.
2126
2127 Il quarto argomento, \param{optval} è un puntatore ad una zona di memoria che
2128 contiene i dati che specificano il valore dell'opzione che si vuole passare al
2129 socket, mentre l'ultimo argomento \param{optlen},\footnote{questo argomento è
2130   in realtà sempre di tipo \ctyp{int}, come era nelle \acr{libc4} e
2131   \acr{libc5}; l'uso di \type{socklen\_t} è stato introdotto da POSIX (valgono
2132   le stesse considerazioni per l'uso di questo tipo di dato fatte in
2133   sez.~\ref{sec:TCP_func_accept}) ed adottato dalle \acr{glibc}.} è la
2134 dimensione in byte dei dati presenti all'indirizzo indicato da \param{optval}.
2135 Dato che il tipo di dati varia a seconda dell'opzione scelta, occorrerà
2136 individuare qual è quello che deve essere usato, ed utilizzare le opportune
2137 variabili.
2138
2139 La gran parte delle opzioni utilizzano per \param{optval} un valore intero, se
2140 poi l'opzione esprime una condizione logica, il valore è sempre un intero, ma
2141 si dovrà usare un valore non nullo per abilitarla ed un valore nullo per
2142 disabilitarla.  Se invece l'opzione non prevede di dover ricevere nessun tipo
2143 di valore si deve impostare \param{optval} a \val{NULL}. Un piccolo numero
2144 di opzioni però usano dei tipi di dati peculiari, è questo il motivo per cui
2145 \param{optval} è stato definito come puntatore generico.
2146
2147 La seconda funzione usata per controllare le proprietà dei socket è
2148 \funcd{getsockopt}, che serve a leggere i valori delle opzioni dei socket ed a
2149 farsi restituire i dati relativi al loro funzionamento; il suo prototipo è:
2150
2151
2152 \begin{funcproto}{
2153 \fhead{sys/socket.h}
2154 \fhead{sys/types.h}
2155 \fdecl{int getsockopt(int s, int level, int optname, void *optval,
2156     socklen\_t *optlen)}
2157 \fdesc{Legge le opzioni di un socket.} 
2158 }
2159
2160 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2161   caso \var{errno} assumerà uno dei valori: 
2162   \begin{errlist}
2163   \item[\errcode{EBADF}] il file descriptor \param{sock} non è valido.
2164   \item[\errcode{EFAULT}] l'indirizzo \param{optval} o quello di
2165     \param{optlen} non è valido.
2166   \item[\errcode{ENOPROTOOPT}] l'opzione scelta non esiste per il livello
2167     indicato. 
2168   \item[\errcode{ENOTSOCK}] il file descriptor \param{sock} non corrisponde ad
2169     un socket.
2170   \end{errlist}
2171 }
2172 \end{funcproto}
2173
2174 I primi tre argomenti sono identici ed hanno lo stesso significato di quelli
2175 di \func{setsockopt}, anche se non è detto che tutte le opzioni siano definite
2176 per entrambe le funzioni. In questo caso \param{optval} viene usato per
2177 ricevere le informazioni ed indica l'indirizzo a cui andranno scritti i dati
2178 letti dal socket, infine \param{optlen} diventa un puntatore ad una variabile
2179 che viene usata come \textit{value result argument} per indicare, prima della
2180 chiamata della funzione, la lunghezza del buffer allocato per \param{optval} e
2181 per ricevere indietro, dopo la chiamata della funzione, la dimensione
2182 effettiva dei dati scritti su di esso.  Se la dimensione del buffer allocato
2183 per \param{optval} non è sufficiente si avrà un errore.
2184
2185
2186
2187 \subsection{Le opzioni generiche}
2188 \label{sec:sock_generic_options}
2189
2190 Come accennato esiste un insieme generico di opzioni dei socket che possono
2191 applicarsi a qualunque tipo di socket,\footnote{una descrizione di queste
2192   opzioni è generalmente disponibile nella settima sezione delle pagine di
2193   manuale, nel caso specifico la si può consultare con \texttt{man 7 socket}.}
2194 indipendentemente da quale protocollo venga poi utilizzato. Se si vuole
2195 operare su queste opzioni generiche il livello da utilizzare è
2196 \const{SOL\_SOCKET}; si è riportato un elenco di queste opzioni in
2197 tab.~\ref{tab:sock_opt_socklevel}.
2198
2199
2200 \begin{table}[!htb]
2201   \centering
2202   \footnotesize
2203   \begin{tabular}[c]{|l|c|c|c|l|l|}
2204     \hline
2205     \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
2206                     \textbf{Descrizione}\\
2207     \hline
2208     \hline
2209     \const{SO\_ACCEPTCONN}&$\bullet$&        &         &\texttt{int}& 
2210                           Indica se il socket è in ascolto.\\
2211     \const{SO\_BINDTODEVICE}&$\bullet$&$\bullet$&         &\texttt{char *}& 
2212                           Lega il socket ad un dispositivo.\\
2213     \const{SO\_BROADCAST}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2214                           Attiva o disattiva il \textit{broadcast}.\\ 
2215     \const{SO\_BSDCOMPAT}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2216                           Abilita la compatibilità con BSD.\\
2217     \const{SO\_DEBUG}    &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2218                           Abilita il debugging sul socket.\\
2219     \const{SO\_DOMAIN}   &$\bullet$&         &         &\texttt{int}& 
2220                           Legge il tipo di socket.\\
2221     \const{SO\_DONTROUTE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2222                           Non invia attraverso un gateway.\\
2223     \const{SO\_ERROR}    &$\bullet$&         &         &\texttt{int}& 
2224                           Riceve e cancella gli errori pendenti.\\
2225     \const{SO\_KEEPALIVE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2226                           Controlla l'attività della connessione.\\
2227     \const{SO\_LINGER}   &$\bullet$&$\bullet$&         &\texttt{linger}&
2228                           Indugia nella chiusura con dati da spedire.\\
2229     \const{SO\_MARK}     &$\bullet$&$\bullet$&         &\texttt{int}&
2230                           Imposta un ``\textit{firewall mark}'' sul socket.\\
2231     \const{SO\_OOBINLINE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2232                           Lascia in linea i dati \textit{out-of-band}.\\
2233     \const{SO\_PASSCRED} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2234                           Abilita la ricezione di credenziali.\\
2235     \const{SO\_PEERCRED} &$\bullet$&         &         &\texttt{ucred}& 
2236                           Restituisce le credenziali del processo remoto.\\
2237     \const{SO\_PRIORITY} &$\bullet$&$\bullet$&         &\texttt{int}& 
2238                           Imposta la priorità del socket.\\
2239     \const{SO\_PROTOCOL} &$\bullet$&         &         &\texttt{int}& 
2240                           Ottiene il protocollo usato dal socket.\\
2241     \const{SO\_RCVBUF}   &$\bullet$&$\bullet$&         &\texttt{int}& 
2242                           Imposta dimensione del buffer di ricezione.\\
2243     \const{SO\_RCVBUFFORCE}&$\bullet$&$\bullet$&         &\texttt{int}& 
2244                           Forza dimensione del buffer di ricezione.\\
2245     \const{SO\_RCVLOWAT} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2246                           Basso livello sul buffer di ricezione.\\
2247     \const{SO\_RCVTIMEO} &$\bullet$&$\bullet$&         &\texttt{timeval}& 
2248                           Timeout in ricezione.\\
2249     \const{SO\_REUSEADDR}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2250                           Consente il riutilizzo di un indirizzo locale.\\
2251     \const{SO\_REUSEPORT}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2252                           Consente il riutilizzo di una porta.\\
2253     \const{SO\_SNDBUF}   &$\bullet$&$\bullet$&         &\texttt{int}& 
2254                           Imposta dimensione del buffer di trasmissione.\\
2255     \const{SO\_SNDBUFFORCE}&$\bullet$&$\bullet$&         &\texttt{int}& 
2256                           Forza dimensione del buffer di trasmissione.\\
2257     \const{SO\_SNDLOWAT} &$\bullet$&$\bullet$&         &\texttt{int}&
2258                           Basso livello sul buffer di trasmissione.\\
2259     \const{SO\_SNDTIMEO} &$\bullet$&$\bullet$&         &\texttt{timeval}& 
2260                           Timeout in trasmissione.\\
2261     \const{SO\_TIMESTAMP}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
2262                           Abilita/disabilita la ricezione dei \textit{timestamp}.\\
2263     \const{SO\_TYPE}     &$\bullet$&         &         &\texttt{int}& 
2264                           Restituisce il tipo di socket.\\
2265    \hline
2266   \end{tabular}
2267   \caption{Le opzioni disponibili al livello \const{SOL\_SOCKET}.} 
2268   \label{tab:sock_opt_socklevel}
2269 \end{table}
2270
2271 % TODO aggiungere e documentare SO_ATTACH_BPF, introdotta con il kernel 3.19,
2272 % vedi http://lwn.net/Articles/625224/
2273 % TODO aggiungere e documentare SO_INCOMING_CPU, introdotta con il kernel 3.19,
2274 % vedi https://lwn.net/Articles/626150/
2275 % TODO documentare SO_PEEK_OFF
2276 % TODO documentare SO_RXQ_OVFL
2277 % TODO documentare SO_BUSYPOLL
2278
2279
2280 % TODO documentare SO_MARK, cercare esempi e verificare il tipo di valore passato
2281 % TODO documentare SO_PROTOCOL
2282 % TODO documentare SO_REUSEPORT
2283 % TODO documentare SO_TIMESTAMP
2284 % TODO documentare SO_SNDBUFFORCE/SO_RCVBUFFORCE
2285
2286
2287 La tabella elenca le costanti che identificano le singole opzioni da usare
2288 come valore per \param{optname}; le due colonne seguenti indicano per quali
2289 delle due funzioni (\func{getsockopt} o \func{setsockopt}) l'opzione è
2290 disponibile, mentre la colonna successiva indica, quando si ha a che fare con
2291 un valore di \param{optval} intero, se l'opzione è da considerare un numero o
2292 un valore logico. Si è inoltre riportato sulla quinta colonna il tipo di dato
2293 usato per \param{optval} ed una breve descrizione del significato delle
2294 singole opzioni sulla sesta.
2295
2296 Le descrizioni delle opzioni presenti in tab.~\ref{tab:sock_opt_socklevel}
2297 sono estremamente sommarie, è perciò necessario fornire un po' più di
2298 informazioni. Alcune opzioni inoltre hanno una notevole rilevanza nella
2299 gestione dei socket, e pertanto il loro utilizzo sarà approfondito
2300 separatamente in sez.~\ref{sec:sock_options_main}. Quello che segue è quindi
2301 soltanto un elenco più dettagliato della breve descrizione di
2302 tab.~\ref{tab:sock_opt_socklevel} sul significato delle varie opzioni:
2303 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
2304
2305 \item[\constd{SO\_ACCEPTCONN}] questa opzione permette di rilevare se il socket
2306   su cui opera è stato posto in modalità di ricezione di eventuali connessioni
2307   con una chiamata a \func{listen}. L'opzione può essere usata soltanto con
2308   \func{getsockopt} e utilizza per \param{optval} un intero in cui viene
2309   restituito 1 se il socket è in ascolto e 0 altrimenti. 
2310
2311 \item[\constd{SO\_BINDTODEVICE}] questa opzione permette di \textsl{legare} il
2312   socket ad una particolare interfaccia, in modo che esso possa ricevere ed
2313   inviare pacchetti solo su quella. L'opzione richiede per \param{optval} il
2314   puntatore ad una stringa contenente il nome dell'interfaccia (ad esempio
2315   \texttt{eth0}); utilizzando una stringa nulla o un valore nullo per
2316   \param{optlen} si può rimuovere un precedente collegamento.
2317
2318   Il nome della interfaccia deve essere specificato con una stringa terminata
2319   da uno zero e di lunghezza massima pari a \constd{IFNAMSIZ}; l'opzione è
2320   effettiva solo per alcuni tipi di socket, ed in particolare per quelli della
2321   famiglia \const{AF\_INET}; non è invece supportata per i \textit{packet
2322     socket} (vedi sez.~\ref{sec:socket_raw}). 
2323
2324 \item[\constd{SO\_BROADCAST}] questa opzione abilita il \textit{broadcast};
2325   quanto abilitata i socket di tipo \const{SOCK\_DGRAM} riceveranno i
2326   pacchetti inviati all'indirizzo di \textit{broadcast}, e potranno scrivere
2327   pacchetti su tale indirizzo.  Prende per \param{optval} un intero usato come
2328   valore logico. L'opzione non ha effetti su un socket di tipo
2329   \const{SOCK\_STREAM}.
2330
2331 \item[\constd{SO\_BSDCOMPAT}] questa opzione abilita la compatibilità con il
2332   comportamento di BSD (in particolare ne riproduce i bug).  Attualmente è una
2333   opzione usata solo per il protocollo UDP e ne è prevista la rimozione in
2334   futuro.  L'opzione utilizza per \param{optval} un intero usato come valore
2335   logico. 
2336
2337   Quando viene abilitata gli errori riportati da messaggi ICMP per un socket
2338   UDP non vengono passati al programma in user space. Con le versioni 2.0.x
2339   del kernel erano anche abilitate altre opzioni per i socket raw, che sono
2340   state rimosse con il passaggio al 2.2; è consigliato correggere i programmi
2341   piuttosto che usare questa funzione. 
2342
2343 \item[\constd{SO\_DEBUG}] questa opzione abilita il debugging delle operazioni
2344   dei socket; l'opzione utilizza per \param{optval} un intero usato come
2345   valore logico, e può essere utilizzata solo da un processo con i privilegi
2346   di amministratore (in particolare con la \textit{capability}
2347   \const{CAP\_NET\_ADMIN}).  L'opzione necessita inoltre dell'opportuno
2348   supporto nel kernel;\footnote{deve cioè essere definita la macro di
2349     preprocessore \macrod{SOCK\_DEBUGGING} nel file \file{include/net/sock.h}
2350     dei sorgenti del kernel, questo è sempre vero nei kernel delle serie
2351     superiori alla 2.3, per i kernel delle serie precedenti invece è
2352     necessario aggiungere a mano detta definizione; è inoltre possibile
2353     abilitare anche il tracciamento degli stati del TCP definendo la macro
2354     \macrod{STATE\_TRACE} in \file{include/net/tcp.h}.}  quando viene
2355   abilitata una serie di messaggi con le informazioni di debug vengono inviati
2356   direttamente al sistema del kernel log.\footnote{si tenga presente che il
2357     comportamento è diverso da quanto avviene con BSD, dove l'opzione opera
2358     solo sui socket TCP, causando la scrittura di tutti i pacchetti inviati
2359     sulla rete su un buffer circolare che viene letto da un apposito
2360     programma, \cmd{trpt}.}
2361
2362 \item[\constd{SO\_DONTROUTE}] questa opzione forza l'invio diretto dei
2363   pacchetti del socket, saltando ogni processo relativo all'uso della tabella
2364   di routing del kernel. Prende per \param{optval} un intero usato come valore
2365   logico.
2366
2367 \item[\constd{SO\_ERROR}] questa opzione riceve un errore presente sul socket;
2368   può essere utilizzata soltanto con \func{getsockopt} e prende per
2369   \param{optval} un valore intero, nel quale viene restituito il codice di
2370   errore, e la condizione di errore sul socket viene cancellata. Viene
2371   usualmente utilizzata per ricevere il codice di errore, come accennato in
2372   sez.~\ref{sec:TCP_sock_select}, quando si sta osservando il socket con una
2373   \func{select} che ritorna a causa dello stesso.
2374
2375 \item[\const{SO\_KEEPALIVE}] questa opzione abilita un meccanismo di verifica
2376   della persistenza di una connessione associata al socket (ed è pertanto
2377   effettiva solo sui socket che supportano le connessioni, ed è usata
2378   principalmente con il TCP). L'opzione utilizza per \param{optval} un intero
2379   usato come valore logico. Maggiori dettagli sul suo funzionamento sono
2380   forniti in sez.~\ref{sec:sock_options_main}.
2381
2382 \item[\const{SO\_LINGER}] questa opzione controlla le modalità con cui viene
2383   chiuso un socket quando si utilizza un protocollo che supporta le
2384   connessioni (è pertanto usata con i socket TCP ed ignorata per UDP) e
2385   modifica il comportamento delle funzioni \func{close} e \func{shutdown}.
2386   L'opzione richiede che l'argomento \param{optval} sia una struttura di tipo
2387   \struct{linger}, definita in \headfile{sys/socket.h} ed illustrata in
2388   fig.~\ref{fig:sock_linger_struct}.  Maggiori dettagli sul suo funzionamento
2389   sono forniti in sez.~\ref{sec:sock_options_main}.
2390
2391 \item[\constd{SO\_OOBINLINE}] se questa opzione viene abilitata i dati
2392   \textit{out-of-band} vengono inviati direttamente nel flusso di dati del
2393   socket (e sono quindi letti con una normale \func{read}) invece che restare
2394   disponibili solo per l'accesso con l'uso del flag \const{MSG\_OOB} di
2395   \func{recvmsg}. L'argomento è trattato in dettaglio in
2396   sez.~\ref{sec:TCP_urgent_data}. L'opzione funziona soltanto con socket che
2397   supportino i dati \textit{out-of-band} (non ha senso per socket UDP ad
2398   esempio), ed utilizza per \param{optval} un intero usato come valore logico.
2399
2400 \item[\constd{SO\_PASSCRED}] questa opzione abilita sui socket unix-domain
2401   (vedi sez.~\ref{sec:unix_socket}) la ricezione dei messaggi di controllo di
2402   tipo \const{SCM\_CREDENTIALS}. Prende come \param{optval} un intero usato
2403   come valore logico.
2404
2405 \item[\constd{SO\_PEERCRED}] questa opzione restituisce le credenziali del
2406   processo remoto connesso al socket; l'opzione è disponibile solo per socket
2407   unix-domain e può essere usata solo con \func{getsockopt}.  Utilizza per
2408   \param{optval} una apposita struttura \struct{ucred} (vedi
2409   sez.~\ref{sec:unix_socket}). 
2410
2411 \item[\constd{SO\_PRIORITY}] questa opzione permette di impostare le priorità
2412   per tutti i pacchetti che sono inviati sul socket, prende per \param{optval}
2413   un valore intero. Con questa opzione il kernel usa il valore per ordinare le
2414   priorità sulle code di rete,\footnote{questo richiede che sia abilitato il
2415     sistema di \textit{Quality of Service} disponibile con le opzioni di
2416     routing avanzato.} i pacchetti con priorità più alta vengono processati
2417   per primi, in modalità che dipendono dalla disciplina di gestione della
2418   coda. Nel caso di protocollo IP questa opzione permette anche di impostare i
2419   valori del campo \textit{type of service} (noto come TOS, vedi
2420   sez.~\ref{sec:IP_header}) per i pacchetti uscenti. Per impostare una
2421   priorità al di fuori dell'intervallo di valori fra 0 e 6 sono richiesti i
2422   privilegi di amministratore con la capability \const{CAP\_NET\_ADMIN}.
2423
2424 \item[\constd{SO\_RCVLOWAT}] questa opzione imposta il valore che indica il
2425   numero minimo di byte che devono essere presenti nel buffer di ricezione
2426   perché il kernel passi i dati all'utente, restituendoli ad una \func{read} o
2427   segnalando ad una \func{select} (vedi sez.~\ref{sec:TCP_sock_select}) che ci
2428   sono dati in ingresso. L'opzione utilizza per \param{optval} un intero che
2429   specifica il numero di byte, ma con Linux questo valore è sempre 1 e non può
2430   essere cambiato; \func{getsockopt} leggerà questo valore mentre
2431   \func{setsockopt} darà un errore di \errcode{ENOPROTOOPT}. 
2432
2433 \item[\constd{SO\_RCVTIMEO}] l'opzione permette di impostare un tempo massimo
2434   sulle operazioni di lettura da un socket, e prende per \param{optval} una
2435   struttura di tipo \struct{timeval} (vedi fig.~\ref{fig:sys_timeval_struct})
2436   identica a quella usata con \func{select}. Con \func{getsockopt} si può
2437   leggere il valore attuale, mentre con \func{setsockopt} si imposta il tempo
2438   voluto, usando un valore nullo per \struct{timeval} il timeout viene
2439   rimosso. 
2440
2441   Se l'opzione viene attivata tutte le volte che una delle funzioni di lettura
2442   (\func{read}, \func{readv}, \func{recv}, \func{recvfrom} e \func{recvmsg})
2443   si blocca in attesa di dati per un tempo maggiore di quello impostato, essa
2444   ritornerà un valore -1 e la variabile \var{errno} sarà impostata con un
2445   errore di \errcode{EAGAIN} e \errcode{EWOULDBLOCK}, così come sarebbe
2446   avvenuto se si fosse aperto il socket in modalità non bloccante.\footnote{in
2447     teoria, se il numero di byte presenti nel buffer di ricezione fosse
2448     inferiore a quello specificato da \const{SO\_RCVLOWAT}, l'effetto potrebbe
2449     essere semplicemente quello di provocare l'uscita delle funzioni di
2450     lettura restituendo il numero di byte fino ad allora ricevuti; dato che
2451     con Linux questo valore è sempre 1 questo caso non esiste.}
2452
2453   In genere questa opzione non è molto utilizzata se si ha a che fare con la
2454   lettura dei dati, in quanto è sempre possibile usare una \func{select} che
2455   consente di specificare un \textit{timeout}; l'uso di \func{select} non
2456   consente però di impostare il timeout per l'uso di \func{connect}, per avere
2457   il quale si può ricorrere a questa opzione. 
2458
2459 \item[\const{SO\_REUSEADDR}] questa opzione permette di eseguire la funzione
2460   \func{bind} su indirizzi locali che siano già in uso da altri socket;
2461   l'opzione utilizza per \param{optval} un intero usato come valore logico.
2462   Questa opzione modifica il comportamento normale dell'interfaccia dei socket
2463   che fa fallire l'esecuzione della funzione \func{bind} con un errore di
2464   \errcode{EADDRINUSE} quando l'indirizzo locale\footnote{più propriamente il
2465     controllo viene eseguito sulla porta.} è già in uso da parte di un altro
2466   socket.  Maggiori dettagli sul suo funzionamento sono forniti in
2467   sez.~\ref{sec:sock_options_main}.
2468
2469 \item[\constd{SO\_SNDLOWAT}] questa opzione imposta il valore che indica il
2470   numero minimo di byte che devono essere presenti nel buffer di trasmissione
2471   perché il kernel li invii al protocollo successivo, consentendo ad una
2472   \func{write} di ritornare o segnalando ad una \func{select} (vedi
2473   sez.~\ref{sec:TCP_sock_select}) che è possibile eseguire una scrittura.
2474   L'opzione utilizza per \param{optval} un intero che specifica il numero di
2475   byte, come per la precedente \const{SO\_RCVLOWAT} con Linux questo valore è
2476   sempre 1 e non può essere cambiato; \func{getsockopt} leggerà questo valore
2477   mentre \func{setsockopt} darà un errore di \errcode{ENOPROTOOPT}.
2478
2479 % TODO verificare il timeout con un programma di test
2480
2481 \item[\constd{SO\_SNDTIMEO}] l'opzione permette di impostare un tempo massimo
2482   sulle operazioni di scrittura su un socket, ed usa gli stessi valori di
2483   \const{SO\_RCVTIMEO}.  In questo caso però si avrà un errore di
2484   \errcode{EAGAIN} o \errcode{EWOULDBLOCK} per le funzioni di scrittura
2485   \func{write}, \func{writev}, \func{send}, \func{sendto} e \func{sendmsg}
2486   qualora queste restino bloccate per un tempo maggiore di quello specificato. 
2487
2488 \item[\constd{SO\_SNDBUF}] questa opzione imposta la dimensione del buffer di
2489   trasmissione del socket. Prende per \param{optval} un intero indicante il
2490   numero di byte. Il valore di default ed il valore massimo che si possono
2491   specificare come argomento per questa opzione sono impostabili
2492   rispettivamente tramite gli opportuni valori di \func{sysctl} (vedi
2493   sez.~\ref{sec:sock_sysctl}).
2494
2495 \item[\constd{SO\_RCVBUF}] questa opzione imposta la dimensione del buffer di
2496   ricezione del socket. Prende per \param{optval} un intero indicante il
2497   numero di byte. Il valore di default ed il valore massimo che si può
2498   specificare come argomento per questa opzione sono impostabili tramiti gli
2499   opportuni valori di \func{sysctl} (vedi sez.~\ref{sec:sock_sysctl}).
2500
2501   Si tenga presente che nel caso di socket TCP, per entrambe le opzioni
2502   \const{SO\_RCVBUF} e \const{SO\_SNDBUF}, il kernel alloca effettivamente una
2503   quantità di memoria doppia rispetto a quanto richiesto con
2504   \func{setsockopt}. Questo comporta che una successiva lettura con
2505   \func{getsockopt} riporterà un valore diverso da quello impostato con
2506   \func{setsockopt}.  Questo avviene perché TCP necessita dello spazio in più
2507   per mantenere dati amministrativi e strutture interne, e solo una parte
2508   viene usata come buffer per i dati, mentre il valore letto da
2509   \func{getsockopt} e quello riportato nei vari parametri di
2510   \textit{sysctl}\footnote{cioè \sysctlrelfile{net/core}{wmem\_max} e
2511     \sysctlrelfile{net/core}{rmem\_max} in \texttt{/proc/sys/net/core} e
2512     \sysctlrelfile{net/ipv4}{tcp\_wmem} e \sysctlrelfile{net/ipv4}{tcp\_rmem}
2513     in \texttt{/proc/sys/net/ipv4}, vedi sez.~\ref{sec:sock_sysctl}.} indica
2514   la memoria effettivamente impiegata.  Si tenga presente inoltre che le
2515   modifiche alle dimensioni dei buffer di ricezione e trasmissione, per poter
2516   essere effettive, devono essere impostate prima della chiamata alle funzioni
2517   \func{listen} o \func{connect}.
2518
2519 \item[\constd{SO\_ATTACH\_FILTER}] questa opzione permette di agganciare ad un
2520   socket un filtro di pacchetti che consente di selezionare quali pacchetti,
2521   fra tutti quelli ricevuti, verranno letti. Viene usato principalmente con i
2522   socket di tipo \const{PF\_PACKET} con la libreria \texttt{libpcap} per
2523   implementare programmi di cattura dei pacchetti, torneremo su questo in
2524   sez.~\ref{sec:packet_socket}.
2525
2526 \item[\constd{SO\_TYPE}] questa opzione permette di leggere il tipo di socket
2527   su cui si opera; funziona solo con \func{getsockopt}, ed utilizza per
2528   \param{optval} un intero in cui verrà restituito il valore numerico che lo
2529   identifica (ad esempio \const{SOCK\_STREAM}). 
2530
2531
2532 \item[\constd{SO\_DETACH\_FILTER}] consente di distaccare un filtro
2533   precedentemente aggiunto ad un socket.
2534
2535 % TODO documentare SO_ATTACH_FILTER e SO_DETACH_FILTER
2536 % riferimenti http://www.rcpt.to/lsfcc/lsf.html
2537 % Documentation/networking/filter.txt
2538
2539 % TODO documentare SO_MARK, introdotta nel 2.6.25, richiede CAP_NET_ADMIN
2540 %A userspace program may wish to set the mark for each packets its send
2541 %without using the netfilter MARK target. Changing the mark can be used
2542 %for mark based routing without netfilter or for packet filtering.
2543
2544
2545 % TODO documentare SO_TIMESTAMP e le altre opzioni di timestamping dei 
2546 % pacchetti, introdotte nel 2.6.30, vedi nei sorgenti del kernel:
2547 % Documentation/networking/timestamping.txt
2548
2549
2550 % TOFO documentare SO_REUSEPORT introdotta con il kernel 3.9, vedi
2551 % http://git.kernel.org/linus/c617f398edd4db2b8567a28e899a88f8f574798d 
2552
2553 \end{basedescript}
2554
2555
2556 \subsection{L'uso delle principali opzioni dei socket}
2557 \label{sec:sock_options_main}
2558
2559 La descrizione sintetica del significato delle opzioni generiche dei socket,
2560 riportata nell'elenco in sez.~\ref{sec:sock_generic_options}, è
2561 necessariamente sintetica, alcune di queste però possono essere utilizzate
2562 per controllare delle funzionalità che hanno una notevole rilevanza nella
2563 programmazione dei socket.  Per questo motivo faremo in questa sezione un
2564 approfondimento sul significato delle opzioni generiche più importanti.
2565
2566
2567 \constbeg{SO\_KEEPALIVE}
2568 \subsubsection{L'opzione \const{SO\_KEEPALIVE}}
2569
2570 La prima opzione da approfondire è \const{SO\_KEEPALIVE} che permette di
2571 tenere sotto controllo lo stato di una connessione. Una connessione infatti
2572 resta attiva anche quando non viene effettuato alcun traffico su di essa; è
2573 allora possibile, in caso di una interruzione completa della rete, che la
2574 caduta della connessione non venga rilevata, dato che sulla stessa non passa
2575 comunque alcun traffico.
2576
2577 Se si imposta questa opzione, è invece cura del kernel inviare degli appositi
2578 messaggi sulla rete, detti appunto \textit{keep-alive}, per verificare se la
2579 connessione è attiva.  L'opzione funziona soltanto con i socket che supportano
2580 le connessioni (non ha senso per socket UDP ad esempio) e si applica
2581 principalmente ai socket TCP.
2582
2583 Con le impostazioni di default (che sono riprese da BSD) Linux emette un
2584 messaggio di \textit{keep-alive}\footnote{in sostanza un segmento ACK vuoto,
2585   cui sarà risposto con un altro segmento ACK vuoto.} verso l'altro capo della
2586 connessione se questa è rimasta senza traffico per più di due ore.  Se è tutto
2587 a posto il messaggio viene ricevuto e verrà emesso un segmento ACK di
2588 risposta, alla cui ricezione ripartirà un altro ciclo di attesa per altre due
2589 ore di inattività; il tutto avviene all'interno del kernel e le applicazioni
2590 non riceveranno nessun dato.
2591
2592 Qualora ci siano dei problemi di rete si possono invece verificare i due casi
2593 di terminazione precoce del server già illustrati in
2594 sez.~\ref{sec:TCP_conn_crash}. Il primo è quello in cui la macchina remota ha
2595 avuto un crollo del sistema ed è stata riavviata, per cui dopo il riavvio la
2596 connessione non esiste più.\footnote{si ricordi che un normale riavvio o il
2597   crollo dell'applicazione non ha questo effetto, in quanto in tal caso si
2598   passa sempre per la chiusura del processo, e questo, come illustrato in
2599   sez.~\ref{sec:file_open_close}, comporta anche la regolare chiusura del
2600   socket con l'invio di un segmento FIN all'altro capo della connessione.} In
2601 questo caso all'invio del messaggio di \textit{keep-alive} si otterrà come
2602 risposta un segmento RST che indica che l'altro capo non riconosce più
2603 l'esistenza della connessione ed il socket verrà chiuso riportando un errore
2604 di \errcode{ECONNRESET}.
2605
2606 Se invece non viene ricevuta nessuna risposta (indice che la macchina non è
2607 più raggiungibile) l'emissione dei messaggi viene ripetuta ad intervalli di 75
2608 secondi per un massimo di 9 volte\footnote{entrambi questi valori possono
2609   essere modificati a livello di sistema (cioè per tutti i socket) con gli
2610   opportuni parametri illustrati in sez.~\ref{sec:sock_sysctl} ed a livello di
2611   singolo socket con le opzioni \texttt{TCP\_KEEP*} di
2612   sez.~\ref{sec:sock_tcp_udp_options}.}  (per un totale di 11 minuti e 15
2613 secondi) dopo di che, se non si è ricevuta nessuna risposta, il socket viene
2614 chiuso dopo aver impostato un errore di \errcode{ETIMEDOUT}. Qualora la
2615 connessione si sia ristabilita e si riceva un successivo messaggio di risposta
2616 il ciclo riparte come se niente fosse avvenuto.  Infine se si riceve come
2617 risposta un pacchetto ICMP di destinazione irraggiungibile (vedi
2618 sez.~\ref{sec:ICMP_protocol}), verrà restituito l'errore corrispondente.
2619
2620 In generale questa opzione serve per individuare una caduta della connessione
2621 anche quando non si sta facendo traffico su di essa.  Viene usata
2622 principalmente sui server per evitare di mantenere impegnate le risorse che
2623 verrebbero dedicate a trattare delle connessioni che in realtà sono già
2624 terminate (quelle che vengono anche chiamate connessioni
2625 \textsl{semi-aperte}); in tutti quei casi cioè in cui il server si trova in
2626 attesa di dati in ingresso su una connessione che non arriveranno mai o perché
2627 il client sull'altro capo non è più attivo o perché non è più in grado di
2628 comunicare con il server via rete.
2629
2630 \begin{figure}[!htbp]
2631   \footnotesize \centering
2632   \begin{minipage}[c]{\codesamplewidth}
2633     \includecodesample{listati/TCP_echod_fourth.c}
2634   \end{minipage}
2635   \normalsize
2636   \caption{La sezione della nuova versione del server del servizio
2637     \textit{echo} che prevede l'attivazione del \textit{keepalive} sui
2638     socket.}
2639   \label{fig:echod_keepalive_code}
2640 \end{figure}
2641
2642 Abilitandola dopo un certo tempo le connessioni effettivamente terminate
2643 verranno comunque chiuse per cui, utilizzando ad esempio una \func{select}, se
2644 be potrà rilevare la conclusione e ricevere il relativo errore. Si tenga
2645 presente però che non può avere la certezza assoluta che un errore di
2646 \errcode{ETIMEDOUT} ottenuto dopo aver abilitato questa opzione corrisponda
2647 necessariamente ad una reale conclusione della connessione, il problema
2648 potrebbe anche essere dovuto ad un problema di routing che perduri per un
2649 tempo maggiore di quello impiegato nei vari tentativi di ritrasmissione del
2650 \textit{keep-alive} (anche se questa non è una condizione molto probabile).
2651
2652 Come esempio dell'utilizzo di questa opzione introduciamo all'interno del
2653 nostro server per il servizio \textit{echo} la nuova opzione \texttt{-k} che
2654 permette di attivare il \textit{keep-alive} sui socket; tralasciando la parte
2655 relativa alla gestione di detta opzione (che si limita ad assegnare ad 1 la
2656 variabile \var{keepalive}) tutte le modifiche al server sono riportate in
2657 fig.~\ref{fig:echod_keepalive_code}. Al solito il codice completo è contenuto
2658 nel file \texttt{TCP\_echod\_fourth.c} dei sorgenti allegati alla guida.
2659
2660 Come si può notare la variabile \var{keepalive} è preimpostata (\texttt{\small
2661   8}) ad un valore nullo; essa viene utilizzata sia come variabile logica per
2662 la condizione (\texttt{\small 14}) che controlla l'attivazione del
2663 \textit{keep-alive} che come valore dell'argomento \param{optval} della
2664 chiamata a \func{setsockopt} (\texttt{\small 16}).  A seconda del suo valore
2665 tutte le volte che un processo figlio viene eseguito in risposta ad una
2666 connessione verrà pertanto eseguita o meno la sezione (\texttt{\small 14--17})
2667 che esegue l'impostazione di \const{SO\_KEEPALIVE} sul socket connesso,
2668 attivando il relativo comportamento.
2669 \constend{SO\_KEEPALIVE}
2670
2671
2672
2673 \constbeg{SO\_REUSEADDR}
2674 \subsubsection{L'opzione \const{SO\_REUSEADDR}}
2675
2676 La seconda opzione da approfondire è \const{SO\_REUSEADDR}, che consente di
2677 eseguire \func{bind} su un socket anche quando la porta specificata è già in
2678 uso da parte di un altro socket. Si ricordi infatti che, come accennato in
2679 sez.~\ref{sec:TCP_func_bind}, normalmente la funzione \func{bind} fallisce con
2680 un errore di \errcode{EADDRINUSE} se la porta scelta è già utilizzata da un
2681 altro socket, proprio per evitare che possano essere lanciati due server sullo
2682 stesso indirizzo e la stessa porta, che verrebbero a contendersi i pacchetti
2683 aventi quella destinazione.
2684
2685 Esistono però situazioni ed esigenze particolari in cui non si vuole che
2686 questo comportamento di salvaguardia accada, ed allora si può fare ricorso a
2687 questa opzione.  La questione è comunque abbastanza complessa in quanto, come
2688 sottolinea Stevens in \cite{UNP1}, si distinguono ben quattro casi diversi in
2689 cui è prevista la possibilità di un utilizzo di questa opzione, il che la
2690 rende una delle più difficili da capire.
2691
2692 Il primo caso, che è anche il più comune, in cui si fa ricorso a
2693 \const{SO\_REUSEADDR} è quello in cui un server è terminato ma esistono ancora
2694 dei processi figli che mantengono attiva almeno una connessione remota che
2695 utilizza l'indirizzo locale, mantenendo occupata la porta. Quando si riesegue
2696 il server allora questo riceve un errore sulla chiamata a \func{bind} dato che
2697 la porta è ancora utilizzata in una connessione esistente.\footnote{questa è
2698   una delle domande più frequenti sui newsgroup dedicati allo sviluppo, in
2699   quanto è piuttosto comune trovarsi in questa situazione quando si sta
2700   sviluppando un server che si ferma e si riavvia in continuazione dopo aver
2701   fatto modifiche.}  Inoltre se si usa il protocollo TCP questo può avvenire
2702 anche dopo tutti i processi figli sono terminati, dato che una connessione può
2703 restare attiva anche dopo la chiusura del socket, mantenendosi nello stato
2704 \texttt{TIME\_WAIT} (vedi sez.~\ref{sec:TCP_time_wait}).
2705
2706 Usando \const{SO\_REUSEADDR} fra la chiamata a \func{socket} e quella a
2707 \func{bind} si consente a quest'ultima di avere comunque successo anche se la
2708 connessione è attiva (o nello stato \texttt{TIME\_WAIT}). È bene però
2709 ricordare (si riveda quanto detto in sez.~\ref{sec:TCP_time_wait}) che la
2710 presenza dello stato \texttt{TIME\_WAIT} ha una ragione, ed infatti se si usa
2711 questa opzione esiste sempre una probabilità, anche se estremamente
2712 remota,\footnote{perché ciò avvenga infatti non solo devono coincidere gli
2713   indirizzi IP e le porte degli estremi della nuova connessione, ma anche i
2714   numeri di sequenza dei pacchetti, e questo è estremamente improbabile.}  che
2715 eventuali pacchetti rimasti intrappolati in una precedente connessione possano
2716 finire fra quelli di una nuova.
2717
2718 Come esempio di uso di questa connessione abbiamo predisposto una nuova
2719 versione della funzione \texttt{sockbind} (vedi fig.~\ref{fig:sockbind_code})
2720 che consenta l'impostazione di questa opzione. La nuova funzione è
2721 \texttt{sockbindopt}, e le principali differenze rispetto alla precedente sono
2722 illustrate in fig.~\ref{fig:sockbindopt_code}, dove si sono riportate le
2723 sezioni di codice modificate rispetto alla versione precedente. Il codice
2724 completo della funzione si trova, insieme alle altre funzioni di servizio dei
2725 socket, all'interno del file \texttt{SockUtils.c} dei sorgenti allegati alla
2726 guida.
2727
2728 \begin{figure}[!htbp]
2729   \footnotesize \centering
2730   \begin{minipage}[c]{\codesamplewidth}
2731     \includecodesample{listati/sockbindopt.c}
2732   \end{minipage}
2733   \normalsize
2734   \caption{Le sezioni della funzione \texttt{sockbindopt} modificate rispetto al
2735     codice della precedente \texttt{sockbind}.} 
2736   \label{fig:sockbindopt_code}
2737 \end{figure}
2738
2739 In realtà tutto quello che si è fatto è stato introdurre nella nuova funzione
2740 (\texttt{\small 1}) un nuovo argomento intero, \param{reuse}, che conterrà il
2741 valore logico da usare nella successiva chiamata (\texttt{\small 14}) a
2742 \func{setsockopt}. Si è poi aggiunta una sezione (\texttt{\small 13--17}) che
2743 esegue l'impostazione dell'opzione fra la chiamata a \func{socket} e quella a
2744 \func{bind}.
2745
2746
2747 A questo punto basterà modificare il  server per utilizzare la nuova
2748 funzione; in fig.~\ref{fig:TCP_echod_fifth} abbiamo riportato le sezioni
2749 modificate rispetto alla precedente versione di
2750 fig.~\ref{fig:TCP_echod_third}. Al solito il codice completo è coi sorgenti
2751 allegati alla guida, nel file \texttt{TCP\_echod\_fifth.c}.
2752
2753 Anche in questo caso si è introdotta (\texttt{\small 8}) una nuova variabile
2754 \var{reuse} che consente di controllare l'uso dell'opzione e che poi sarà
2755 usata (\texttt{\small 14}) come ultimo argomento di \func{setsockopt}. Il
2756 valore di default di questa variabile è nullo, ma usando l'opzione \texttt{-r}
2757 nell'invocazione del server (al solito la gestione delle opzioni non è
2758 riportata in fig.~\ref{fig:TCP_echod_fifth}) se ne potrà impostare ad 1 il
2759 valore, per cui in tal caso la successiva chiamata (\texttt{\small 13--17}) a
2760 \func{setsockopt} attiverà l'opzione \const{SO\_REUSEADDR}.
2761
2762 \begin{figure}[!htbp] 
2763   \footnotesize \centering
2764   \begin{minipage}[c]{\codesamplewidth}
2765     \includecodesample{listati/TCP_echod_fifth.c}
2766   \end{minipage}
2767   \normalsize
2768   \caption{Il nuovo codice per l'apertura passiva del server \textit{echo} che
2769     usa la nuova funzione \texttt{sockbindopt}.}
2770   \label{fig:TCP_echod_fifth}
2771 \end{figure}
2772
2773 Il secondo caso in cui viene usata \const{SO\_REUSEADDR} è quando si ha una
2774 macchina cui sono assegnati diversi numeri IP (o come suol dirsi
2775 \textit{multi-homed}) e si vuole porre in ascolto sulla stessa porta un
2776 programma diverso (o una istanza diversa dello stesso programma) per indirizzi
2777 IP diversi. Si ricordi infatti che è sempre possibile indicare a \func{bind}
2778 di collegarsi solo su di un indirizzo specifico; in tal caso se un altro
2779 programma cerca di riutilizzare la stessa porta (anche specificando un
2780 indirizzo diverso) otterrà un errore, a meno di non aver preventivamente
2781 impostato \const{SO\_REUSEADDR}.
2782
2783 Usando questa opzione diventa anche possibile eseguire \func{bind}
2784 sull'indirizzo generico, e questo permetterà il collegamento per tutti gli
2785 indirizzi (di quelli presenti) per i quali la porta non risulti occupata da
2786 una precedente chiamata più specifica. Infine si tenga presente che con il
2787 protocollo TCP non è mai possibile far partire server che eseguano \func{bind}
2788 sullo stesso indirizzo e la stessa porta, cioè ottenere quello che viene
2789 chiamato un \textit{completely duplicate binding}.
2790
2791 Il terzo impiego è simile al precedente e prevede l'uso di \func{bind}
2792 all'interno dello stesso programma per associare indirizzi locali diversi a
2793 socket diversi. In genere questo viene fatto per i socket UDP quando è
2794 necessario ottenere l'indirizzo a cui sono rivolte le richieste del client ed
2795 il sistema non supporta l'opzione \constd{IP\_RECVDSTADDR};\footnote{nel caso
2796   di Linux questa opzione è stata supportata per in certo periodo nello
2797   sviluppo del kernel 2.1.x, ma è in seguito stata soppiantata dall'uso di
2798   \const{IP\_PKTINFO} (vedi sez.~\ref{sec:sock_ipv4_options}).} in tale modo
2799 si può sapere a quale socket corrisponde un certo indirizzo.  Non ha senso
2800 fare questa operazione per un socket TCP dato che su di essi si può sempre
2801 invocare \func{getsockname} una volta che si è completata la connessione.
2802
2803 Infine il quarto caso è quello in cui si vuole effettivamente ottenere un
2804 \textit{completely duplicate binding}, quando cioè si vuole eseguire
2805 \func{bind} su un indirizzo ed una porta che sono già \textsl{legati} ad un
2806 altro socket.  Questo ovviamente non ha senso per il normale traffico di rete,
2807 in cui i pacchetti vengono scambiati direttamente fra due applicazioni; ma
2808 quando un sistema supporta il traffico in \textit{multicast}, allora ha senso
2809 che su una macchina i pacchetti provenienti dal traffico in \textit{multicast}
2810 possano essere ricevuti da più applicazioni\footnote{l'esempio classico di
2811   traffico in \textit{multicast} è quello di uno streaming di dati (audio,
2812   video, ecc.), l'uso del \textit{multicast} consente in tal caso di
2813   trasmettere un solo pacchetto, che potrà essere ricevuto da tutti i
2814   possibili destinatari (invece di inviarne un duplicato a ciascuno); in
2815   questo caso è perfettamente logico aspettarsi che sulla stessa macchina più
2816   utenti possano lanciare un programma che permetta loro di ricevere gli
2817   stessi dati.} o da diverse istanze della stessa applicazione.
2818
2819 In questo caso utilizzando \const{SO\_REUSEADDR} si consente ad una
2820 applicazione eseguire \func{bind} sulla stessa porta ed indirizzo usata da
2821 un'altra, così che anche essa possa ricevere gli stessi pacchetti (chiaramente
2822 la cosa non ha alcun senso per i socket TCP, ed infatti in questo tipo di
2823 applicazione è normale l'uso del protocollo UDP). La regola è che quando si
2824 hanno più applicazioni che hanno eseguito \func{bind} sulla stessa porta, di
2825 tutti pacchetti destinati ad un indirizzo di \textit{broadcast} o di
2826 \textit{multicast} viene inviata una copia a ciascuna applicazione.  Non è
2827 definito invece cosa accade qualora il pacchetto sia destinato ad un indirizzo
2828 normale (unicast).
2829
2830 Essendo questo un caso particolare in alcuni sistemi (come BSD) è stata
2831 introdotta una opzione ulteriore, \const{SO\_REUSEPORT} che richiede che detta
2832 opzione sia specificata per tutti i socket per i quali si vuole eseguire il
2833 \textit{completely duplicate binding}. Nel caso di Linux questa opzione non
2834 esisteva fino al kernel 3.9, ma il comportamento di \const{SO\_REUSEADDR} è
2835 analogo, sarà cioè possibile effettuare un \textit{completely duplicate
2836   binding} ed ottenere il successo di \func{bind} su un socket legato allo
2837 stesso indirizzo e porta solo se il programma che ha eseguito per primo
2838 \func{bind} su di essi ha impostato questa opzione.\footnote{questa
2839   restrizione permette di evitare parzialmente il cosiddetto \textit{port
2840     stealing}, in cui un programma, usando \const{SO\_REUSEADDR}, può
2841   collegarsi ad una porta già in uso e ricevere i pacchetti destinati ad un
2842   altro programma; con questa caratteristica ciò è possibile soltanto se il
2843   primo programma a consentirlo, avendo usato fin dall'inizio
2844   \const{SO\_REUSEADDR}.}
2845
2846 \constend{SO\_REUSEADDR}
2847
2848 % TODO documentare SO_REUSEPORT, vedi https://lwn.net/Articles/542260/
2849
2850 \constbeg{SO\_LINGER}
2851 \subsubsection{L'opzione \const{SO\_LINGER}}
2852
2853 La terza opzione da approfondire è \const{SO\_LINGER}; essa, come il nome
2854 suggerisce, consente di ``\textsl{indugiare}'' nella chiusura di un socket. Il
2855 comportamento standard sia di \func{close} che \func{shutdown} è infatti
2856 quello di terminare immediatamente dopo la chiamata, mentre il procedimento di
2857 chiusura della connessione (o di un lato di essa) ed il rispettivo invio sulla
2858 rete di tutti i dati ancora presenti nei buffer, viene gestito in sottofondo
2859 dal kernel.
2860
2861 \begin{figure}[!htb]
2862   \footnotesize \centering
2863   \begin{minipage}[c]{0.80\textwidth}
2864     \includestruct{listati/linger.h}
2865   \end{minipage}
2866   \caption{La struttura \structd{linger} richiesta come valore dell'argomento
2867     \param{optval} per l'impostazione dell'opzione dei socket
2868     \const{SO\_LINGER}.}
2869   \label{fig:sock_linger_struct}
2870 \end{figure}
2871
2872 L'uso di \const{SO\_LINGER} con \func{setsockopt} permette di modificare (ed
2873 eventualmente ripristinare) questo comportamento in base ai valori passati nei
2874 campi della struttura \struct{linger}, illustrata in
2875 fig.~\ref{fig:sock_linger_struct}.  Fintanto che il valore del campo
2876 \var{l\_onoff} di \struct{linger} è nullo la modalità che viene impostata
2877 (qualunque sia il valore di \var{l\_linger}) è quella standard appena
2878 illustrata; questa combinazione viene utilizzata per riportarsi al
2879 comportamento normale qualora esso sia stato cambiato da una precedente
2880 chiamata.
2881
2882 Se si utilizza un valore di \var{l\_onoff} diverso da zero, il comportamento
2883 alla chiusura viene a dipendere dal valore specificato per il campo
2884 \var{l\_linger}; se quest'ultimo è nullo l'uso delle funzioni \func{close} e
2885 \func{shutdown} provoca la terminazione immediata della connessione: nel caso
2886 di TCP cioè non viene eseguito il procedimento di chiusura illustrato in
2887 sez.~\ref{sec:TCP_conn_term}, ma tutti i dati ancora presenti nel buffer
2888 vengono immediatamente scartati e sulla rete viene inviato un segmento di RST
2889 che termina immediatamente la connessione.
2890
2891 Un esempio di questo comportamento si può abilitare nel nostro client del
2892 servizio \textit{echo} utilizzando l'opzione \texttt{-r}; riportiamo in
2893 fig.~\ref{fig:TCP_echo_sixth} la sezione di codice che permette di introdurre
2894 questa funzionalità; al solito il codice completo è disponibile nei sorgenti
2895 allegati.
2896
2897 \begin{figure}[!htbp] 
2898   \footnotesize \centering
2899   \begin{minipage}[c]{\codesamplewidth}
2900     \includecodesample{listati/TCP_echo_sixth.c}
2901   \end{minipage}
2902   \normalsize
2903   \caption{La sezione del codice del client \textit{echo} che imposta la
2904     terminazione immediata della connessione in caso di chiusura.}
2905   \label{fig:TCP_echo_sixth}
2906 \end{figure}
2907
2908 La sezione indicata viene eseguita dopo aver effettuato la connessione e prima
2909 di chiamare la funzione di gestione, cioè fra le righe (\texttt{\small 12}) e
2910 (\texttt{\small 13}) del precedente esempio di fig.~\ref{fig:TCP_echo_fifth}.
2911 Il codice si limita semplicemente a controllare (\texttt{\small 3}) il
2912 valore della variabile \var{reset} che assegnata nella gestione delle opzioni
2913 in corrispondenza all'uso di \texttt{-r} nella chiamata del client. Nel caso
2914 questa sia diversa da zero vengono impostati (\texttt{\small 5--6}) i valori
2915 della struttura \var{ling} che permettono una terminazione immediata della
2916 connessione. Questa viene poi usata nella successiva (\texttt{\small 7})
2917 chiamata a \func{setsockopt}. Al solito si controlla (\texttt{\small 7--10})
2918 il valore di ritorno e si termina il programma in caso di errore, stampandone
2919 il valore.
2920
2921 Infine l'ultima possibilità, quella in cui si utilizza effettivamente
2922 \const{SO\_LINGER} per \textsl{indugiare} nella chiusura, è quella in cui sia
2923 \var{l\_onoff} che \var{l\_linger} hanno un valore diverso da zero. Se si
2924 esegue l'impostazione con questi valori sia \func{close} che \func{shutdown}
2925 si bloccano, nel frattempo viene eseguita la normale procedura di conclusione
2926 della connessione (quella di sez.~\ref{sec:TCP_conn_term}) ma entrambe le
2927 funzioni non ritornano fintanto che non si sia concluso il procedimento di
2928 chiusura della connessione, o non sia passato un numero di
2929 secondi\footnote{questa è l'unità di misura indicata da POSIX ed adottata da
2930   Linux, altri kernel possono usare unità di misura diverse, oppure usare il
2931   campo \var{l\_linger} come valore logico (ignorandone il valore) per rendere
2932   (quando diverso da zero) \func{close} e \func{shutdown} bloccanti fino al
2933   completamento della trasmissione dei dati sul buffer.}  pari al valore
2934 specificato in \var{l\_linger}.
2935
2936 \constend{SO\_LINGER}
2937
2938
2939
2940 \subsection{Le opzioni per il protocollo IPv4}
2941 \label{sec:sock_ipv4_options}
2942
2943 Il secondo insieme di opzioni dei socket che tratteremo è quello relativo ai
2944 socket che usano il protocollo IPv4.\footnote{come per le precedenti opzioni
2945   generiche una descrizione di esse è disponibile nella settima sezione delle
2946   pagine di manuale, nel caso specifico la documentazione si può consultare
2947   con \texttt{man 7 ip}.}  Se si vuole operare su queste opzioni generiche il
2948 livello da utilizzare è \const{SOL\_IP} (o l'equivalente
2949 \constd{IPPROTO\_IP}); si è riportato un elenco di queste opzioni in
2950 tab.~\ref{tab:sock_opt_iplevel}.  Le costanti indicanti le opzioni e tutte le
2951 altre costanti ad esse collegate sono definite in \headfiled{netinet/ip.h}, ed
2952 accessibili includendo detto file.
2953
2954 \begin{table}[!htb]
2955   \centering
2956   \footnotesize
2957   \begin{tabular}[c]{|l|c|c|c|l|p{6cm}|}
2958     \hline
2959     \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
2960                     \textbf{Descrizione}\\
2961     \hline
2962     \hline
2963     \const{IP\_OPTIONS}         &$\bullet$&$\bullet$&&\texttt{void *}& %??? 
2964       Imposta o riceve le opzioni di IP.\\
2965     \const{IP\_PKTINFO}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2966       Passa un messaggio di informazione.\\
2967     \const{IP\_RECVTOS}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2968       Passa un messaggio col campo TOS.\\
2969     \const{IP\_RECVTTL}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2970       Passa un messaggio col campo TTL.\\
2971     \const{IP\_RECVOPTS}        &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2972       Passa un messaggio con le opzioni IP.\\
2973     \const{IP\_RETOPTS}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2974       Passa un messaggio con le opzioni IP non trattate.\\
2975     \const{IP\_TOS}             &$\bullet$&$\bullet$&         &\texttt{int}& 
2976       Imposta il valore del campo TOS.\\
2977     \const{IP\_TTL}             &$\bullet$&$\bullet$&         &\texttt{int}& 
2978       Imposta il valore del campo TTL.\\
2979     \const{IP\_MINTTL}          &$\bullet$&$\bullet$&   &\texttt{int}& 
2980       Imposta il valore minimo del TTL per i pacchetti accettati.\\ 
2981     \const{IP\_HDRINCL}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2982       Passa l'intestazione di IP nei dati.\\
2983     \const{IP\_RECVERR}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2984       Abilita la gestione degli errori.\\
2985     \const{IP\_MTU\_DISCOVER}   &$\bullet$&$\bullet$&         &\texttt{int}& 
2986       Imposta il \textit{Path MTU Discovery}.\\
2987     \const{IP\_MTU}             &$\bullet$&         &         &\texttt{int}& 
2988       Legge il valore attuale della MTU.\\
2989     \const{IP\_ROUTER\_ALERT}   &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2990       Imposta l'opzione \textit{IP router alert} sui pacchetti.\\
2991     \const{IP\_MULTICAST\_TTL}  &$\bullet$&$\bullet$&         &\texttt{int}& 
2992       Imposta il TTL per i pacchetti \textit{multicast}.\\
2993     \const{IP\_MULTICAST\_LOOP} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2994       Controlla il reinvio a se stessi dei dati di \textit{multicast}.\\ 
2995     \const{IP\_ADD\_MEMBERSHIP} &         &$\bullet$&   &\struct{ip\_mreqn}& 
2996       Si unisce a un gruppo di \textit{multicast}.\\
2997     \const{IP\_DROP\_MEMBERSHIP}&         &$\bullet$&   &\struct{ip\_mreqn}& 
2998       Si sgancia da un gruppo di \textit{multicast}.\\
2999     \const{IP\_MULTICAST\_IF}   &         &$\bullet$&   &\struct{ip\_mreqn}& 
3000       Imposta l'interfaccia locale di un socket \textit{multicast}.\\ 
3001    \hline
3002   \end{tabular}
3003   \caption{Le opzioni disponibili al livello \const{SOL\_IP}.} 
3004   \label{tab:sock_opt_iplevel}
3005 \end{table}
3006
3007 Le descrizioni riportate in tab.~\ref{tab:sock_opt_iplevel} sono estremamente
3008 succinte, una maggiore quantità di dettagli sulle varie opzioni è fornita nel
3009 seguente elenco:
3010 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
3011
3012
3013 \item[\constd{IP\_OPTIONS}] l'opzione permette di impostare o leggere le
3014   opzioni del protocollo IP (si veda sez.~\ref{sec:IP_options}). L'opzione
3015   prende come valore dell'argomento \param{optval} un puntatore ad un buffer
3016   dove sono mantenute le opzioni, mentre \param{optlen} indica la dimensione
3017   di quest'ultimo. Quando la si usa con \func{getsockopt} vengono lette le
3018   opzioni IP utilizzate per la spedizione, quando la si usa con
3019   \func{setsockopt} vengono impostate le opzioni specificate. L'uso di questa
3020   opzione richiede una profonda conoscenza del funzionamento del protocollo,
3021   torneremo in parte sull'argomento in sez.~\ref{sec:sock_IP_options}.
3022
3023
3024 \item[\constd{IP\_PKTINFO}] Quando abilitata l'opzione permette di ricevere
3025   insieme ai pacchetti un messaggio ancillare (vedi
3026   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_PKTINFO} contenente
3027   una struttura \struct{pktinfo} (vedi fig.~\ref{fig:sock_pktinfo_struct}) che
3028   mantiene una serie di informazioni riguardo i pacchetti in arrivo. In
3029   particolare è possibile conoscere l'interfaccia su cui è stato ricevuto un
3030   pacchetto (nel campo \var{ipi\_ifindex}),\footnote{in questo campo viene
3031     restituito il valore numerico dell'indice dell'interfaccia,
3032     sez.~\ref{sec:sock_ioctl_netdevice}.} l'indirizzo locale da esso
3033   utilizzato (nel campo \var{ipi\_spec\_dst}) e l'indirizzo remoto dello
3034   stesso (nel campo \var{ipi\_addr}).
3035
3036 \begin{figure}[!htb]
3037   \footnotesize \centering
3038   \begin{minipage}[c]{0.80\textwidth}
3039     \includestruct{listati/pktinfo.h}
3040   \end{minipage}
3041   \caption{La struttura \structd{pktinfo} usata dall'opzione
3042     \const{IP\_PKTINFO} per ricavare informazioni sui pacchetti di un socket
3043     di tipo \const{SOCK\_DGRAM}.}
3044   \label{fig:sock_pktinfo_struct}
3045 \end{figure}
3046
3047
3048 L'opzione è utilizzabile solo per socket di tipo \const{SOCK\_DGRAM}. Questa è
3049 una opzione introdotta con i kernel della serie 2.2.x, ed è specifica di
3050 Linux;\footnote{non dovrebbe pertanto essere utilizzata se si ha a cuore la
3051   portabilità.} essa permette di sostituire le opzioni \const{IP\_RECVDSTADDR}
3052 e \const{IP\_RECVIF} presenti in altri Unix (la relativa informazione è quella
3053 ottenibile rispettivamente dai campi \var{ipi\_addr} e \var{ipi\_ifindex} di
3054 \struct{pktinfo}). 
3055
3056 L'opzione prende per \param{optval} un intero usato come valore logico, che
3057 specifica soltanto se insieme al pacchetto deve anche essere inviato o
3058 ricevuto il messaggio \const{IP\_PKTINFO} (vedi
3059 sez.~\ref{sec:net_ancillary_data}); il messaggio stesso dovrà poi essere
3060 letto o scritto direttamente con \func{recvmsg} e \func{sendmsg} (vedi
3061 sez.~\ref{sec:net_sendmsg}).
3062
3063
3064 \item[\constd{IP\_RECVTOS}] Quando abilitata l'opzione permette di ricevere
3065   insieme ai pacchetti un messaggio ancillare (vedi
3066   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_TOS}, che contiene un
3067   byte con il valore del campo \textit{Type of Service} dell'intestazione IP
3068   del pacchetto stesso (vedi sez.~\ref{sec:IP_header}).  Prende per
3069   \param{optval} un intero usato come valore logico.
3070
3071 \item[\constd{IP\_RECVTTL}] Quando abilitata l'opzione permette di ricevere
3072   insieme ai pacchetti un messaggio ancillare (vedi
3073   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_RECVTTL}, contenente
3074   un byte con il valore del campo \textit{Time to Live} dell'intestazione IP
3075   (vedi sez.~\ref{sec:IP_header}).  L'opzione richiede per \param{optval} un
3076   intero usato come valore logico. L'opzione non è supportata per socket di
3077   tipo \const{SOCK\_STREAM}.
3078
3079 \item[\constd{IP\_RECVOPTS}] Quando abilitata l'opzione permette di ricevere
3080   insieme ai pacchetti un messaggio ancillare (vedi
3081   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_OPTIONS}, contenente
3082   le opzioni IP del protocollo (vedi sez.~\ref{sec:IP_options}). Le
3083   intestazioni di instradamento e le altre opzioni sono già riempite con i
3084   dati locali. L'opzione richiede per \param{optval} un intero usato come
3085   valore logico.  L'opzione non è supportata per socket di tipo
3086   \const{SOCK\_STREAM}.
3087
3088 \item[\constd{IP\_RETOPTS}] Identica alla precedente \const{IP\_RECVOPTS}, ma
3089   in questo caso restituisce i dati grezzi delle opzioni, senza che siano
3090   riempiti i capi di instradamento e le marche temporali.  L'opzione richiede
3091   per \param{optval} un intero usato come valore logico.  L'opzione non è
3092   supportata per socket di tipo \const{SOCK\_STREAM}.
3093
3094 \item[\constd{IP\_TOS}] L'opzione consente di leggere o impostare il campo
3095   \textit{Type of Service} dell'intestazione IP (per una trattazione più
3096   dettagliata, che riporta anche i valori possibili e le relative costanti di
3097   definizione si veda sez.~\ref{sec:IP_header}) che permette di indicare le
3098   priorità dei pacchetti. Se impostato il valore verrà mantenuto per tutti i
3099   pacchetti del socket; alcuni valori (quelli che aumentano la priorità)
3100   richiedono i privilegi di amministrazione con la capability
3101   \const{CAP\_NET\_ADMIN}.
3102
3103   Il campo TOS è di 8 bit e l'opzione richiede per \param{optval} un intero
3104   che ne contenga il valore. Sono definite anche alcune costanti che
3105   definiscono alcuni valori standardizzati per il \textit{Type of Service},
3106   riportate in tab.~\ref{tab:IP_TOS_values}, il valore di default usato da
3107   Linux è \const{IPTOS\_LOWDELAY}, ma esso può essere modificato con le
3108   funzionalità del cosiddetto \textit{Advanced Routing}. Si ricordi che la
3109   priorità dei pacchetti può essere impostata anche in maniera indipendente
3110   dal protocollo utilizzando l'opzione \const{SO\_PRIORITY} illustrata in
3111   sez.~\ref{sec:sock_generic_options}.
3112
3113 \item[\constd{IP\_TTL}] L'opzione consente di leggere o impostare per tutti i
3114   pacchetti associati al socket il campo \textit{Time to Live}
3115   dell'intestazione IP che indica il numero massimo di \textit{hop} (passaggi
3116   da un router ad un altro) restanti al paccheto (per una trattazione più
3117   estesa si veda sez.~\ref{sec:IP_header}).  Il campo TTL è di 8 bit e
3118   l'opzione richiede che \param{optval} sia un intero, che ne conterrà il
3119   valore.
3120
3121 \item[\constd{IP\_MINTTL}] L'opzione, introdotta con il kernel 2.6.34, imposta
3122   un valore minimo per il campo \textit{Time to Live} dei pacchetti associati
3123   al socket su cui è attivata, che se non rispettato ne causa lo scarto
3124   automatico. L'opzione è nata per implementare
3125   l'\href{http://www.ietf.org/rfc/rfc5082.txt}{RFC~5082} che la prevede come
3126   forma di protezione per i router che usano il protocollo BGP poiché questi,
3127   essendo in genere adiacenti, possono, impostando un valore di 255, scartare
3128   automaticamente tutti gli eventuali pacchetti falsi creati da un attacco a
3129   questo protocollo, senza doversi curare di verificarne la
3130   validità.\footnote{l'attacco viene in genere portato per causare un
3131     \textit{Denial of Service} aumentando il consumo di CPU del router nella
3132     verifica dell'autenticità di un gran numero di pacchetti di pacchetti
3133     falsi; questi, arrivando da sorgenti diverse da un router adiacente, non
3134     potrebbero più avere un TTL di 255 anche qualora questo fosse stato il
3135     valore di partenza, e l'impostazione dell'opzione consente di scartarli
3136     senza carico aggiuntivo sulla CPU (che altrimenti dovrebbe calcolare una
3137     checksum).}
3138
3139 \item[\constd{IP\_HDRINCL}] Se abilitata l'utente deve fornire lui stesso
3140   l'intestazione IP in cima ai propri dati. L'opzione è valida soltanto per
3141   socket di tipo \const{SOCK\_RAW}, e quando utilizzata eventuali valori
3142   impostati con \const{IP\_OPTIONS}, \const{IP\_TOS} o \const{IP\_TTL} sono
3143   ignorati. In ogni caso prima della spedizione alcuni campi
3144   dell'intestazione vengono comunque modificati dal kernel, torneremo
3145   sull'argomento in sez.~\ref{sec:socket_raw}
3146
3147 \item[\constd{IP\_RECVERR}] Questa è una opzione introdotta con i kernel della
3148   serie 2.2.x, ed è specifica di Linux. Essa permette di usufruire di un
3149   meccanismo affidabile per ottenere un maggior numero di informazioni in caso
3150   di errori. Se l'opzione è abilitata tutti gli errori generati su un socket
3151   vengono memorizzati su una coda, dalla quale poi possono essere letti con
3152   \func{recvmsg} (vedi sez.~\ref{sec:net_sendmsg}) come messaggi ancillari
3153   (torneremo su questo in sez.~\ref{sec:net_ancillary_data}) di tipo
3154   \const{IP\_RECVERR}.  L'opzione richiede per \param{optval} un intero usato
3155   come valore logico e non è applicabile a socket di tipo
3156   \const{SOCK\_STREAM}.
3157
3158 \itindbeg{Path~MTU}
3159 \item[\constd{IP\_MTU\_DISCOVER}] Questa è una opzione introdotta con i kernel
3160   della serie 2.2.x, ed è specifica di Linux.  L'opzione permette di scrivere
3161   o leggere le impostazioni della modalità usata per la determinazione della
3162   \textit{Path MTU} (vedi sez.~\ref{sec:net_lim_dim}) del
3163   socket. L'opzione prende per \param{optval} un valore intero che indica la
3164   modalità usata, da specificare con una delle costanti riportate in
3165   tab.~\ref{tab:sock_ip_mtu_discover}.
3166
3167   \begin{table}[!htb]
3168     \centering
3169     \footnotesize
3170     \begin{tabular}[c]{|l|r|p{7cm}|}
3171       \hline
3172       \multicolumn{2}{|c|}{\textbf{Valore}}&\textbf{Significato} \\
3173       \hline
3174       \hline
3175       \constd{IP\_PMTUDISC\_DONT}&0& Non effettua la ricerca dalla \textit{Path
3176                                      MTU}.\\
3177       \constd{IP\_PMTUDISC\_WANT}&1& Utilizza il valore impostato per la rotta
3178                                      utilizzata dai pacchetti (dal comando
3179                                      \texttt{route}).\\ 
3180       \constd{IP\_PMTUDISC\_DO}  &2& Esegue la procedura di determinazione
3181                                      della \textit{Path MTU} come richiesto
3182                                      dall'\href{http://www.ietf.org/rfc/rfc1191.txt}{RFC~1191}.\\ 
3183       \hline
3184     \end{tabular}
3185     \caption{Valori possibili per l'argomento \param{optval} di
3186       \const{IP\_MTU\_DISCOVER}.} 
3187     \label{tab:sock_ip_mtu_discover}
3188   \end{table}
3189
3190   Il valore di default applicato ai socket di tipo \const{SOCK\_STREAM} è
3191   determinato dal parametro \texttt{ip\_no\_pmtu\_disc} (vedi
3192   sez.~\ref{sec:sock_sysctl}), mentre per tutti gli altri socket di default la
3193   ricerca è disabilitata ed è responsabilità del programma creare pacchetti di
3194   dimensioni appropriate e ritrasmettere eventuali pacchetti persi. Se
3195   l'opzione viene abilitata, il kernel si incaricherà di tenere traccia
3196   automaticamente della \textit{Path MTU} verso ciascuna destinazione, e
3197   rifiuterà immediatamente la trasmissione di pacchetti di dimensioni maggiori
3198   della MTU con un errore di \errval{EMSGSIZE}.\footnote{in caso contrario la
3199     trasmissione del pacchetto sarebbe effettuata, ottenendo o un fallimento
3200     successivo della trasmissione, o la frammentazione dello stesso.}
3201
3202 \item[\constd{IP\_MTU}] Permette di leggere il valore della \textit{Path MTU}
3203   di percorso del socket.  L'opzione richiede per \param{optval} un intero che
3204   conterrà il valore della \textit{Path MTU} in byte.  Questa è una opzione
3205   introdotta con i kernel della serie 2.2.x, ed è specifica di Linux.
3206
3207   È tramite questa opzione che un programma può leggere, quando si è avuto un
3208   errore di \errval{EMSGSIZE}, il valore della MTU corrente del socket. Si
3209   tenga presente che per poter usare questa opzione, oltre ad avere abilitato
3210   la scoperta della \textit{Path MTU}, occorre che il socket sia stato
3211   esplicitamente connesso con \func{connect}. 
3212
3213   Ad esempio con i socket UDP si potrà ottenere una stima iniziale della
3214   \textit{Path MTU} eseguendo prima una \func{connect} verso la destinazione,
3215   e poi usando \func{getsockopt} con questa opzione. Si può anche avviare
3216   esplicitamente il procedimento di scoperta inviando un pacchetto di grosse
3217   dimensioni (che verrà scartato) e ripetendo l'invio coi dati aggiornati. Si
3218   tenga infine conto che durante il procedimento i pacchetti iniziali possono
3219   essere perduti, ed è compito dell'applicazione gestirne una eventuale
3220   ritrasmissione.
3221
3222 \itindend{Path~MTU}
3223
3224 \item[\constd{IP\_ROUTER\_ALERT}] Questa è una opzione introdotta con i
3225   kernel della serie 2.2.x, ed è specifica di Linux. Prende per
3226   \param{optval} un intero usato come valore logico. Se abilitata
3227   passa tutti i pacchetti con l'opzione \textit{IP Router Alert} (vedi
3228   sez.~\ref{sec:IP_options}) che devono essere inoltrati al socket
3229   corrente. Può essere usata soltanto per socket di tipo raw.
3230
3231 \item[\constd{IP\_MULTICAST\_TTL}] L'opzione permette di impostare o leggere il
3232   valore del campo TTL per i pacchetti \textit{multicast} in uscita associati
3233   al socket. È importante che questo valore sia il più basso possibile, ed il
3234   default è 1, che significa che i pacchetti non potranno uscire dalla rete
3235   locale. Questa opzione consente ai programmi che lo richiedono di superare
3236   questo limite.  L'opzione richiede per
3237   \param{optval} un intero che conterrà il valore del TTL.
3238
3239 \item[\constd{IP\_MULTICAST\_LOOP}] L'opzione consente di decidere se i dati
3240   che si inviano su un socket usato con il \textit{multicast} vengano ricevuti
3241   anche sulla stessa macchina da cui li si stanno inviando.  Prende per
3242   \param{optval} un intero usato come valore logico.
3243
3244   In generale se si vuole che eventuali client possano ricevere i dati che si
3245   inviano occorre che questa funzionalità sia abilitata (come avviene di
3246   default). Qualora però non si voglia generare traffico per dati che già sono
3247   disponibili in locale l'uso di questa opzione permette di disabilitare
3248   questo tipo di traffico.
3249
3250 \item[\constd{IP\_ADD\_MEMBERSHIP}] L'opzione consente di unirsi ad gruppo di
3251   \textit{multicast}, e può essere usata solo con \func{setsockopt}.
3252   L'argomento \param{optval} in questo caso deve essere una struttura di tipo
3253   \struct{ip\_mreqn}, illustrata in fig.~\ref{fig:ip_mreqn_struct}, che
3254   permette di indicare, con il campo \var{imr\_multiaddr} l'indirizzo del
3255   gruppo di \textit{multicast} a cui ci si vuole unire, con il campo
3256   \var{imr\_address} l'indirizzo dell'interfaccia locale con cui unirsi al
3257   gruppo di \textit{multicast} e con \var{imr\_ifindex} l'indice
3258   dell'interfaccia da utilizzare (un valore nullo indica una interfaccia
3259   qualunque).
3260
3261   Per compatibilità è possibile utilizzare anche un argomento di tipo
3262   \struct{ip\_mreq}, una precedente versione di \struct{ip\_mreqn}, che
3263   differisce da essa soltanto per l'assenza del campo \var{imr\_ifindex}.
3264
3265 \begin{figure}[!htb]
3266   \footnotesize \centering
3267   \begin{minipage}[c]{0.80\textwidth}
3268     \includestruct{listati/ip_mreqn.h}
3269   \end{minipage}
3270   \caption{La struttura \structd{ip\_mreqn} utilizzata dalle opzioni dei
3271     socket per le operazioni concernenti l'appartenenza ai gruppi di
3272     \textit{multicast}.}
3273   \label{fig:ip_mreqn_struct}
3274 \end{figure}
3275
3276 \item[\constd{IP\_DROP\_MEMBERSHIP}] Lascia un gruppo di \textit{multicast},
3277   prende per \param{optval} la stessa struttura \struct{ip\_mreqn} (o
3278   \struct{ip\_mreq}) usata anche per \const{IP\_ADD\_MEMBERSHIP}.
3279
3280 \item[\constd{IP\_MULTICAST\_IF}] Imposta l'interfaccia locale per l'utilizzo
3281   del \textit{multicast}, ed utilizza come \param{optval} le stesse strutture
3282   \struct{ip\_mreqn} o \struct{ip\_mreq} delle due precedenti opzioni.
3283
3284 % TODO chiarire quale è la struttura \struct{ip\_mreq}
3285
3286
3287 \end{basedescript}
3288
3289
3290
3291 \subsection{Le opzioni per i protocolli TCP e UDP}
3292 \label{sec:sock_tcp_udp_options}
3293
3294 In questa sezione tratteremo le varie opzioni disponibili per i socket che
3295 usano i due principali protocolli di comunicazione del livello di trasporto;
3296 UDP e TCP.\footnote{come per le precedenti, una descrizione di queste opzioni
3297   è disponibile nella settima sezione delle pagine di manuale, che si può
3298   consultare rispettivamente con \texttt{man 7 tcp} e \texttt{man 7 udp}; le
3299   pagine di manuale però, alla stesura di questa sezione (Agosto 2006) sono
3300   alquanto incomplete.}  Dato che questi due protocolli sono entrambi
3301 trasportati su IP,\footnote{qui si sottintende IPv4, ma le opzioni per TCP e
3302   UDP sono le stesse anche quando si usa IPv6.} oltre alle opzioni generiche
3303 di sez.~\ref{sec:sock_generic_options} saranno comunque disponibili anche le
3304 precedenti opzioni di sez.~\ref{sec:sock_ipv4_options}.\footnote{in realtà in
3305   sez.~\ref{sec:sock_ipv4_options} si sono riportate le opzioni per IPv4, al
3306   solito, qualora si stesse utilizzando IPv6, si potrebbero utilizzare le
3307   opzioni di quest'ultimo.}
3308
3309 Il protocollo che supporta il maggior numero di opzioni è TCP; per poterle
3310 utilizzare occorre specificare \const{SOL\_TCP} (o l'equivalente
3311 \constd{IPPROTO\_TCP}) come valore per l'argomento \param{level}. Si sono
3312 riportate le varie opzioni disponibili in tab.~\ref{tab:sock_opt_tcplevel},
3313 dove sono elencate le rispettive costanti da utilizzare come valore per
3314 l'argomento \param{optname}. Dette costanti e tutte le altre costanti e
3315 strutture collegate all'uso delle opzioni TCP sono definite in
3316 \headfiled{netinet/tcp.h}, ed accessibili includendo detto file.\footnote{in
3317   realtà questo è il file usato dalle librerie; la definizione delle opzioni
3318   effettivamente supportate da Linux si trova nel file
3319   \texttt{include/linux/tcp.h} dei sorgenti del kernel, dal quale si sono
3320   estratte le costanti di tab.~\ref{tab:sock_opt_tcplevel}.}
3321
3322 \begin{table}[!htb]
3323   \centering
3324   \footnotesize
3325   \begin{tabular}[c]{|l|c|c|c|l|l|}
3326     \hline
3327     \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
3328                     \textbf{Descrizione}\\
3329     \hline
3330     \hline
3331     \const{TCP\_NODELAY}      &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
3332       Spedisce immediatamente i dati in segmenti singoli.\\
3333     \const{TCP\_MAXSEG}       &$\bullet$&$\bullet$&         &\texttt{int}&
3334       Valore della MSS per i segmenti in uscita.\\  
3335     \const{TCP\_CORK}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3336       Accumula i dati in un unico segmento.\\
3337     \const{TCP\_KEEPIDLE}     &$\bullet$&$\bullet$&         &\texttt{int}& 
3338       Tempo in secondi prima di inviare un \textit{keepalive}.\\
3339     \const{TCP\_KEEPINTVL}    &$\bullet$&$\bullet$&         &\texttt{int}&
3340       Tempo in secondi prima fra \textit{keepalive} successivi.\\
3341     \const{TCP\_KEEPCNT}      &$\bullet$&$\bullet$&         &\texttt{int}& 
3342       Numero massimo di \textit{keepalive} inviati.\\
3343     \const{TCP\_SYNCNT}       &$\bullet$&$\bullet$&         &\texttt{int}& 
3344       Numero massimo di ritrasmissioni di un SYN.\\
3345     \const{TCP\_LINGER2}      &$\bullet$&$\bullet$&         &\texttt{int}&
3346       Tempo di vita in stato \texttt{FIN\_WAIT2}.\\
3347     \const{TCP\_DEFER\_ACCEPT}&$\bullet$&$\bullet$&         &\texttt{int}&
3348       Ritorna da \func{accept} solo in presenza di dati.\\
3349     \const{TCP\_WINDOW\_CLAMP}&$\bullet$&$\bullet$&         &\texttt{int}&
3350       Valore della \textit{advertised window}.\\
3351     \const{TCP\_INFO}         &$\bullet$&        &       &\struct{tcp\_info}& 
3352       Restituisce informazioni sul socket.\\
3353     \const{TCP\_QUICKACK}     &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3354       Abilita la modalità \textit{quickack}.\\
3355     \const{TCP\_CONGESTION}   &$\bullet$&$\bullet$&         &\texttt{char *}&
3356       Imposta l'algoritmo per il controllo della congestione.\\
3357    \hline
3358   \end{tabular}
3359   \caption{Le opzioni per i socket TCP disponibili al livello
3360     \const{SOL\_TCP}.}
3361   \label{tab:sock_opt_tcplevel}
3362 \end{table}
3363
3364 Le descrizioni delle varie opzioni riportate in
3365 tab.~\ref{tab:sock_opt_tcplevel} sono estremamente sintetiche ed indicative,
3366 la spiegazione del funzionamento delle singole opzioni con una maggiore
3367 quantità di dettagli è fornita nel seguente elenco:
3368 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
3369
3370 \item[\constd{TCP\_NODELAY}] il protocollo TCP utilizza un meccanismo di
3371   bufferizzazione dei dati uscenti, per evitare la trasmissione di tanti
3372   piccoli segmenti con un utilizzo non ottimale della banda
3373   disponibile.\footnote{il problema è chiamato anche
3374     \itindex{silly~window~syndrome} \textit{silly window syndrome}, per averne
3375     un'idea si pensi al risultato che si ottiene quando un programma di
3376     terminale invia un segmento TCP per ogni tasto premuto, 40 byte di
3377     intestazione di protocollo con 1 byte di dati trasmessi; per evitare
3378     situazioni del genere è stato introdotto \index{algoritmo~di~Nagle}
3379     l'\textsl{algoritmo di Nagle}.}  Questo meccanismo è controllato da un
3380   apposito algoritmo (detto \textsl{algoritmo di Nagle}, vedi
3381   sez.~\ref{sec:tcp_protocol_xxx}).  Il comportamento normale del protocollo
3382   prevede che i dati siano accumulati fintanto che non si raggiunge una
3383   quantità considerata adeguata per eseguire la trasmissione di un singolo
3384   segmento.
3385
3386   Ci sono però delle situazioni in cui questo comportamento può non essere
3387   desiderabile, ad esempio quando si sa in anticipo che l'applicazione invierà
3388   soltanto un piccolo quantitativo di dati;\footnote{è il caso classico di una
3389     richiesta HTTP.} in tal caso l'attesa introdotta dall'algoritmo di
3390   bufferizzazione non soltanto è inutile, ma peggiora le prestazioni
3391   introducendo un ritardo.  Impostando questa opzione si disabilita l'uso
3392   dell'\textsl{algoritmo di Nagle} ed i dati vengono inviati immediatamente in
3393   singoli segmenti, qualunque sia la loro dimensione.  Ovviamente l'uso di
3394   questa opzione è dedicato a chi ha esigenze particolari come quella
3395   illustrata, che possono essere stabilite solo per la singola applicazione.
3396
3397   Si tenga conto che questa opzione viene sovrascritta dall'eventuale
3398   impostazione dell'opzione \const{TCP\_CORK} (il cui scopo è sostanzialmente
3399   l'opposto) che blocca l'invio immediato. Tuttavia quando la si abilita viene
3400   sempre forzato lo scaricamento della coda di invio (con conseguente
3401   trasmissione di tutti i dati pendenti), anche qualora si fosse già abilitata
3402   \const{TCP\_CORK}.\footnote{si tenga presente però che \const{TCP\_CORK} può
3403     essere specificata insieme a \const{TCP\_NODELAY} soltanto a partire dal
3404     kernel 2.5.71.}
3405
3406 \item[\constd{TCP\_MAXSEG}] con questa opzione si legge o si imposta il valore
3407   della MSS (\textit{Maximum Segment Size}, vedi sez.~\ref{sec:net_lim_dim} e
3408   sez.~\ref{sec:tcp_protocol_xxx}) dei segmenti TCP uscenti. Se l'opzione è
3409   impostata prima di stabilire la connessione, si cambia anche il valore della
3410   MSS annunciata all'altro capo della connessione. Se si specificano valori
3411   maggiori della MTU questi verranno ignorati, inoltre TCP imporrà anche i
3412   suoi limiti massimo e minimo per questo valore.
3413
3414 \item[\constd{TCP\_CORK}] questa opzione è il complemento naturale di
3415   \const{TCP\_NODELAY} e serve a gestire a livello applicativo la situazione
3416   opposta, cioè quella in cui si sa fin dal principio che si dovranno inviare
3417   grosse quantità di dati. Anche in questo caso l'\textsl{algoritmo di Nagle}
3418   tenderà a suddividerli in dimensioni da lui ritenute
3419   opportune,\footnote{l'algoritmo cerca di tenere conto di queste situazioni,
3420     ma essendo un algoritmo generico tenderà comunque ad introdurre delle
3421     suddivisioni in segmenti diversi, anche quando potrebbero non essere
3422     necessarie, con conseguente spreco di banda.}  ma sapendo fin dall'inizio
3423   quale è la dimensione dei dati si potranno di nuovo ottenere delle migliori
3424   prestazioni disabilitandolo, e gestendo direttamente l'invio del nostro
3425   blocco di dati in soluzione unica.
3426
3427   Quando questa opzione viene abilitata non vengono inviati segmenti di dati
3428   fintanto che essa non venga disabilitata; a quel punto tutti i dati rimasti
3429   in coda saranno inviati in un solo segmento TCP. In sostanza con questa
3430   opzione si può controllare il flusso dei dati mettendo una sorta di
3431   ``\textsl{tappo}'' (da cui il nome in inglese) al flusso di uscita, in modo
3432   ottimizzare a mano l'uso della banda. Si tenga presente che per l'effettivo
3433   funzionamento ci si deve ricordare di disattivare l'opzione al termine
3434   dell'invio del blocco dei dati.
3435
3436   Si usa molto spesso \const{TCP\_CORK} quando si effettua il trasferimento
3437   diretto di un blocco di dati da un file ad un socket con \func{sendfile}
3438   (vedi sez.~\ref{sec:file_sendfile_splice}), per inserire una intestazione
3439   prima della chiamata a questa funzione; senza di essa l'intestazione
3440   potrebbe venire spedita in un segmento a parte, che a seconda delle
3441   condizioni potrebbe richiedere anche una risposta di ACK, portando ad una
3442   notevole penalizzazione delle prestazioni.
3443
3444   Si tenga presente che l'implementazione corrente di \const{TCP\_CORK} non
3445   consente di bloccare l'invio dei dati per più di 200 millisecondi, passati i
3446   quali i dati accumulati in coda sanno inviati comunque.  Questa opzione è
3447   tipica di Linux\footnote{l'opzione è stata introdotta con i kernel della
3448     serie 2.4.x.} e non è disponibile su tutti i kernel unix-like, pertanto
3449   deve essere evitata se si vuole scrivere codice portabile.
3450
3451 \item[\constd{TCP\_KEEPIDLE}] con questa opzione si legge o si imposta
3452   l'intervallo di tempo, in secondi, che deve trascorrere senza traffico sul
3453   socket prima che vengano inviati, qualora si sia attivata su di esso
3454   l'opzione \const{SO\_KEEPALIVE}, i messaggi di \textit{keep-alive} (si veda
3455   la trattazione relativa al \textit{keep-alive} in
3456   sez.~\ref{sec:sock_options_main}).  Anche questa opzione non è disponibile
3457   su tutti i kernel unix-like e deve essere evitata se si vuole scrivere
3458   codice portabile.
3459
3460 \item[\constd{TCP\_KEEPINTVL}] con questa opzione si legge o si imposta
3461   l'intervallo di tempo, in secondi, fra due messaggi di \textit{keep-alive}
3462   successivi (si veda sempre quanto illustrato in
3463   sez.~\ref{sec:sock_options_main}). Come la precedente non è disponibile su
3464   tutti i kernel unix-like e deve essere evitata se si vuole scrivere codice
3465   portabile.
3466
3467 \item[\constd{TCP\_KEEPCNT}] con questa opzione si legge o si imposta il numero
3468   totale di messaggi di \textit{keep-alive} da inviare prima di concludere che
3469   la connessione è caduta per assenza di risposte ad un messaggio di
3470   \textit{keep-alive} (di nuovo vedi sez.~\ref{sec:sock_options_main}). Come
3471   la precedente non è disponibile su tutti i kernel unix-like e deve essere
3472   evitata se si vuole scrivere codice portabile.
3473
3474 \item[\constd{TCP\_SYNCNT}] con questa opzione si legge o si imposta il numero
3475   di tentativi di ritrasmissione dei segmenti SYN usati nel \textit{three way
3476     handshake} prima che il tentativo di connessione venga abortito (si
3477   ricordi quanto accennato in sez.~\ref{sec:TCP_func_connect}). Sovrascrive
3478   per il singolo socket il valore globale impostato con la \textit{sysctl}
3479   \texttt{tcp\_syn\_retries} (vedi sez.~\ref{sec:sock_ipv4_sysctl}).  Non
3480   vengono accettati valori maggiori di 255; anche questa opzione non è
3481   standard e deve essere evitata se si vuole scrivere codice portabile.
3482
3483 \item[\constd{TCP\_LINGER2}] con questa opzione si legge o si imposta, in
3484   numero di secondi, il tempo di sussistenza dei socket terminati nello stato
3485   \texttt{FIN\_WAIT2} (si ricordi quanto visto in
3486   sez.~\ref{sec:TCP_conn_term}).\footnote{si tenga ben presente che questa
3487     opzione non ha nulla a che fare con l'opzione \const{SO\_LINGER} che
3488     abbiamo visto in sez.~\ref{sec:sock_options_main}.}  Questa&nb