Piccole correzioni dimenticate
[gapil.git] / sockctrl.tex
1 %% sockctrl.tex
2 %%
3 %% Copyright (C) 2004-2017 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{La gestione dei socket}
13 \label{cha:sock_generic_management}
14
15 Esamineremo in questo capitolo una serie di funzionalità aggiuntive relative
16 alla gestione dei socket, come la gestione della risoluzione di nomi e
17 indirizzi, le impostazioni delle varie proprietà ed opzioni relative ai
18 socket, e le funzioni di controllo che permettono di modificarne il
19 comportamento.
20
21
22 \section{La risoluzione dei nomi}
23 \label{sec:sock_name_resolution}
24
25 Negli esempi dei capitoli precedenti abbiamo sempre identificato le singole
26 macchine attraverso indirizzi numerici, sfruttando al più le funzioni di
27 conversione elementare illustrate in sez.~\ref{sec:sock_addr_func} che
28 permettono di passare da un indirizzo espresso in forma \textit{dotted
29   decimal} ad un numero. Vedremo in questa sezione le funzioni utilizzate per
30 poter utilizzare dei nomi simbolici al posto dei valori numerici, e viceversa
31 quelle che permettono di ottenere i nomi simbolici associati ad indirizzi,
32 porte o altre proprietà del sistema.
33
34
35 \subsection{La struttura del \textit{resolver}}
36 \label{sec:sock_resolver}
37
38 \itindbeg{resolver} La risoluzione dei nomi è associata tradizionalmente al
39 servizio del \itindex{Domain~Name~Service} \textit{Domain Name Service} che
40 permette di identificare le macchine su internet invece che per numero IP
41 attraverso il relativo \textsl{nome a dominio}.\footnote{non staremo ad
42   entrare nei dettagli della definizione di cosa è un nome a dominio, dandolo
43   per noto, una introduzione alla problematica si trova in \cite{AGL} (cap.~9)
44   mentre per una trattazione approfondita di tutte le problematiche relative
45   al DNS si può fare riferimento a \cite{DNSbind}.} In realtà per DNS si
46 intendono spesso i server che forniscono su internet questo servizio, mentre
47 nel nostro caso affronteremo la problematica dal lato client, di un qualunque
48 programma che necessita di compiere questa operazione.
49
50 \begin{figure}[!htb]
51   \centering \includegraphics[width=11cm]{img/resolver}
52   \caption{Schema di funzionamento delle funzioni del \textit{resolver}.}
53   \label{fig:sock_resolver_schema}
54 \end{figure}
55
56 Inoltre quella fra nomi a dominio e indirizzi IP non è l'unica corrispondenza
57 possibile fra nomi simbolici e valori numerici, come abbiamo visto anche in
58 sez.~\ref{sec:sys_user_group} per le corrispondenze fra nomi di utenti e
59 gruppi e relativi identificatori numerici; per quanto riguarda però tutti i
60 nomi associati a identificativi o servizi relativi alla rete il servizio di
61 risoluzione è gestito in maniera unificata da un insieme di funzioni fornite
62 con le librerie del C, detto appunto \textit{resolver}.
63
64 Lo schema di funzionamento del \textit{resolver} è illustrato in
65 fig.~\ref{fig:sock_resolver_schema}; in sostanza i programmi hanno a
66 disposizione un insieme di funzioni di libreria con cui chiamano il
67 \textit{resolver}, indicate con le frecce nere. Ricevuta la richiesta è
68 quest'ultimo che, sulla base della sua configurazione, esegue le operazioni
69 necessarie a fornire la risposta, che possono essere la lettura delle
70 informazioni mantenute nei relativi dei file statici presenti sulla macchina,
71 una interrogazione ad un DNS (che a sua volta, per il funzionamento del
72 protocollo, può interrogarne altri) o la richiesta ad altri server per i quali
73 sia fornito il supporto, come LDAP.\footnote{la sigla LDAP fa riferimento ad
74   un protocollo, il \textit{Lightweight Directory Access Protocol}, che
75   prevede un meccanismo per la gestione di \textsl{elenchi} di informazioni
76   via rete; il contenuto di un elenco può essere assolutamente generico, e
77   questo permette il mantenimento dei più vari tipi di informazioni su una
78   infrastruttura di questo tipo.}
79
80 La configurazione del \textit{resolver} attiene più alla amministrazione di
81 sistema che alla programmazione, ciò non di meno, prima di trattare le varie
82 funzioni di librerie utilizzate dai programmi, vale la pena fare una
83 panoramica generale.  Originariamente la configurazione del \textit{resolver}
84 riguardava esclusivamente le questioni relative alla gestione dei nomi a
85 dominio, e prevedeva solo l'utilizzo del DNS e del file statico
86 \conffile{/etc/hosts}.
87
88 Per questo aspetto il file di configurazione principale del sistema è
89 \conffile{/etc/resolv.conf} che contiene in sostanza l'elenco degli indirizzi
90 IP dei server DNS da contattare; a questo si affiancava (fino alle \acr{glibc}
91 2.4) il file \conffile{/etc/host.conf} il cui scopo principale era indicare
92 l'ordine in cui eseguire la risoluzione dei nomi (se usare prima i valori di
93 \conffile{/etc/hosts} o quelli del DNS). Tralasciamo i dettagli relativi alle
94 varie direttive che possono essere usate in questi file, che si trovano nelle
95 rispettive pagine di manuale.
96
97 Con il tempo però è divenuto possibile fornire diversi sostituti per
98 l'utilizzo delle associazione statiche in \conffile{/etc/hosts}, inoltre oltre
99 alla risoluzione dei nomi a dominio ci sono anche altri nomi da risolvere,
100 come quelli che possono essere associati ad una rete (invece che ad una
101 singola macchina) o ai gruppi di macchine definiti dal servizio
102 NIS,\footnote{il \textit{Network Information Service} è un servizio, creato da
103   Sun, e poi diffuso su tutte le piattaforme unix-like, che permette di
104   raggruppare all'interno di una rete (in quelli che appunto vengono chiamati
105   \textit{netgroup}) varie macchine, centralizzando i servizi di definizione
106   di utenti e gruppi e di autenticazione, oggi è sempre più spesso sostituito
107   da LDAP.} o come quelli dei protocolli e dei servizi che sono mantenuti nei
108 file statici \conffile{/etc/protocols} e \conffile{/etc/services}.  
109
110 Molte di queste informazioni non si trovano su un DNS, ma in una rete locale
111 può essere molto utile centralizzare il mantenimento di alcune di esse su
112 opportuni server.  Inoltre l'uso di diversi supporti possibili per le stesse
113 informazioni (ad esempio il nome delle macchine può essere mantenuto sia
114 tramite \conffile{/etc/hosts}, che con il DNS, che con NIS) comporta il
115 problema dell'ordine in cui questi vengono interrogati. Con le implementazioni
116 classiche i vari supporti erano introdotti modificando direttamente le
117 funzioni di libreria, prevedendo un ordine di interrogazione predefinito e non
118 modificabile (a meno di una ricompilazione delle librerie stesse).
119
120 \itindbeg{Name~Service~Switch~(NSS)} 
121
122 Per risolvere questa serie di problemi la risoluzione dei nomi a dominio
123 eseguità dal \textit{resolver} è stata inclusa all'interno di un meccanismo
124 generico per la risoluzione di corrispondenze fra nomi ed informazioni ad essi
125 associate chiamato \textit{Name Service Switch}, cui abbiamo accennato anche in
126 sez.~\ref{sec:sys_user_group} per quanto riguarda la gestione dei dati
127 associati a utenti e gruppi. Il sistema è stato introdotto la prima volta
128 nelle librerie standard di Solaris e le \acr{glibc} hanno ripreso lo stesso
129 schema; si tenga presente che questo sistema non esiste per altre librerie
130 standard come le \acr{libc5} o le \acr{uclib}.
131
132 Il \textit{Name Service Switch} (cui spesso si fa riferimento con l'acronimo
133 NSS) è un sistema di librerie dinamiche che permette di definire in maniera
134 generica sia i supporti su cui mantenere i dati di corrispondenza fra nomi e
135 valori numerici, sia l'ordine in cui effettuare le ricerche sui vari supporti
136 disponibili. Il sistema prevede una serie di possibili classi di
137 corrispondenza, quelle attualmente definite sono riportate in
138 tab.~\ref{tab:sys_NSS_classes}.
139
140 \begin{table}[htb]
141   \footnotesize
142   \centering
143   \begin{tabular}[c]{|l|p{8cm}|}
144     \hline
145     \textbf{Classe} & \textbf{Tipo di corrispondenza}\\
146     \hline
147     \hline
148     \texttt{passwd}   & Corrispondenze fra nome dell'utente e relative
149                         proprietà (\ids{UID}, gruppo principale, ecc.).\\  
150     \texttt{shadow}   & Corrispondenze fra username e password dell'utente
151                         (e altre informazioni relative alle password).\\  
152     \texttt{group}    & Corrispondenze fra nome del gruppo e proprietà dello 
153                         stesso.\\  
154     \texttt{aliases}  & Alias per la posta elettronica.\\ 
155     \texttt{ethers}   & Corrispondenze fra numero IP e MAC address della
156                         scheda di rete.\\ 
157     \texttt{hosts}    & Corrispondenze fra nome a dominio e numero IP.\\ 
158     \texttt{netgroup} & Corrispondenze fra gruppo di rete e macchine che lo
159                         compongono.\\  
160     \texttt{networks} & Corrispondenze fra nome di una rete e suo indirizzo
161                         IP.\\  
162     \texttt{protocols}& Corrispondenze fra nome di un protocollo e relativo
163                         numero identificativo.\\ 
164     \texttt{rpc}      & Corrispondenze fra nome di un servizio RPC e relativo 
165                         numero identificativo.\\ 
166     \texttt{publickey}& Chiavi pubbliche e private usate per gli RFC sicuri,
167                         utilizzate da NFS e NIS+. \\ 
168     \texttt{services} & Corrispondenze fra nome di un servizio e numero di
169                         porta. \\ 
170     \hline
171   \end{tabular}
172   \caption{Le diverse classi di corrispondenze definite
173     all'interno del \textit{Name Service Switch}.} 
174   \label{tab:sys_NSS_classes}
175 \end{table}
176
177 % TODO rivedere meglio la tabella
178
179 Il sistema del \textit{Name Service Switch} è controllato dal contenuto del
180 file \conffile{/etc/nsswitch.conf}; questo contiene una riga di configurazione
181 per ciascuna di queste classi, che viene inizia col nome di
182 tab.~\ref{tab:sys_NSS_classes} seguito da un carattere ``\texttt{:}'' e
183 prosegue con la lista dei \textsl{servizi} su cui le relative informazioni
184 sono raggiungibili, scritti nell'ordine in cui si vuole siano interrogati.
185 Pertanto nelle versioni recenti delle librerie è questo file e non
186 \conffile{/etc/host.conf}  a indicare l'ordine con cui si esegue la
187 risoluzione dei nomi.
188
189 Ogni servizio è specificato a sua volta da un nome, come \texttt{file},
190 \texttt{dns}, \texttt{db}, ecc.  che identifica la libreria dinamica che
191 realizza l'interfaccia con esso. Per ciascun servizio se \texttt{NAME} è il
192 nome utilizzato dentro \conffile{/etc/nsswitch.conf}, dovrà essere presente
193 (usualmente in \file{/lib}) una libreria \texttt{libnss\_NAME} che ne
194 implementa le funzioni.
195
196 In ogni caso, qualunque sia la modalità con cui ricevono i dati o il supporto
197 su cui vengono mantenuti, e che si usino o meno funzionalità aggiuntive
198 fornite dal sistema del \textit{Name Service Switch}, dal punto di vista di un
199 programma che deve effettuare la risoluzione di un nome a dominio, tutto
200 quello che conta sono le funzioni classiche che il \textit{resolver} mette a
201 disposizione (è cura delle \acr{glibc} tenere conto della presenza del
202 \textit{Name Service Switch}) e sono queste quelle che tratteremo nelle
203 sezioni successive.  
204
205 \itindend{Name~Service~Switch~(NSS)}
206
207
208 \subsection{Le funzioni di interrogazione del DNS}
209 \label{sec:sock_resolver_functions}
210
211 Prima di trattare le funzioni usate normalmente nella risoluzione dei nomi a
212 dominio conviene trattare in maniera più dettagliata il servizio DNS. Come
213 accennato questo, benché esso in teoria sia solo uno dei possibili supporti su
214 cui mantenere le informazioni, in pratica costituisce il meccanismo principale
215 con cui vengono risolti i nomi a dominio. Inolte esso può fornire anche
216 ulteriori informazioni oltre relative alla risoluzione dei nomi a dominio.
217 Per questo motivo esistono una serie di funzioni di libreria che servono
218 specificamente ad eseguire delle interrogazioni verso un server DNS, funzioni
219 che poi vengono utilizzate anche per realizzare le funzioni generiche di
220 libreria usate dal sistema del \textit{resolver}.
221
222 Il sistema del DNS è in sostanza di un database distribuito organizzato in
223 maniera gerarchica, i dati vengono mantenuti in tanti server distinti ciascuno
224 dei quali si occupa della risoluzione del proprio \textsl{dominio}; i nomi a
225 dominio sono organizzati in una struttura ad albero analoga a quella
226 dell'albero dei file, con domini di primo livello (come i \texttt{.org}),
227 secondo livello (come \texttt{.truelite.it}), ecc.  In questo caso le
228 separazioni sono fra i vari livelli sono definite dal carattere ``\texttt{.}''
229 ed i nomi devono essere risolti da destra verso sinistra.\footnote{per chi si
230   stia chiedendo quale sia la radice di questo albero, cioè l'equivalente di
231   ``\texttt{/}'', la risposta è il dominio speciale ``\texttt{.}'', che in
232   genere non viene mai scritto esplicitamente, ma che, come chiunque abbia
233   configurato un server DNS sa bene, esiste ed è gestito dai cosiddetti
234   \textit{root DNS} che risolvono i domini di primo livello.} Il meccanismo
235 funziona con il criterio della \textsl{delegazione}, un server responsabile
236 per un dominio di primo livello può delegare la risoluzione degli indirizzi
237 per un suo dominio di secondo livello ad un altro server, il quale a sua volta
238 potrà delegare la risoluzione di un eventuale sotto-dominio di terzo livello ad
239 un altro server ancora.
240
241 Come accennato un server DNS è in grado di fare molto altro rispetto alla
242 risoluzione di un nome a dominio in un indirizzo IP: ciascuna voce nel
243 database viene chiamata \textit{resource record}, e può contenere diverse
244 informazioni. In genere i \textit{resource record} vengono classificati per la
245 \textsl{classe di indirizzi} cui i dati contenuti fanno riferimento, e per il
246 \textsl{tipo} di questi ultimi (ritroveremo classi di indirizzi e tipi di
247 record più avanti in tab.~\ref{tab:DNS_address_class} e
248 tab.~\ref{tab:DNS_record_type}).  Oggigiorno i dati mantenuti nei server DNS
249 sono quasi esclusivamente relativi ad indirizzi internet, per cui in pratica
250 viene utilizzata soltanto una classe di indirizzi; invece le corrispondenze
251 fra un nome a dominio ed un indirizzo IP sono solo uno fra i vari tipi di
252 informazione che un server DNS fornisce normalmente.
253
254 L'esistenza di vari tipi di informazioni è un altro dei motivi per cui il
255 \textit{resolver} prevede, oltre a quelle relative alla semplice risoluzione
256 dei nomi, un insieme di funzioni specifiche dedicate all'interrogazione di un
257 server DNS, tutte nella forma \texttt{res\_}\textsl{\texttt{nome}}. La prima
258 di queste funzioni è \funcd{res\_init}, il cui prototipo è:
259
260 \begin{funcproto}{
261 \fhead{netinet/in.h} 
262 \fhead{arpa/nameser.h} 
263 \fhead{resolv.h}
264 \fdecl{int res\_init(void)}
265 \fdesc{Inizializza il sistema del \textit{resolver}.} 
266 }
267 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore.
268 }
269 \end{funcproto}
270
271 La funzione legge il contenuto dei file di configurazione per impostare il
272 dominio di default, gli indirizzi dei server DNS da contattare e l'ordine
273 delle ricerche; se non sono specificati server verrà utilizzato l'indirizzo
274 locale, e se non è definito un dominio di default sarà usato quello associato
275 con l'indirizzo locale (ma questo può essere sovrascritto con l'uso della
276 variabile di ambiente \envvar{LOCALDOMAIN}). In genere non è necessario
277 eseguire questa funzione esplicitamente, in quanto viene automaticamente
278 chiamata la prima volta che si esegue una qualunque delle altre.
279
280 Le impostazioni e lo stato del \textit{resolver} inizializzati da
281 \func{res\_init} vengono mantenuti in una serie di variabili raggruppate nei
282 campi di una apposita struttura. Questa struttura viene definita in
283 \headfiled{resolv.h} e mantenuta nella variabile globale \var{\_res}, che
284 viene utilizzata internamente da tutte le funzioni dell'interfaccia. Questo
285 consente anche di accedere direttamente al contenuto della variabile
286 all'interno di un qualunque programma, una volta che la sia opportunamente
287 dichiarata con:
288 \includecodesnip{listati/resolv_option.c}
289
290 Dato che l'uso di una variabile globale rende tutte le funzioni
291 dell'interfaccia classica non rientranti, queste sono state deprecate in
292 favore di una nuova interfaccia in cui esse sono state sostituite da
293 altrettante nuove funzioni, il cui nome è ottenuto apponendo una
294 ``\texttt{n}'' al nome di quella tradizionale (cioè nella forma
295 \texttt{res\_n\textsl{nome}}). Tutte le nuove funzioni sono identiche alle
296 precedenti, ma hanno un primo argomento aggiuntivo, \param{statep}, puntatore
297 ad una struttura dello stesso tipo di \var{\_res}. Questo consente di usare
298 una variabile locale per mantenere lo stato del \textit{resolver}, rendendo le
299 nuove funzioni rientranti.  In questo caso per poter utilizzare il nuovo
300 argomento occorrerà una opportuna dichiarazione del relativo tipo di dato con:
301 \includecodesnip{listati/resolv_newoption.c}
302
303 Così la nuova funzione utilizzata per inizializzare il \textit{resolver} (che
304 come la precedente viene chiamata automaticamente da tutte altre funzioni) è
305 \funcd{res\_ninit}, ed il suo prototipo è:
306
307 \begin{funcproto}{
308 \fhead{netinet/in.h} 
309 \fhead{arpa/nameser.h} 
310 \fhead{resolv.h}
311 \fdecl{int res\_ninit(res\_state statep)}
312 \fdesc{Inizializza il sistema del \textit{resolver}.} 
313 }
314 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore.
315 }
316 \end{funcproto}
317
318 Indipendentemente da quale versione delle funzioni si usino, tutti i campi
319 della struttura (\var{\_res} o la variabile puntata da \param{statep}) sono ad
320 uso interno, e vengono usualmente inizializzate da \func{res\_init} o
321 \func{res\_ninit} in base al contenuto dei file di configurazione e ad una
322 serie di valori di default. L'unico campo che può essere utile modificare è
323 \var{\_res.options} (o l'equivalente della variabile puntata
324 da\param{statep}), una maschera binaria che contiene una serie di bit che
325 esprimono le opzioni che permettono di controllare il comportamento del
326 \textit{resolver}.
327
328 \begin{table}[htb]
329   \centering
330   \footnotesize
331   \begin{tabular}[c]{|l|p{8cm}|}
332     \hline
333     \textbf{Costante} & \textbf{Significato} \\
334     \hline
335     \hline
336     \constd{RES\_INIT}       & Viene attivato se è stata chiamata
337                                \func{res\_init}. \\
338     \constd{RES\_DEBUG}      & Stampa dei messaggi di debug.\\
339     \constd{RES\_AAONLY}     & Accetta solo risposte autoritative.\\
340     \constd{RES\_USEVC}      & Usa connessioni TCP per contattare i server 
341                                invece che l'usuale UDP.\\
342     \constd{RES\_PRIMARY}    & Interroga soltanto server DNS primari.\\
343     \constd{RES\_IGNTC}      & Ignora gli errori di troncamento, non ritenta la
344                                richiesta con una connessione TCP.\\
345     \constd{RES\_RECURSE}    & Imposta il bit che indica che si desidera
346                                eseguire una interrogazione ricorsiva.\\
347     \constd{RES\_DEFNAMES}   & Se attivo \func{res\_search} aggiunge il nome
348                                del dominio di default ai nomi singoli (che non
349                                contengono cioè un ``\texttt{.}'').\\
350     \constd{RES\_STAYOPEN}   & Usato con \const{RES\_USEVC} per mantenere
351                                aperte le connessioni TCP fra interrogazioni
352                                diverse.\\
353     \constd{RES\_DNSRCH}     & Se attivo \func{res\_search} esegue le ricerche
354                                di nomi di macchine nel dominio corrente o nei
355                                domini ad esso sovrastanti.\\
356     \constd{RES\_INSECURE1}  & Blocca i controlli di sicurezza di tipo 1.\\
357     \constd{RES\_INSECURE2}  & Blocca i controlli di sicurezza di tipo 2.\\
358     \constd{RES\_NOALIASES}  & Blocca l'uso della variabile di ambiente
359                                \envvar{HOSTALIASES}.\\ 
360     \constd{RES\_USE\_INET6} & Restituisce indirizzi IPv6 con
361                                \func{gethostbyname}. \\
362     \constd{RES\_ROTATE}     & Ruota la lista dei server DNS dopo ogni
363                                interrogazione.\\
364     \constd{RES\_NOCHECKNAME}& Non controlla i nomi per verificarne la
365                                correttezza sintattica. \\
366     \constd{RES\_KEEPTSIG}   & Non elimina i record di tipo \texttt{TSIG}.\\
367     \constd{RES\_BLAST}      & Effettua un ``\textit{blast}'' inviando
368                                simultaneamente le richieste a tutti i server;
369                                non ancora implementata. \\
370     \constd{RES\_DEFAULT}    & Combinazione di \const{RES\_RECURSE},
371                                \const{RES\_DEFNAMES} e \const{RES\_DNSRCH}.\\
372     \hline
373   \end{tabular}
374   \caption{Costanti utilizzabili come valori per \var{\_res.options}.}
375   \label{tab:resolver_option}
376 \end{table}
377
378 Per utilizzare questa funzionalità per modificare le impostazioni direttamente
379 da programma occorrerà impostare un opportuno valore per questo campo ed
380 invocare esplicitamente \func{res\_init} o \func{res\_ninit}, dopo di che le
381 altre funzioni prenderanno le nuove impostazioni. Le costanti che definiscono
382 i vari bit di questo campo, ed il relativo significato sono illustrate in
383 tab.~\ref{tab:resolver_option}; trattandosi di una maschera binaria un valore
384 deve essere espresso con un opportuno OR aritmetico di dette costanti; ad
385 esempio il valore di default delle opzioni, espresso dalla costante
386 \const{RES\_DEFAULT}, è definito come:
387 \includecodesnip{listati/resolv_option_def.c}
388
389 Non tratteremo il significato degli altri campi non essendovi necessità di
390 modificarli direttamente; gran parte di essi sono infatti impostati dal
391 contenuto dei file di configurazione, mentre le funzionalità controllate da
392 alcuni di esse possono essere modificate con l'uso delle opportune variabili
393 di ambiente come abbiamo visto per \envvar{LOCALDOMAIN}. In particolare con
394 \envvar{RES\_RETRY} si soprassiede il valore del campo \var{retry} che
395 controlla quante volte viene ripetuto il tentativo di connettersi ad un server
396 DNS prima di dichiarare fallimento; il valore di default è 4, un valore nullo
397 significa bloccare l'uso del DNS. Infine con \envvar{RES\_TIMEOUT} si
398 soprassiede il valore del campo \var{retrans} (preimpostato al valore della
399 omonima costante \const{RES\_TIMEOUT} di \headfile{resolv.h}) che è il valore
400 preso come base (in numero di secondi) per definire la scadenza di una
401 richiesta, ciascun tentativo di richiesta fallito viene ripetuto raddoppiando
402 il tempo di scadenza per il numero massimo di volte stabilito da
403 \texttt{RES\_RETRY}.
404
405 La funzione di interrogazione principale è \funcd{res\_query}
406 (\funcd{res\_nquery} per la nuova interfaccia), che serve ad eseguire una
407 richiesta ad un server DNS per un nome a dominio \textsl{completamente
408   specificato} (quello che si chiama
409 \itindex{Fully~Qualified~Domain~Name~(FQDN)} FQDN, \textit{Fully Qualified 
410   Domain Name}); il loro prototipo è:
411
412 \begin{funcproto}{
413 \fhead{netinet/in.h} 
414 \fhead{arpa/nameser.h} 
415 \fhead{resolv.h}
416 \fdecl{int res\_query(const char *dname, int class, int type,
417               unsigned char *answer, int anslen)}
418 \fdecl{int res\_nquery(res\_state statep, const char *dname, int class, int
419   type, \\
420   \phantom{int res\_nquery(}unsigned char *answer, int anslen)}
421 \fdesc{Esegue una interrogazione al DNS.} 
422 }
423 {Le funzioni ritornano un valore positivo pari alla lunghezza dei dati scritti
424   nel buffer \param{answer} in caso di successo e $-1$ per un errore.
425 }
426 \end{funcproto}
427
428 Le funzioni eseguono una interrogazione ad un server DNS relativa al nome da
429 risolvere passato nella stringa indirizzata da \param{dname}, inoltre deve
430 essere specificata la classe di indirizzi in cui eseguire la ricerca con
431 \param{class}, ed il tipo di \textit{resource record} che si vuole ottenere
432 con \param{type}. Il risultato della ricerca verrà scritto nel buffer di
433 lunghezza \param{anslen} puntato da \param{answer} che si sarà opportunamente
434 allocato in precedenza.
435
436 Una seconda funzione di ricerca analoga a \func{res\_query}, che prende gli
437 stessi argomenti ma che esegue l'interrogazione con le funzionalità
438 addizionali previste dalle due opzioni \const{RES\_DEFNAMES} e
439 \const{RES\_DNSRCH}, è \funcd{res\_search} (\funcd{res\_nsearch} per la nuova
440 interfaccia), il cui prototipo è:
441
442 \begin{funcproto}{
443 \fhead{netinet/in.h} 
444 \fhead{arpa/nameser.h} 
445 \fhead{resolv.h}
446 \fdecl{int res\_search(const char *dname, int class, int type,
447   unsigned char *answer, \\
448   \phantom{int res\_search}int anslen)}
449 \fdecl{int res\_nsearch(res\_state statep, const char *dname, int class, 
450   int type, \\
451   \phantom{int res\_nsearch(}unsigned char *answer, int anslen)}
452 \fdesc{Esegue una interrogazione al DNS.} 
453 }
454 {Le funzioni ritornano un valore positivo pari alla lunghezza dei dati scritti
455   nel buffer \param{answer} in caso di successo e $-1$ per un errore.
456 }
457 \end{funcproto}
458
459 In sostanza la funzione ripete una serie di chiamate a \func{res\_query}
460 (\func{res\_nquery}) aggiungendo al nome contenuto nella stringa \param{dname}
461 il dominio di default da cercare, fermandosi non appena trova un risultato.
462 Il risultato di entrambe le funzioni viene scritto nel formato opportuno (che
463 sarà diverso a seconda del tipo di record richiesto) nel buffer di ritorno;
464 sarà compito del programma (o di altre funzioni) estrarre i relativi dati,
465 esistono una serie di funzioni interne usate per la scansione di questi dati,
466 per chi fosse interessato una trattazione dettagliata è riportata nel
467 quattordicesimo capitolo di \cite{DNSbind}.
468
469 Le classi di indirizzi supportate da un server DNS sono tre, ma di queste in
470 pratica oggi viene utilizzata soltanto quella degli indirizzi internet; le
471 costanti che identificano dette classi, da usare come valore per l'argomento
472 \param{class} delle precedenti funzioni, sono riportate in
473 tab.~\ref{tab:DNS_address_class} (esisteva in realtà anche una classe
474 \constd{C\_CSNET} per la omonima rete, ma è stata dichiarata obsoleta).
475
476 \begin{table}[htb]
477   \centering
478   \footnotesize
479   \begin{tabular}[c]{|l|p{8cm}|}
480     \hline
481     \textbf{Costante} & \textbf{Significato} \\
482     \hline
483     \hline
484     \constd{C\_IN}   & Indirizzi internet, in pratica i soli utilizzati oggi.\\
485     \constd{C\_HS}   & Indirizzi \textit{Hesiod}, utilizzati solo al MIT, oggi
486                        completamente estinti. \\
487     \constd{C\_CHAOS}& Indirizzi per la rete \textit{Chaosnet}, un'altra rete
488                        sperimentale nata al MIT. \\
489     \constd{C\_ANY}  & Indica un indirizzo di classe qualunque.\\
490     \hline
491   \end{tabular}
492   \caption{Costanti identificative delle classi di indirizzi per l'argomento
493     \param{class} di \func{res\_query}.}
494   \label{tab:DNS_address_class}
495 \end{table}
496
497 Come accennato le tipologie di dati che sono mantenibili su un server DNS sono
498 diverse, ed a ciascuna di essa corrisponde un diverso tipo di \textit{resource
499   record}. L'elenco delle costanti, ripreso dai file di dichiarazione
500 \headfiled{arpa/nameser.h} e \headfiled{arpa/nameser\_compat.h}, che
501 definiscono i valori che si possono usare per l'argomento \param{type} per
502 specificare il tipo di \textit{resource record} da richiedere è riportato in
503 tab.~\ref{tab:DNS_record_type}; le costanti (tolto il \texttt{T\_} iniziale)
504 hanno gli stessi nomi usati per identificare i record nei file di zona di
505 BIND,\footnote{BIND, acronimo di \textit{Berkley Internet Name Domain}, è una
506   implementazione di un server DNS, ed, essendo utilizzata nella stragrande
507   maggioranza dei casi, fa da riferimento; i dati relativi ad un certo dominio
508   (cioè i suoi \textit{resource record} vengono mantenuti in quelli che sono
509   usualmente chiamati \textsl{file di zona}, e in essi ciascun tipo di dominio
510   è identificato da un nome che è appunto identico a quello delle costanti di
511   tab.~\ref{tab:DNS_record_type} senza il \texttt{T\_} iniziale.} e che
512 normalmente sono anche usati come nomi per indicare i record.
513
514 \begin{table}[!htb]
515   \centering
516   \footnotesize
517   \begin{tabular}[c]{|l|l|}
518     \hline
519     \textbf{Costante} & \textbf{Significato} \\
520     \hline
521     \hline
522     \constd{T\_A}     & Indirizzo di una stazione.\\
523     \constd{T\_NS}    & Server DNS autoritativo per il dominio richiesto.\\
524     \constd{T\_MD}    & Destinazione per la posta elettronica.\\
525     \constd{T\_MF}    & Redistributore per la posta elettronica.\\
526     \constd{T\_CNAME} & Nome canonico.\\
527     \constd{T\_SOA}   & Inizio di una zona di autorità.\\
528     \constd{T\_MB}    & Nome a dominio di una casella di posta.\\
529     \constd{T\_MG}    & Nome di un membro di un gruppo di posta.\\
530     \constd{T\_MR}    & Nome di un cambiamento di nome per la posta.\\
531     \constd{T\_NULL}  & Record nullo.\\
532     \constd{T\_WKS}   & Servizio noto.\\
533     \constd{T\_PTR}   & Risoluzione inversa di un indirizzo numerico.\\
534     \constd{T\_HINFO} & Informazione sulla stazione.\\
535     \constd{T\_MINFO} & Informazione sulla casella di posta.\\
536     \constd{T\_MX}    & Server cui instradare la posta per il dominio.\\
537     \constd{T\_TXT}   & Stringhe di testo (libere).\\
538     \constd{T\_RP}    & Nome di un responsabile (\textit{responsible person}).\\
539     \constd{T\_AFSDB} & Database per una cella AFS.\\
540     \constd{T\_X25}   & Indirizzo di chiamata per X.25.\\
541     \constd{T\_ISDN}  & Indirizzo di chiamata per ISDN.\\
542     \constd{T\_RT}    & Router.\\
543     \constd{T\_NSAP}  & Indirizzo NSAP.\\
544     \constd{T\_NSAP\_PTR}& Risoluzione inversa per NSAP (deprecato).\\
545     \constd{T\_SIG}   & Firma digitale di sicurezza.\\
546     \constd{T\_KEY}   & Chiave per firma.\\
547     \constd{T\_PX}    & Corrispondenza per la posta X.400.\\
548     \constd{T\_GPOS}  & Posizione geografica.\\
549     \constd{T\_AAAA}  & Indirizzo IPv6.\\
550     \constd{T\_LOC}   & Informazione di collocazione.\\
551     \constd{T\_NXT}   & Dominio successivo.\\
552     \constd{T\_EID}   & Identificatore di punto conclusivo.\\
553     \constd{T\_NIMLOC}& Posizionatore \textit{nimrod}.\\
554     \constd{T\_SRV}   & Servizio.\\
555     \constd{T\_ATMA}  & Indirizzo ATM.\\
556     \constd{T\_NAPTR} & Puntatore ad una \textit{naming authority}.\\
557     \constd{T\_TSIG}  & Firma di transazione.\\
558     \constd{T\_IXFR}  & Trasferimento di zona incrementale.\\
559     \constd{T\_AXFR}  & Trasferimento di zona di autorità.\\
560     \constd{T\_MAILB} & Trasferimento di record di caselle di posta.\\
561     \constd{T\_MAILA} & Trasferimento di record di server di posta.\\
562     \constd{T\_ANY}   & Valore generico.\\
563     \hline
564   \end{tabular}
565   \caption{Costanti identificative del tipo di record per l'argomento
566     \param{type} di \func{res\_query}.}
567   \label{tab:DNS_record_type}
568 \end{table}
569
570
571 L'elenco di tab.~\ref{tab:DNS_record_type} è quello di \textsl{tutti} i
572 \textit{resource record} definiti, con una breve descrizione del relativo
573 significato.  Di tutti questi però viene impiegato correntemente solo un
574 piccolo sottoinsieme, alcuni sono obsoleti ed altri fanno riferimento a dati
575 applicativi che non ci interessano non avendo nulla a che fare con la
576 risoluzione degli indirizzi IP, pertanto non entreremo nei dettagli del
577 significato di tutti i \textit{resource record}, ma solo di quelli usati dalle
578 funzioni del \textit{resolver}. Questi sono sostanzialmente i seguenti (per
579 indicarli si è usata la notazione dei file di zona di BIND):
580 \begin{basedescript}{\desclabelwidth{1.2cm}\desclabelstyle{\nextlinelabel}}
581 \item[\texttt{A}] viene usato per indicare la corrispondenza fra un nome a
582   dominio ed un indirizzo IPv4; ad esempio la corrispondenza fra
583   \texttt{jojo.truelite.it} e l'indirizzo IP \texttt{62.48.34.25}.
584 \item[\texttt{AAAA}] viene usato per indicare la corrispondenza fra un nome a
585   dominio ed un indirizzo IPv6; è chiamato in questo modo dato che la
586   dimensione di un indirizzo IPv6 è quattro volte quella di un indirizzo IPv4.
587 \item[\texttt{PTR}] per fornire la corrispondenza inversa fra un indirizzo IP
588   ed un nome a dominio ad esso associato si utilizza questo tipo di record (il
589   cui nome sta per \textit{pointer}).
590 \item[\texttt{CNAME}] qualora si abbiamo più nomi che corrispondono allo
591   stesso indirizzo (come ad esempio \texttt{www.truelite.it} e
592   \texttt{sources.truelite.it}, che fanno entrambi riferimento alla stessa
593   macchina (nel caso \texttt{dodds.truelite.it}) si può usare questo tipo di
594   record per creare degli \textit{alias} in modo da associare un qualunque
595   altro nome al \textsl{nome canonico} della macchina (si chiama così quello
596   associato al record \texttt{A}).
597 \end{basedescript}
598
599 Come accennato in caso di successo le due funzioni di richiesta restituiscono
600 il risultato della interrogazione al server, in caso di insuccesso l'errore
601 invece viene segnalato da un valore di ritorno pari a $-1$, ma in questo caso,
602 non può essere utilizzata la variabile \var{errno} per riportare un codice di
603 errore, in quanto questo viene impostato per ciascuna delle chiamate al
604 sistema utilizzate dalle funzioni del \textit{resolver}, non avrà alcun
605 significato nell'indicare quale parte del procedimento di risoluzione è
606 fallita.
607
608 Per questo motivo è stata definita una variabile di errore separata,
609 \var{h\_errno}, che viene utilizzata dalle funzioni del \textit{resolver} per
610 indicare quale problema ha causato il fallimento della risoluzione del nome.
611 Ad essa si può accedere una volta che la si dichiara con:
612 \includecodesnip{listati/herrno.c} 
613 ed i valori che può assumere, con il relativo significato, sono riportati in
614 tab.~\ref{tab:h_errno_values}.
615
616 \begin{table}[!htb]
617   \centering
618   \footnotesize
619   \begin{tabular}[c]{|l|p{9cm}|}
620     \hline
621     \textbf{Costante} & \textbf{Significato} \\
622     \hline
623     \hline
624     \constd{HOST\_NOT\_FOUND}& L'indirizzo richiesto non è valido e la
625                                macchina indicata è sconosciuta.\\
626     \constd{NO\_ADDRESS}     & Il nome a dominio richiesto è valido, ma non ha
627                                un indirizzo associato ad esso
628                                (alternativamente può essere indicato come 
629                                \constd{NO\_DATA}).\\
630     \constd{NO\_RECOVERY}    & Si è avuto un errore non recuperabile
631                                nell'interrogazione di un server DNS.\\
632     \constd{TRY\_AGAIN}      & Si è avuto un errore temporaneo
633                                nell'interrogazione di un server DNS, si può
634                                ritentare l'interrogazione in un secondo
635                                tempo.\\
636     \hline
637   \end{tabular}
638   \caption{Valori possibili della variabile \var{h\_errno}.}
639   \label{tab:h_errno_values}
640 \end{table}
641
642 Insieme alla nuova variabile vengono definite anche delle nuove funzioni per
643 stampare l'errore a video, analoghe a quelle di sez.~\ref{sec:sys_strerror}
644 per \var{errno}, ma che usano il valore di \var{h\_errno}; la prima è
645 \funcd{herror} ed il suo prototipo è:
646
647 {\centering
648 \vspace{3pt}
649 \begin{funcbox}{
650 \fhead{netdb.h}
651 \fdecl{void herror(const char *string)}
652 \fdesc{Stampa un errore di risoluzione.} 
653 }
654 \end{funcbox}}
655
656 La funzione è l'analoga di \func{perror} e stampa sullo \textit{standard error} un
657 messaggio di errore corrispondente al valore corrente di \var{h\_errno}, a cui
658 viene anteposta la stringa \param{string} passata come argomento.  La seconda
659 funzione è \funcd{hstrerror} ed il suo prototipo è:
660
661 {\centering
662 \vspace{3pt}
663 \begin{funcbox}{
664 \fhead{netdb.h}
665 \fdecl{const char *hstrerror(int err)}
666 \fdesc{Restituisce una stringa corrispondente ad un errore di risoluzione.}
667 }
668 \end{funcbox}}
669
670 \noindent che, come  l'analoga \func{strerror}, restituisce una stringa con un
671 messaggio di errore già formattato, corrispondente al codice passato come
672 argomento (che si presume sia dato da \var{h\_errno}).
673
674 \itindend{resolver}
675
676
677 \subsection{La vecchia interfaccia per la risoluzione dei nomi a dominio}
678 \label{sec:sock_name_services}
679
680 La principale funzionalità del \textit{resolver} resta quella di risolvere i
681 nomi a dominio in indirizzi IP, per cui non ci dedicheremo oltre alle funzioni
682 per effetture delle richieste generiche al DNS ed esamineremo invece le
683 funzioni del \textit{resolver} dedicate specificamente a questo. Tratteremo in
684 questa sezione l'interfaccia tradizionale, che ormai è deprecata, mentre
685 vedremo nella sezione seguente la nuova interfaccia.
686
687 La prima funzione dell'interfaccia tradizionale è \funcd{gethostbyname} il cui
688 scopo è ottenere l'indirizzo di una stazione noto il suo nome a dominio, il
689 suo prototipo è:
690
691 \begin{funcproto}{
692 \fhead{netdb.h}
693 \fdecl{struct hostent *gethostbyname(const char *name)}
694 \fdesc{Determina l'indirizzo associato ad un nome a dominio.} 
695 }
696
697 {La funzione ritorna il puntatore ad una
698   struttura di tipo \struct{hostent} contenente i dati associati al nome a
699   dominio in caso di successo o un puntatore nullo per un errore.}
700 \end{funcproto}
701
702 La funzione prende come argomento una stringa \param{name} contenente il nome
703 a dominio che si vuole risolvere, in caso di successo i dati ad esso relativi
704 vengono memorizzati in una opportuna struttura \struct{hostent} la cui
705 definizione è riportata in fig.~\ref{fig:sock_hostent_struct}. 
706
707 \begin{figure}[!htb]
708   \footnotesize \centering
709   \begin{minipage}[c]{0.80\textwidth}
710     \includestruct{listati/hostent.h}
711   \end{minipage}
712   \caption{La struttura \structd{hostent} per la risoluzione dei nomi a
713     dominio e degli indirizzi IP.}
714   \label{fig:sock_hostent_struct}
715 \end{figure}
716
717 Quando un programma chiama \func{gethostbyname} e questa usa il DNS per
718 effettuare la risoluzione del nome, è con i valori contenuti nei relativi
719 record che vengono riempite le varie parti della struttura \struct{hostent}.
720 Il primo campo della struttura, \var{h\_name} contiene sempre il \textsl{nome
721   canonico}, che nel caso del DNS è appunto il nome associato ad un record
722 \texttt{A}. Il secondo campo della struttura, \var{h\_aliases}, invece è un
723 puntatore ad vettore di puntatori, terminato da un puntatore nullo. Ciascun
724 puntatore del vettore punta ad una stringa contenente uno degli altri
725 possibili nomi associati allo stesso \textsl{nome canonico} (quelli che nel
726 DNS vengono inseriti come record di tipo \texttt{CNAME}).
727
728 Il terzo campo della struttura, \var{h\_addrtype}, indica il tipo di indirizzo
729 che è stato restituito, e può assumere soltanto i valori \const{AF\_INET} o
730 \const{AF\_INET6}, mentre il quarto campo, \var{h\_length}, indica la
731 lunghezza dell'indirizzo stesso in byte. 
732
733 Infine il campo \var{h\_addr\_list} è il puntatore ad un vettore di puntatori
734 ai singoli indirizzi; il vettore è terminato da un puntatore nullo.  Inoltre,
735 come illustrato in fig.~\ref{fig:sock_hostent_struct}, viene definito il campo
736 \var{h\_addr} come sinonimo di \code{h\_addr\_list[0]}, cioè un riferimento
737 diretto al primo indirizzo della lista.
738
739 Oltre ai normali nomi a dominio la funzione accetta come argomento
740 \param{name} anche indirizzi numerici, in formato dotted decimal per IPv4 o
741 con la notazione illustrata in sez.~\ref{sec:IP_ipv6_notation} per IPv6. In
742 tal caso \func{gethostbyname} non eseguirà nessuna interrogazione remota, ma
743 si limiterà a copiare la stringa nel campo \var{h\_name} ed a creare la
744 corrispondente struttura \var{in\_addr} da indirizzare con
745 \code{h\_addr\_list[0]}.
746
747 Con l'uso di \func{gethostbyname} si ottengono solo gli indirizzi IPv4, se si
748 vogliono ottenere degli indirizzi IPv6 occorrerà prima impostare l'opzione
749 \const{RES\_USE\_INET6} nel campo \texttt{\_res.options} e poi chiamare
750 \func{res\_init} (vedi sez.~\ref{sec:sock_resolver_functions}) per modificare
751 le opzioni del \textit{resolver}; dato che questo non è molto comodo è stata
752 definita (è una estensione fornita dalle \acr{glibc}, disponibile anche in
753 altri sistemi unix-like) un'altra funzione, \funcd{gethostbyname2}, il cui
754 prototipo è:
755
756 \begin{funcproto}{
757 \fhead{netdb.h}
758 \fhead{sys/socket.h}
759 \fdecl{struct hostent *gethostbyname2(const char *name, int af)}
760 \fdesc{Determina l'indirizzo del tipo scelto associato ad un nome a dominio.} 
761 }
762
763 {La funzione ritorna il puntatore ad una
764   struttura di tipo \struct{hostent} contenente i dati associati al nome a
765   dominio in caso di successo e  un puntatore nullo per un errore.}
766 \end{funcproto}
767
768 In questo caso la funzione prende un secondo argomento \param{af} che indica
769 quale famiglia di indirizzi è quella che dovrà essere utilizzata per
770 selezionare i risultati restituiti dalla funzione; i soli valori consentiti
771 sono \const{AF\_INET} o \const{AF\_INET6} per indicare rispettivamente IPv4 e
772 IPv6 (per questo è necessario l'uso di \headfile{sys/socket.h}). Per tutto il
773 resto la funzione è identica a \func{gethostbyname}, ed identici sono i suoi
774 risultati.
775
776 \begin{figure}[!htb]
777   \footnotesize \centering
778   \begin{minipage}[c]{\codesamplewidth}
779     \includecodesample{listati/mygethost.c}
780   \end{minipage}
781   \normalsize
782   \caption{Esempio di codice per la risoluzione di un indirizzo.}
783   \label{fig:mygethost_example}
784 \end{figure}
785
786 Vediamo allora un primo esempio dell'uso delle funzioni di risoluzione, in
787 fig.~\ref{fig:mygethost_example} è riportato un estratto del codice di un
788 programma che esegue una semplice interrogazione al \textit{resolver} usando
789 \func{gethostbyname} e poi ne stampa a video i risultati. Al solito il
790 sorgente completo, che comprende il trattamento delle opzioni ed una funzione
791 per stampare un messaggio di aiuto, è nel file \texttt{mygethost.c} dei
792 sorgenti allegati alla guida.
793
794 Il programma richiede un solo argomento che specifichi il nome da cercare,
795 senza il quale (\texttt{\small 15--18}) esce con un errore. Dopo di che
796 (\texttt{\small 20}) si limita a chiamare \func{gethostbyname}, ricevendo il
797 risultato nel puntatore \var{data}. Questo (\texttt{\small 21--24}) viene
798 controllato per rilevare eventuali errori, nel qual caso il programma esce
799 dopo aver stampato un messaggio con \func{herror}. 
800
801 Se invece la risoluzione è andata a buon fine si inizia (\texttt{\small 25})
802 con lo stampare il nome canonico, dopo di che (\texttt{\small 26--30}) si
803 stampano eventuali altri nomi. Per questo prima (\texttt{\small 26}) si prende
804 il puntatore alla cima della lista che contiene i nomi e poi (\texttt{\small
805   27--30}) si esegue un ciclo che sarà ripetuto fin tanto che nella lista si
806 troveranno dei puntatori validi per le stringhe dei nomi (si ricordi che la
807 lista viene terminata da un puntatore nullo); prima (\texttt{\small 28}) si
808 stamperà la stringa e poi (\texttt{\small 29}) si provvederà ad incrementare
809 il puntatore per passare al successivo elemento della lista.
810
811 Una volta stampati i nomi si passerà a stampare gli indirizzi, il primo passo
812 (\texttt{\small 31--38}) è allora quello di riconoscere il tipo di indirizzo
813 sulla base del valore del campo \var{h\_addrtype}, stampandolo a video. Si è
814 anche previsto di stampare un errore nel caso (che non dovrebbe mai accadere)
815 di un indirizzo non valido.
816
817 Infine (\texttt{\small 39--44}) si stamperanno i valori degli indirizzi, di
818 nuovo (\texttt{\small 39}) si inizializzerà un puntatore alla cima della lista
819 e si eseguirà un ciclo fintanto che questo punterà ad indirizzi validi in
820 maniera analoga a quanto fatto in precedenza per i nomi a dominio. Si noti
821 come, essendo il campo \var{h\_addr\_list} un puntatore ad strutture di
822 indirizzi generiche, questo sia ancora di tipo \texttt{char **} e si possa
823 riutilizzare lo stesso puntatore usato per i nomi.
824
825 Per ciascun indirizzo valido si provvederà (\texttt{\small 41}) ad una
826 conversione con la funzione \func{inet\_ntop} (vedi
827 sez.~\ref{sec:sock_addr_func}) passandole gli opportuni argomenti, questa
828 restituirà la stringa da stampare (\texttt{\small 42}) con il valore
829 dell'indirizzo in \var{buffer}, che si è avuto la cura di dichiarare
830 inizialmente (\texttt{\small 10}) con dimensioni adeguate; dato che la
831 funzione è in grado di tenere conto automaticamente del tipo di indirizzo non
832 ci sono precauzioni particolari da prendere.\footnote{volendo essere pignoli
833   si dovrebbe controllarne lo stato di uscita, lo si è tralasciato per non
834   appesantire il codice, dato che in caso di indirizzi non validi si sarebbe
835   avuto un errore con \func{gethostbyname}, ma si ricordi che la sicurezza non
836   è mai troppa.}
837
838 Le funzioni illustrate finora hanno un difetto: utilizzano tutte una area di
839 memoria interna per allocare i contenuti della struttura \struct{hostent} e
840 per questo non possono essere rientranti. L'uso della memoria interna inoltre
841 comporta anche che in due successive chiamate i dati potranno essere
842 sovrascritti.
843
844 Si tenga presente poi che copiare il contenuto della sola struttura non è
845 sufficiente per salvare tutti i dati, in quanto questa contiene puntatori ad
846 altri dati, che pure possono essere sovrascritti; per questo motivo, se si
847 vuole salvare il risultato di una chiamata, occorrerà eseguire quella che si
848 chiama una \itindex{deep~copy} \textit{deep copy}.\footnote{si chiama così
849   quella tecnica per cui, quando si deve copiare il contenuto di una struttura
850   complessa (con puntatori che puntano ad altri dati, che a loro volta possono
851   essere puntatori ad altri dati) si deve copiare non solo il contenuto della
852   struttura, ma eseguire una scansione per risolvere anche tutti i puntatori
853   contenuti in essa (e così via se vi sono altre sotto-strutture con altri
854   puntatori) e copiare anche i dati da questi referenziati.}
855
856 Per ovviare a questi problemi nelle \acr{glibc} sono definite anche delle
857 versioni rientranti delle precedenti funzioni, al solito queste sono
858 caratterizzate dall'avere un suffisso \texttt{\_r}, pertanto avremo le due
859 funzioni \funcd{gethostbyname\_r} e \funcd{gethostbyname2\_r} i cui prototipi
860 sono:
861
862 \begin{funcproto}{
863 \fhead{netdb.h}
864 \fhead{sys/socket.h}
865 \fdecl{int gethostbyname\_r(const char *name, struct hostent *ret, 
866     char *buf, size\_t buflen,\\
867 \phantom{int gethostbyname\_r(}struct hostent **result, int *h\_errnop)}
868 \fdecl{int gethostbyname2\_r(const char *name, int af,
869          struct hostent *ret, char *buf,\\
870 \phantom{int gethostbyname2\_r(}size\_t buflen, struct hostent **result, int *h\_errnop)}
871
872 \fdesc{Versioni rientranti delle funzioni \func{gethostbyname} e
873   \func{gethostbyname2}.} 
874 }
875
876 {Le funzioni ritornano $0$ in caso di successo ed un valore diverso da zero per
877   un errore.}
878 \end{funcproto}
879
880 Gli argomenti \param{name} (e \param{af} per \func{gethostbyname2\_r}) hanno
881 lo stesso significato visto in precedenza. Tutti gli altri argomenti hanno lo
882 stesso significato per entrambe le funzioni. Per evitare l'uso di variabili
883 globali si dovrà allocare preventivamente una struttura \struct{hostent} in
884 cui ricevere il risultato, passandone l'indirizzo alla funzione nell'argomento
885 \param{ret}.  Inoltre, dato che \struct{hostent} contiene dei puntatori, dovrà
886 essere allocato anche un buffer in cui le funzioni possano scrivere tutti i
887 dati del risultato dell'interrogazione da questi puntati; l'indirizzo e la
888 lunghezza di questo buffer devono essere indicati con gli argomenti
889 \param{buf} e \param{buflen}.
890
891 Gli ultimi due argomenti vengono utilizzati per avere indietro i risultati
892 come \textit{value result argument}, si deve specificare l'indirizzo della
893 variabile su cui la funzione dovrà salvare il codice di errore
894 con \param{h\_errnop} e quello su cui dovrà salvare il puntatore che si userà
895 per accedere i dati con \param{result}.
896
897 In caso di successo entrambe le funzioni restituiscono un valore nullo,
898 altrimenti restituiscono un valore non nulla e all'indirizzo puntato
899 da \param{result} sarà salvato un puntatore nullo, mentre a quello puntato da
900 \param{h\_errnop} sarà salvato il valore del codice di errore, dato che per
901 essere rientrante la funzione non può la variabile globale \var{h\_errno}. In
902 questo caso il codice di errore, oltre ai valori di
903 tab.~\ref{tab:h_errno_values}, può avere anche quello di \errcode{ERANGE}
904 qualora il buffer allocato su \param{buf} non sia sufficiente a contenere i
905 dati, in tal caso si dovrà semplicemente ripetere l'esecuzione della funzione
906 con un buffer di dimensione maggiore.
907
908 Una delle caratteristiche delle interrogazioni al servizio DNS è che queste
909 sono normalmente eseguite con il protocollo UDP, ci sono casi in cui si
910 preferisce che vengano usate connessioni permanenti con il protocollo TCP. Per
911 ottenere questo sono previste delle funzioni apposite (si potrebbero impostare
912 direttamente le opzioni di \var{\_\_res.options}, ma queste funzioni
913 permettono di semplificare la procedura); la prime sono \funcd{sethostent} e
914 \func{endhostent}, il cui prototipo è:
915
916 \begin{funcproto}{
917 \fhead{netdb.h}
918 \fdecl{void sethostent(int stayopen)}
919 \fdesc{Richiede l'uso di connessioni TCP per le interrogazioni ad un server DNS.} 
920 \fdecl{void endhostent(void)}
921 \fdesc{Disattiva l'uso di connessioni TCP per le interrogazioni ad un server DNS.} 
922 }
923
924 {Le funzioni non restituiscono nulla, e non danno errori.}
925 \end{funcproto}
926
927 La funzione \func{sethostent} permette di richiedere l'uso di connessioni TCP
928 per la richiesta dei dati, e che queste restino aperte per successive
929 richieste; il valore dell'argomento \param{stayopen} indica se attivare questa
930 funzionalità, un valore diverso da zero, che indica una condizione vera in C,
931 attiva la funzionalità.  Per disattivare l'uso delle connessioni TCP si può
932 invece usare \func{endhostent}, e come si vede la funzione è estremamente
933 semplice, non richiedendo nessun argomento.
934
935 Infine si può richiedere la risoluzione inversa di un indirizzo IP od IPv6,
936 per ottenerne il nome a dominio ad esso associato, per fare questo si può
937 usare la funzione \funcd{gethostbyaddr}, il cui prototipo è:
938
939 \begin{funcproto}{
940 \fhead{netdb.h}
941 \fhead{sys/socket.h} 
942 \fdecl{struct hostent *gethostbyaddr(const char *addr, int len, int type)}
943 \fdesc{Richiede la risoluzione inversa di un indirizzo IP.} 
944 }
945
946 {La funzione ritorna l'indirizzo ad una struttura \struct{hostent} in caso di
947   successo e \val{NULL} per un errore.}
948 \end{funcproto}
949
950 In questo caso l'argomento \param{addr} dovrà essere il puntatore ad una
951 appropriata struttura contenente il valore dell'indirizzo IP (o IPv6) che si
952 vuole risolvere. L'uso del tipo \texttt{char *} per questo argomento è
953 storico, il dato dovrà essere fornito in una struttura \struct{in\_addr} per
954 un indirizzo IPv4 ed una struttura \struct{in6\_addr} per un indirizzo IPv6.
955
956 Si ricordi inoltre, come illustrato in fig.~\ref{fig:sock_sa_ipv4_struct}, che
957 mentre \struct{in\_addr} corrisponde in realtà ad un oridinario numero intero
958 a 32 bit  (da esprimere comunque in \textit{network order}) non altrettanto
959 avviene per \struct{in6\_addr}, pertanto è sempre opportuno inizializzare
960 questi indirizzi con \func{inet\_pton} (vedi
961 sez.~\ref{sec:sock_conv_func_gen}).
962
963 Nell'argomento \param{len} se ne dovrà poi specificare la dimensione
964 (rispettivamente 4 o 16), infine l'argomento
965 \param{type} deve indicare il tipo di indirizzo, e dovrà essere o
966 \const{AF\_INET} o \const{AF\_INET6}.
967
968 La funzione restituisce, in caso di successo, un puntatore ad una struttura
969 \struct{hostent}, solo che in questo caso la ricerca viene eseguita
970 richiedendo al DNS un record di tipo \texttt{PTR} corrispondente all'indirizzo
971 specificato. In caso di errore al solito viene usata la variabile
972 \var{h\_errno} per restituire un opportuno codice. In questo caso l'unico
973 campo del risultato che interessa è \var{h\_name} che conterrà il nome a
974 dominio, la funzione comunque inizializza anche il primo campo della lista
975 \var{h\_addr\_list} col valore dell'indirizzo passato come argomento.
976
977 Dato che \func{gethostbyaddr} usa un buffer statico, anche di questa funzione
978 esiste una versione rientrante \funcd{gethostbyaddr\_r} fornita come
979 estensione dalle \acr{glibc}, il cui prototipo è:
980
981 \begin{funcproto}{
982 \fhead{netdb.h}
983 \fhead{sys/socket.h} 
984 \fdecl{struct hostent *gethostbyaddr\_r(const void *addr, socklen\_t len, int type,\\
985 \phantom{struct hostent *gethostbyaddr\_r(}struct hostent *ret, char *buf, size\_t buflen,\\
986 \phantom{struct hostent *gethostbyaddr\_r(}struct hostent **result, int *h\_errnop);}
987 \fdesc{Richiede la risoluzione inversa di un indirizzo IP.} 
988 }
989
990 {La funzione ritorna $0$ in caso di successo e un valore non nullo per un errore.}
991 \end{funcproto}
992
993 La funzione prende per gli argomenti \param{addr}, \param{len} e \param{type}
994 gli stessi valori di \func{gethostbyaddr} con lo stesso significato, gli
995 argomenti successivi vengono utilizzati per restituire i dati, sono identici a
996 quelli già illustrati in per \func{gethostbyname\_r} e
997 \func{gethostbyname2\_r} e devono essere usati allo stesso modo.
998
999 Infine lo standard POSIX prevede la presenza della funzione
1000 \funcd{gethostent}, il cui prototipo è:
1001
1002 \begin{funcproto}{
1003 \fhead{netdb.h}
1004 \fdecl{struct hostent *gethostent(void)}
1005 \fdesc{Ottiene la voce successiva nel database dei nomi a dominio.} 
1006 }
1007
1008 {La funzione ritorna l'indirizzo ad una struttura \struct{hostent} in caso di
1009   successo e \val{NULL} per un errore.}
1010 \end{funcproto}
1011
1012 La funzione dovrebbe ritornare (come puntatore alla solita struttura
1013 \struct{hostent} allocata internamente) la voce successiva nel database dei
1014 nomi a dominio, ma questo ha un significato soltato quando è relativo alla
1015 lettura dei dati da un file come \conffile{/etc/hosts} e non per i risultati
1016 del DNS. Nel caso della \acr{glibc} questa viene usata allora solo per la
1017 lettura delle voci presenti in quest'ultimo, come avviene anche in altri
1018 sistemi unix-like, ed inoltre ignora le voci relative ad indirizzi IPv6.
1019
1020 Della stessa funzione le \acr{glibc} forniscono anche una versione rientrante
1021 \funcd{gethostent\_r}, il cui prototipo è:
1022
1023 \begin{funcproto}{
1024 \fhead{netdb.h}
1025 \fdecl{struct hostent *gethostent\_r(struct hostent *ret, char *buf, size\_t buflen,\\
1026 \phantom{struct hostent *gethostent\_r(}struct hostent **result, int *h\_errnop);}
1027 \fdesc{Ottiene la voce successiva nel database dei nomi a dominio.} 
1028 }
1029
1030 {La funzione ritorna $0$ in caso di successo e un valore non nullo per un errore.}
1031 \end{funcproto}
1032
1033 La funzione ha lo stesso effetto di \func{gethostent}; gli argomenti servono a
1034 restituire i risultati in maniera rientrante e vanno usati secondo le modalità
1035 già illustrate per \func{gethostbyname\_r} e \func{gethostbyname2\_r}.
1036
1037 Dati i limiti delle funzioni \func{gethostbyname} e \func{gethostbyaddr} con
1038 l'uso di memoria statica che può essere sovrascritta fra due chiamate
1039 successive, e per avere sempre la possibilità di indicare esplicitamente il
1040 tipo di indirizzi voluto (cosa che non è possibile con \func{gethostbyname}),
1041 è stata successivamente proposta,
1042 nell'\href{http://www.ietf.org/rfc/rfc2553.txt}{RFC~2553} un diversa
1043 interfaccia con l'introduzione due nuove funzioni di
1044 risoluzione,\footnote{dette funzioni sono presenti nelle \acr{glibc} versione
1045   2.1.96, ma essendo considerate deprecate (vedi
1046   sez.~\ref{sec:sock_advanced_name_services}) sono state rimosse nelle
1047   versioni successive.} \funcd{getipnodebyname} e \funcd{getipnodebyaddr}, i
1048 cui prototipi sono:
1049
1050 \begin{funcproto}{
1051 \fhead{netdb.h}
1052 \fhead{sys/types.h}
1053 \fhead{sys/socket.h}
1054 \fdecl{struct hostent *getipnodebyname(const char *name, int af, int
1055     flags, int *error\_num)} 
1056 \fdesc{Richiede la risoluzione di un nome a dominio.} 
1057 \fdecl{struct hostent *getipnodebyaddr(const void *addr, size\_t len,
1058     int af, int *error\_num)}
1059 \fdesc{Richiede la risoluzione inversa di un indirizzo IP.} 
1060 }
1061
1062 {Le funzioni ritornano l'indirizzo ad una struttura \struct{hostent} in caso
1063   di successo e \val{NULL} per un errore.}
1064 \end{funcproto}
1065
1066 Entrambe le funzioni supportano esplicitamente la scelta di una famiglia di
1067 indirizzi con l'argomento \param{af} (che può assumere i valori
1068 \const{AF\_INET} o \const{AF\_INET6}), e restituiscono un codice di errore
1069 (con valori identici a quelli precedentemente illustrati in
1070 tab.~\ref{tab:h_errno_values}) nella variabile puntata da \param{error\_num}.
1071 La funzione \func{getipnodebyaddr} richiede poi che si specifichi l'indirizzo
1072 come per \func{gethostbyaddr} passando anche la lunghezza dello stesso
1073 nell'argomento \param{len}.
1074
1075 La funzione \func{getipnodebyname} prende come primo argomento il nome da
1076 risolvere, inoltre prevede un apposito argomento \param{flags}, da usare come
1077 maschera binaria, che permette di specificarne il comportamento nella
1078 risoluzione dei diversi tipi di indirizzi (IPv4 e IPv6); ciascun bit
1079 dell'argomento esprime una diversa opzione, e queste possono essere specificate
1080 con un OR aritmetico delle costanti riportate in
1081 tab.~\ref{tab:sock_getipnodebyname_flags}.
1082
1083 \begin{table}[!htb]
1084   \centering
1085   \footnotesize
1086   \begin{tabular}[c]{|l|p{8cm}|}
1087     \hline
1088     \textbf{Costante} & \textbf{Significato} \\
1089     \hline
1090     \hline
1091     \constd{AI\_V4MAPPED}  & Usato con \const{AF\_INET6} per richiedere una
1092                              ricerca su un indirizzo IPv4 invece che IPv6; gli
1093                              eventuali risultati saranno rimappati su indirizzi 
1094                              IPv6.\\
1095     \constd{AI\_ALL}       & Usato con \const{AI\_V4MAPPED}; richiede sia
1096                              indirizzi IPv4 che IPv6, e gli indirizzi IPv4
1097                              saranno rimappati in IPv6.\\
1098     \constd{AI\_ADDRCONFIG}& Richiede che una richiesta IPv4 o IPv6 venga
1099                              eseguita solo se almeno una interfaccia del
1100                              sistema è associata ad un indirizzo di tale tipo.\\
1101     \constd{AI\_DEFAULT}   & Il valore di default, è equivalente alla
1102                              combinazione di \const{AI\_ADDRCONFIG} e di
1103                              \const{AI\_V4MAPPED}.\\  
1104     \hline
1105   \end{tabular}
1106   \caption{Valori possibili per i bit dell'argomento \param{flags} della
1107     funzione \func{getipnodebyname}.}
1108   \label{tab:sock_getipnodebyname_flags}
1109 \end{table}
1110
1111 Entrambe le funzioni restituiscono un puntatore ad una struttura \var{hostent}
1112 che contiene i risultati della ricerca, che viene allocata dinamicamente
1113 insieme a tutto lo spazio necessario a contenere i dati in essa referenziati;
1114 per questo motivo queste funzioni non soffrono dei problemi dovuti all'uso di
1115 una sezione statica di memoria presenti con le precedenti \func{gethostbyname}
1116 e \func{gethostbyaddr}.  L'uso di una allocazione dinamica però comporta anche
1117 la necessità di disallocare esplicitamente la memoria occupata dai risultati
1118 una volta che questi non siano più necessari; a tale scopo viene fornita la
1119 funzione \funcd{freehostent}, il cui prototipo è:
1120
1121 \begin{funcproto}{
1122 \fhead{netdb.h}
1123 \fhead{sys/types.h}
1124 \fhead{sys/socket.h}
1125 \fdecl{void freehostent(struct hostent *ip)}
1126 \fdesc{Disalloca una struttura \var{hostent}.} 
1127 }
1128
1129 {La funzione non ritorna nulla, e non da errori.}
1130 \end{funcproto}
1131
1132 La funzione permette di disallocare una struttura \var{hostent}
1133 precedentemente allocata in una chiamata di \func{getipnodebyname} o
1134 \func{getipnodebyaddr}, e prende come argomento l'indirizzo restituito da una
1135 di queste funzioni.
1136
1137 Infine per concludere la nostra panoramica sulle funzioni di risoluzione dei
1138 nomi dobbiamo citare le funzioni che permettono di interrogare gli altri
1139 servizi di risoluzione dei nomi illustrati in sez.~\ref{sec:sock_resolver}; in
1140 generale infatti ci sono una serie di funzioni nella forma
1141 \texttt{get\textsl{XXX}byname} e \texttt{get\textsl{XXX}byaddr} (dove
1142 \texttt{\textsl{XXX}} indica il servizio) per ciascuna delle informazioni di
1143 rete mantenute dal \textit{Name Service Switch} che permettono rispettivamente
1144 di trovare una corrispondenza cercando per nome o per numero.
1145
1146 L'elenco di queste funzioni è riportato nelle colonne finali di
1147 tab.~\ref{tab:name_resolution_functions}, dove le si sono suddivise rispetto
1148 al tipo di informazione che forniscono (riportato in prima colonna). Nella
1149 tabella si è anche riportato il file su cui vengono ordinariamente mantenute
1150 queste informazioni, che però può essere sostituito da un qualunque supporto
1151 interno al \textit{Name Service Switch} (anche se usualmente questo avviene
1152 solo per la risoluzione degli indirizzi).  Ciascuna funzione fa riferimento ad
1153 una sua apposita struttura che contiene i relativi dati, riportata in terza
1154 colonna.
1155
1156 \begin{table}[!htb]
1157   \centering
1158   \footnotesize
1159   \begin{tabular}[c]{|l|l|l|l|l|}
1160     \hline
1161     \textbf{Informazione}&\textbf{File}&\textbf{Struttura}&
1162     \multicolumn{2}{|c|}{\textbf{Funzioni}}\\
1163     \hline
1164     \hline
1165     indirizzo &\conffile{/etc/hosts}&\struct{hostent}&\func{gethostbyname}&
1166                \func{gethostbyaddr}\\ 
1167     servizio  &\conffile{/etc/services}&\struct{servent}&\func{getservbyname}&
1168                \func{getservbyport}\\ 
1169     rete      &\conffile{/etc/networks}&\struct{netent}&\funcm{getnetbyname}&
1170                \funcm{getnetbyaddr}\\ 
1171     protocollo&\conffile{/etc/protocols}&\struct{protoent}&
1172                \funcm{getprotobyname}&\funcm{getprotobyaddr}\\ 
1173     \hline
1174   \end{tabular}
1175   \caption{Funzioni di risoluzione dei nomi per i vari servizi del
1176     \textit{Name Service Switch} riguardanti la rete.}
1177   \label{tab:name_resolution_functions}
1178 \end{table}
1179
1180 Delle funzioni di tab.~\ref{tab:name_resolution_functions} abbiamo trattato
1181 finora soltanto quelle relative alla risoluzione dei nomi, dato che sono le
1182 più usate, e prevedono praticamente da sempre la necessità di rivolgersi ad
1183 una entità esterna; per le altre invece, estensioni fornite dal \textit{Name
1184   Service Switch} a parte, si fa sempre riferimento ai dati mantenuti nei
1185 rispettivi file.
1186
1187 Dopo la risoluzione dei nomi a dominio una delle ricerche più comuni è quella
1188 sui nomi dei servizi di rete più comuni (cioè \texttt{http}, \texttt{smtp},
1189 ecc.) da associare alle rispettive porte. Le due funzioni da utilizzare per
1190 questo sono \funcd{getservbyname} e \funcd{getservbyport}, che permettono
1191 rispettivamente di ottenere il numero di porta associato ad un servizio dato
1192 il nome e viceversa; i loro prototipi sono:
1193
1194
1195
1196 \begin{funcproto}{
1197 \fhead{netdb.h} 
1198 \fdecl{struct servent *getservbyname(const char *name, const char *proto)}
1199 \fdecl{struct servent *getservbyport(int port, const char *proto)} 
1200 \fdesc{Risolvono il nome di un servizio nel rispettivo numero di porta e viceversa.} 
1201 }
1202
1203 {Le funzioni ritornano il puntatore ad una struttura \struct{servent} con i
1204     risultati in caso di successo e \val{NULL} per un errore.}
1205 \end{funcproto}
1206
1207 Entrambe le funzioni prendono come ultimo argomento una stringa \param{proto}
1208 che indica il protocollo per il quale si intende effettuare la ricerca (le
1209 informazioni mantenute in \conffile{/etc/services} infatti sono relative sia
1210 alle porte usate su UDP che su TCP, occorre quindi specificare a quale dei due
1211 protocolli si fa riferimento) che nel caso di IP può avere come valori
1212 possibili solo \texttt{udp} o \texttt{tcp};\footnote{in teoria si potrebbe
1213   avere un qualunque protocollo fra quelli citati in
1214   \conffile{/etc/protocols}, posto che lo stesso supporti il concetto di
1215   \textsl{porta}, in pratica questi due sono gli unici presenti.}  se si
1216 specifica un puntatore nullo la ricerca sarà eseguita su un protocollo
1217 qualsiasi.
1218
1219 Il primo argomento è il nome del servizio per \func{getservbyname},
1220 specificato tramite la stringa \param{name}, mentre \func{getservbyport}
1221 richiede il numero di porta in \param{port}. Entrambe le funzioni eseguono una
1222 ricerca sul file \conffile{/etc/services}\footnote{il \textit{Name Service
1223     Switch} astrae il concetto a qualunque supporto su cui si possano
1224   mantenere i suddetti dati.}  ed estraggono i dati dalla prima riga che
1225 corrisponde agli argomenti specificati; se la risoluzione ha successo viene
1226 restituito un puntatore ad una apposita struttura \struct{servent} contenente
1227 tutti i risultati, altrimenti viene restituito un puntatore nullo.  Si tenga
1228 presente che anche in questo caso i dati vengono mantenuti in una area di
1229 memoria statica e che quindi la funzione non è rientrante.
1230
1231 \begin{figure}[!htb]
1232   \footnotesize \centering
1233   \begin{minipage}[c]{0.80\textwidth}
1234     \includestruct{listati/servent.h}
1235   \end{minipage}
1236   \caption{La struttura \structd{servent} per la risoluzione dei nomi dei
1237     servizi e dei numeri di porta.}
1238   \label{fig:sock_servent_struct}
1239 \end{figure}
1240
1241 La definizione della struttura \struct{servent} è riportata in
1242 fig.~\ref{fig:sock_servent_struct}, il primo campo, \var{s\_name} contiene
1243 sempre il nome canonico del servizio, mentre \var{s\_aliases} è un puntatore
1244 ad un vettore di stringhe contenenti gli eventuali nomi alternativi
1245 utilizzabili per identificare lo stesso servizio. Infine \var{s\_port}
1246 contiene il numero di porta e \var{s\_proto} il nome del protocollo.
1247
1248 Come riportato in tab.~\ref{tab:name_resolution_functions} ci sono analoghe
1249 funzioni per la risoluzione del nome dei protocolli e delle reti; non staremo
1250 a descriverle nei dettagli, in quanto il loro uso è molto limitato, esse
1251 comunque utilizzano una loro struttura dedicata del tutto analoga alle
1252 precedenti: tutti i dettagli relativi al loro funzionamento possono essere
1253 trovati nelle rispettive pagine di manuale.
1254
1255 Oltre alle funzioni di ricerca esistono delle ulteriori funzioni che prevedono
1256 una lettura sequenziale delle informazioni mantenute nel \textit{Name Service
1257   Switch} (in sostanza permettono di leggere i file contenenti le informazioni
1258 riga per riga), che sono analoghe a quelle elencate in
1259 tab.~\ref{tab:sys_passwd_func} per le informazioni relative ai dati degli
1260 utenti e dei gruppi. Nel caso specifico dei servizi avremo allora le tre
1261 funzioni \funcd{setservent}, \funcd{getservent} e \funcd{endservent} i cui
1262 prototipi sono:
1263
1264 \begin{funcproto}{
1265 \fhead{netdb.h} 
1266 \fdecl{struct servent *getservent(void)}
1267 \fdesc{Legge la voce successiva nel file \conffile{/etc/services}.} 
1268 \fdecl{void setservent(int stayopen)} 
1269 \fdesc{Apre il file \conffile{/etc/services} e si posiziona al suo inizio.} 
1270 \fdecl{void endservent(void)}
1271 \fdesc{Chiude il file \conffile{/etc/services}.} 
1272 }
1273
1274 {Le due funzioni \func{setservent} e \func{endservent} non ritornano nulla,
1275   \func{getservent} restituisce il puntatore ad una struttura \struct{servent}
1276   in caso di successo e \val{NULL} per un errore o fine del file.}
1277 \end{funcproto}
1278
1279 La prima funzione, \func{getservent}, legge una singola voce a partire dalla
1280 posizione corrente in \conffile{/etc/services}, pertanto si può eseguire una
1281 lettura sequenziale dello stesso invocandola più volte. Se il file non è
1282 aperto provvede automaticamente ad aprirlo, nel qual caso leggerà la prima
1283 voce. La seconda funzione, \func{setservent}, permette di aprire il file
1284 \conffile{/etc/services} per una successiva lettura, ma se il file è già stato
1285 aperto riporta la posizione di lettura alla prima voce del file, in questo
1286 modo si può far ricominciare da capo una lettura sequenziale. 
1287
1288 \begin{table}[!htb]
1289   \centering
1290   \footnotesize
1291   \begin{tabular}[c]{|l|l|l|l|}
1292     \hline
1293     \textbf{Informazione}&\multicolumn{3}{|c|}{\textbf{Funzioni}}\\
1294     \hline
1295     \hline
1296     indirizzo &\func{sethostent} &\func{gethostent} &\func{endhostent} \\
1297     servizio  &\func{setservent} &\func{getservent} &\func{endservent}\\ 
1298     rete      &\funcm{setnetent}  &\funcm{getnetent}  &\funcm{endnetent}\\ 
1299     protocollo&\funcm{setprotoent}&\funcm{getprotoent}&\funcm{endprotoent}\\ 
1300     \hline
1301   \end{tabular}
1302   \caption{Funzioni lettura sequenziale dei dati del
1303     \textit{Name Service Switch}.} 
1304   \label{tab:name_sequential_read}
1305 \end{table}
1306
1307 L'argomento \param{stayopen} di \func{setservent}, se diverso da zero, fa sì
1308 che il file resti aperto anche fra diverse chiamate a \func{getservbyname} e
1309 \func{getservbyport}; di default dopo una chiamata a queste funzioni il file
1310 viene chiuso, cosicché una successiva chiamata a \func{getservent} riparte
1311 dall'inizio.  La terza funzione, \func{endservent}, provvede semplicemente a
1312 chiudere il file.
1313
1314 Queste tre funzioni per la lettura sequenziale di nuovo sono presenti per
1315 ciascuno dei vari tipi di informazione relative alle reti di
1316 tab.~\ref{tab:name_resolution_functions}; questo significa che esistono
1317 altrettante funzioni nella forma \texttt{setXXXent}, \texttt{getXXXent} e
1318 \texttt{endXXXent}, analoghe alle precedenti per la risoluzione dei servizi,
1319 che abbiamo riportato in tab.~\ref{tab:name_sequential_read}.  Essendo, a
1320 parte il tipo di informazione che viene trattato, sostanzialmente identiche
1321 nel funzionamento e di scarso utilizzo, non staremo a trattarle una per una,
1322 rimandando alle rispettive pagine di manuale.
1323
1324
1325 \subsection{Le funzioni avanzate per la risoluzione dei nomi}
1326 \label{sec:sock_advanced_name_services}
1327
1328 Quelle illustrate nella sezione precedente sono le funzioni classiche per la
1329 risoluzione di nomi ed indirizzi IP, ma abbiamo già visto come esse soffrano
1330 di vari inconvenienti come il fatto che usano informazioni statiche, e non
1331 prevedono la possibilità di avere diverse classi di indirizzi. Anche se sono
1332 state create delle estensioni o metodi diversi che permettono di risolvere
1333 alcuni di questi inconvenienti, comunque esse non forniscono una interfaccia
1334 sufficientemente generica.\footnote{rimane ad esempio il problema generico che
1335   si deve sapere in anticipo quale tipo di indirizzi IP (IPv4 o IPv6)
1336   corrispondono ad un certo nome a dominio.}
1337
1338 Inoltre in genere quando si ha a che fare con i socket non esiste soltanto il
1339 problema della risoluzione del nome che identifica la macchina, ma anche
1340 quello del servizio a cui ci si vuole rivolgere.  Per questo motivo con lo
1341 standard POSIX 1003.1-2001 sono state indicate come deprecate le varie
1342 funzioni \func{gethostbyaddr}, \func{gethostbyname}, \var{getipnodebyname} e
1343 \var{getipnodebyaddr} ed è stata introdotta una interfaccia completamente
1344 nuova.
1345
1346 La prima funzione di questa interfaccia è \funcd{getaddrinfo}, che combina le
1347 funzionalità delle precedenti \func{getipnodebyname}, \func{getipnodebyaddr},
1348 \func{getservbyname} e \func{getservbyport}, consentendo di ottenere
1349 contemporaneamente sia la risoluzione di un indirizzo simbolico che del nome
1350 di un servizio; la funzione è stata introdotta, insieme a \func{getnameinfo}
1351 che vedremo più avanti,
1352 nell'\href{http://www.ietf.org/rfc/rfc2553.txt}{RFC~2553} ed il suo prototipo è:
1353
1354
1355 \begin{funcproto}{
1356 \fhead{netdb.h}
1357 \fhead{sys/socket.h} 
1358 \fdecl{int getaddrinfo(const char *node, const char *service, const
1359     struct addrinfo *hints, \\
1360 \phantom{int getaddrinfo(}struct addrinfo **res)}
1361 \fdesc{Esegue una risoluzione di un nome a dominio e di un nome di servizio.} 
1362 }
1363
1364 {La funzione ritorna $0$ in caso di successo e un codice di errore diverso da
1365   zero per un errore.}
1366 \end{funcproto}
1367
1368 La funzione prende come primo argomento il nome della macchina che si vuole
1369 risolvere, specificato tramite la stringa \param{node}. Questo argomento,
1370 oltre ad un comune nome a dominio, può indicare anche un indirizzo numerico in
1371 forma \textit{dotted-decimal} per IPv4 o in formato esadecimale per IPv6.  Si
1372 può anche specificare il nome di una rete invece che di una singola macchina.
1373 Il secondo argomento, \param{service}, specifica invece il nome del servizio
1374 che si intende risolvere. Per uno dei due argomenti si può anche usare il
1375 valore \val{NULL}, nel qual caso la risoluzione verrà effettuata soltanto
1376 sulla base del valore dell'altro.
1377
1378 Il terzo argomento, \param{hints}, deve essere invece un puntatore ad una
1379 struttura \struct{addrinfo} usata per dare dei \textsl{suggerimenti} al
1380 procedimento di risoluzione riguardo al protocollo o del tipo di socket che si
1381 intenderà utilizzare; \func{getaddrinfo} infatti permette di effettuare
1382 ricerche generiche sugli indirizzi, usando sia IPv4 che IPv6, e richiedere
1383 risoluzioni sui nomi dei servizi indipendentemente dal protocollo (ad esempio
1384 TCP o UDP) che questi possono utilizzare.
1385
1386 Come ultimo argomento in \param{res} deve essere passato un puntatore ad una
1387 variabile (di tipo puntatore ad una struttura \struct{addrinfo}) che verrà
1388 utilizzata dalla funzione per riportare (come \textit{value result argument})
1389 i propri risultati. La funzione infatti è rientrante, ed alloca autonomamente
1390 tutta la memoria necessaria in cui verranno riportati i risultati della
1391 risoluzione.  La funzione scriverà all'indirizzo puntato da \param{res} il
1392 puntatore iniziale ad una \textit{linked list} di strutture di tipo
1393 \struct{addrinfo} contenenti tutte le informazioni ottenute.
1394
1395 \begin{figure}[!htb]
1396   \footnotesize \centering
1397   \begin{minipage}[c]{0.90\textwidth}
1398     \includestruct{listati/addrinfo.h}
1399   \end{minipage}
1400   \caption{La struttura \structd{addrinfo} usata nella nuova interfaccia POSIX
1401     per la risoluzione di nomi a dominio e servizi.}
1402   \label{fig:sock_addrinfo_struct}
1403 \end{figure}
1404
1405 Come illustrato la struttura \struct{addrinfo}, la cui definizione è riportata
1406 in fig.~\ref{fig:sock_addrinfo_struct}, viene usata sia in ingresso, per
1407 passare dei valori di controllo alla funzione, che in uscita, per ricevere i
1408 risultati. La definizione è ripresa direttamente dal file \headfiled{netdb.h}
1409 in cui questa struttura viene dichiarata, la pagina di manuale riporta
1410 \type{size\_t} come tipo di dato per il campo \var{ai\_addrlen}, qui viene
1411 usata quanto previsto dallo standard POSIX, in cui viene utilizzato
1412 \type{socklen\_t}; i due tipi di dati sono comunque equivalenti.
1413
1414 Il primo campo, \var{ai\_flags}, è una maschera binaria di bit che
1415 permettono di controllare le varie modalità di risoluzione degli indirizzi,
1416 che viene usato soltanto in ingresso. I tre campi successivi \var{ai\_family},
1417 \var{ai\_socktype}, e \var{ai\_protocol} contengono rispettivamente la
1418 famiglia di indirizzi, il tipo di socket e il protocollo, in ingresso vengono
1419 usati per impostare una selezione (impostandone il valore nella struttura
1420 puntata da \param{hints}), mentre in uscita indicano il tipo di risultato
1421 contenuto nella struttura.
1422
1423 Tutti i campi seguenti vengono usati soltanto in uscita e devono essere nulli
1424 o \val{NULL} in ingresso; il campo \var{ai\_addrlen} indica la dimensione
1425 della struttura degli indirizzi ottenuta come risultato, il cui contenuto sarà
1426 memorizzato nella struttura \struct{sockaddr} posta all'indirizzo puntato dal
1427 campo \var{ai\_addr}. Il campo \var{ai\_canonname} è un puntatore alla stringa
1428 contenente il nome canonico della macchina, ed infine, quando la funzione
1429 restituisce più di un risultato, \var{ai\_next} è un puntatore alla successiva
1430 struttura \struct{addrinfo} della lista.
1431
1432 Ovviamente non è necessario dare dei suggerimenti in ingresso, ed usando
1433 \val{NULL} come valore per l'argomento \param{hints} si possono compiere
1434 ricerche generiche.  Se però si specifica un valore non nullo questo deve
1435 puntare ad una struttura \struct{addrinfo} precedentemente allocata nella
1436 quale siano stati opportunamente impostati i valori dei campi
1437 \var{ai\_family}, \var{ai\_socktype}, \var{ai\_protocol} ed \var{ai\_flags}.
1438
1439 I due campi \var{ai\_family} e \var{ai\_socktype} prendono gli stessi valori
1440 degli analoghi argomenti della funzione \func{socket}; in particolare per
1441 \var{ai\_family} si possono usare i valori di tab.~\ref{tab:net_pf_names} ma
1442 sono presi in considerazione solo \const{AF\_INET} e \const{AF\_INET6}, mentre
1443 se non si vuole specificare nessuna famiglia di indirizzi si può usare il
1444 valore \const{AF\_UNSPEC}.  Allo stesso modo per \var{ai\_socktype} si possono
1445 usare i valori illustrati in sez.~\ref{sec:sock_type} per indicare per quale
1446 tipo di socket si vuole risolvere il servizio indicato, anche se i soli
1447 significativi sono \const{SOCK\_STREAM} e \const{SOCK\_DGRAM}; in questo caso,
1448 se non si vuole effettuare nessuna risoluzione specifica, si potrà usare un
1449 valore nullo.
1450
1451 Il campo \var{ai\_protocol} permette invece di effettuare la selezione dei
1452 risultati per il nome del servizio usando il numero identificativo del
1453 rispettivo protocollo di trasporto (i cui valori possibili sono riportati in
1454 \conffile{/etc/protocols}); di nuovo i due soli valori utilizzabili sono quelli
1455 relativi a UDP e TCP, o il valore nullo che indica di ignorare questo campo
1456 nella selezione.
1457
1458 \begin{table}[!htb]
1459   \centering
1460   \footnotesize
1461   \begin{tabular}[c]{|l|p{8cm}|}
1462     \hline
1463     \textbf{Costante} & \textbf{Significato} \\
1464     \hline
1465     \hline
1466     \const{AI\_ADDRCONFIG} & Stesso significato dell'analoga di
1467                              tab.~\ref{tab:sock_getipnodebyname_flags}.\\ 
1468     \const{AI\_ALL}        & Stesso significato dell'analoga di
1469                              tab.~\ref{tab:sock_getipnodebyname_flags}.\\ 
1470     \constd{AI\_CANONNAME}  & Richiede la restituzione del nome canonico della
1471                               macchina, che verrà salvato in una stringa il cui
1472                               indirizzo sarà restituito nel campo
1473                               \var{ai\_canonname} della prima struttura
1474                               \struct{addrinfo} dei risultati. Se il nome
1475                               canonico non è disponibile al suo posto
1476                               viene restituita una copia di \param{node}. \\ 
1477     \constd{AI\_NUMERICHOST}& Se impostato il nome della macchina specificato
1478                               con \param{node} deve essere espresso in forma
1479                               numerica, altrimenti sarà restituito un errore
1480                               \const{EAI\_NONAME} (vedi
1481                               tab.~\ref{tab:addrinfo_error_code}), in questo
1482                               modo si evita ogni chiamata alle funzioni di
1483                               risoluzione.\\ 
1484     \constd{AI\_NUMERICSERVICE}& Analogo di \const{AI\_NUMERICHOST} per la
1485                                  risoluzione di un servizio, con 
1486                                  \param{service} che deve essere espresso in forma
1487                                  numerica.\\ 
1488     \constd{AI\_PASSIVE}    & Viene utilizzato per ottenere un indirizzo in
1489                               formato adatto per una successiva chiamata a
1490                               \func{bind}. Se specificato quando si è usato 
1491                               \val{NULL} come valore per \param{node} gli
1492                               indirizzi restituiti saranno inizializzati al
1493                               valore generico (\const{INADDR\_ANY} per IPv4 e
1494                               \const{IN6ADDR\_ANY\_INIT} per IPv6), altrimenti
1495                               verrà usato l'indirizzo dell'interfaccia di
1496                               \textit{loopback}. Se invece non è impostato gli
1497                               indirizzi verranno restituiti in formato adatto ad
1498                               una chiamata a \func{connect} o \func{sendto}.\\
1499     \const{AI\_V4MAPPED}   & Stesso significato dell'analoga di
1500                              tab.~\ref{tab:sock_getipnodebyname_flags}.\\  
1501     \hline
1502     \const{AI\_CANONIDN}   & Se il nome canonico richiesto con
1503                              \const{AI\_CANONNAME} è codificato con questo
1504                              flag la codifica viene convertita in forma
1505                              leggibile nella localizzazione corrente.\\ 
1506     \const{AI\_IDN}        & Se specificato il nome viene convertito, se
1507                              necessario, nella codifica IDN, usando la
1508                              localizzazione corrente.\\ 
1509     \const{AI\_IDN\_ALLOW\_UNASSIGNED} & attiva il controllo 
1510                                          \texttt{IDNA\_ALLOW\_UNASSIGNED}.\\ 
1511     \const{AI\_AI\_IDN\_USE\_STD3\_ASCII\_RULES} & attiva il controllo
1512                                             \texttt{IDNA\_USE\_STD3\_ASCII\_RULES}\\ 
1513     \hline
1514   \end{tabular}
1515   \caption{Costanti associate ai bit del campo \var{ai\_flags} della struttura 
1516     \struct{addrinfo}.} 
1517   \label{tab:ai_flags_values}
1518 \end{table}
1519
1520 % TODO mettere riferimento a IDNA_ALLOW_UNASSIGNED e IDNA_USE_STD3_ASCII_RULES
1521
1522 Infine gli ultimi dettagli si controllano con il campo \var{ai\_flags}; che
1523 deve essere impostato come una maschera binaria; i bit di questa variabile
1524 infatti vengono usati per dare delle indicazioni sul tipo di risoluzione
1525 voluta, ed hanno valori analoghi a quelli visti in
1526 sez.~\ref{sec:sock_name_services} per \func{getipnodebyname}; il valore di
1527 \var{ai\_flags} può essere impostata con un OR aritmetico delle costanti di
1528 tab.~\ref{tab:ai_flags_values}, ciascuna delle quali identifica un bit della
1529 maschera. 
1530
1531 Nella seconda parte della tabella si sono riportati i valori delle costanti
1532 aggiunte a partire dalle \acr{glibc} 2.3.4 per gestire la
1533 internazionalizazione dei nomi a dominio (IDN o \textit{Internationalized
1534   Domain Names}) secondo quanto specificato
1535 nell'\href{http://www.ietf.org/rfc/rfc3490.txt}{RFC~3490} (potendo cioè usare
1536 codifiche di caratteri che consentono l'espressione di nomi a dominio in
1537 qualunque lingua).
1538
1539 Come accennato passando un valore \val{NULL} per l'argomento \param{hints} si
1540 effettua una risuluzione generica, equivalente ad aver impostato un valore
1541 nullo per \var{ai\_family} e \var{ai\_socktype}, un valore \const{AF\_UNSPEC}
1542 per \var{ai\_family} e il valore \code{(AI\_V4MAPPED|AI\_ADDRCONFIG)} per
1543 \var{ai\_flags}. 
1544
1545 La funzione restituisce un valore nullo in caso di successo, o un codice in
1546 caso di errore. I valori usati come codice di errore sono riportati in
1547 tab.~\ref{tab:addrinfo_error_code}; dato che la funzione utilizza altre
1548 funzioni e chiamate al sistema per ottenere il suo risultato in generale il
1549 valore di \var{errno} non è significativo, eccetto il caso in cui si sia
1550 ricevuto un errore di \const{EAI\_SYSTEM}, nel qual caso l'errore
1551 corrispondente è riportato tramite \var{errno}.
1552
1553 \begin{table}[!htb]
1554   \centering
1555   \footnotesize
1556   \begin{tabular}[c]{|l|p{10cm}|}
1557     \hline
1558     \textbf{Costante} & \textbf{Significato} \\
1559     \hline
1560     \hline
1561     \constd{EAI\_ADDRFAMILY}& La richiesta non ha nessun indirizzo di rete
1562                               per la famiglia di indirizzi specificata. \\
1563     \constd{EAI\_AGAIN}   & Il DNS ha restituito un errore di risoluzione  
1564                             temporaneo, si può ritentare in seguito. \\
1565     \constd{EAI\_BADFLAGS}& Il campo \var{ai\_flags} contiene dei valori non
1566                             validi per i flag o si è richiesto
1567                             \const{AI\_CANONNAME} con \param{name} nullo. \\
1568     \constd{EAI\_FAIL}    & Il DNS ha restituito un errore di risoluzione  
1569                             permanente. \\
1570     \constd{EAI\_FAMILY}  & La famiglia di indirizzi richiesta non è
1571                             supportata. \\ 
1572     \constd{EAI\_MEMORY}  & È stato impossibile allocare la memoria necessaria
1573                             alle operazioni. \\
1574     \constd{EAI\_NODATA}  & La macchina specificata esiste, ma non ha nessun
1575                             indirizzo di rete definito. \\
1576     \constd{EAI\_NONAME}  & Il nome a dominio o il servizio non sono noti,
1577                             viene usato questo errore anche quando si specifica
1578                             il valore \val{NULL} per entrambi gli argomenti
1579                             \param{node} e \param{service}. \\
1580     \constd{EAI\_SERVICE} & Il servizio richiesto non è disponibile per il tipo
1581                             di socket richiesto, anche se può esistere per
1582                             altri tipi di socket. \\
1583     \constd{EAI\_SOCKTYPE}& Il tipo di socket richiesto non è supportato. \\
1584     \constd{EAI\_SYSTEM}  & C'è stato un errore di sistema, si può controllare
1585                             \var{errno} per i dettagli. \\
1586 %    \hline
1587 % TODO estensioni GNU, trovarne la documentazione
1588 %    \constd{EAI\_INPROGRESS}& Richiesta in corso. \\
1589 %    \constd{EAI\_CANCELED}& La richiesta è stata cancellata.\\
1590 %    \constd{EAI\_NOTCANCELED}& La richiesta non è stata cancellata. \\
1591 %    \constd{EAI\_ALLDONE} & Tutte le richieste sono complete. \\
1592 %    \constd{EAI\_INTR}    & Richiesta interrotta. \\
1593     \hline
1594   \end{tabular}
1595   \caption{Costanti associate ai valori dei codici di errore della funzione
1596     \func{getaddrinfo}.} 
1597   \label{tab:addrinfo_error_code}
1598 \end{table}
1599
1600 Come per i codici di errore di \func{gethostbyname} anche in questo caso è
1601 fornita una apposita funzione, simile a \func{strerror}, che consente di
1602 utilizzare direttamente il codice restituito dalla funzione per stampare a
1603 video un messaggio esplicativo; la funzione è \funcd{gai\_strerror} ed il suo
1604 prototipo è:
1605
1606 \begin{funcproto}{
1607 \fhead{netdb.h} 
1608 \fdecl{const char *gai\_strerror(int errcode)}
1609 \fdesc{Fornisce il messaggio corrispondente ad un errore di \func{getaddrinfo}.} 
1610 }
1611
1612 {La funzione ritorna il puntatore alla stringa contenente il messaggio di
1613   errore.}
1614 \end{funcproto}
1615
1616 La funzione restituisce un puntatore alla stringa contenente il messaggio
1617 corrispondente dal codice di errore \param{errcode} ottenuto come valore di
1618 ritorno di \func{getaddrinfo}.  La stringa è allocata staticamente, ma essendo
1619 costante ed accessibile in sola lettura, la funzione è rientrante.
1620
1621 Dato che ad un certo nome a dominio possono corrispondere più indirizzi IP
1622 (sia IPv4 che IPv6), e che un certo servizio può essere fornito su protocolli
1623 e tipi di socket diversi, in generale, a meno di non aver eseguito una
1624 selezione specifica attraverso l'uso di \param{hints}, si otterrà una diversa
1625 struttura \struct{addrinfo} per ciascuna possibilità.  
1626
1627 Ad esempio se si richiede la risoluzione del servizio \textit{echo} per
1628 l'indirizzo \texttt{www.truelite.it}, e si imposta \const{AI\_CANONNAME} per
1629 avere anche la risoluzione del nome canonico, si avrà come risposta della
1630 funzione la lista illustrata in fig.~\ref{fig:sock_addrinfo_list}.
1631
1632 \begin{figure}[!htb]
1633   \centering
1634   \includegraphics[width=10cm]{img/addrinfo_list}
1635   \caption{La \textit{linked list} delle strutture \struct{addrinfo}
1636     restituite da \func{getaddrinfo}.}
1637   \label{fig:sock_addrinfo_list}
1638 \end{figure}
1639
1640 Come primo esempio di uso di \func{getaddrinfo} vediamo un programma
1641 elementare di interrogazione del \textit{resolver} basato questa funzione, il
1642 cui corpo principale è riportato in fig.~\ref{fig:mygetaddr_example}. Il
1643 codice completo del programma, compresa la gestione delle opzioni in cui è
1644 gestita l'eventuale inizializzazione dell'argomento \var{hints} per
1645 restringere le ricerche su protocolli, tipi di socket o famiglie di indirizzi,
1646 è disponibile nel file \texttt{mygetaddr.c} dei sorgenti allegati alla guida.
1647
1648 \begin{figure}[!htb]
1649   \footnotesize \centering
1650   \begin{minipage}[c]{\codesamplewidth}
1651     \includecodesample{listati/mygetaddr.c}
1652   \end{minipage}
1653   \normalsize
1654   \caption{Esempio di codice per la risoluzione di un indirizzo.}
1655   \label{fig:mygetaddr_example}
1656 \end{figure}
1657
1658 Il corpo principale inizia controllando (\texttt{\small 1--5}) il numero di
1659 argomenti passati, che devono essere sempre due, e corrispondere
1660 rispettivamente all'indirizzo ed al nome del servizio da risolvere. A questo
1661 segue la chiamata (\texttt{\small 7}) alla funzione \func{getaddrinfo}, ed il
1662 successivo controllo (\texttt{\small 8--11}) del suo corretto funzionamento,
1663 senza il quale si esce immediatamente stampando il relativo codice di errore.
1664
1665 Se la funzione ha restituito un valore nullo il programma prosegue
1666 inizializzando (\texttt{\small 12}) il puntatore \var{ptr} che sarà usato nel
1667 successivo ciclo (\texttt{\small 14--35}) di scansione della lista delle
1668 strutture \struct{addrinfo} restituite dalla funzione. Prima di eseguire
1669 questa scansione (\texttt{\small 12}) viene stampato il valore del nome
1670 canonico che è presente solo nella prima struttura.
1671
1672 La scansione viene ripetuta (\texttt{\small 14}) fintanto che si ha un
1673 puntatore valido. La selezione principale è fatta sul campo \var{ai\_family},
1674 che stabilisce a quale famiglia di indirizzi fa riferimento la struttura in
1675 esame. Le possibilità sono due, un indirizzo IPv4 o IPv6, se nessuna delle due
1676 si verifica si provvede (\texttt{\small 27--30}) a stampare un messaggio di
1677 errore ed uscire (questa eventualità non dovrebbe comunque mai verificarsi,
1678 almeno fintanto che la funzione \func{getaddrinfo} lavora correttamente).
1679
1680 Per ciascuno delle due possibili famiglie di indirizzi si estraggono le
1681 informazioni che poi verranno stampate alla fine del ciclo (\texttt{\small
1682   31--34}). Il primo caso esaminato (\texttt{\small 15--21}) è quello degli
1683 indirizzi IPv4, nel qual caso prima se ne stampa l'identificazione
1684 (\texttt{\small 16}) poi si provvede a ricavare la struttura degli indirizzi
1685 (\texttt{\small 17}) indirizzata dal campo \var{ai\_addr}, eseguendo un
1686 opportuno casting del puntatore per poter estrarre da questa la porta
1687 (\texttt{\small 18}) e poi l'indirizzo (\texttt{\small 19}) che verrà
1688 convertito con una chiamata ad \func{inet\_ntop}.
1689
1690 La stessa operazione (\texttt{\small 21--27}) viene ripetuta per gli indirizzi
1691 IPv6, usando la rispettiva struttura degli indirizzi. Si noti anche come in
1692 entrambi i casi per la chiamata a \func{inet\_ntop} si sia dovuto passare il
1693 puntatore al campo contenente l'indirizzo IP nella struttura puntata dal campo
1694 \var{ai\_addr}.\footnote{il meccanismo è complesso a causa del fatto che al
1695   contrario di IPv4, in cui l'indirizzo IP può essere espresso con un semplice
1696   numero intero, in IPv6 questo deve essere necessariamente fornito come
1697   struttura, e pertanto anche se nella struttura puntata da \var{ai\_addr}
1698   sono presenti direttamente i valori finali, per l'uso con \func{inet\_ntop}
1699   occorre comunque passare un puntatore agli stessi (ed il costrutto
1700   \code{\&addr6->sin6\_addr} è corretto in quanto l'operatore \texttt{->} ha
1701   in questo caso precedenza su \texttt{\&}).}
1702
1703 Una volta estratte dalla struttura \struct{addrinfo} tutte le informazioni
1704 relative alla risoluzione richiesta e stampati i relativi valori, l'ultimo
1705 passo (\texttt{\small 34}) è di estrarre da \var{ai\_next} l'indirizzo della
1706 eventuale successiva struttura presente nella lista e ripetere il ciclo, fin
1707 tanto che, completata la scansione, questo avrà un valore nullo e si potrà
1708 terminare (\texttt{\small 36}) il programma.
1709
1710 Si tenga presente che \func{getaddrinfo} non garantisce nessun particolare
1711 ordinamento della lista delle strutture \struct{addrinfo} restituite, anche se
1712 usualmente i vari indirizzi IP (se ne è presente più di uno) sono forniti
1713 nello stesso ordine in cui vengono inviati dal server DNS. In particolare
1714 nulla garantisce che vengano forniti prima i dati relativi ai servizi di un
1715 determinato protocollo o tipo di socket, se ne sono presenti di diversi.  Se
1716 allora utilizziamo il nostro programma potremo verificare il risultato:
1717 \begin{Console}
1718 [piccardi@gont sources]$ \textbf{./mygetaddr -c  gapil.truelite.it echo}
1719 Canonical name sources2.truelite.it
1720 IPv4 address:
1721         Indirizzo 62.48.34.25
1722         Protocollo 6
1723         Porta 7
1724 IPv4 address:
1725         Indirizzo 62.48.34.25
1726         Protocollo 17
1727         Porta 7
1728 \end{Console}
1729 %$
1730
1731 Una volta estratti i risultati dalla \textit{linked list} puntata
1732 da \param{res} se questa non viene più utilizzata si dovrà avere cura di
1733 disallocare opportunamente tutta la memoria, per questo viene fornita
1734 l'apposita funzione \funcd{freeaddrinfo}, il cui prototipo è:
1735
1736
1737 \begin{funcproto}{
1738 \fhead{netdb.h}
1739 \fdecl{void freeaddrinfo(struct addrinfo *res)}
1740 \fdesc{Libera la memoria allocata da una precedente chiamata a \func{getaddrinfo}.} 
1741 }
1742
1743 {La funzione non restituisce nessun codice di errore.}
1744 \end{funcproto}
1745
1746 La funzione prende come unico argomento il puntatore \param{res}, ottenuto da
1747 una precedente chiamata a \func{getaddrinfo}, e scandisce la lista delle
1748 strutture per liberare tutta la memoria allocata. Dato che la funzione non ha
1749 valori di ritorno deve essere posta molta cura nel passare un valore valido
1750 per \param{res} ed usare un indirizzo non valido o già liberato può avere
1751 conseguenze non prevedibili.
1752
1753 Si tenga presente infine che se si copiano i risultati da una delle strutture
1754 \struct{addrinfo} restituite nella lista indicizzata da \param{res}, occorre
1755 avere cura di eseguire una \textit{deep copy} in cui si copiano anche tutti i
1756 dati presenti agli indirizzi contenuti nella struttura \struct{addrinfo},
1757 perché una volta disallocati i dati con \func{freeaddrinfo} questi non
1758 sarebbero più disponibili.
1759
1760 Anche la nuova interfaccia definita da POSIX prevede una nuova funzione per
1761 eseguire la risoluzione inversa e determinare nomi di servizi e di dominio
1762 dati i rispettivi valori numerici. La funzione che sostituisce le varie
1763 \func{gethostbyname}, \func{getipnodebyname} e \func{getservbyname} è
1764 \funcd{getnameinfo}, ed il suo prototipo è:
1765
1766 \begin{funcproto}{
1767 \fhead{netdb.h}
1768 \fhead{sys/socket.h}
1769 \fdecl{int getnameinfo(const struct sockaddr *sa, socklen\_t salen, \\
1770 \phantom{int getnameinfo(}char *host, size\_t hostlen, char *serv, size\_t
1771 servlen, int flags)} 
1772 \fdesc{Effettua una risoluzione di un indirizzo di rete in maniera
1773   indipendente dal protocollo.} 
1774 }
1775
1776 {La funzione ritorna $0$ in caso di successo e un codice di errore diverso da
1777   zero per un errore.}
1778 \end{funcproto}
1779
1780 La principale caratteristica di \func{getnameinfo} è che la funzione è in
1781 grado di eseguire una risoluzione inversa in maniera indipendente dal
1782 protocollo; il suo primo argomento \param{sa} infatti è il puntatore ad una
1783 struttura degli indirizzi generica, che può contenere sia indirizzi IPv4 che
1784 IPv6, la cui dimensione deve comunque essere specificata con l'argomento
1785 \param{salen}. 
1786
1787 I risultati della funzione saranno restituiti nelle due stringhe puntate da
1788 \param{host} e \param{serv}, che dovranno essere state precedentemente
1789 allocate per una lunghezza massima che deve essere specificata con gli altri
1790 due argomenti \param{hostlen} e \param{servlen}. Quando non si è
1791 interessati ad uno dei due, si può passare il valore \val{NULL} come argomento,
1792 così che la corrispondente informazione non venga richiesta. Infine l'ultimo
1793 argomento \param{flags} è una maschera binaria i cui bit consentono di
1794 impostare le modalità con cui viene eseguita la ricerca, e deve essere
1795 specificato attraverso l'OR aritmetico dei valori illustrati in
1796 tab.~\ref{tab:getnameinfo_flags}, nella seconda parte della tabella si sono
1797 aggiunti i valori introdotto con le \acr{glibc} 2.3.4 per gestire la
1798 internazionalizzione dei nomi a dominio.
1799
1800 \begin{table}[!htb]
1801   \centering
1802   \footnotesize
1803   \begin{tabular}[c]{|l|p{8cm}|}
1804     \hline
1805     \textbf{Costante} & \textbf{Significato} \\
1806     \hline
1807     \hline
1808     \constd{NI\_DGRAM}      & Richiede che venga restituito il nome del
1809                               servizio su UDP invece che quello su TCP per quei
1810                               pichi servizi (porte 512-214) che soni diversi
1811                               nei due protocolli.\\
1812     \constd{NI\_NOFQDN}     & Richiede che venga restituita solo il nome della
1813                               macchina all'interno del dominio al posto del
1814                               nome completo (FQDN).\\
1815     \constd{NI\_NAMEREQD}   & Richiede la restituzione di un errore se il nome
1816                               non può essere risolto.\\
1817     \constd{NI\_NUMERICHOST}& Richiede che venga restituita la forma numerica
1818                               dell'indirizzo (questo succede sempre se il nome
1819                               non può essere ottenuto).\\ 
1820     \constd{NI\_NUMERICSERV}& Richiede che il servizio venga restituito in
1821                               forma numerica (attraverso il numero di
1822                               porta).\\
1823     \hline
1824     \const{NI\_IDN}        & Se specificato il nome restituito viene convertito usando la
1825                              localizzazione corrente, se necessario, nella
1826                              codifica IDN.\\ 
1827     \const{NI\_IDN\_ALLOW\_UNASSIGNED} & attiva il controllo 
1828                                        \texttt{IDNA\_ALLOW\_UNASSIGNED}.\\ 
1829     \const{NI\_AI\_IDN\_USE\_STD3\_ASCII\_RULES} & attiva il controllo
1830                                        \texttt{IDNA\_USE\_STD3\_ASCII\_RULES}\\ 
1831     \hline
1832   \end{tabular}
1833   \caption{Costanti associate ai bit dell'argomento \param{flags} della  
1834     funzione \func{getnameinfo}.} 
1835   \label{tab:getnameinfo_flags}
1836 \end{table}
1837
1838 La funzione ritorna zero in caso di successo, e scrive i propri risultati agli
1839 indirizzi indicati dagli argomenti \param{host} e \param{serv} come stringhe
1840 terminate dal carattere NUL, a meno che queste non debbano essere troncate
1841 qualora la loro dimensione ecceda quelle specificate dagli argomenti
1842 \param{hostlen} e \param{servlen}. Sono comunque definite le due costanti
1843 \constd{NI\_MAXHOST} e \constd{NI\_MAXSERV}\footnote{in Linux le due costanti
1844   sono definite in \headfile{netdb.h} ed hanno rispettivamente il valore 1024
1845   e 12.}  che possono essere utilizzate come limiti massimi.  In caso di
1846 errore viene restituito invece un codice che assume gli stessi valori
1847 illustrati in tab.~\ref{tab:addrinfo_error_code}.
1848
1849 A questo punto possiamo fornire degli esempi di utilizzo della nuova
1850 interfaccia, adottandola per le precedenti implementazioni del client e del
1851 server per il servizio \textit{echo}; dato che l'uso delle funzioni appena
1852 illustrate (in particolare di \func{getaddrinfo}) è piuttosto complesso,
1853 essendo necessaria anche una impostazione diretta dei campi dell'argomento
1854 \param{hints}, provvederemo una interfaccia semplificata per i due casi visti
1855 finora, quello in cui si specifica nel client un indirizzo remoto per la
1856 connessione al server, e quello in cui si specifica nel server un indirizzo
1857 locale su cui porsi in ascolto.
1858
1859 La prima funzione della nostra interfaccia semplificata è \texttt{sockconn}
1860 che permette di ottenere un socket, connesso all'indirizzo ed al servizio
1861 specificati. Il corpo della funzione è riportato in
1862 fig.~\ref{fig:sockconn_code}, il codice completo è nel file \file{SockUtil.c}
1863 dei sorgenti allegati alla guida, che contiene varie funzioni di utilità per
1864 l'uso dei socket.
1865
1866 \begin{figure}[!htb]
1867   \footnotesize \centering
1868   \begin{minipage}[c]{\codesamplewidth}
1869     \includecodesample{listati/sockconn.c}
1870   \end{minipage}
1871   \normalsize
1872   \caption{Il codice della funzione \texttt{sockconn}.}
1873   \label{fig:sockconn_code}
1874 \end{figure}
1875
1876 La funzione prende quattro argomenti, i primi due sono le stringhe che
1877 indicano il nome della macchina a cui collegarsi ed il relativo servizio su
1878 cui sarà effettuata la risoluzione; seguono il protocollo da usare (da
1879 specificare con il valore numerico di \conffile{/etc/protocols}) ed il tipo di
1880 socket (al solito specificato con i valori illustrati in
1881 sez.~\ref{sec:sock_type}).  La funzione ritorna il valore del file descriptor
1882 associato al socket (un numero positivo) in caso di successo, o $-1$ in caso
1883 di errore.
1884
1885 Per risolvere il problema di non poter passare indietro i valori di ritorno di
1886 \func{getaddrinfo} contenenti i relativi codici di errore si sono stampati i
1887 messaggi d'errore direttamente nella funzione; infatti non si può avere
1888 nessuna certezza che detti valori siano negativi e per cui stampare subito
1889 l'errore diventa necessario per evitare ogni possibile ambiguità nei confronti
1890 del valore di ritorno in caso di successo.
1891
1892 Una volta definite le variabili occorrenti (\texttt{\small 3--5}) la funzione
1893 prima (\texttt{\small 6}) azzera il contenuto della struttura \var{hint} e poi
1894 provvede (\texttt{\small 7--9}) ad inizializzarne i valori necessari per la
1895 chiamata (\texttt{\small 10}) a \func{getaddrinfo}. Di quest'ultima si
1896 controlla (\texttt{\small 12--16}) il codice di ritorno, in modo da stampare
1897 un avviso di errore, azzerare \var{errno} ed uscire in caso di errore.  
1898
1899 Dato che ad una macchina possono corrispondere più indirizzi IP, e di tipo
1900 diverso (sia IPv4 che IPv6), mentre il servizio può essere in ascolto soltanto
1901 su uno solo di questi, si provvede a tentare la connessione per ciascun
1902 indirizzo restituito all'interno di un ciclo (\texttt{\small 18--40}) di
1903 scansione della lista restituita da \func{getaddrinfo}, ma prima
1904 (\texttt{\small 17}) si salva il valore del puntatore per poterlo riutilizzare
1905 alla fine per disallocare la lista.
1906
1907 Il ciclo viene ripetuto (\texttt{\small 18}) fintanto che si hanno indirizzi
1908 validi, ed inizia (\texttt{\small 19}) con l'apertura del socket; se questa
1909 fallisce si controlla (\texttt{\small 20}) se sono disponibili altri
1910 indirizzi, nel qual caso si passa al successivo (\texttt{\small 21}) e si
1911 riprende (\texttt{\small 22}) il ciclo da capo; se non ve ne sono si stampa
1912 l'errore ritornando immediatamente (\texttt{\small 24--27}). 
1913
1914 Quando la creazione del socket ha avuto successo si procede (\texttt{\small
1915   29}) direttamente con la connessione, di nuovo in caso di fallimento viene
1916 ripetuto (\texttt{\small 30--38}) il controllo se vi sono o no altri indirizzi
1917 da provare nella stessa modalità fatta in precedenza, aggiungendovi però in
1918 entrambi i casi (\texttt{\small 32} e (\texttt{\small 36}) la chiusura del
1919 socket precedentemente aperto, che non è più utilizzabile.
1920
1921 Se la connessione ha avuto successo invece si termina (\texttt{\small 39})
1922 direttamente il ciclo, e prima di ritornare (\texttt{\small 31}) il valore del
1923 file descriptor del socket si provvede (\texttt{\small 30}) a liberare le
1924 strutture \struct{addrinfo} allocate da \func{getaddrinfo} utilizzando il
1925 valore del relativo puntatore precedentemente (\texttt{\small 17}) salvato.
1926 Si noti come per la funzione sia del tutto irrilevante se la struttura
1927 ritornata contiene indirizzi IPv6 o IPv4, in quanto si fa uso direttamente dei
1928 dati relativi alle strutture degli indirizzi di \struct{addrinfo} che sono
1929 opachi rispetto all'uso della funzione \func{connect}.
1930
1931 Per usare questa funzione possiamo allora modificare ulteriormente il nostro
1932 programma client per il servizio \textit{echo}; in questo caso rispetto al
1933 codice usato finora per collegarsi (vedi fig.~\ref{fig:TCP_echo_client_1})
1934 avremo una semplificazione per cui il corpo principale del nostro client
1935 diventerà quello illustrato in fig.~\ref{fig:TCP_echo_fifth}, in cui le
1936 chiamate a \func{socket}, \func{inet\_pton} e \func{connect} sono sostituite
1937 da una singola chiamata a \texttt{sockconn}. Inoltre il nuovo client (il cui
1938 codice completo è nel file \file{TCP\_echo\_fifth.c} dei sorgenti allegati)
1939 consente di utilizzare come argomento del programma un nome a dominio al posto
1940 dell'indirizzo numerico, e può utilizzare sia indirizzi IPv4 che IPv6.
1941
1942 \begin{figure}[!htb]
1943   \footnotesize \centering
1944   \begin{minipage}[c]{\codesamplewidth}
1945     \includecodesample{listati/TCP_echo_fifth.c}
1946   \end{minipage}
1947   \normalsize
1948   \caption{Il nuovo codice per la connessione del client \textit{echo}.}
1949   \label{fig:TCP_echo_fifth}
1950 \end{figure}
1951
1952 La seconda funzione di ausilio che abbiamo creato è \texttt{sockbind}, il cui
1953 corpo principale è riportato in fig.~\ref{fig:sockbind_code} (al solito il
1954 sorgente completo è nel file \file{sockbind.c} dei sorgenti allegati alla
1955 guida). Come si può notare la funzione è del tutto analoga alla precedente
1956 \texttt{sockconn}, e prende gli stessi argomenti, però invece di eseguire una
1957 connessione con \func{connect} si limita a chiamare \func{bind} per collegare
1958 il socket ad una porta.
1959
1960 \begin{figure}[!htb]
1961   \footnotesize \centering
1962   \begin{minipage}[c]{\codesamplewidth}
1963     \includecodesample{listati/sockbind.c}
1964   \end{minipage}
1965   \normalsize
1966   \caption{Il codice della funzione \texttt{sockbind}.}
1967   \label{fig:sockbind_code}
1968 \end{figure}
1969
1970 Dato che la funzione è pensata per essere utilizzata da un server ci si può
1971 chiedere a quale scopo mantenere l'argomento \param{host} quando l'indirizzo
1972 di questo è usualmente noto. Si ricordi però quanto detto in
1973 sez.~\ref{sec:TCP_func_bind}, relativamente al significato della scelta di un
1974 indirizzo specifico come argomento di \func{bind}, che consente di porre il
1975 server in ascolto su uno solo dei possibili diversi indirizzi presenti su di
1976 una macchina.  Se non si vuole che la funzione esegua \func{bind} su un
1977 indirizzo specifico, ma utilizzi l'indirizzo generico, occorrerà avere cura di
1978 passare un valore \val{NULL} come valore per l'argomento \var{host}; l'uso
1979 del valore \const{AI\_PASSIVE} serve ad ottenere il valore generico nella
1980 rispettiva struttura degli indirizzi.
1981
1982 Come già detto la funzione è analoga a \texttt{sockconn} ed inizia azzerando
1983 ed inizializzando (\texttt{\small 6--11}) opportunamente la struttura
1984 \var{hint} con i valori ricevuti come argomenti, soltanto che in questo caso
1985 si è usata (\texttt{\small 8}) una impostazione specifica dei flag di
1986 \var{hint} usando \const{AI\_PASSIVE} per indicare che il socket sarà usato
1987 per una apertura passiva. Per il resto la chiamata (\texttt{\small 12--18}) a
1988 \func{getaddrinfo} e ed il ciclo principale (\texttt{\small 20--42}) sono
1989 identici, solo che si è sostituita (\texttt{\small 31}) la chiamata a
1990 \func{connect} con una chiamata a \func{bind}. Anche la conclusione
1991 (\texttt{\small 43--44}) della funzione è identica.
1992
1993 Si noti come anche in questo caso si siano inserite le stampe degli errori
1994 sullo \textit{standard error}, nonostante la funzione possa essere invocata da
1995 un demone. Nel nostro caso questo non è un problema in quanto se la funzione
1996 non ha successo il programma deve uscire immediatamente prima di essere posto
1997 in background, e può quindi scrivere gli errori direttamente sullo
1998 \textit{standard error}.
1999
2000 \begin{figure}[!htbp]
2001   \footnotesize \centering
2002   \begin{minipage}[c]{\codesamplewidth}
2003     \includecodesample{listati/TCP_echod_third.c}
2004   \end{minipage}
2005   \normalsize
2006   \caption{Nuovo codice per l'apertura passiva del server \textit{echo}.}
2007   \label{fig:TCP_echod_third}
2008 \end{figure}
2009
2010 Con l'uso di questa funzione si può modificare anche il codice del nostro
2011 server \textit{echo}, che rispetto a quanto illustrato nella versione iniziale
2012 di fig.~\ref{fig:TCP_echo_server_first_code} viene modificato nella forma
2013 riportata in fig.~\ref{fig:TCP_echod_third}. In questo caso il socket su cui
2014 porsi in ascolto viene ottenuto (\texttt{\small 15--18}) da \texttt{sockbind}
2015 che si cura anche della eventuale risoluzione di un indirizzo specifico sul
2016 quale si voglia far ascoltare il server.
2017
2018
2019 \section{Le opzioni dei socket}
2020 \label{sec:sock_options}
2021
2022 Benché dal punto di vista del loro uso come canali di trasmissione di dati i
2023 socket vengano trattati allo stesso modo dei file, acceduti tramite i file
2024 descriptor, e gestiti con le ordinarie funzioni di lettura e scrittura dei
2025 file, l'interfaccia standard usata per la gestione dei file generici non è
2026 comunque sufficiente a controllare la moltitudine di caratteristiche
2027 specifiche che li contraddistinguono, considerato tra l'altro che queste
2028 possono essere completamente diverse fra loro a seconda del tipo di socket e
2029 della relativa forma di comunicazione sottostante.
2030
2031 In questa sezione vedremo allora quali sono le funzioni dedicate alla gestione
2032 delle caratteristiche specifiche dei vari tipi di socket, che vengono
2033 raggruppate sotto il nome generico di ``\textit{socket options}'', ma
2034 soprattutto analizzaremo quali sono queste opzioni e quali caretteristiche e
2035 comportamenti dei socket permettono di controllare.
2036
2037
2038 \subsection{Le funzioni di gestione delle opzioni dei socket}
2039 \label{sec:sock_setsockopt}
2040
2041 La modalità principale con cui si possono gestire le caratteristiche dei
2042 socket (ne vedremo delle ulteriori nelle prossime sezioni) è quella che passa
2043 attraverso l'uso di due funzioni di sistema generiche che permettono
2044 rispettivamente di impostarle e di recuperarne il valore corrente. La prima di
2045 queste due funzioni, quella usata per impostare le \textit{socket options}, è
2046 \funcd{setsockopt}, ed il suo prototipo è:
2047
2048 \begin{funcproto}{
2049 \fhead{sys/socket.h}
2050 \fhead{sys/types.h}
2051 \fdecl{int setsockopt(int sock, int level, int optname, const void
2052     *optval, socklen\_t optlen)}
2053 \fdesc{Imposta le opzioni di un socket.} 
2054 }
2055
2056 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2057   caso \var{errno} assumerà uno dei valori: 
2058   \begin{errlist}
2059   \item[\errcode{EBADF}]  il file descriptor \param{sock} non è valido.
2060   \item[\errcode{EFAULT}] l'indirizzo \param{optval} non è valido.
2061   \item[\errcode{EINVAL}] il valore di \param{optlen} non è valido.
2062   \item[\errcode{ENOPROTOOPT}] l'opzione scelta non esiste per il livello
2063     indicato. 
2064   \item[\errcode{ENOTSOCK}] il file descriptor \param{sock} non corrisponde ad
2065     un socket.
2066   \end{errlist}
2067 }
2068 \end{funcproto}
2069
2070 Il primo argomento della funzione, \param{sock}, indica il socket su cui si
2071 intende operare; per indicare l'opzione da impostare si devono usare i due
2072 argomenti successivi, \param{level} e \param{optname}.  Come abbiamo visto in
2073 sez.~\ref{sec:net_protocols} i protocolli di rete sono strutturati su vari
2074 livelli, ed l'interfaccia dei socket può usarne più di uno. Si avranno allora
2075 funzionalità e caratteristiche diverse per ciascun protocollo usato da un
2076 socket, e quindi saranno anche diverse le opzioni che si potranno impostare
2077 per ciascun socket, a seconda del \textsl{livello} (trasporto, rete, ecc.) su
2078 cui si vuole andare ad operare.
2079
2080 Il valore di \param{level} seleziona allora il protocollo su cui vuole
2081 intervenire, mentre \param{optname} permette di scegliere su quale delle
2082 opzioni che sono definite per quel protocollo si vuole operare. In sostanza la
2083 selezione di una specifica opzione viene fatta attraverso una coppia di valori
2084 \param{level} e \param{optname} e chiaramente la funzione avrà successo
2085 soltanto se il protocollo in questione prevede quella opzione ed è utilizzato
2086 dal socket.  Infine \param{level} prevede anche il valore speciale
2087 \const{SOL\_SOCKET} usato per le opzioni generiche che sono disponibili per
2088 qualunque tipo di socket.
2089
2090 \begin{table}[!htb]
2091   \centering
2092   \footnotesize
2093   \begin{tabular}[c]{|l|l|}
2094     \hline
2095     \textbf{Livello} & \textbf{Significato} \\
2096     \hline
2097     \hline
2098     \constd{SOL\_SOCKET}& Opzioni generiche dei socket.\\
2099     \constd{SOL\_IP}    & Opzioni specifiche per i socket che usano IPv4.\\
2100     \constd{SOL\_TCP}   & Opzioni per i socket che usano TCP.\\
2101     \constd{SOL\_IPV6}  & Opzioni specifiche per i socket che usano IPv6.\\
2102     \constd{SOL\_ICMPV6}& Opzioni specifiche per i socket che usano ICMPv6.\\
2103     \hline
2104   \end{tabular}
2105   \caption{Possibili valori dell'argomento \param{level} delle 
2106     funzioni \func{setsockopt} e \func{getsockopt}.} 
2107   \label{tab:sock_option_levels}
2108 \end{table}
2109
2110 I valori usati per \param{level}, corrispondenti ad un dato protocollo usato
2111 da un socket, sono quelli corrispondenti al valore numerico che identifica il
2112 suddetto protocollo in \conffile{/etc/protocols}; dato che la leggibilità di un
2113 programma non trarrebbe certo beneficio dall'uso diretto dei valori numerici,
2114 più comunemente si indica il protocollo tramite le apposite costanti
2115 \texttt{SOL\_*} riportate in tab.~\ref{tab:sock_option_levels}, dove si sono
2116 riassunti i valori che possono essere usati per l'argomento
2117 \param{level}. 
2118
2119 La notazione in questo caso è, purtroppo, abbastanza confusa: infatti in Linux
2120 il valore si può impostare sia usando le costanti \texttt{SOL\_*}, che le
2121 analoghe \texttt{IPPROTO\_*} (citate anche da Stevens in \cite{UNP1});
2122 entrambe hanno gli stessi valori che sono equivalenti ai numeri di protocollo
2123 di \conffile{/etc/protocols}, con una eccezione specifica, che è quella del
2124 protocollo ICMP, per la quale non esiste una costante, il che è comprensibile
2125 dato che il suo valore, 1, è quello che viene assegnato a \const{SOL\_SOCKET}.
2126
2127 Il quarto argomento, \param{optval} è un puntatore ad una zona di memoria che
2128 contiene i dati che specificano il valore dell'opzione che si vuole passare al
2129 socket, mentre l'ultimo argomento \param{optlen},\footnote{questo argomento è
2130   in realtà sempre di tipo \ctyp{int}, come era nelle \acr{libc4} e
2131   \acr{libc5}; l'uso di \type{socklen\_t} è stato introdotto da POSIX (valgono
2132   le stesse considerazioni per l'uso di questo tipo di dato fatte in
2133   sez.~\ref{sec:TCP_func_accept}) ed adottato dalle \acr{glibc}.} è la
2134 dimensione in byte dei dati presenti all'indirizzo indicato da \param{optval}.
2135 Dato che il tipo di dati varia a seconda dell'opzione scelta, occorrerà
2136 individuare qual è quello che deve essere usato, ed utilizzare le opportune
2137 variabili.
2138
2139 La gran parte delle opzioni utilizzano per \param{optval} un valore intero, se
2140 poi l'opzione esprime una condizione logica, il valore è sempre un intero, ma
2141 si dovrà usare un valore non nullo per abilitarla ed un valore nullo per
2142 disabilitarla.  Se invece l'opzione non prevede di dover ricevere nessun tipo
2143 di valore si deve impostare \param{optval} a \val{NULL}. Un piccolo numero
2144 di opzioni però usano dei tipi di dati peculiari, è questo il motivo per cui
2145 \param{optval} è stato definito come puntatore generico.
2146
2147 La seconda funzione usata per controllare le proprietà dei socket è
2148 \funcd{getsockopt}, che serve a leggere i valori delle opzioni dei socket ed a
2149 farsi restituire i dati relativi al loro funzionamento; il suo prototipo è:
2150
2151
2152 \begin{funcproto}{
2153 \fhead{sys/socket.h}
2154 \fhead{sys/types.h}
2155 \fdecl{int getsockopt(int s, int level, int optname, void *optval,
2156     socklen\_t *optlen)}
2157 \fdesc{Legge le opzioni di un socket.} 
2158 }
2159
2160 {La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual
2161   caso \var{errno} assumerà uno dei valori: 
2162   \begin{errlist}
2163   \item[\errcode{EBADF}] il file descriptor \param{sock} non è valido.
2164   \item[\errcode{EFAULT}] l'indirizzo \param{optval} o quello di
2165     \param{optlen} non è valido.
2166   \item[\errcode{ENOPROTOOPT}] l'opzione scelta non esiste per il livello
2167     indicato. 
2168   \item[\errcode{ENOTSOCK}] il file descriptor \param{sock} non corrisponde ad
2169     un socket.
2170   \end{errlist}
2171 }
2172 \end{funcproto}
2173
2174 I primi tre argomenti sono identici ed hanno lo stesso significato di quelli
2175 di \func{setsockopt}, anche se non è detto che tutte le opzioni siano definite
2176 per entrambe le funzioni. In questo caso \param{optval} viene usato per
2177 ricevere le informazioni ed indica l'indirizzo a cui andranno scritti i dati
2178 letti dal socket, infine \param{optlen} diventa un puntatore ad una variabile
2179 che viene usata come \textit{value result argument} per indicare, prima della
2180 chiamata della funzione, la lunghezza del buffer allocato per \param{optval} e
2181 per ricevere indietro, dopo la chiamata della funzione, la dimensione
2182 effettiva dei dati scritti su di esso.  Se la dimensione del buffer allocato
2183 per \param{optval} non è sufficiente si avrà un errore.
2184
2185
2186
2187 \subsection{Le opzioni generiche}
2188 \label{sec:sock_generic_options}
2189
2190 Come accennato esiste un insieme generico di opzioni dei socket che possono
2191 applicarsi a qualunque tipo di socket,\footnote{una descrizione di queste
2192   opzioni è generalmente disponibile nella settima sezione delle pagine di
2193   manuale, nel caso specifico la si può consultare con \texttt{man 7 socket}.}
2194 indipendentemente da quale protocollo venga poi utilizzato. Se si vuole
2195 operare su queste opzioni generiche il livello da utilizzare è
2196 \const{SOL\_SOCKET}; si è riportato un elenco di queste opzioni in
2197 tab.~\ref{tab:sock_opt_socklevel}.
2198
2199
2200 \begin{table}[!htb]
2201   \centering
2202   \footnotesize
2203   \begin{tabular}[c]{|l|c|c|c|l|l|}
2204     \hline
2205     \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
2206                     \textbf{Descrizione}\\
2207     \hline
2208     \hline
2209     \const{SO\_ACCEPTCONN}&$\bullet$&        &         &\texttt{int}& 
2210                           Indica se il socket è in ascolto.\\
2211     \const{SO\_BINDTODEVICE}&$\bullet$&$\bullet$&         &\texttt{char *}& 
2212                           Lega il socket ad un dispositivo.\\
2213     \const{SO\_BROADCAST}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2214                           Attiva o disattiva il \textit{broadcast}.\\ 
2215     \const{SO\_BSDCOMPAT}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2216                           Abilita la compatibilità con BSD.\\
2217     \const{SO\_DEBUG}    &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2218                           Abilita il debugging sul socket.\\
2219     \const{SO\_DONTROUTE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2220                           Non invia attraverso un gateway.\\
2221     \const{SO\_ERROR}    &$\bullet$&         &         &\texttt{int}& 
2222                           Riceve e cancella gli errori pendenti.\\
2223     \const{SO\_KEEPALIVE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2224                           Controlla l'attività della connessione.\\
2225     \const{SO\_LINGER}   &$\bullet$&$\bullet$&         &\texttt{linger}&
2226                           Indugia nella chiusura con dati da spedire.\\
2227     \const{SO\_MARK}     &$\bullet$&$\bullet$&         &\texttt{int}&
2228                           Imposta un ``\textit{firewall mark}'' sul socket.\\
2229     \const{SO\_OOBINLINE}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2230                           Lascia in linea i dati \textit{out-of-band}.\\
2231     \const{SO\_PASSCRED} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2232                           Abilita la ricezione di credenziali.\\
2233     \const{SO\_PEERCRED} &$\bullet$&         &         &\texttt{ucred}& 
2234                           Restituisce le credenziali del processo remoto.\\
2235     \const{SO\_PRIORITY} &$\bullet$&$\bullet$&         &\texttt{int}& 
2236                           Imposta la priorità del socket.\\
2237     \const{SO\_PROTOCOL} &$\bullet$&         &         &\texttt{int}& 
2238                           Ottiene il protocollo usato dal socket.\\
2239     \const{SO\_RCVLOWAT} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2240                           Basso livello sul buffer di ricezione.\\
2241     \const{SO\_SNDLOWAT} &$\bullet$&$\bullet$&         &\texttt{int}&
2242                           Basso livello sul buffer di trasmissione.\\
2243     \const{SO\_RCVTIMEO} &$\bullet$&$\bullet$&         &\texttt{timeval}& 
2244                           Timeout in ricezione.\\
2245     \const{SO\_SNDTIMEO} &$\bullet$&$\bullet$&         &\texttt{timeval}& 
2246                           Timeout in trasmissione.\\
2247     \const{SO\_REUSEADDR}&$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2248                           Consente il riutilizzo di un indirizzo locale.\\
2249     \const{SO\_TYPE}     &$\bullet$&         &         &\texttt{int}& 
2250                           Restituisce il tipo di socket.\\
2251     \const{SO\_SNDBUF}   &$\bullet$&$\bullet$&         &\texttt{int}& 
2252                           Imposta dimensione del buffer di trasmissione.\\
2253     \const{SO\_RCVBUF}   &$\bullet$&$\bullet$&         &\texttt{int}& 
2254                           Imposta dimensione del buffer di ricezione.\\
2255    \hline
2256   \end{tabular}
2257   \caption{Le opzioni disponibili al livello \const{SOL\_SOCKET}.} 
2258   \label{tab:sock_opt_socklevel}
2259 \end{table}
2260
2261 % TODO aggiungere e documentare SO_ATTACH_BPF, introdotta con il kernel 3.19,
2262 % vedi http://lwn.net/Articles/625224/
2263 % TODO aggiungere e documentare SO_INCOMING_CPU, introdotta con il kernel 3.19,
2264 % vedi https://lwn.net/Articles/626150/
2265
2266 % TODO documentare SO_MARK, cercare esempi e verificare il tipo di valore passato
2267 % TODO documentare SO_PEEK_OFF
2268 % TODO documentare SO_PROTOCOL
2269
2270
2271 La tabella elenca le costanti che identificano le singole opzioni da usare
2272 come valore per \param{optname}; le due colonne seguenti indicano per quali
2273 delle due funzioni (\func{getsockopt} o \func{setsockopt}) l'opzione è
2274 disponibile, mentre la colonna successiva indica, quando si ha a che fare con
2275 un valore di \param{optval} intero, se l'opzione è da considerare un numero o
2276 un valore logico. Si è inoltre riportato sulla quinta colonna il tipo di dato
2277 usato per \param{optval} ed una breve descrizione del significato delle
2278 singole opzioni sulla sesta.
2279
2280 Le descrizioni delle opzioni presenti in tab.~\ref{tab:sock_opt_socklevel}
2281 sono estremamente sommarie, è perciò necessario fornire un po' più di
2282 informazioni. Alcune opzioni inoltre hanno una notevole rilevanza nella
2283 gestione dei socket, e pertanto il loro utilizzo sarà approfondito
2284 separatamente in sez.~\ref{sec:sock_options_main}. Quello che segue è quindi
2285 soltanto un elenco più dettagliato della breve descrizione di
2286 tab.~\ref{tab:sock_opt_socklevel} sul significato delle varie opzioni:
2287 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
2288
2289 \item[\const{SO\_KEEPALIVE}] questa opzione abilita un meccanismo di verifica
2290   della persistenza di una connessione associata al socket (ed è pertanto
2291   effettiva solo sui socket che supportano le connessioni, ed è usata
2292   principalmente con il TCP). L'opzione utilizza per \param{optval} un intero
2293   usato come valore logico. Maggiori dettagli sul suo funzionamento sono
2294   forniti in sez.~\ref{sec:sock_options_main}.
2295
2296 \item[\constd{SO\_OOBINLINE}] se questa opzione viene abilitata i dati
2297   \textit{out-of-band} vengono inviati direttamente nel flusso di dati del
2298   socket (e sono quindi letti con una normale \func{read}) invece che restare
2299   disponibili solo per l'accesso con l'uso del flag \const{MSG\_OOB} di
2300   \func{recvmsg}. L'argomento è trattato in dettaglio in
2301   sez.~\ref{sec:TCP_urgent_data}. L'opzione funziona soltanto con socket che
2302   supportino i dati \textit{out-of-band} (non ha senso per socket UDP ad
2303   esempio), ed utilizza per \param{optval} un intero usato come valore logico.
2304
2305 \item[\constd{SO\_RCVLOWAT}] questa opzione imposta il valore che indica il
2306   numero minimo di byte che devono essere presenti nel buffer di ricezione
2307   perché il kernel passi i dati all'utente, restituendoli ad una \func{read} o
2308   segnalando ad una \func{select} (vedi sez.~\ref{sec:TCP_sock_select}) che ci
2309   sono dati in ingresso. L'opzione utilizza per \param{optval} un intero che
2310   specifica il numero di byte, ma con Linux questo valore è sempre 1 e non può
2311   essere cambiato; \func{getsockopt} leggerà questo valore mentre
2312   \func{setsockopt} darà un errore di \errcode{ENOPROTOOPT}. 
2313
2314 \item[\constd{SO\_SNDLOWAT}] questa opzione imposta il valore che indica il
2315   numero minimo di byte che devono essere presenti nel buffer di trasmissione
2316   perché il kernel li invii al protocollo successivo, consentendo ad una
2317   \func{write} di ritornare o segnalando ad una \func{select} (vedi
2318   sez.~\ref{sec:TCP_sock_select}) che è possibile eseguire una scrittura.
2319   L'opzione utilizza per \param{optval} un intero che specifica il numero di
2320   byte, come per la precedente \const{SO\_RCVLOWAT} con Linux questo valore è
2321   sempre 1 e non può essere cambiato; \func{getsockopt} leggerà questo valore
2322   mentre \func{setsockopt} darà un errore di \errcode{ENOPROTOOPT}.
2323
2324 \item[\constd{SO\_RCVTIMEO}] l'opzione permette di impostare un tempo massimo
2325   sulle operazioni di lettura da un socket, e prende per \param{optval} una
2326   struttura di tipo \struct{timeval} (vedi fig.~\ref{fig:sys_timeval_struct})
2327   identica a quella usata con \func{select}. Con \func{getsockopt} si può
2328   leggere il valore attuale, mentre con \func{setsockopt} si imposta il tempo
2329   voluto, usando un valore nullo per \struct{timeval} il timeout viene
2330   rimosso. 
2331
2332   Se l'opzione viene attivata tutte le volte che una delle funzioni di lettura
2333   (\func{read}, \func{readv}, \func{recv}, \func{recvfrom} e \func{recvmsg})
2334   si blocca in attesa di dati per un tempo maggiore di quello impostato, essa
2335   ritornerà un valore -1 e la variabile \var{errno} sarà impostata con un
2336   errore di \errcode{EAGAIN} e \errcode{EWOULDBLOCK}, così come sarebbe
2337   avvenuto se si fosse aperto il socket in modalità non bloccante.\footnote{in
2338     teoria, se il numero di byte presenti nel buffer di ricezione fosse
2339     inferiore a quello specificato da \const{SO\_RCVLOWAT}, l'effetto potrebbe
2340     essere semplicemente quello di provocare l'uscita delle funzioni di
2341     lettura restituendo il numero di byte fino ad allora ricevuti; dato che
2342     con Linux questo valore è sempre 1 questo caso non esiste.}
2343
2344   In genere questa opzione non è molto utilizzata se si ha a che fare con la
2345   lettura dei dati, in quanto è sempre possibile usare una \func{select} che
2346   consente di specificare un \textit{timeout}; l'uso di \func{select} non
2347   consente però di impostare il timeout per l'uso di \func{connect}, per avere
2348   il quale si può ricorrere a questa opzione. 
2349
2350 % TODO verificare il timeout con un programma di test
2351
2352 \item[\constd{SO\_SNDTIMEO}] l'opzione permette di impostare un tempo massimo
2353   sulle operazioni di scrittura su un socket, ed usa gli stessi valori di
2354   \const{SO\_RCVTIMEO}.  In questo caso però si avrà un errore di
2355   \errcode{EAGAIN} o \errcode{EWOULDBLOCK} per le funzioni di scrittura
2356   \func{write}, \func{writev}, \func{send}, \func{sendto} e \func{sendmsg}
2357   qualora queste restino bloccate per un tempo maggiore di quello specificato. 
2358
2359 \item[\constd{SO\_BSDCOMPAT}] questa opzione abilita la compatibilità con il
2360   comportamento di BSD (in particolare ne riproduce i bug).  Attualmente è una
2361   opzione usata solo per il protocollo UDP e ne è prevista la rimozione in
2362   futuro.  L'opzione utilizza per \param{optval} un intero usato come valore
2363   logico. 
2364
2365   Quando viene abilitata gli errori riportati da messaggi ICMP per un socket
2366   UDP non vengono passati al programma in user space. Con le versioni 2.0.x
2367   del kernel erano anche abilitate altre opzioni per i socket raw, che sono
2368   state rimosse con il passaggio al 2.2; è consigliato correggere i programmi
2369   piuttosto che usare questa funzione. 
2370
2371 \item[\constd{SO\_PASSCRED}] questa opzione abilita sui socket unix-domain
2372   (vedi sez.~\ref{sec:unix_socket}) la ricezione dei messaggi di controllo di
2373   tipo \const{SCM\_CREDENTIALS}. Prende come \param{optval} un intero usato
2374   come valore logico.
2375
2376 \item[\constd{SO\_PEERCRED}] questa opzione restituisce le credenziali del
2377   processo remoto connesso al socket; l'opzione è disponibile solo per socket
2378   unix-domain e può essere usata solo con \func{getsockopt}.  Utilizza per
2379   \param{optval} una apposita struttura \struct{ucred} (vedi
2380   sez.~\ref{sec:unix_socket}). 
2381
2382 \item[\constd{SO\_BINDTODEVICE}] questa opzione permette di \textsl{legare} il
2383   socket ad una particolare interfaccia, in modo che esso possa ricevere ed
2384   inviare pacchetti solo su quella. L'opzione richiede per \param{optval} il
2385   puntatore ad una stringa contenente il nome dell'interfaccia (ad esempio
2386   \texttt{eth0}); utilizzando una stringa nulla o un valore nullo per
2387   \param{optlen} si può rimuovere un precedente collegamento.
2388
2389   Il nome della interfaccia deve essere specificato con una stringa terminata
2390   da uno zero e di lunghezza massima pari a \constd{IFNAMSIZ}; l'opzione è
2391   effettiva solo per alcuni tipi di socket, ed in particolare per quelli della
2392   famiglia \const{AF\_INET}; non è invece supportata per i \textit{packet
2393     socket} (vedi sez.~\ref{sec:socket_raw}). 
2394
2395 \item[\constd{SO\_DEBUG}] questa opzione abilita il debugging delle operazioni
2396   dei socket; l'opzione utilizza per \param{optval} un intero usato come
2397   valore logico, e può essere utilizzata solo da un processo con i privilegi
2398   di amministratore (in particolare con la \textit{capability}
2399   \const{CAP\_NET\_ADMIN}).  L'opzione necessita inoltre dell'opportuno
2400   supporto nel kernel;\footnote{deve cioè essere definita la macro di
2401     preprocessore \macrod{SOCK\_DEBUGGING} nel file \file{include/net/sock.h}
2402     dei sorgenti del kernel, questo è sempre vero nei kernel delle serie
2403     superiori alla 2.3, per i kernel delle serie precedenti invece è
2404     necessario aggiungere a mano detta definizione; è inoltre possibile
2405     abilitare anche il tracciamento degli stati del TCP definendo la macro
2406     \macrod{STATE\_TRACE} in \file{include/net/tcp.h}.}  quando viene
2407   abilitata una serie di messaggi con le informazioni di debug vengono inviati
2408   direttamente al sistema del kernel log.\footnote{si tenga presente che il
2409     comportamento è diverso da quanto avviene con BSD, dove l'opzione opera
2410     solo sui socket TCP, causando la scrittura di tutti i pacchetti inviati
2411     sulla rete su un buffer circolare che viene letto da un apposito
2412     programma, \cmd{trpt}.}
2413
2414 \item[\const{SO\_REUSEADDR}] questa opzione permette di eseguire la funzione
2415   \func{bind} su indirizzi locali che siano già in uso da altri socket;
2416   l'opzione utilizza per \param{optval} un intero usato come valore logico.
2417   Questa opzione modifica il comportamento normale dell'interfaccia dei socket
2418   che fa fallire l'esecuzione della funzione \func{bind} con un errore di
2419   \errcode{EADDRINUSE} quando l'indirizzo locale\footnote{più propriamente il
2420     controllo viene eseguito sulla porta.} è già in uso da parte di un altro
2421   socket.  Maggiori dettagli sul suo funzionamento sono forniti in
2422   sez.~\ref{sec:sock_options_main}.
2423
2424 \item[\constd{SO\_TYPE}] questa opzione permette di leggere il tipo di socket
2425   su cui si opera; funziona solo con \func{getsockopt}, ed utilizza per
2426   \param{optval} un intero in cui verrà restituito il valore numerico che lo
2427   identifica (ad esempio \const{SOCK\_STREAM}). 
2428
2429 \item[\constd{SO\_ACCEPTCONN}] questa opzione permette di rilevare se il socket
2430   su cui opera è stato posto in modalità di ricezione di eventuali connessioni
2431   con una chiamata a \func{listen}. L'opzione può essere usata soltanto con
2432   \func{getsockopt} e utilizza per \param{optval} un intero in cui viene
2433   restituito 1 se il socket è in ascolto e 0 altrimenti. 
2434
2435 \item[\constd{SO\_DONTROUTE}] questa opzione forza l'invio diretto dei
2436   pacchetti del socket, saltando ogni processo relativo all'uso della tabella
2437   di routing del kernel. Prende per \param{optval} un intero usato come valore
2438   logico.
2439
2440 \item[\constd{SO\_BROADCAST}] questa opzione abilita il \textit{broadcast};
2441   quanto abilitata i socket di tipo \const{SOCK\_DGRAM} riceveranno i
2442   pacchetti inviati all'indirizzo di \textit{broadcast}, e potranno scrivere
2443   pacchetti su tale indirizzo.  Prende per \param{optval} un intero usato come
2444   valore logico. L'opzione non ha effetti su un socket di tipo
2445   \const{SOCK\_STREAM}.
2446
2447 \item[\constd{SO\_SNDBUF}] questa opzione imposta la dimensione del buffer di
2448   trasmissione del socket. Prende per \param{optval} un intero indicante il
2449   numero di byte. Il valore di default ed il valore massimo che si possono
2450   specificare come argomento per questa opzione sono impostabili
2451   rispettivamente tramite gli opportuni valori di \func{sysctl} (vedi
2452   sez.~\ref{sec:sock_sysctl}).
2453
2454 \item[\constd{SO\_RCVBUF}] questa opzione imposta la dimensione del buffer di
2455   ricezione del socket. Prende per \param{optval} un intero indicante il
2456   numero di byte. Il valore di default ed il valore massimo che si può
2457   specificare come argomento per questa opzione sono impostabili tramiti gli
2458   opportuni valori di \func{sysctl} (vedi sez.~\ref{sec:sock_sysctl}).
2459
2460   Si tenga presente che nel caso di socket TCP, per entrambe le opzioni
2461   \const{SO\_RCVBUF} e \const{SO\_SNDBUF}, il kernel alloca effettivamente una
2462   quantità di memoria doppia rispetto a quanto richiesto con
2463   \func{setsockopt}. Questo comporta che una successiva lettura con
2464   \func{getsockopt} riporterà un valore diverso da quello impostato con
2465   \func{setsockopt}.  Questo avviene perché TCP necessita dello spazio in più
2466   per mantenere dati amministrativi e strutture interne, e solo una parte
2467   viene usata come buffer per i dati, mentre il valore letto da
2468   \func{getsockopt} e quello riportato nei vari parametri di
2469   \textit{sysctl}\footnote{cioè \sysctlrelfile{net/core}{wmem\_max} e
2470     \sysctlrelfile{net/core}{rmem\_max} in \texttt{/proc/sys/net/core} e
2471     \sysctlrelfile{net/ipv4}{tcp\_wmem} e \sysctlrelfile{net/ipv4}{tcp\_rmem}
2472     in \texttt{/proc/sys/net/ipv4}, vedi sez.~\ref{sec:sock_sysctl}.} indica
2473   la memoria effettivamente impiegata.  Si tenga presente inoltre che le
2474   modifiche alle dimensioni dei buffer di ricezione e trasmissione, per poter
2475   essere effettive, devono essere impostate prima della chiamata alle funzioni
2476   \func{listen} o \func{connect}.
2477
2478 \item[\const{SO\_LINGER}] questa opzione controlla le modalità con cui viene
2479   chiuso un socket quando si utilizza un protocollo che supporta le
2480   connessioni (è pertanto usata con i socket TCP ed ignorata per UDP) e
2481   modifica il comportamento delle funzioni \func{close} e \func{shutdown}.
2482   L'opzione richiede che l'argomento \param{optval} sia una struttura di tipo
2483   \struct{linger}, definita in \headfile{sys/socket.h} ed illustrata in
2484   fig.~\ref{fig:sock_linger_struct}.  Maggiori dettagli sul suo funzionamento
2485   sono forniti in sez.~\ref{sec:sock_options_main}.
2486
2487 \item[\constd{SO\_PRIORITY}] questa opzione permette di impostare le priorità
2488   per tutti i pacchetti che sono inviati sul socket, prende per \param{optval}
2489   un valore intero. Con questa opzione il kernel usa il valore per ordinare le
2490   priorità sulle code di rete,\footnote{questo richiede che sia abilitato il
2491     sistema di \textit{Quality of Service} disponibile con le opzioni di
2492     routing avanzato.} i pacchetti con priorità più alta vengono processati
2493   per primi, in modalità che dipendono dalla disciplina di gestione della
2494   coda. Nel caso di protocollo IP questa opzione permette anche di impostare i
2495   valori del campo \textit{type of service} (noto come TOS, vedi
2496   sez.~\ref{sec:IP_header}) per i pacchetti uscenti. Per impostare una
2497   priorità al di fuori dell'intervallo di valori fra 0 e 6 sono richiesti i
2498   privilegi di amministratore con la capability \const{CAP\_NET\_ADMIN}.
2499
2500 \item[\constd{SO\_ERROR}] questa opzione riceve un errore presente sul socket;
2501   può essere utilizzata soltanto con \func{getsockopt} e prende per
2502   \param{optval} un valore intero, nel quale viene restituito il codice di
2503   errore, e la condizione di errore sul socket viene cancellata. Viene
2504   usualmente utilizzata per ricevere il codice di errore, come accennato in
2505   sez.~\ref{sec:TCP_sock_select}, quando si sta osservando il socket con una
2506   \func{select} che ritorna a causa dello stesso.
2507
2508 \item[\constd{SO\_ATTACH\_FILTER}] questa opzione permette di agganciare ad un
2509   socket un filtro di pacchetti che consente di selezionare quali pacchetti,
2510   fra tutti quelli ricevuti, verranno letti. Viene usato principalmente con i
2511   socket di tipo \const{PF\_PACKET} con la libreria \texttt{libpcap} per
2512   implementare programmi di cattura dei pacchetti, torneremo su questo in
2513   sez.~\ref{sec:packet_socket}.
2514
2515 \item[\constd{SO\_DETACH\_FILTER}] consente di distaccare un filtro
2516   precedentemente aggiunto ad un socket.
2517
2518 % TODO documentare SO_ATTACH_FILTER e SO_DETACH_FILTER
2519 % riferimenti http://www.rcpt.to/lsfcc/lsf.html
2520 % Documentation/networking/filter.txt
2521
2522 % TODO documentare SO_MARK, introdotta nel 2.6.25, richiede CAP_NET_ADMIN
2523 %A userspace program may wish to set the mark for each packets its send
2524 %without using the netfilter MARK target. Changing the mark can be used
2525 %for mark based routing without netfilter or for packet filtering.
2526
2527
2528 % TODO documentare SO_TIMESTAMP e le altre opzioni di timestamping dei 
2529 % pacchetti, introdotte nel 2.6.30, vedi nei sorgenti del kernel:
2530 % Documentation/networking/timestamping.txt
2531
2532
2533 % TOFO documentare SO_REUSEPORT introdotta con il kernel 3.9, vedi
2534 % http://git.kernel.org/linus/c617f398edd4db2b8567a28e899a88f8f574798d 
2535
2536 \end{basedescript}
2537
2538
2539 \subsection{L'uso delle principali opzioni dei socket}
2540 \label{sec:sock_options_main}
2541
2542 La descrizione sintetica del significato delle opzioni generiche dei socket,
2543 riportata nell'elenco in sez.~\ref{sec:sock_generic_options}, è
2544 necessariamente sintetica, alcune di queste però possono essere utilizzate
2545 per controllare delle funzionalità che hanno una notevole rilevanza nella
2546 programmazione dei socket.  Per questo motivo faremo in questa sezione un
2547 approfondimento sul significato delle opzioni generiche più importanti.
2548
2549
2550 \constbeg{SO\_KEEPALIVE}
2551 \subsubsection{L'opzione \const{SO\_KEEPALIVE}}
2552
2553 La prima opzione da approfondire è \const{SO\_KEEPALIVE} che permette di
2554 tenere sotto controllo lo stato di una connessione. Una connessione infatti
2555 resta attiva anche quando non viene effettuato alcun traffico su di essa; è
2556 allora possibile, in caso di una interruzione completa della rete, che la
2557 caduta della connessione non venga rilevata, dato che sulla stessa non passa
2558 comunque alcun traffico.
2559
2560 Se si imposta questa opzione, è invece cura del kernel inviare degli appositi
2561 messaggi sulla rete, detti appunto \textit{keep-alive}, per verificare se la
2562 connessione è attiva.  L'opzione funziona soltanto con i socket che supportano
2563 le connessioni (non ha senso per socket UDP ad esempio) e si applica
2564 principalmente ai socket TCP.
2565
2566 Con le impostazioni di default (che sono riprese da BSD) Linux emette un
2567 messaggio di \textit{keep-alive}\footnote{in sostanza un segmento ACK vuoto,
2568   cui sarà risposto con un altro segmento ACK vuoto.} verso l'altro capo della
2569 connessione se questa è rimasta senza traffico per più di due ore.  Se è tutto
2570 a posto il messaggio viene ricevuto e verrà emesso un segmento ACK di
2571 risposta, alla cui ricezione ripartirà un altro ciclo di attesa per altre due
2572 ore di inattività; il tutto avviene all'interno del kernel e le applicazioni
2573 non riceveranno nessun dato.
2574
2575 Qualora ci siano dei problemi di rete si possono invece verificare i due casi
2576 di terminazione precoce del server già illustrati in
2577 sez.~\ref{sec:TCP_conn_crash}. Il primo è quello in cui la macchina remota ha
2578 avuto un crollo del sistema ed è stata riavviata, per cui dopo il riavvio la
2579 connessione non esiste più.\footnote{si ricordi che un normale riavvio o il
2580   crollo dell'applicazione non ha questo effetto, in quanto in tal caso si
2581   passa sempre per la chiusura del processo, e questo, come illustrato in
2582   sez.~\ref{sec:file_open_close}, comporta anche la regolare chiusura del
2583   socket con l'invio di un segmento FIN all'altro capo della connessione.} In
2584 questo caso all'invio del messaggio di \textit{keep-alive} si otterrà come
2585 risposta un segmento RST che indica che l'altro capo non riconosce più
2586 l'esistenza della connessione ed il socket verrà chiuso riportando un errore
2587 di \errcode{ECONNRESET}.
2588
2589 Se invece non viene ricevuta nessuna risposta (indice che la macchina non è
2590 più raggiungibile) l'emissione dei messaggi viene ripetuta ad intervalli di 75
2591 secondi per un massimo di 9 volte\footnote{entrambi questi valori possono
2592   essere modificati a livello di sistema (cioè per tutti i socket) con gli
2593   opportuni parametri illustrati in sez.~\ref{sec:sock_sysctl} ed a livello di
2594   singolo socket con le opzioni \texttt{TCP\_KEEP*} di
2595   sez.~\ref{sec:sock_tcp_udp_options}.}  (per un totale di 11 minuti e 15
2596 secondi) dopo di che, se non si è ricevuta nessuna risposta, il socket viene
2597 chiuso dopo aver impostato un errore di \errcode{ETIMEDOUT}. Qualora la
2598 connessione si sia ristabilita e si riceva un successivo messaggio di risposta
2599 il ciclo riparte come se niente fosse avvenuto.  Infine se si riceve come
2600 risposta un pacchetto ICMP di destinazione irraggiungibile (vedi
2601 sez.~\ref{sec:ICMP_protocol}), verrà restituito l'errore corrispondente.
2602
2603 In generale questa opzione serve per individuare una caduta della connessione
2604 anche quando non si sta facendo traffico su di essa.  Viene usata
2605 principalmente sui server per evitare di mantenere impegnate le risorse che
2606 verrebbero dedicate a trattare delle connessioni che in realtà sono già
2607 terminate (quelle che vengono anche chiamate connessioni
2608 \textsl{semi-aperte}); in tutti quei casi cioè in cui il server si trova in
2609 attesa di dati in ingresso su una connessione che non arriveranno mai o perché
2610 il client sull'altro capo non è più attivo o perché non è più in grado di
2611 comunicare con il server via rete.
2612
2613 \begin{figure}[!htbp]
2614   \footnotesize \centering
2615   \begin{minipage}[c]{\codesamplewidth}
2616     \includecodesample{listati/TCP_echod_fourth.c}
2617   \end{minipage}
2618   \normalsize
2619   \caption{La sezione della nuova versione del server del servizio
2620     \textit{echo} che prevede l'attivazione del \textit{keepalive} sui
2621     socket.}
2622   \label{fig:echod_keepalive_code}
2623 \end{figure}
2624
2625 Abilitandola dopo un certo tempo le connessioni effettivamente terminate
2626 verranno comunque chiuse per cui, utilizzando ad esempio una \func{select}, se
2627 be potrà rilevare la conclusione e ricevere il relativo errore. Si tenga
2628 presente però che non può avere la certezza assoluta che un errore di
2629 \errcode{ETIMEDOUT} ottenuto dopo aver abilitato questa opzione corrisponda
2630 necessariamente ad una reale conclusione della connessione, il problema
2631 potrebbe anche essere dovuto ad un problema di routing che perduri per un
2632 tempo maggiore di quello impiegato nei vari tentativi di ritrasmissione del
2633 \textit{keep-alive} (anche se questa non è una condizione molto probabile).
2634
2635 Come esempio dell'utilizzo di questa opzione introduciamo all'interno del
2636 nostro server per il servizio \textit{echo} la nuova opzione \texttt{-k} che
2637 permette di attivare il \textit{keep-alive} sui socket; tralasciando la parte
2638 relativa alla gestione di detta opzione (che si limita ad assegnare ad 1 la
2639 variabile \var{keepalive}) tutte le modifiche al server sono riportate in
2640 fig.~\ref{fig:echod_keepalive_code}. Al solito il codice completo è contenuto
2641 nel file \texttt{TCP\_echod\_fourth.c} dei sorgenti allegati alla guida.
2642
2643 Come si può notare la variabile \var{keepalive} è preimpostata (\texttt{\small
2644   8}) ad un valore nullo; essa viene utilizzata sia come variabile logica per
2645 la condizione (\texttt{\small 14}) che controlla l'attivazione del
2646 \textit{keep-alive} che come valore dell'argomento \param{optval} della
2647 chiamata a \func{setsockopt} (\texttt{\small 16}).  A seconda del suo valore
2648 tutte le volte che un processo figlio viene eseguito in risposta ad una
2649 connessione verrà pertanto eseguita o meno la sezione (\texttt{\small 14--17})
2650 che esegue l'impostazione di \const{SO\_KEEPALIVE} sul socket connesso,
2651 attivando il relativo comportamento.
2652 \constend{SO\_KEEPALIVE}
2653
2654
2655
2656 \constbeg{SO\_REUSEADDR}
2657 \subsubsection{L'opzione \const{SO\_REUSEADDR}}
2658
2659 La seconda opzione da approfondire è \const{SO\_REUSEADDR}, che consente di
2660 eseguire \func{bind} su un socket anche quando la porta specificata è già in
2661 uso da parte di un altro socket. Si ricordi infatti che, come accennato in
2662 sez.~\ref{sec:TCP_func_bind}, normalmente la funzione \func{bind} fallisce con
2663 un errore di \errcode{EADDRINUSE} se la porta scelta è già utilizzata da un
2664 altro socket, proprio per evitare che possano essere lanciati due server sullo
2665 stesso indirizzo e la stessa porta, che verrebbero a contendersi i pacchetti
2666 aventi quella destinazione.
2667
2668 Esistono però situazioni ed esigenze particolari in cui non si vuole che
2669 questo comportamento di salvaguardia accada, ed allora si può fare ricorso a
2670 questa opzione.  La questione è comunque abbastanza complessa in quanto, come
2671 sottolinea Stevens in \cite{UNP1}, si distinguono ben quattro casi diversi in
2672 cui è prevista la possibilità di un utilizzo di questa opzione, il che la
2673 rende una delle più difficili da capire.
2674
2675 Il primo caso, che è anche il più comune, in cui si fa ricorso a
2676 \const{SO\_REUSEADDR} è quello in cui un server è terminato ma esistono ancora
2677 dei processi figli che mantengono attiva almeno una connessione remota che
2678 utilizza l'indirizzo locale, mantenendo occupata la porta. Quando si riesegue
2679 il server allora questo riceve un errore sulla chiamata a \func{bind} dato che
2680 la porta è ancora utilizzata in una connessione esistente.\footnote{questa è
2681   una delle domande più frequenti sui newsgroup dedicati allo sviluppo, in
2682   quanto è piuttosto comune trovarsi in questa situazione quando si sta
2683   sviluppando un server che si ferma e si riavvia in continuazione dopo aver
2684   fatto modifiche.}  Inoltre se si usa il protocollo TCP questo può avvenire
2685 anche dopo tutti i processi figli sono terminati, dato che una connessione può
2686 restare attiva anche dopo la chiusura del socket, mantenendosi nello stato
2687 \texttt{TIME\_WAIT} (vedi sez.~\ref{sec:TCP_time_wait}).
2688
2689 Usando \const{SO\_REUSEADDR} fra la chiamata a \func{socket} e quella a
2690 \func{bind} si consente a quest'ultima di avere comunque successo anche se la
2691 connessione è attiva (o nello stato \texttt{TIME\_WAIT}). È bene però
2692 ricordare (si riveda quanto detto in sez.~\ref{sec:TCP_time_wait}) che la
2693 presenza dello stato \texttt{TIME\_WAIT} ha una ragione, ed infatti se si usa
2694 questa opzione esiste sempre una probabilità, anche se estremamente
2695 remota,\footnote{perché ciò avvenga infatti non solo devono coincidere gli
2696   indirizzi IP e le porte degli estremi della nuova connessione, ma anche i
2697   numeri di sequenza dei pacchetti, e questo è estremamente improbabile.}  che
2698 eventuali pacchetti rimasti intrappolati in una precedente connessione possano
2699 finire fra quelli di una nuova.
2700
2701 Come esempio di uso di questa connessione abbiamo predisposto una nuova
2702 versione della funzione \texttt{sockbind} (vedi fig.~\ref{fig:sockbind_code})
2703 che consenta l'impostazione di questa opzione. La nuova funzione è
2704 \texttt{sockbindopt}, e le principali differenze rispetto alla precedente sono
2705 illustrate in fig.~\ref{fig:sockbindopt_code}, dove si sono riportate le
2706 sezioni di codice modificate rispetto alla versione precedente. Il codice
2707 completo della funzione si trova, insieme alle altre funzioni di servizio dei
2708 socket, all'interno del file \texttt{SockUtils.c} dei sorgenti allegati alla
2709 guida.
2710
2711 \begin{figure}[!htbp]
2712   \footnotesize \centering
2713   \begin{minipage}[c]{\codesamplewidth}
2714     \includecodesample{listati/sockbindopt.c}
2715   \end{minipage}
2716   \normalsize
2717   \caption{Le sezioni della funzione \texttt{sockbindopt} modificate rispetto al
2718     codice della precedente \texttt{sockbind}.} 
2719   \label{fig:sockbindopt_code}
2720 \end{figure}
2721
2722 In realtà tutto quello che si è fatto è stato introdurre nella nuova funzione
2723 (\texttt{\small 1}) un nuovo argomento intero, \param{reuse}, che conterrà il
2724 valore logico da usare nella successiva chiamata (\texttt{\small 14}) a
2725 \func{setsockopt}. Si è poi aggiunta una sezione (\texttt{\small 13--17}) che
2726 esegue l'impostazione dell'opzione fra la chiamata a \func{socket} e quella a
2727 \func{bind}.
2728
2729
2730 A questo punto basterà modificare il  server per utilizzare la nuova
2731 funzione; in fig.~\ref{fig:TCP_echod_fifth} abbiamo riportato le sezioni
2732 modificate rispetto alla precedente versione di
2733 fig.~\ref{fig:TCP_echod_third}. Al solito il codice completo è coi sorgenti
2734 allegati alla guida, nel file \texttt{TCP\_echod\_fifth.c}.
2735
2736 Anche in questo caso si è introdotta (\texttt{\small 8}) una nuova variabile
2737 \var{reuse} che consente di controllare l'uso dell'opzione e che poi sarà
2738 usata (\texttt{\small 14}) come ultimo argomento di \func{setsockopt}. Il
2739 valore di default di questa variabile è nullo, ma usando l'opzione \texttt{-r}
2740 nell'invocazione del server (al solito la gestione delle opzioni non è
2741 riportata in fig.~\ref{fig:TCP_echod_fifth}) se ne potrà impostare ad 1 il
2742 valore, per cui in tal caso la successiva chiamata (\texttt{\small 13--17}) a
2743 \func{setsockopt} attiverà l'opzione \const{SO\_REUSEADDR}.
2744
2745 \begin{figure}[!htbp] 
2746   \footnotesize \centering
2747   \begin{minipage}[c]{\codesamplewidth}
2748     \includecodesample{listati/TCP_echod_fifth.c}
2749   \end{minipage}
2750   \normalsize
2751   \caption{Il nuovo codice per l'apertura passiva del server \textit{echo} che
2752     usa la nuova funzione \texttt{sockbindopt}.}
2753   \label{fig:TCP_echod_fifth}
2754 \end{figure}
2755
2756 Il secondo caso in cui viene usata \const{SO\_REUSEADDR} è quando si ha una
2757 macchina cui sono assegnati diversi numeri IP (o come suol dirsi
2758 \textit{multi-homed}) e si vuole porre in ascolto sulla stessa porta un
2759 programma diverso (o una istanza diversa dello stesso programma) per indirizzi
2760 IP diversi. Si ricordi infatti che è sempre possibile indicare a \func{bind}
2761 di collegarsi solo su di un indirizzo specifico; in tal caso se un altro
2762 programma cerca di riutilizzare la stessa porta (anche specificando un
2763 indirizzo diverso) otterrà un errore, a meno di non aver preventivamente
2764 impostato \const{SO\_REUSEADDR}.
2765
2766 Usando questa opzione diventa anche possibile eseguire \func{bind}
2767 sull'indirizzo generico, e questo permetterà il collegamento per tutti gli
2768 indirizzi (di quelli presenti) per i quali la porta non risulti occupata da
2769 una precedente chiamata più specifica. Infine si tenga presente che con il
2770 protocollo TCP non è mai possibile far partire server che eseguano \func{bind}
2771 sullo stesso indirizzo e la stessa porta, cioè ottenere quello che viene
2772 chiamato un \textit{completely duplicate binding}.
2773
2774 Il terzo impiego è simile al precedente e prevede l'uso di \func{bind}
2775 all'interno dello stesso programma per associare indirizzi locali diversi a
2776 socket diversi. In genere questo viene fatto per i socket UDP quando è
2777 necessario ottenere l'indirizzo a cui sono rivolte le richieste del client ed
2778 il sistema non supporta l'opzione \constd{IP\_RECVDSTADDR};\footnote{nel caso
2779   di Linux questa opzione è stata supportata per in certo periodo nello
2780   sviluppo del kernel 2.1.x, ma è in seguito stata soppiantata dall'uso di
2781   \const{IP\_PKTINFO} (vedi sez.~\ref{sec:sock_ipv4_options}).} in tale modo
2782 si può sapere a quale socket corrisponde un certo indirizzo.  Non ha senso
2783 fare questa operazione per un socket TCP dato che su di essi si può sempre
2784 invocare \func{getsockname} una volta che si è completata la connessione.
2785
2786 Infine il quarto caso è quello in cui si vuole effettivamente ottenere un
2787 \textit{completely duplicate binding}, quando cioè si vuole eseguire
2788 \func{bind} su un indirizzo ed una porta che sono già \textsl{legati} ad un
2789 altro socket.  Questo ovviamente non ha senso per il normale traffico di rete,
2790 in cui i pacchetti vengono scambiati direttamente fra due applicazioni; ma
2791 quando un sistema supporta il traffico in \textit{multicast}, allora ha senso
2792 che su una macchina i pacchetti provenienti dal traffico in \textit{multicast}
2793 possano essere ricevuti da più applicazioni\footnote{l'esempio classico di
2794   traffico in \textit{multicast} è quello di uno streaming di dati (audio,
2795   video, ecc.), l'uso del \textit{multicast} consente in tal caso di
2796   trasmettere un solo pacchetto, che potrà essere ricevuto da tutti i
2797   possibili destinatari (invece di inviarne un duplicato a ciascuno); in
2798   questo caso è perfettamente logico aspettarsi che sulla stessa macchina più
2799   utenti possano lanciare un programma che permetta loro di ricevere gli
2800   stessi dati.} o da diverse istanze della stessa applicazione.
2801
2802 In questo caso utilizzando \const{SO\_REUSEADDR} si consente ad una
2803 applicazione eseguire \func{bind} sulla stessa porta ed indirizzo usata da
2804 un'altra, così che anche essa possa ricevere gli stessi pacchetti (chiaramente
2805 la cosa non ha alcun senso per i socket TCP, ed infatti in questo tipo di
2806 applicazione è normale l'uso del protocollo UDP). La regola è che quando si
2807 hanno più applicazioni che hanno eseguito \func{bind} sulla stessa porta, di
2808 tutti pacchetti destinati ad un indirizzo di \textit{broadcast} o di
2809 \textit{multicast} viene inviata una copia a ciascuna applicazione.  Non è
2810 definito invece cosa accade qualora il pacchetto sia destinato ad un indirizzo
2811 normale (unicast).
2812
2813 Essendo questo un caso particolare in alcuni sistemi (come BSD) è stata
2814 introdotta una opzione ulteriore, \const{SO\_REUSEPORT} che richiede che detta
2815 opzione sia specificata per tutti i socket per i quali si vuole eseguire il
2816 \textit{completely duplicate binding}. Nel caso di Linux questa opzione non
2817 esisteva fino al kernel 3.9, ma il comportamento di \const{SO\_REUSEADDR} è
2818 analogo, sarà cioè possibile effettuare un \textit{completely duplicate
2819   binding} ed ottenere il successo di \func{bind} su un socket legato allo
2820 stesso indirizzo e porta solo se il programma che ha eseguito per primo
2821 \func{bind} su di essi ha impostato questa opzione.\footnote{questa
2822   restrizione permette di evitare parzialmente il cosiddetto \textit{port
2823     stealing}, in cui un programma, usando \const{SO\_REUSEADDR}, può
2824   collegarsi ad una porta già in uso e ricevere i pacchetti destinati ad un
2825   altro programma; con questa caratteristica ciò è possibile soltanto se il
2826   primo programma a consentirlo, avendo usato fin dall'inizio
2827   \const{SO\_REUSEADDR}.}
2828
2829 \constend{SO\_REUSEADDR}
2830
2831 % TODO documentare SO_REUSEPORT, vedi https://lwn.net/Articles/542260/
2832
2833 \constbeg{SO\_LINGER}
2834 \subsubsection{L'opzione \const{SO\_LINGER}}
2835
2836 La terza opzione da approfondire è \const{SO\_LINGER}; essa, come il nome
2837 suggerisce, consente di ``\textsl{indugiare}'' nella chiusura di un socket. Il
2838 comportamento standard sia di \func{close} che \func{shutdown} è infatti
2839 quello di terminare immediatamente dopo la chiamata, mentre il procedimento di
2840 chiusura della connessione (o di un lato di essa) ed il rispettivo invio sulla
2841 rete di tutti i dati ancora presenti nei buffer, viene gestito in sottofondo
2842 dal kernel.
2843
2844 \begin{figure}[!htb]
2845   \footnotesize \centering
2846   \begin{minipage}[c]{0.80\textwidth}
2847     \includestruct{listati/linger.h}
2848   \end{minipage}
2849   \caption{La struttura \structd{linger} richiesta come valore dell'argomento
2850     \param{optval} per l'impostazione dell'opzione dei socket
2851     \const{SO\_LINGER}.}
2852   \label{fig:sock_linger_struct}
2853 \end{figure}
2854
2855 L'uso di \const{SO\_LINGER} con \func{setsockopt} permette di modificare (ed
2856 eventualmente ripristinare) questo comportamento in base ai valori passati nei
2857 campi della struttura \struct{linger}, illustrata in
2858 fig.~\ref{fig:sock_linger_struct}.  Fintanto che il valore del campo
2859 \var{l\_onoff} di \struct{linger} è nullo la modalità che viene impostata
2860 (qualunque sia il valore di \var{l\_linger}) è quella standard appena
2861 illustrata; questa combinazione viene utilizzata per riportarsi al
2862 comportamento normale qualora esso sia stato cambiato da una precedente
2863 chiamata.
2864
2865 Se si utilizza un valore di \var{l\_onoff} diverso da zero, il comportamento
2866 alla chiusura viene a dipendere dal valore specificato per il campo
2867 \var{l\_linger}; se quest'ultimo è nullo l'uso delle funzioni \func{close} e
2868 \func{shutdown} provoca la terminazione immediata della connessione: nel caso
2869 di TCP cioè non viene eseguito il procedimento di chiusura illustrato in
2870 sez.~\ref{sec:TCP_conn_term}, ma tutti i dati ancora presenti nel buffer
2871 vengono immediatamente scartati e sulla rete viene inviato un segmento di RST
2872 che termina immediatamente la connessione.
2873
2874 Un esempio di questo comportamento si può abilitare nel nostro client del
2875 servizio \textit{echo} utilizzando l'opzione \texttt{-r}; riportiamo in
2876 fig.~\ref{fig:TCP_echo_sixth} la sezione di codice che permette di introdurre
2877 questa funzionalità; al solito il codice completo è disponibile nei sorgenti
2878 allegati.
2879
2880 \begin{figure}[!htbp] 
2881   \footnotesize \centering
2882   \begin{minipage}[c]{\codesamplewidth}
2883     \includecodesample{listati/TCP_echo_sixth.c}
2884   \end{minipage}
2885   \normalsize
2886   \caption{La sezione del codice del client \textit{echo} che imposta la
2887     terminazione immediata della connessione in caso di chiusura.}
2888   \label{fig:TCP_echo_sixth}
2889 \end{figure}
2890
2891 La sezione indicata viene eseguita dopo aver effettuato la connessione e prima
2892 di chiamare la funzione di gestione, cioè fra le righe (\texttt{\small 12}) e
2893 (\texttt{\small 13}) del precedente esempio di fig.~\ref{fig:TCP_echo_fifth}.
2894 Il codice si limita semplicemente a controllare (\texttt{\small 3}) il
2895 valore della variabile \var{reset} che assegnata nella gestione delle opzioni
2896 in corrispondenza all'uso di \texttt{-r} nella chiamata del client. Nel caso
2897 questa sia diversa da zero vengono impostati (\texttt{\small 5--6}) i valori
2898 della struttura \var{ling} che permettono una terminazione immediata della
2899 connessione. Questa viene poi usata nella successiva (\texttt{\small 7})
2900 chiamata a \func{setsockopt}. Al solito si controlla (\texttt{\small 7--10})
2901 il valore di ritorno e si termina il programma in caso di errore, stampandone
2902 il valore.
2903
2904 Infine l'ultima possibilità, quella in cui si utilizza effettivamente
2905 \const{SO\_LINGER} per \textsl{indugiare} nella chiusura, è quella in cui sia
2906 \var{l\_onoff} che \var{l\_linger} hanno un valore diverso da zero. Se si
2907 esegue l'impostazione con questi valori sia \func{close} che \func{shutdown}
2908 si bloccano, nel frattempo viene eseguita la normale procedura di conclusione
2909 della connessione (quella di sez.~\ref{sec:TCP_conn_term}) ma entrambe le
2910 funzioni non ritornano fintanto che non si sia concluso il procedimento di
2911 chiusura della connessione, o non sia passato un numero di
2912 secondi\footnote{questa è l'unità di misura indicata da POSIX ed adottata da
2913   Linux, altri kernel possono usare unità di misura diverse, oppure usare il
2914   campo \var{l\_linger} come valore logico (ignorandone il valore) per rendere
2915   (quando diverso da zero) \func{close} e \func{shutdown} bloccanti fino al
2916   completamento della trasmissione dei dati sul buffer.}  pari al valore
2917 specificato in \var{l\_linger}.
2918
2919 \constend{SO\_LINGER}
2920
2921
2922
2923 \subsection{Le opzioni per il protocollo IPv4}
2924 \label{sec:sock_ipv4_options}
2925
2926 Il secondo insieme di opzioni dei socket che tratteremo è quello relativo ai
2927 socket che usano il protocollo IPv4.\footnote{come per le precedenti opzioni
2928   generiche una descrizione di esse è disponibile nella settima sezione delle
2929   pagine di manuale, nel caso specifico la documentazione si può consultare
2930   con \texttt{man 7 ip}.}  Se si vuole operare su queste opzioni generiche il
2931 livello da utilizzare è \const{SOL\_IP} (o l'equivalente
2932 \constd{IPPROTO\_IP}); si è riportato un elenco di queste opzioni in
2933 tab.~\ref{tab:sock_opt_iplevel}.  Le costanti indicanti le opzioni e tutte le
2934 altre costanti ad esse collegate sono definite in \headfiled{netinet/ip.h}, ed
2935 accessibili includendo detto file.
2936
2937 \begin{table}[!htb]
2938   \centering
2939   \footnotesize
2940   \begin{tabular}[c]{|l|c|c|c|l|p{6cm}|}
2941     \hline
2942     \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
2943                     \textbf{Descrizione}\\
2944     \hline
2945     \hline
2946     \const{IP\_OPTIONS}         &$\bullet$&$\bullet$&&\texttt{void *}& %??? 
2947       Imposta o riceve le opzioni di IP.\\
2948     \const{IP\_PKTINFO}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2949       Passa un messaggio di informazione.\\
2950     \const{IP\_RECVTOS}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2951       Passa un messaggio col campo TOS.\\
2952     \const{IP\_RECVTTL}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2953       Passa un messaggio col campo TTL.\\
2954     \const{IP\_RECVOPTS}        &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2955       Passa un messaggio con le opzioni IP.\\
2956     \const{IP\_RETOPTS}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2957       Passa un messaggio con le opzioni IP non trattate.\\
2958     \const{IP\_TOS}             &$\bullet$&$\bullet$&         &\texttt{int}& 
2959       Imposta il valore del campo TOS.\\
2960     \const{IP\_TTL}             &$\bullet$&$\bullet$&         &\texttt{int}& 
2961       Imposta il valore del campo TTL.\\
2962     \const{IP\_MINTTL}          &$\bullet$&$\bullet$&   &\texttt{int}& 
2963       Imposta il valore minimo del TTL per i pacchetti accettati.\\ 
2964     \const{IP\_HDRINCL}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2965       Passa l'intestazione di IP nei dati.\\
2966     \const{IP\_RECVERR}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2967       Abilita la gestione degli errori.\\
2968     \const{IP\_MTU\_DISCOVER}   &$\bullet$&$\bullet$&         &\texttt{int}& 
2969       Imposta il \textit{Path MTU Discovery}.\\
2970     \const{IP\_MTU}             &$\bullet$&         &         &\texttt{int}& 
2971       Legge il valore attuale della MTU.\\
2972     \const{IP\_ROUTER\_ALERT}   &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2973       Imposta l'opzione \textit{IP router alert} sui pacchetti.\\
2974     \const{IP\_MULTICAST\_TTL}  &$\bullet$&$\bullet$&         &\texttt{int}& 
2975       Imposta il TTL per i pacchetti \textit{multicast}.\\
2976     \const{IP\_MULTICAST\_LOOP} &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
2977       Controlla il reinvio a se stessi dei dati di \textit{multicast}.\\ 
2978     \const{IP\_ADD\_MEMBERSHIP} &         &$\bullet$&   &\struct{ip\_mreqn}& 
2979       Si unisce a un gruppo di \textit{multicast}.\\
2980     \const{IP\_DROP\_MEMBERSHIP}&         &$\bullet$&   &\struct{ip\_mreqn}& 
2981       Si sgancia da un gruppo di \textit{multicast}.\\
2982     \const{IP\_MULTICAST\_IF}   &         &$\bullet$&   &\struct{ip\_mreqn}& 
2983       Imposta l'interfaccia locale di un socket \textit{multicast}.\\ 
2984    \hline
2985   \end{tabular}
2986   \caption{Le opzioni disponibili al livello \const{SOL\_IP}.} 
2987   \label{tab:sock_opt_iplevel}
2988 \end{table}
2989
2990 Le descrizioni riportate in tab.~\ref{tab:sock_opt_iplevel} sono estremamente
2991 succinte, una maggiore quantità di dettagli sulle varie opzioni è fornita nel
2992 seguente elenco:
2993 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
2994
2995
2996 \item[\constd{IP\_OPTIONS}] l'opzione permette di impostare o leggere le
2997   opzioni del protocollo IP (si veda sez.~\ref{sec:IP_options}). L'opzione
2998   prende come valore dell'argomento \param{optval} un puntatore ad un buffer
2999   dove sono mantenute le opzioni, mentre \param{optlen} indica la dimensione
3000   di quest'ultimo. Quando la si usa con \func{getsockopt} vengono lette le
3001   opzioni IP utilizzate per la spedizione, quando la si usa con
3002   \func{setsockopt} vengono impostate le opzioni specificate. L'uso di questa
3003   opzione richiede una profonda conoscenza del funzionamento del protocollo,
3004   torneremo in parte sull'argomento in sez.~\ref{sec:sock_IP_options}.
3005
3006
3007 \item[\constd{IP\_PKTINFO}] Quando abilitata l'opzione permette di ricevere
3008   insieme ai pacchetti un messaggio ancillare (vedi
3009   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_PKTINFO} contenente
3010   una struttura \struct{pktinfo} (vedi fig.~\ref{fig:sock_pktinfo_struct}) che
3011   mantiene una serie di informazioni riguardo i pacchetti in arrivo. In
3012   particolare è possibile conoscere l'interfaccia su cui è stato ricevuto un
3013   pacchetto (nel campo \var{ipi\_ifindex}),\footnote{in questo campo viene
3014     restituito il valore numerico dell'indice dell'interfaccia,
3015     sez.~\ref{sec:sock_ioctl_netdevice}.} l'indirizzo locale da esso
3016   utilizzato (nel campo \var{ipi\_spec\_dst}) e l'indirizzo remoto dello
3017   stesso (nel campo \var{ipi\_addr}).
3018
3019 \begin{figure}[!htb]
3020   \footnotesize \centering
3021   \begin{minipage}[c]{0.80\textwidth}
3022     \includestruct{listati/pktinfo.h}
3023   \end{minipage}
3024   \caption{La struttura \structd{pktinfo} usata dall'opzione
3025     \const{IP\_PKTINFO} per ricavare informazioni sui pacchetti di un socket
3026     di tipo \const{SOCK\_DGRAM}.}
3027   \label{fig:sock_pktinfo_struct}
3028 \end{figure}
3029
3030
3031 L'opzione è utilizzabile solo per socket di tipo \const{SOCK\_DGRAM}. Questa è
3032 una opzione introdotta con i kernel della serie 2.2.x, ed è specifica di
3033 Linux;\footnote{non dovrebbe pertanto essere utilizzata se si ha a cuore la
3034   portabilità.} essa permette di sostituire le opzioni \const{IP\_RECVDSTADDR}
3035 e \const{IP\_RECVIF} presenti in altri Unix (la relativa informazione è quella
3036 ottenibile rispettivamente dai campi \var{ipi\_addr} e \var{ipi\_ifindex} di
3037 \struct{pktinfo}). 
3038
3039 L'opzione prende per \param{optval} un intero usato come valore logico, che
3040 specifica soltanto se insieme al pacchetto deve anche essere inviato o
3041 ricevuto il messaggio \const{IP\_PKTINFO} (vedi
3042 sez.~\ref{sec:net_ancillary_data}); il messaggio stesso dovrà poi essere
3043 letto o scritto direttamente con \func{recvmsg} e \func{sendmsg} (vedi
3044 sez.~\ref{sec:net_sendmsg}).
3045
3046
3047 \item[\constd{IP\_RECVTOS}] Quando abilitata l'opzione permette di ricevere
3048   insieme ai pacchetti un messaggio ancillare (vedi
3049   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_TOS}, che contiene un
3050   byte con il valore del campo \textit{Type of Service} dell'intestazione IP
3051   del pacchetto stesso (vedi sez.~\ref{sec:IP_header}).  Prende per
3052   \param{optval} un intero usato come valore logico.
3053
3054 \item[\constd{IP\_RECVTTL}] Quando abilitata l'opzione permette di ricevere
3055   insieme ai pacchetti un messaggio ancillare (vedi
3056   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_RECVTTL}, contenente
3057   un byte con il valore del campo \textit{Time to Live} dell'intestazione IP
3058   (vedi sez.~\ref{sec:IP_header}).  L'opzione richiede per \param{optval} un
3059   intero usato come valore logico. L'opzione non è supportata per socket di
3060   tipo \const{SOCK\_STREAM}.
3061
3062 \item[\constd{IP\_RECVOPTS}] Quando abilitata l'opzione permette di ricevere
3063   insieme ai pacchetti un messaggio ancillare (vedi
3064   sez.~\ref{sec:net_ancillary_data}) di tipo \const{IP\_OPTIONS}, contenente
3065   le opzioni IP del protocollo (vedi sez.~\ref{sec:IP_options}). Le
3066   intestazioni di instradamento e le altre opzioni sono già riempite con i
3067   dati locali. L'opzione richiede per \param{optval} un intero usato come
3068   valore logico.  L'opzione non è supportata per socket di tipo
3069   \const{SOCK\_STREAM}.
3070
3071 \item[\constd{IP\_RETOPTS}] Identica alla precedente \const{IP\_RECVOPTS}, ma
3072   in questo caso restituisce i dati grezzi delle opzioni, senza che siano
3073   riempiti i capi di instradamento e le marche temporali.  L'opzione richiede
3074   per \param{optval} un intero usato come valore logico.  L'opzione non è
3075   supportata per socket di tipo \const{SOCK\_STREAM}.
3076
3077 \item[\constd{IP\_TOS}] L'opzione consente di leggere o impostare il campo
3078   \textit{Type of Service} dell'intestazione IP (per una trattazione più
3079   dettagliata, che riporta anche i valori possibili e le relative costanti di
3080   definizione si veda sez.~\ref{sec:IP_header}) che permette di indicare le
3081   priorità dei pacchetti. Se impostato il valore verrà mantenuto per tutti i
3082   pacchetti del socket; alcuni valori (quelli che aumentano la priorità)
3083   richiedono i privilegi di amministrazione con la capability
3084   \const{CAP\_NET\_ADMIN}.
3085
3086   Il campo TOS è di 8 bit e l'opzione richiede per \param{optval} un intero
3087   che ne contenga il valore. Sono definite anche alcune costanti che
3088   definiscono alcuni valori standardizzati per il \textit{Type of Service},
3089   riportate in tab.~\ref{tab:IP_TOS_values}, il valore di default usato da
3090   Linux è \const{IPTOS\_LOWDELAY}, ma esso può essere modificato con le
3091   funzionalità del cosiddetto \textit{Advanced Routing}. Si ricordi che la
3092   priorità dei pacchetti può essere impostata anche in maniera indipendente
3093   dal protocollo utilizzando l'opzione \const{SO\_PRIORITY} illustrata in
3094   sez.~\ref{sec:sock_generic_options}.
3095
3096 \item[\constd{IP\_TTL}] L'opzione consente di leggere o impostare per tutti i
3097   pacchetti associati al socket il campo \textit{Time to Live}
3098   dell'intestazione IP che indica il numero massimo di \textit{hop} (passaggi
3099   da un router ad un altro) restanti al paccheto (per una trattazione più
3100   estesa si veda sez.~\ref{sec:IP_header}).  Il campo TTL è di 8 bit e
3101   l'opzione richiede che \param{optval} sia un intero, che ne conterrà il
3102   valore.
3103
3104 \item[\constd{IP\_MINTTL}] L'opzione, introdotta con il kernel 2.6.34, imposta
3105   un valore minimo per il campo \textit{Time to Live} dei pacchetti associati
3106   al socket su cui è attivata, che se non rispettato ne causa lo scarto
3107   automatico. L'opzione è nata per implementare
3108   l'\href{http://www.ietf.org/rfc/rfc5082.txt}{RFC~5082} che la prevede come
3109   forma di protezione per i router che usano il protocollo BGP poiché questi,
3110   essendo in genere adiacenti, possono, impostando un valore di 255, scartare
3111   automaticamente tutti gli eventuali pacchetti falsi creati da un attacco a
3112   questo protocollo, senza doversi curare di verificarne la
3113   validità.\footnote{l'attacco viene in genere portato per causare un
3114     \textit{Denial of Service} aumentando il consumo di CPU del router nella
3115     verifica dell'autenticità di un gran numero di pacchetti di pacchetti
3116     falsi; questi, arrivando da sorgenti diverse da un router adiacente, non
3117     potrebbero più avere un TTL di 255 anche qualora questo fosse stato il
3118     valore di partenza, e l'impostazione dell'opzione consente di scartarli
3119     senza carico aggiuntivo sulla CPU (che altrimenti dovrebbe calcolare una
3120     checksum).}
3121
3122 \item[\constd{IP\_HDRINCL}] Se abilitata l'utente deve fornire lui stesso
3123   l'intestazione IP in cima ai propri dati. L'opzione è valida soltanto per
3124   socket di tipo \const{SOCK\_RAW}, e quando utilizzata eventuali valori
3125   impostati con \const{IP\_OPTIONS}, \const{IP\_TOS} o \const{IP\_TTL} sono
3126   ignorati. In ogni caso prima della spedizione alcuni campi
3127   dell'intestazione vengono comunque modificati dal kernel, torneremo
3128   sull'argomento in sez.~\ref{sec:socket_raw}
3129
3130 \item[\constd{IP\_RECVERR}] Questa è una opzione introdotta con i kernel della
3131   serie 2.2.x, ed è specifica di Linux. Essa permette di usufruire di un
3132   meccanismo affidabile per ottenere un maggior numero di informazioni in caso
3133   di errori. Se l'opzione è abilitata tutti gli errori generati su un socket
3134   vengono memorizzati su una coda, dalla quale poi possono essere letti con
3135   \func{recvmsg} (vedi sez.~\ref{sec:net_sendmsg}) come messaggi ancillari
3136   (torneremo su questo in sez.~\ref{sec:net_ancillary_data}) di tipo
3137   \const{IP\_RECVERR}.  L'opzione richiede per \param{optval} un intero usato
3138   come valore logico e non è applicabile a socket di tipo
3139   \const{SOCK\_STREAM}.
3140
3141 \itindbeg{Path~MTU}
3142 \item[\constd{IP\_MTU\_DISCOVER}] Questa è una opzione introdotta con i kernel
3143   della serie 2.2.x, ed è specifica di Linux.  L'opzione permette di scrivere
3144   o leggere le impostazioni della modalità usata per la determinazione della
3145   \textit{Path MTU} (vedi sez.~\ref{sec:net_lim_dim}) del
3146   socket. L'opzione prende per \param{optval} un valore intero che indica la
3147   modalità usata, da specificare con una delle costanti riportate in
3148   tab.~\ref{tab:sock_ip_mtu_discover}.
3149
3150   \begin{table}[!htb]
3151     \centering
3152     \footnotesize
3153     \begin{tabular}[c]{|l|r|p{7cm}|}
3154       \hline
3155       \multicolumn{2}{|c|}{\textbf{Valore}}&\textbf{Significato} \\
3156       \hline
3157       \hline
3158       \constd{IP\_PMTUDISC\_DONT}&0& Non effettua la ricerca dalla \textit{Path
3159                                      MTU}.\\
3160       \constd{IP\_PMTUDISC\_WANT}&1& Utilizza il valore impostato per la rotta
3161                                      utilizzata dai pacchetti (dal comando
3162                                      \texttt{route}).\\ 
3163       \constd{IP\_PMTUDISC\_DO}  &2& Esegue la procedura di determinazione
3164                                      della \textit{Path MTU} come richiesto
3165                                      dall'\href{http://www.ietf.org/rfc/rfc1191.txt}{RFC~1191}.\\ 
3166       \hline
3167     \end{tabular}
3168     \caption{Valori possibili per l'argomento \param{optval} di
3169       \const{IP\_MTU\_DISCOVER}.} 
3170     \label{tab:sock_ip_mtu_discover}
3171   \end{table}
3172
3173   Il valore di default applicato ai socket di tipo \const{SOCK\_STREAM} è
3174   determinato dal parametro \texttt{ip\_no\_pmtu\_disc} (vedi
3175   sez.~\ref{sec:sock_sysctl}), mentre per tutti gli altri socket di default la
3176   ricerca è disabilitata ed è responsabilità del programma creare pacchetti di
3177   dimensioni appropriate e ritrasmettere eventuali pacchetti persi. Se
3178   l'opzione viene abilitata, il kernel si incaricherà di tenere traccia
3179   automaticamente della \textit{Path MTU} verso ciascuna destinazione, e
3180   rifiuterà immediatamente la trasmissione di pacchetti di dimensioni maggiori
3181   della MTU con un errore di \errval{EMSGSIZE}.\footnote{in caso contrario la
3182     trasmissione del pacchetto sarebbe effettuata, ottenendo o un fallimento
3183     successivo della trasmissione, o la frammentazione dello stesso.}
3184
3185 \item[\constd{IP\_MTU}] Permette di leggere il valore della \textit{Path MTU}
3186   di percorso del socket.  L'opzione richiede per \param{optval} un intero che
3187   conterrà il valore della \textit{Path MTU} in byte.  Questa è una opzione
3188   introdotta con i kernel della serie 2.2.x, ed è specifica di Linux.
3189
3190   È tramite questa opzione che un programma può leggere, quando si è avuto un
3191   errore di \errval{EMSGSIZE}, il valore della MTU corrente del socket. Si
3192   tenga presente che per poter usare questa opzione, oltre ad avere abilitato
3193   la scoperta della \textit{Path MTU}, occorre che il socket sia stato
3194   esplicitamente connesso con \func{connect}. 
3195
3196   Ad esempio con i socket UDP si potrà ottenere una stima iniziale della
3197   \textit{Path MTU} eseguendo prima una \func{connect} verso la destinazione,
3198   e poi usando \func{getsockopt} con questa opzione. Si può anche avviare
3199   esplicitamente il procedimento di scoperta inviando un pacchetto di grosse
3200   dimensioni (che verrà scartato) e ripetendo l'invio coi dati aggiornati. Si
3201   tenga infine conto che durante il procedimento i pacchetti iniziali possono
3202   essere perduti, ed è compito dell'applicazione gestirne una eventuale
3203   ritrasmissione.
3204
3205 \itindend{Path~MTU}
3206
3207 \item[\constd{IP\_ROUTER\_ALERT}] Questa è una opzione introdotta con i
3208   kernel della serie 2.2.x, ed è specifica di Linux. Prende per
3209   \param{optval} un intero usato come valore logico. Se abilitata
3210   passa tutti i pacchetti con l'opzione \textit{IP Router Alert} (vedi
3211   sez.~\ref{sec:IP_options}) che devono essere inoltrati al socket
3212   corrente. Può essere usata soltanto per socket di tipo raw.
3213
3214 \item[\constd{IP\_MULTICAST\_TTL}] L'opzione permette di impostare o leggere il
3215   valore del campo TTL per i pacchetti \textit{multicast} in uscita associati
3216   al socket. È importante che questo valore sia il più basso possibile, ed il
3217   default è 1, che significa che i pacchetti non potranno uscire dalla rete
3218   locale. Questa opzione consente ai programmi che lo richiedono di superare
3219   questo limite.  L'opzione richiede per
3220   \param{optval} un intero che conterrà il valore del TTL.
3221
3222 \item[\constd{IP\_MULTICAST\_LOOP}] L'opzione consente di decidere se i dati
3223   che si inviano su un socket usato con il \textit{multicast} vengano ricevuti
3224   anche sulla stessa macchina da cui li si stanno inviando.  Prende per
3225   \param{optval} un intero usato come valore logico.
3226
3227   In generale se si vuole che eventuali client possano ricevere i dati che si
3228   inviano occorre che questa funzionalità sia abilitata (come avviene di
3229   default). Qualora però non si voglia generare traffico per dati che già sono
3230   disponibili in locale l'uso di questa opzione permette di disabilitare
3231   questo tipo di traffico.
3232
3233 \item[\constd{IP\_ADD\_MEMBERSHIP}] L'opzione consente di unirsi ad gruppo di
3234   \textit{multicast}, e può essere usata solo con \func{setsockopt}.
3235   L'argomento \param{optval} in questo caso deve essere una struttura di tipo
3236   \struct{ip\_mreqn}, illustrata in fig.~\ref{fig:ip_mreqn_struct}, che
3237   permette di indicare, con il campo \var{imr\_multiaddr} l'indirizzo del
3238   gruppo di \textit{multicast} a cui ci si vuole unire, con il campo
3239   \var{imr\_address} l'indirizzo dell'interfaccia locale con cui unirsi al
3240   gruppo di \textit{multicast} e con \var{imr\_ifindex} l'indice
3241   dell'interfaccia da utilizzare (un valore nullo indica una interfaccia
3242   qualunque).
3243
3244   Per compatibilità è possibile utilizzare anche un argomento di tipo
3245   \struct{ip\_mreq}, una precedente versione di \struct{ip\_mreqn}, che
3246   differisce da essa soltanto per l'assenza del campo \var{imr\_ifindex}.
3247
3248 \begin{figure}[!htb]
3249   \footnotesize \centering
3250   \begin{minipage}[c]{0.80\textwidth}
3251     \includestruct{listati/ip_mreqn.h}
3252   \end{minipage}
3253   \caption{La struttura \structd{ip\_mreqn} utilizzata dalle opzioni dei
3254     socket per le operazioni concernenti l'appartenenza ai gruppi di
3255     \textit{multicast}.}
3256   \label{fig:ip_mreqn_struct}
3257 \end{figure}
3258
3259 \item[\constd{IP\_DROP\_MEMBERSHIP}] Lascia un gruppo di \textit{multicast},
3260   prende per \param{optval} la stessa struttura \struct{ip\_mreqn} (o
3261   \struct{ip\_mreq}) usata anche per \const{IP\_ADD\_MEMBERSHIP}.
3262
3263 \item[\constd{IP\_MULTICAST\_IF}] Imposta l'interfaccia locale per l'utilizzo
3264   del \textit{multicast}, ed utilizza come \param{optval} le stesse strutture
3265   \struct{ip\_mreqn} o \struct{ip\_mreq} delle due precedenti opzioni.
3266
3267 % TODO chiarire quale è la struttura \struct{ip\_mreq}
3268
3269
3270 \end{basedescript}
3271
3272
3273
3274 \subsection{Le opzioni per i protocolli TCP e UDP}
3275 \label{sec:sock_tcp_udp_options}
3276
3277 In questa sezione tratteremo le varie opzioni disponibili per i socket che
3278 usano i due principali protocolli di comunicazione del livello di trasporto;
3279 UDP e TCP.\footnote{come per le precedenti, una descrizione di queste opzioni
3280   è disponibile nella settima sezione delle pagine di manuale, che si può
3281   consultare rispettivamente con \texttt{man 7 tcp} e \texttt{man 7 udp}; le
3282   pagine di manuale però, alla stesura di questa sezione (Agosto 2006) sono
3283   alquanto incomplete.}  Dato che questi due protocolli sono entrambi
3284 trasportati su IP,\footnote{qui si sottintende IPv4, ma le opzioni per TCP e
3285   UDP sono le stesse anche quando si usa IPv6.} oltre alle opzioni generiche
3286 di sez.~\ref{sec:sock_generic_options} saranno comunque disponibili anche le
3287 precedenti opzioni di sez.~\ref{sec:sock_ipv4_options}.\footnote{in realtà in
3288   sez.~\ref{sec:sock_ipv4_options} si sono riportate le opzioni per IPv4, al
3289   solito, qualora si stesse utilizzando IPv6, si potrebbero utilizzare le
3290   opzioni di quest'ultimo.}
3291
3292 Il protocollo che supporta il maggior numero di opzioni è TCP; per poterle
3293 utilizzare occorre specificare \const{SOL\_TCP} (o l'equivalente
3294 \constd{IPPROTO\_TCP}) come valore per l'argomento \param{level}. Si sono
3295 riportate le varie opzioni disponibili in tab.~\ref{tab:sock_opt_tcplevel},
3296 dove sono elencate le rispettive costanti da utilizzare come valore per
3297 l'argomento \param{optname}. Dette costanti e tutte le altre costanti e
3298 strutture collegate all'uso delle opzioni TCP sono definite in
3299 \headfiled{netinet/tcp.h}, ed accessibili includendo detto file.\footnote{in
3300   realtà questo è il file usato dalle librerie; la definizione delle opzioni
3301   effettivamente supportate da Linux si trova nel file
3302   \texttt{include/linux/tcp.h} dei sorgenti del kernel, dal quale si sono
3303   estratte le costanti di tab.~\ref{tab:sock_opt_tcplevel}.}
3304
3305 \begin{table}[!htb]
3306   \centering
3307   \footnotesize
3308   \begin{tabular}[c]{|l|c|c|c|l|l|}
3309     \hline
3310     \textbf{Opzione}&\texttt{get}&\texttt{set}&\textbf{flag}&\textbf{Tipo}&
3311                     \textbf{Descrizione}\\
3312     \hline
3313     \hline
3314     \const{TCP\_NODELAY}      &$\bullet$&$\bullet$&$\bullet$&\texttt{int}& 
3315       Spedisce immediatamente i dati in segmenti singoli.\\
3316     \const{TCP\_MAXSEG}       &$\bullet$&$\bullet$&         &\texttt{int}&
3317       Valore della MSS per i segmenti in uscita.\\  
3318     \const{TCP\_CORK}         &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3319       Accumula i dati in un unico segmento.\\
3320     \const{TCP\_KEEPIDLE}     &$\bullet$&$\bullet$&         &\texttt{int}& 
3321       Tempo in secondi prima di inviare un \textit{keepalive}.\\
3322     \const{TCP\_KEEPINTVL}    &$\bullet$&$\bullet$&         &\texttt{int}&
3323       Tempo in secondi prima fra \textit{keepalive} successivi.\\
3324     \const{TCP\_KEEPCNT}      &$\bullet$&$\bullet$&         &\texttt{int}& 
3325       Numero massimo di \textit{keepalive} inviati.\\
3326     \const{TCP\_SYNCNT}       &$\bullet$&$\bullet$&         &\texttt{int}& 
3327       Numero massimo di ritrasmissioni di un SYN.\\
3328     \const{TCP\_LINGER2}      &$\bullet$&$\bullet$&         &\texttt{int}&
3329       Tempo di vita in stato \texttt{FIN\_WAIT2}.\\
3330     \const{TCP\_DEFER\_ACCEPT}&$\bullet$&$\bullet$&         &\texttt{int}&
3331       Ritorna da \func{accept} solo in presenza di dati.\\
3332     \const{TCP\_WINDOW\_CLAMP}&$\bullet$&$\bullet$&         &\texttt{int}&
3333       Valore della \textit{advertised window}.\\
3334     \const{TCP\_INFO}         &$\bullet$&        &       &\struct{tcp\_info}& 
3335       Restituisce informazioni sul socket.\\
3336     \const{TCP\_QUICKACK}     &$\bullet$&$\bullet$&$\bullet$&\texttt{int}&
3337       Abilita la modalità \textit{quickack}.\\
3338     \const{TCP\_CONGESTION}   &$\bullet$&$\bullet$&         &\texttt{char *}&
3339       Imposta l'algoritmo per il controllo della congestione.\\
3340    \hline
3341   \end{tabular}
3342   \caption{Le opzioni per i socket TCP disponibili al livello
3343     \const{SOL\_TCP}.}
3344   \label{tab:sock_opt_tcplevel}
3345 \end{table}
3346
3347 Le descrizioni delle varie opzioni riportate in
3348 tab.~\ref{tab:sock_opt_tcplevel} sono estremamente sintetiche ed indicative,
3349 la spiegazione del funzionamento delle singole opzioni con una maggiore
3350 quantità di dettagli è fornita nel seguente elenco:
3351 \begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}}
3352
3353 \item[\constd{TCP\_NODELAY}] il protocollo TCP utilizza un meccanismo di
3354   bufferizzazione dei dati uscenti, per evitare la trasmissione di tanti
3355   piccoli segmenti con un utilizzo non ottimale della banda
3356   disponibile.\footnote{il problema è chiamato anche
3357     \itindex{silly~window~syndrome} \textit{silly window syndrome}, per averne
3358     un'idea si pensi al risultato che si ottiene quando un programma di
3359     terminale invia un segmento TCP per ogni tasto premuto, 40 byte di
3360     intestazione di protocollo con 1 byte di dati trasmessi; per evitare
3361     situazioni del genere è stato introdotto \index{algoritmo~di~Nagle}
3362     l'\textsl{algoritmo di Nagle}.}  Questo meccanismo è controllato da un
3363   apposito algoritmo (detto \textsl{algoritmo di Nagle}, vedi
3364   sez.~\ref{sec:tcp_protocol_xxx}).  Il comportamento normale del protocollo
3365   prevede che i dati siano accumulati fintanto che non si raggiunge una
3366   quantità considerata adeguata per eseguire la trasmissione di un singolo
3367   segmento.
3368
3369   Ci sono però delle situazioni in cui questo comportamento può non essere
3370   desiderabile, ad esempio quando si sa in anticipo che l'applicazione invierà
3371   soltanto un piccolo quantitativo di dati;\footnote{è il caso classico di una
3372     richiesta HTTP.} in tal caso l'attesa introdotta dall'algoritmo di
3373   bufferizzazione non soltanto è inutile, ma peggiora le prestazioni
3374   introducendo un ritardo.  Impostando questa opzione si disabilita l'uso
3375   dell'\textsl{algoritmo di Nagle} ed i dati vengono inviati immediatamente in
3376   singoli segmenti, qualunque sia la loro dimensione.  Ovviamente l'uso di
3377   questa opzione è dedicato a chi ha esigenze particolari come quella
3378   illustrata, che possono essere stabilite solo per la singola applicazione.
3379
3380   Si tenga conto che questa opzione viene sovrascritta dall'eventuale
3381   impostazione dell'opzione \const{TCP\_CORK} (il cui scopo è sostanzialmente
3382   l'opposto) che blocca l'invio immediato. Tuttavia quando la si abilita viene
3383   sempre forzato lo scaricamento della coda di invio (con conseguente
3384   trasmissione di tutti i dati pendenti), anche qualora si fosse già abilitata
3385   \const{TCP\_CORK}.\footnote{si tenga presente però che \const{TCP\_CORK} può
3386     essere specificata insieme a \const{TCP\_NODELAY} soltanto a partire dal
3387     kernel 2.5.71.}
3388
3389 \item[\constd{TCP\_MAXSEG}] con questa opzione si legge o si imposta il valore
3390   della MSS (\textit{Maximum Segment Size}, vedi sez.~\ref{sec:net_lim_dim} e
3391   sez.~\ref{sec:tcp_protocol_xxx}) dei segmenti TCP uscenti. Se l'opzione è
3392   impostata prima di stabilire la connessione, si cambia anche il valore della
3393   MSS annunciata all'altro capo della connessione. Se si specificano valori
3394   maggiori della MTU questi verranno ignorati, inoltre TCP imporrà anche i
3395   suoi limiti massimo e minimo per questo valore.
3396
3397 \item[\constd{TCP\_CORK}] questa opzione è il complemento naturale di
3398   \const{TCP\_NODELAY} e serve a gestire a livello applicativo la situazione
3399   opposta, cioè quella in cui si sa fin dal principio che si dovranno inviare
3400   grosse quantità di dati. Anche in questo caso l'\textsl{algoritmo di Nagle}
3401   tenderà a suddividerli in dimensioni da lui ritenute
3402   opportune,\footnote{l'algoritmo cerca di tenere conto di queste situazioni,
3403     ma essendo un algoritmo generico tenderà comunque ad introdurre delle
3404     suddivisioni in segmenti diversi, anche quando potrebbero non essere
3405     necessarie, con conseguente spreco di banda.}  ma sapendo fin dall'inizio
3406   quale è la dimensione dei dati si potranno di nuovo ottenere delle migliori
3407   prestazioni disabilitandolo, e gestendo direttamente l'invio del nostro
3408   blocco di dati in soluzione unica.
3409
3410   Quando questa opzione viene abilitata non vengono inviati segmenti di dati
3411   fintanto che essa non venga disabilitata; a quel punto tutti i dati rimasti
3412   in coda saranno inviati in un solo segmento TCP. In sostanza con questa
3413   opzione si può controllare il flusso dei dati mettendo una sorta di
3414   ``\textsl{tappo}'' (da cui il nome in inglese) al flusso di uscita, in modo
3415   ottimizzare a mano l'uso della banda. Si tenga presente che per l'effettivo
3416   funzionamento ci si deve ricordare di disattivare l'opzione al termine
3417   dell'invio del blocco dei dati.
3418
3419   Si usa molto spesso \const{TCP\_CORK} quando si effettua il trasferimento
3420   diretto di un blocco di dati da un file ad un socket con \func{sendfile}
3421   (vedi sez.~\ref{sec:file_sendfile_splice}), per inserire una intestazione
3422   prima della chiamata a questa funzione; senza di essa l'intestazione
3423   potrebbe venire spedita in un segmento a parte, che a seconda delle
3424   condizioni potrebbe richiedere anche una risposta di ACK, portando ad una
3425   notevole penalizzazione delle prestazioni.
3426
3427   Si tenga presente che l'implementazione corrente di \const{TCP\_CORK} non
3428   consente di bloccare l'invio dei dati per più di 200 millisecondi, passati i
3429   quali i dati accumulati in coda sanno inviati comunque.  Questa opzione è
3430   tipica di Linux\footnote{l'opzione è stata introdotta con i kernel della
3431     serie 2.4.x.} e non è disponibile su tutti i kernel unix-like, pertanto
3432   deve essere evitata se si vuole scrivere codice portabile.
3433
3434 \item[\constd{TCP\_KEEPIDLE}] con questa opzione si legge o si imposta
3435   l'intervallo di tempo, in secondi, che deve trascorrere senza traffico sul
3436   socket prima che vengano inviati, qualora si sia attivata su di esso
3437   l'opzione \const{SO\_KEEPALIVE}, i messaggi di \textit{keep-alive} (si veda
3438   la trattazione relativa al \textit{keep-alive} in
3439   sez.~\ref{sec:sock_options_main}).  Anche questa opzione non è disponibile
3440   su tutti i kernel unix-like e deve essere evitata se si vuole scrivere
3441   codice portabile.
3442
3443 \item[\constd{TCP\_KEEPINTVL}] con questa opzione si legge o si imposta
3444   l'intervallo di tempo, in secondi, fra due messaggi di \textit{keep-alive}
3445   successivi (si veda sempre quanto illustrato in
3446   sez.~\ref{sec:sock_options_main}). Come la precedente non è disponibile su
3447   tutti i kernel unix-like e deve essere evitata se si vuole scrivere codice
3448   portabile.
3449
3450 \item[\constd{TCP\_KEEPCNT}] con questa opzione si legge o si imposta il numero
3451   totale di messaggi di \textit{keep-alive} da inviare prima di concludere che
3452   la connessione è caduta per assenza di risposte ad un messaggio di
3453   \textit{keep-alive} (di nuovo vedi sez.~\ref{sec:sock_options_main}). Come
3454   la precedente non è disponibile su tutti i kernel unix-like e deve essere
3455   evitata se si vuole scrivere codice portabile.
3456
3457 \item[\constd{TCP\_SYNCNT}] con questa opzione si legge o si imposta il numero
3458   di tentativi di ritrasmissione dei segmenti SYN usati nel \textit{three way
3459     handshake} prima che il tentativo di connessione venga abortito (si
3460   ricordi quanto accennato in sez.~\ref{sec:TCP_func_connect}). Sovrascrive
3461   per il singolo socket il valore globale impostato con la \textit{sysctl}
3462   \texttt{tcp\_syn\_retries} (vedi sez.~\ref{sec:sock_ipv4_sysctl}).  Non
3463   vengono accettati valori maggiori di 255; anche questa opzione non è
3464   standard e deve essere evitata se si vuole scrivere codice portabile.
3465
3466 \item[\constd{TCP\_LINGER2}] con questa opzione si legge o si imposta, in
3467   numero di secondi, il tempo di sussistenza dei socket terminati nello stato
3468   \texttt{FIN\_WAIT2} (si ricordi quanto visto in
3469   sez.~\ref{sec:TCP_conn_term}).\footnote{si tenga ben presente che questa
3470     opzione non ha nulla a che fare con l'opzione \const{SO\_LINGER} che
3471     abbiamo visto in sez.~\ref{sec:sock_options_main}.}  Questa opzione
3472   consente di sovrascrivere per il singolo socket il valore globale impostato
3473   con la \textit{sysctl} \texttt{tcp\_fin\_timeout} (vedi
3474   sez.~\ref{sec:sock_ipv4_sysctl}).  Anche questa opzione è da evitare se si
3475   ha a cuore la portabilità del codice.
3476
3477 \item[\constd{TCP\_DEFER\_ACCEPT}] questa opzione consente di modificare il
3478   comportamento standard del protocollo TCP nello stabilirsi di una
3479   connessione; se ricordiamo il meccanismo del \textit{three way handshake}
3480   illustrato in fig.~\ref{fig:TCP_TWH} possiamo vedere che in genere un client
3481   inizierà ad inviare i dati ad un server solo dopo l'emissione dell'ultimo
3482   segmento di ACK.
3483
3484   Di nuovo esistono situazioni (e la più tipica è quella di una richiesta
3485   HTTP) in cui sarebbe utile inviare immediatamente la richiesta all'interno
3486   del segmento con l'ultimo ACK del \textit{three way handshake}; si potrebbe
3487   così risparmiare l'invio di un segmento successivo per la richiesta e il
3488   ritardo sul server fra la ricezione dell'ACK e quello della richiesta.
3489