c538c3f07cb01642fe33ff6c64faa8e76122de5d
[gapil.git] / elemtcp.tex
1 \chapter{Socket TCP elementari}
2 \label{cha:elem_TCP_sock}
3
4 In questo capitolo iniziamo ad approfondire la conoscenza dei socket TCP,
5 tratteremo qui dunque il funzionamento delle varie funzioni che si sono usate
6 nei due esempi elementari forniti in precedenza (vedi
7 \secref{sec:net_cli_sample} e \secref{sec:net_serv_sample}), previa una
8 descrizione delle principali caratteristiche del funzionamento di una
9 connessione TCP.
10
11
12 \section{Il funzionamento di una connessione TCP}
13 \label{sec:TCPel_connession}
14
15 Prima di entrare nei dettagli delle funzioni usate nelle applicazioni che
16 utilizzano i socket TCP, è fondamentale spiegare alcune basi del funzionamento
17 del TCP; la conoscenza del funzionamento del protocollo è infatti essenziale
18 per capire il modello di programmazione ed il funzionamento delle API.
19
20 In particolare ci concentreremo sulle modalità con le quali il protocollo dà
21 inizio e conclude una connessione; faremo inoltre anche un breve accenno al
22 significato di alcuni dei vari stati che il protocollo assume durante la vita
23 di una connessione, che possono essere osservati per ciascun socket attivo con
24 l'uso del programma \cmd{netstat}.
25
26 \subsection{La creazione della connessione: il \textit{three way handshake}}
27 \label{sec:TCPel_conn_cre}
28
29 Il processo che porta a creare una connessione TCP è chiamato \textit{three
30   way handshake}; la successione tipica degli eventi (la stessa che si
31 verifica utilizzando il codice dei due precedenti esempi elementari
32 \figref{fig:net_cli_code} e \figref{fig:net_serv_code}) che porta alla
33 creazione di una connessione è la seguente:
34  
35 \begin{enumerate}
36 \item Il server deve essere preparato per accettare le connessioni in arrivo;
37   il procedimento si chiama \textsl{apertura passiva} del socket (in inglese
38   \textit{passive open}); questo viene fatto chiamando la sequenza di funzioni
39   \texttt{socket}, \texttt{bind} e \texttt{listen}. Completata l'apertura
40   passiva il server chiama la funzione \texttt{accept} e il processo si blocca
41   in attesa di connessioni.
42   
43 \item Il client richiede l'inizio della connessione usando la funzione
44   \texttt{connect}, attraverso un procedimento che viene chiamato
45   \textsl{apertura attiva}, dall'inglese \textit{active open}. La chiamata di
46   \texttt{connect} blocca il processo e causa l'invio da parte del client di
47   un segmento \texttt{SYN}\footnote{Si ricordi che il segmento è l'unità
48     elementare di dati trasmessa dal protocollo TCP al livello superiore;
49     tutti i segmenti hanno un header che contiene le informazioni che servono
50     allo \textit{stack TCP} (così viene di solito chiamata la parte del kernel
51     che implementa il protocollo) per realizzare la comunicazione, fra questi
52     dati ci sono una serie di flag usati per gestire la connessione, come
53     \texttt{SYN}, \texttt{ACK}, \texttt{URG}, \texttt{FIN}, alcuni di essi,
54     come \texttt{SYN} (che sta per \textit{syncronize}) corrispondono a
55     funzioni particolari del protocollo e danno il nome al segmento, (per
56     maggiori dettagli vedere \capref{cha:tcp_protocol})}, in sostanza viene
57   inviato al server un pacchetto IP che contiene solo gli header IP e TCP (con
58   il numero di sequenza iniziale e il flag \texttt{SYN}) e le opzioni di TCP.
59   
60 \item il server deve dare ricevuto (l'\textit{acknowledge}) del \texttt{SYN}
61   del client, inoltre anche il server deve inviare il suo \texttt{SYN} al
62   client (e trasmettere il suo numero di sequenza iniziale) questo viene fatto
63   ritrasmettendo un singolo segmento in cui entrambi i flag \texttt{SYN}
64   \texttt{ACK} e sono settati.
65   
66 \item una volta che il client ha ricevuto l'acknowledge dal server la funzione
67   \texttt{connect} ritorna, l'ultimo passo è dare dare il ricevuto del
68   \texttt{SYN} del server inviando un \texttt{ACK}. Alla ricezione di
69   quest'ultimo la funzione \texttt{accept} del server ritorna e la connessione
70   è stabilita.
71 \end{enumerate} 
72
73 Il procedimento viene chiamato \textit{three way handshake} dato che per
74 realizzarlo devono essere scambiati tre segmenti.  In \nfig\ si è
75 rappresentata graficamente la sequenza di scambio dei segmenti che stabilisce
76 la connessione.
77
78 % Una analogia citata da R. Stevens per la connessione TCP è quella con il
79 % sistema del telefono. La funzione \texttt{socket} può essere considerata
80 % l'equivalente di avere un telefono. La funzione \texttt{bind} è analoga al
81 % dire alle altre persone qual'è il proprio numero di telefono perché possano
82 % chiamare. La funzione \texttt{listen} è accendere il campanello del telefono
83 % per sentire le chiamate in arrivo.  La funzione \texttt{connect} richiede di
84 % conoscere il numero di chi si vuole chiamare. La funzione \texttt{accept} è
85 % quando si risponde al telefono.
86
87 \begin{figure}[htb]
88   \centering
89   \includegraphics[width=10cm]{img/three_way_handshake.eps}  
90   \caption{Il \textit{three way handshake} del TCP}
91   \label{fig:TCPel_TWH}
92 \end{figure}
93
94 Si è accennato in precedenza ai \textsl{numeri di sequenza} (che sono anche
95 riportati in \curfig); per gestire una connessione affidabile infatti il
96 protocollo TCP prevede nell'header la presenza di un numero a 32 bit (chiamato
97 appunto \textit{sequence number}) che identifica a quale byte nella sequenza
98 del flusso corrisponde il primo byte della sezione dati contenuta nel
99 segmento.
100
101 Il numero di sequenza di ciascun segmento viene calcolato a partire da un
102 \textsl{numero di sequenza iniziale} generato in maniera casuale del kernel
103 all'inizio della connessione e trasmesso con il SYN; l'acknowledgement di
104 ciascun segmento viene effettuato dall'altro capo della connessione settando
105 il flag \texttt{ACK} e restituendo nell'apposito campo dell'header un
106 \textit{acknowledge number}) pari al numero di sequenza che il ricevente si
107 aspetta di ricevere con il pacchetto successivo; dato che il primo pacchetto
108 SYN consuma un byte, nel \textit{three way handshake} il numero di acknowledge
109 è sempre pari al numero di sequenza iniziale incrementato di uno; lo stesso
110 varrà anche (vedi \nfig) per l'acknowledgement di un FIN.
111
112 \subsection{Le opzioni TCP.}
113 \label{sec:TCPel_TCP_opt}
114
115 Ciascun segmento SYN contiene in genere delle opzioni per il protocollo TCP
116 (le cosiddette \textit{TCP options}, che vengono inserite fra l'header e i
117 dati) che servono a comunicare all'altro capo una serie di parametri utili a
118 regolare la connessione. Normalmente vengono usate le seguenti opzioni:
119
120 \begin{itemize}
121 \item \textit{MSS option}, dove MMS sta per \textit{maximum segment size}, con
122   questa opzione ciascun capo della connessione annuncia all'altro il massimo
123   ammontare di dati che vorrebbe accettare per ciascun segmento nella
124   connessione corrente. È possibile leggere e scrivere questo valore
125   attraverso l'opzione del socket \texttt{TCP\_MAXSEG}.
126   
127 \item \textit{window scale option}; come spiegato in \capref{cha:tcp_protocol}
128   il protocollo TCP implementa il controllo di flusso attraverso una
129   \textsl{finestra annunciata} (\textit{advertized window}) con la quale
130   ciascun capo della comunicazione dichiara quanto spazio disponibile ha in
131   memoria per i dati. Questo è un numero a 16 bit dell'header, che così può
132   indicare un massimo di 65535 bytes (anche se Linux usa come massimo 32767
133   per evitare problemi con alcuni stack bacati che usano l'aritmetica con
134   segno per implementare lo stack TCP); ma alcuni tipi di connessione come
135   quelle ad alta velocità (sopra i 45Mbits/sec) e quelle che hanno grandi
136   ritardi nel cammino dei pacchetti (come i satelliti) richiedono una finestra
137   più grande per poter ottenere il massimo dalla trasmissione, per questo
138   esiste questa opzione che indica un fattore di scala da applicare al valore
139   della finestra annunciata\footnote{essendo una nuova opzione per garantire
140     la compatibilità con delle vecchie implementazioni del protocollo la
141     procedura che la attiva prevede come negoziazione che l'altro capo della
142     connessione riconosca esplicitamente l'opzione inserendola anche lui nel
143     suo SYN di risposta dell'apertura della connessione} per la connessione
144   corrente (espresso come numero di bit cui shiftare a sinistra il valore
145   della finestra annunciata inserito nel pacchetto).
146
147 \item \textit{timestamp option}, è anche questa una nuova opzione necessaria
148   per le connessioni ad alta velocità per evitare possibili corruzioni di dati
149   dovute a pacchetti perduti che riappaiono; anche questa viene negoziata come
150   la precedente.
151
152 \end{itemize}
153
154 La MSS è generalmente supportata da quasi tutte le implementazioni del
155 protocollo, le ultime due opzioni (trattate nell'RFC~1323) sono meno comuni;
156 vengono anche dette \textit{long fat pipe options} dato che questo è il nome
157 che viene dato alle connessioni caratterizzate da alta velocità o da ritardi
158 elevati. In ogni caso Linux supporta pienamente entrambe le opzioni.
159
160 \subsection{La terminazione della connessione}
161 \label{sec:TCPel_conn_term}
162
163 Mentre per creare una connessione occorre un interscambio di tre segmenti, la
164 procedura di chiusura ne richiede quattro; ancora una volta si può fare
165 riferimento al codice degli esempi \figref{fig:net_cli_code} e
166 \figref{fig:net_serv_code}, in questo caso la successione degli eventi è la
167 seguente:
168
169 \begin{enumerate}
170 \item Un processo ad uno dei due capi chiama la funzione \texttt{close}, dando
171   l'avvio a quella che viene chiamata \textsl{chiusura attiva} (o
172   \textit{active close}). Questo comporta l'emissione di un segmento FIN, che
173   significa che si è finito con l'invio dei dati sulla connessione.
174   
175 \item L'altro capo della connessione riceve il FIN ed esegue la
176   \textit{chiusura passiva} (o \textit{passive close}); al FIN, come ad ogni
177   altro pacchetto, viene risposto con un ACK. Inoltre il ricevimento del FIN
178   viene segnalato al processo che ha aperto il socket (dopo che ogni altro
179   eventuale dato rimasto in coda è stato ricevuto) come un end-of-file sulla
180   lettura, questo perché il ricevimento di un FIN significa che non si
181   riceveranno altri dati sulla connessione.
182
183 \item Dopo un certo tempo anche il secondo processo chiamerà la funzione
184   \texttt{close} sul proprio socket, causando l'emissione di un altro segmento
185   FIN. 
186
187 \item L'altro capo della connessione riceverà il FIN conclusivo e risponderà
188   con un ACK.
189 \end{enumerate}
190
191 Dato che in questo caso sono richiesti un FIN ed un ACK per ciascuna direzione
192 normalmente i segmenti scambiati sono quattro.  Questo non è vero sempre
193 giacché in alcune situazioni il FIN del passo 1) è inviato insieme a dei dati.
194 Inoltre è possibile che i segmenti inviati nei passi 2 e 3 dal capo che
195 effettua la chiusura passiva, siano accorpati in un singolo segmento. In
196 \nfig\ si è rappresentato graficamente lo sequenza di scambio dei segmenti che
197 stabilisce la connessione.
198
199 \begin{figure}[htb]
200   \centering  
201   \includegraphics[width=10cm]{img/tcp_close.eps}  
202   \caption{La chiusura di una connessione TCP}
203   \label{fig:TCPel_close}
204 \end{figure}
205
206 Come per il SYN anche il FIN occupa un byte nel numero di sequenza, per cui
207 l'ACK riporterà un \textit{acknowledge number} incrementato di uno. 
208
209 Si noti che nella sequenza di chiusura fra i passi 2 e 3 è in teoria possibile
210 che si mantenga un flusso di dati dal capo della connessione che deve ancora
211 eseguire la chiusura passiva a quello che sta eseguendo la chiusura attiva.
212 Nella sequenza indicata i dati verrebbero persi, dato che si è chiuso il
213 socket dal lato che esegue la chiusura attiva; esistono tuttavia situazioni in
214 cui si vuole poter sfuttare questa possibilità, usando una procedura che è
215 chiamata \textit{half-close}; torneremo su questo aspetto e su come
216 utilizzarlo più avanti, quando parleremo della funzione \texttt{shutdown}.
217
218 La emissione del FIN avviene quando il socket viene chiuso, questo però non
219 avviene solo per la chiamata della funzione \texttt{close} (come in
220 \figref{fig:net_serv_code}), ma anche alla terminazione di un processo (come
221 in \figref{fig:net_cli_code}). Questo vuol dire ad esempio che se un processo
222 viene terminato da un segnale tutte le connessioni aperte verranno chiuse.
223
224 Infine è da sottolineare che, benché nella figura (e nell'esempio che vedremo
225 più avanti in \secref{sec:TCPsimp_echo}) sia stato il client ad eseguire la
226 chiusura attiva, nella realtà questa può essere eseguita da uno qualunque dei
227 due capi della comunicazione (come in fatto in precedenza nell'esempio di
228 \figref{fig:net_serv_code}), e anche se il caso più comune resta quello del
229 client, ci sono alcuni servizi, il principale dei quali è l'HTTP, per i
230 quali è il server ad effettuare la chiusura attiva.
231
232
233 \subsection{Un esempio di connessione}
234 \label{sec:TCPel_conn_dia}
235
236 Le operazioni del TCP nella creazione e conclusione di una connessione sono
237 specificate attraverso il diagramma di transizione degli stati riportato in
238 \nfig. TCP prevede l'esistenza di 11 diversi stati per un socket ed un insieme
239 di regole per le transizioni da uno stato all'altro basate sullo stato
240 corrente e sul tipo di segmento ricevuto; i nomi degli stati sono gli stessi
241 che vengono riportati del comando \cmd{netstat} nel campo \textit{State}.
242
243 Una descrizione completa del funzionamento del protocollo va al di là degli
244 obiettivi di questo libro; un approfondimento sugli aspetti principali si
245 trova in \capref{cha:tcp_protocol}, ma per una trattazione esauriente il
246 miglior riferimento resta (FIXME citare lo Stevens); qui ci limiteremo a
247 descrivere brevemente un semplice esempio di connessione e le transizioni che
248 avvengono nei due casi appena citati (creazione e terminazione della
249 connessione).
250
251 In assenza di connessione lo stato del TCP è \texttt{CLOSED}; quando una
252 applicazione esegue una apertura attiva il TCP emette un SYN e lo stato
253 diventa \texttt{SYN\_SENT}; quando il TCP riceve la risposta del SYN$+$ACK
254 emette un ACK e passa allo stato \texttt{ESTABLISHED}; questo è lo stato
255 finale in cui avviene la gran parte del trasferimento dei dati.
256
257 Dal lato server in genere invece il passaggio che si opera con l'apertura
258 passiva è quello di portare il socket dallo stato \texttt{CLOSED} allo
259 stato \texttt{LISTEN} in cui vengono accettate le connessioni.
260
261 Dallo stato \texttt{ESTABLISHED} si può uscire in due modi; se un'applicazione
262 chiama la \texttt{close} prima di aver ricevuto un end of file (chiusura
263 attiva) la transizione è verso lo stato \texttt{FIN\_WAIT\_1}; se invece
264 l'applicazione riceve un FIN nello stato \texttt{ESTABLISHED} (chiusura
265 passiva) la transizione è verso lo stato \texttt{CLOSE\_WAIT}.
266
267 In \nfig\ è riportato lo schema dello scambio dei pacchetti che avviene per
268 una un esempio di connessione, insieme ai vari stati che il protocollo viene
269 ad assumere per i due lati, server e client.
270
271 \begin{figure}[htb]
272   \centering
273   \includegraphics[width=9cm]{img/tcp_connection.eps}  
274   \caption{Schema dello scambio di pacchetti per un esempio di connessione}
275   \label{fig:TPCel_conn_example}
276 \end{figure}
277
278 La connessione viene iniziata dal client che annuncia un MSS di 1460 (un
279 valore tipico per IPv4 su ethernet) con Linux, il server risponde con lo
280 stesso valore (ma potrebbe essere anche un valore diverso).
281
282 Una volta che la connessione è stabilita il client scrive al server una
283 richiesta (che assumiamo stare in un singolo segmento, cioè essere minore dei
284 1460 bytes annunciati dal server), quest'ultimo riceve la richiesta e
285 restituisce una risposta (che di nuovo supponiamo stare in un singolo
286 segmento). Si noti che l'acknowledge della richiesta è mandato insieme alla
287 risposta, questo viene chiamato \textit{piggybacking} ed avviene tutte le
288 volte che che il server è sufficientemente veloce a costruire la risposta, in
289 caso contrario si avrebbe prima l'emissione di un ACK e poi l'invio della
290 risposta.
291
292 Infine si ha lo scambio dei quattro segmenti che terminano la connessione
293 secondo quanto visto in \secref{sec:TCPel_conn_term}; si noti che il capo
294 della connessione che esegue la chiusura attiva entra nello stato
295 \texttt{TIME\_WAIT} su cui torneremo fra poco.
296
297 È da notare come per effettuare uno scambio di due pacchetti (uno di richiesta
298 e uno di risposta) il TCP necessiti di ulteriori otto segmenti, se invece si
299 fosse usato UDP sarebbero stati sufficienti due soli pacchetti. Questo è il
300 costo che occorre pagare per avere l'affidabilità garantita dal TCP, se si
301 fosse usato UDP si sarebbe dovuto trasferire la gestione di tutta una serie di
302 dettagli (come la verifica della ricezione dei pacchetti) dal livello del
303 trasporto all'interno dell'applicazione.
304
305 Quello che è bene sempre tenere presente è allora quali sono le esigenze che
306 si hanno in una applicazione di rete, perché non è detto che TCP sia la
307 miglior scelta in tutti i casi (ad esempio se si devono solo scambiare dati
308 già organizzati in piccoli pacchetti l'overhead aggiunto può essere eccessivo)
309 per questo esistono applicazioni che usano UDP e lo fanno perché nel caso
310 specifico le sue caratteristiche di velocità e compattezza nello scambio dei
311 dati rispondono meglio alle esigenze che devono essere affrontate.
312
313 \subsection{Lo stato \texttt{TIME\_WAIT}}
314 \label{sec:TCPel_time_wait}
315
316 Come riportato da Stevens (FIXME citare) lo stato \texttt{TIME\_WAIT} è
317 probabilmente uno degli aspetti meno compresi del protocollo TCP, è infatti
318 comune trovare nei newsgroup domande su come sia possibile evitare che
319 un'applicazione resti in questo stato lasciando attiva una connessione ormai
320 conclusa; la risposta è che non deve essere fatto, ed il motivo cercheremo di
321 spiegarlo adesso.
322
323 Come si è visto nell'esempio precedente (vedi \curfig) \texttt{TIME\_WAIT} è
324 lo stato finale in cui il capo di una connessione che esegue la chiusura
325 attiva resta prima di passare alla chiusura definitiva della connessione. Il
326 tempo in cui l'applicazione resta in questo stato deve essere due volte la MSL
327 (\textit{Maximum Segment Lifetime}). 
328
329 La MSL è la stima del massimo periodo di tempo che un pacchetto IP può vivere
330 sulla rete; questo tempo è limitato perché ogni pacchetto IP può essere
331 ritrasmesso dai router un numero massimo di volte (detto \textit{hop limit}).
332 Il numero di ritrasmissioni consentito è indicato dal campo TTL dell'header di
333 IP (per maggiori dettagli vedi \secref{sec:IP_xxx}), e viene decrementato
334 ad ogni passaggio da un router; quando si annulla il pacchetto viene scartato.
335 Siccome il numero è ad 8 bit il numero massimo di ``salti'' è di 255, pertanto
336 anche se il TTL (da \textit{time to live}) non è propriamente un limite sul
337 tempo di vita, si stima che un pacchetto IP non possa restare nella rete per
338 più di MSL secondi.
339
340 Ogni implementazione del TCP deve scegliere un valore per la MSL (l'RFC~1122
341 raccomanda 2 minuti, Linux usa 30 secondi), questo comporta una durata dello
342 stato \texttt{TIME\_WAIT} che a seconda delle implementazioni può variare fra
343 1 a 4 minuti.
344
345 Lo stato \texttt{TIME\_WAIT} viene utilizzato dal protocollo per due motivi
346 principali:
347 \begin{enumerate}
348 \item implementare in maniera affidabile la terminazione della connessione
349   in entrambe le direzioni.
350 \item consentire l'eliminazione dei segmenti duplicati dalla rete. 
351 \end{enumerate}
352
353 Il punto è che entrambe le ragioni sono importanti, anche se spesso si fa
354 riferimento solo alla prima; ma è solo se si tiene conto della seconda che si
355 capisce il perché della scelta di un tempo pari al doppio della MSL come
356 durata di questo stato.
357
358 Il primo dei due motivi precedenti si può capire tornando a \curfig: assumendo
359 che l'ultimo ACK della sequenza (quello del capo che ha eseguito la chiusura
360 attiva) vanga perso, chi esegue la chiusura passiva non ricevendo risposta
361 rimanderà un ulteriore FIN, per questo motivo chi esegue la chiusura attiva
362 deve mantenere lo stato della connessione per essere in grado di reinviare
363 l'ACK e chiuderla correttamente. Se non fosse così la risposta sarebbe un RST
364 (un altro tipo si segmento) che verrebbe interpretato come un errore.
365
366 Se il TCP deve poter chiudere in maniera pulita entrambe le direzioni della
367 connessione allora deve essere in grado di affrontare la perdita di uno
368 qualunque dei quattro segmenti che costituiscono la chiusura. Per questo
369 motivo lo stato \texttt{TIME\_WAIT} deve essere mantenuto anche dopo l'invio
370 dell'ultimo ACK per poter essere in grado di poterne gestire l'eventuale
371 ritrasmissione in caso di perdita.
372
373 Il secondo motivo è più complesso da capire, e necessita di spiegare meglio
374 gli scenari in cui accade che i pacchetti si possono perdere nella rete o
375 restare intrappolati, per poi riemergere.
376
377 Il caso più comune in cui questo avviene è quello di anomalie
378 nell'instradamento; può accadere cioè che un router smetta di funzionare o che
379 una connessione fra due router si interrompa. In questo caso i protocolli di
380 instradamento dei pacchetti possono impiegare diverso tempo (anche dell'ordine
381 dei minuti) prima di trovare e stabilire un percorso alternativo per i
382 pacchetti. Nel frattempo possono accadere casi in cui un router manda i
383 pacchetti verso un'altro e quest'ultimo li rispedisce indietro, o li manda ad
384 un terzo router che li rispedisce al primo, si creano cioè dei circoli (i
385 cosiddetti \textit{routing loop}) in cui restano intrappolati i pacchetti.
386
387 Se uno di questi pacchetti intrappolati è un segmento di TCP chi l'ha inviato,
388 non ricevendo risposta, provvederà alla ritrasmissione e se nel frattempo sarà
389 stata stabilita una strada alternativa il pacchetto ritrasmesso giungerà a
390 destinazione. 
391
392 Ma se dopo un po' di tempo (che non supera il limite dell'MSL, dato che
393 altrimenti verrebbe ecceduto il TTL) l'anomalia viene a cessare il circolo di
394 instradamento viene spezzato i pacchetti intrappolati potranno essere inviati
395 alla destinazione finale, con la conseguenza di avere dei pacchetti duplicati;
396 questo è un caso che il TCP deve essere in grado di gestire.
397
398 Allora per capire la seconda ragione per l'esistenza dello stato
399 \texttt{TIME\_WAIT} si consideri il caso seguente: si supponga di avere una
400 connessione fra l'IP 195.110.112.236 porta 1550 e l'IP 192.84.145.100 porta
401 22, che questa venga chiusa e che poco dopo si ristabilisca la stessa
402 connessione fra gli stessi IP sulle stesse porte (quella che viene detta,
403 essendo gli stessi porte e numeri IP, una nuova \textsl{incarnazione} della
404 connessione precedente); in questo caso ci si potrebbe trovare con dei
405 pacchetti duplicati relativi alla precedente connessione che riappaiono nella
406 nuova.
407
408 Ma fintanto che il socket non è chiuso una nuova incarnazione non può essere
409 creata, per questo un socket TCP resta sempre nello stato \texttt{TIME\_WAIT}
410 per un periodo di 2MSL, in modo da attendere MSL secondi per essere sicuri che
411 tutti i pacchetti duplicati in arrivo siano stati ricevuti (e scartati) o che
412 nel frattempo siano stati eliminati dalla rete, e altri MSL secondi per essere
413 sicuri che lo stesso avvenga le risposte nella direzione opposta.
414
415 In questo modo il TCP si assicura che quando una viene creata una nuova
416 connessione tutti gli eventuali segmenti residui di una precedente connessione
417 che possono causare disturbi sono stati eliminati dalla rete.
418
419
420 \subsection{I numeri di porta}
421 \label{sec:TCPel_port_num}
422
423 In un ambiente multitasking in un dato momento più processi possono dover
424 usare sia UDP che TCP, e ci devono poter essere più connessioni in
425 contemporanea. Per poter tenere distinte le diverse connessioni entrambi i
426 protocolli usano i \textsl{numeri di porta}, che fanno parte, come si può
427 vedere in \secref{sec:sock_sa_ipv4} e \secref{sec:sock_sa_ipv6} pure delle
428 strutture degli indirizzi del socket.
429
430 Quando un client contatta un server deve poter identificare con quale dei vari
431 possibili server attivi intende parlare. Sia TCP che UDP definiscono un gruppo
432 di \textsl{porte conosciute} (le cosiddette \textit{well-known port}) che
433 identificano una serie di servizi noti (ad esempio la porta 22 identifica il
434 servizio \texttt{ssh}) effettuati da appositi server che rispondono alle
435 connessioni verso tali porte.
436
437 D'altra parte un client non ha necessità di usare un numero di porta
438 specifico, per cui in genere vengono usate le cosiddette \textsl{porte
439   effimere} (o \textit{ephemeral ports}) cioè porte a cui non è assegnato
440 nessun servizio noto e che vengono assegnate automaticamente dal kernel alla
441 creazione della connessione. Queste sono dette effimere in quanto vengono
442 usate solo per la durata della connessione, e l'unico requisito che deve
443 essere soddisfatto è che ognuna di esse sia assegnata in maniera univoca.
444
445 La lista delle porte conosciute è definita dall'RFC~1700 che contiene l'elenco
446 delle porte assegnate dalla IANA (\textit{Internet Assigned Number Authority})
447 ma l'elenco viene costantemente aggiornato e pubblicato all'indirizzo
448 \texttt{ftp://ftp.isi.edu/in-notes/iana/assignements/port-numbers}, inoltre il
449 file \file{/etc/services} contiene un analogo elenco, con la corrispondenza
450 fra i numeri di porta ed il nome simbolico del servizio. I numeri sono divisi
451 in tre intervalli:
452
453 \begin{enumerate}
454 \item \textsl{le porte conosciute}. I numeri da 0 a 1023. Queste sono
455   controllate e assegnate dalla IANA. Se è possibile la stessa porta è
456   assegnata allo stesso servizio sia su UDP che su TCP (ad esempio la porta 22
457   è assegnata a ssh su entrambi i protocolli, anche se viene usata solo dal
458   TCP).
459   
460 \item \textsl{le porte registrate}. I numeri da 1024 a 49151. Queste porte non
461   sono controllate dalla IANA, che però registra ed elenca chi usa queste
462   porte come servizio agli utenti. Come per le precedenti si assegna una porta
463   ad un servizio sia per TCP che UDP anche se poi il servizio è implementato
464   solo su TCP. Ad esempio X Window usa le porte TCP e UDP dal 6000 al 6063
465   anche se il protocollo è implementato solo tramite TCP.
466   
467 \item \textsl{le porte private} o \textsl{dinamiche}. I numeri da 49152 a
468   65535. La IANA non dice nulla riguardo a queste porte che pertanto
469   sono i candidati naturali ad essere usate come porte effimere.
470 \end{enumerate}
471
472 In realtà rispetto a quanto indicato nell'RFC~1700 i vari sistemi hanno fatto
473 scelte diverse per le porte effimere, in particolare in \nfig\ sono riportate
474 quelle di BSD, Solaris e Linux. Nel caso di Linux poi la scelta fra i due
475 intervalli possibili viene fatta dinamicamente a seconda della memoria a
476 disposizione del kernel per gestire le relative tabelle.
477
478 \begin{figure}[!htb]
479   \centering
480   \includegraphics[width=10cm]{img/tcpip_overview.eps}  
481   \caption{Allocazione dei numeri di porta}
482   \label{fig:TCPel_port_alloc}
483 \end{figure}
484
485 I sistemi unix hanno inoltre il concetto di \textsl{porte riservate} (che
486 corrispondono alle porte con numero minore di 1024 e coincidono quindi con le
487 porte conosciute). La loro caratteristica è che possono essere assegnate a un
488 socket solo da un processo con i privilegi di root, per far si che solo
489 l'amministratore possa allocare queste porte per far partire i relativi
490 servizi.
491
492 Si tenga conto poi che ci sono alcuni client (in particolare \cmd{rsh} e
493 \cmd{rlogin}) che richiedono una connessione su una porta riservata anche
494 dal lato client come parte dell'autenticazione. Questo viene fatto tramite la
495 funzione \func{rresvport} assegnando al socket una porta libera
496 nell'intervallo fra 512 e 1023.
497
498 Data una connessione TCP si suole chiamare \textit{socket pair} la
499 combinazione dei quattro numeri che definiscono i due capi della connessione e
500 cioè l'indirizzo IP locale e la porta TCP locale, e l'indirizzo IP remoto e la
501 porta TCP remota; questa combinazione, che scriveremo usando una notazione del
502 tipo (195.110.112.152:22, 192.84.146.100:20100), identifica univocamente una
503 connessione su internet. Questo concetto viene di solito esteso anche a UDP,
504 benché in questo caso non abbia senso parlare di connessione. L'utilizzo del
505 programma \cmd{netstat} permette di visualizzare queste informazioni nei campi
506 \textit{Local Address} e \textit{Foreing Address}.
507
508
509 \subsection{Le porte ed il modello client/server}
510 \label{sec:TCPel_port_cliserv}
511
512 Per capire meglio l'uso delle porte e come vengono utilizzate quando si ha a
513 che fare con un'applicazione client/server (come quella che scriveremo in
514 \secref{sec:TCPel_cunc_serv}) esamineremo cosa accade con le connessioni nel
515 caso di un server TCP che deve gestire connessioni multiple.
516
517 Se eseguiamo un \cmd{netstat} su una macchina di prova (che supponiamo avere
518 indirizzo 195.110.112.152) potremo avere un risultato del tipo:
519 \begin{verbatim}
520 Active Internet connections (servers and established)
521 Proto Recv-Q Send-Q Local Address           Foreign Address         State      
522 tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
523 tcp        0      0 0.0.0.0:25              0.0.0.0:*               LISTEN
524 tcp        0      0 127.0.0.1:53            0.0.0.0:*               LISTEN
525 \end{verbatim}
526 essendo presenti e attivi un server ssh, un server di posta e un DNS per il
527 caching locale.
528
529 Questo ci mostra ad esempio che il server ssh ha compiuto un'apertura passiva
530 mettendosi in ascolto sulla porta 22 riservata a questo servizio e che si è
531 posto in ascolto per connessioni provenienti da uno qualunque degli indirizzi
532 associati alle interfacce locali; la notazione 0.0.0.0 usata da netstat è
533 equivalente all'asterisco utilizzato per il numero di porta ed indica il
534 valore generico, e corrisponde al valore \texttt{INADDR\_ANY} definito in
535 \texttt{arpa/inet.h}.
536
537 Inoltre la porta e l'indirizzo di ogni eventuale connessione esterna non sono
538 specificati; in questo caso la \textit{socket pair} associata al socket può
539 essere indicata come (*:22, *:*), usando l'asterisco anche per gli indirizzi
540 come carattere di \textit{wildchard}. 
541
542 In genere avendo le macchine associato un solo IP ci si può chiedere che senso
543 abbia l'utilizzo dell'indirizzo generico per l'indirizzo locale, ma esistono
544 anche macchine che hanno più di un indirizzo IP (il cosiddetto
545 \textit{multihoming}) in questo modo si possono accettare connessioni
546 indirizzate verso uno qualunque di essi. Ma come si può vedere nell'esempio
547 con il DNS in ascolto sulla porta 53 è anche possibile restringere l'accesso
548 solo alle connessioni che provengono da uno specifico indirizzo, cosa che nel
549 caso è fatta accettando solo connessioni che arrivino sull'interfaccia di
550 loopback.
551
552 Una volta che ci si vorrà collegare a questa macchina da un'altra posta
553 all'indirizzo 192.84.146.100 si potrà lanciare un client \cmd{ssh} per
554 creare una connessione verso la precedente, e il kernel assocerà al suddetto
555 una porta effimera che per esempio potrà essere la 21100, la connessione
556 allora sarà espressa dalla socket pair (192.84.146.100:21100,
557 195.110.112.152.22).
558
559 Alla ricezione della richiesta dal client il server creerà un processo figlio
560 per gestire la connessione, se a questo punto eseguiamo nuovamente il
561 programma netstat otterremo come risultato:
562 \begin{verbatim}
563 Active Internet connections (servers and established)
564 Proto Recv-Q Send-Q Local Address           Foreign Address         State      
565 tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
566 tcp        0      0 0.0.0.0:25              0.0.0.0:*               LISTEN
567 tcp        0      0 127.0.0.1:53            0.0.0.0:*               LISTEN
568 tcp        0      0 195.110.112.152:22      192.84.146.100:21100    ESTABLISHED
569 \end{verbatim}
570
571 Come si può notare il server è ancora in ascolto sulla porta 22, però adesso
572 c'è un nuovo socket (con lo stato \texttt{ESTABLISHED}) che anch'esso utilizza
573 la porta 22, ed ha specificato l'indirizzo locale, questo è il socket con cui
574 il processo figlio gestisce la connessione mentre il padre resta in ascolto
575 sul socket originale.
576
577 Se a questo punto lanciamo un'altra volta il client ssh per una seconda
578 connessione quello che otterremo usando netstat sarà qualcosa del genere:
579 \begin{verbatim}
580 Active Internet connections (servers and established)
581 Proto Recv-Q Send-Q Local Address           Foreign Address         State      
582 tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
583 tcp        0      0 0.0.0.0:25              0.0.0.0:*               LISTEN
584 tcp        0      0 127.0.0.1:53            0.0.0.0:*               LISTEN
585 tcp        0      0 195.110.112.152:22      192.84.146.100:21100    ESTABLISHED
586 tcp        0      0 195.110.112.152:22      192.84.146.100:21101    ESTABLISHED
587 \end{verbatim}
588 cioè il client effettuerà la connessione usando un'altra porta effimera, con
589 questa sarà aperta la connessione, ed il server creerà un'altro processo
590 figlio sarà creato per gestirla.
591
592 Tutto ciò mostra come TCP, per poter gestire le connessioni con un server
593 concorrente, non può suddividere i pacchetti solo sulla base della porta di
594 destinazione, ma deve usare tutta l'informazione contenuta nella socket pair,
595 compresa la porta dell'indirizzo remoto.  E se andassimo a vedere quali sono i
596 processi a cui fanno riferimento i vari socket vedremmo che i pacchetti che
597 arrivano dalla porta remota 21100 vanno al primo figlio e quelli che arrivano
598 alla porta 21101 al secondo.
599
600
601 \section{Le funzioni dei socket TCP}
602 \label{sec:TCPel_functions}
603
604 In questa sezione descriveremo in dettaglio le varie funzioni necessarie per
605 l'uso dei socket TCP già citate in precedenza (e utilizzate nei due esempi
606 \secref{sec:net_cli_sample} e \secref{sec:net_serv_sample}) con l'eccezione
607 della funzione \func{socket} che è già stata esaminata in dettaglio in
608 \secref{sec:sock_socket}.
609
610 In \nfig\ abbiamo un tipico schema di funzionamento di un'applicazione
611 client-server che usa i socket TCP: prima il server viene avviato ed in
612 seguito il client si connette, in questo caso, a differenza di quanto accadeva
613 con gli esempi elementari del \capref{cha:network} si assume che sia il
614 client ad effettuare delle richieste a cui il server risponde, il client
615 notifica poi di avere concluso inviando un end-of-file a cui il server
616 risponderà anche lui chiudendo la connessione per aspettarne una nuova.
617
618 \begin{figure}[!htb]
619   \centering
620
621   \caption{Struttura delle funzioni dei socket per una semplice applicazione
622     client/server su TCP.}
623   \label{fig:TCPel_cliserv_func}
624 \end{figure}
625
626 Useremo questo schema anche per l'esempio di reimplementazione del servizio
627 \texttt{daytime} che illustreremo in \secref{sec:TCPel_cunc_serv}.
628
629
630 \subsection{La funzione \texttt{bind}}
631 \label{sec:TCPel_func_bind}
632
633 La funzione \func{bind} assegna un indirizzo locale ad un socket. È usata
634 cioè per specificare la prima parte dalla socket pair. Viene usata sul lato
635 server per specificare la porta (e gli eventuali indirizzi locali) su cui poi
636 ci si porrà in ascolto. Il prototipo della funzione è il seguente:
637 \begin{prototype}{sys/socket.h}
638 {int bind(int sockfd, const struct sockaddr *serv\_addr, socklen\_t addrlen)}
639   
640   Il primo argomento è un file descriptor ottenuto da una precedente chiamata
641   a \func{socket}, mentre il secondo e terzo argomento sono rispettivamente
642   l'indirizzo (locale) del socket e la dimensione della struttura che lo
643   contiene, secondo quanto già trattato in \secref{sec:sock_sockaddr}.
644
645   La funzione restituisce zero in caso di successo e -1 per un errore; in caso
646   di errore la variabile \var{errno} viene settata secondo i seguenti
647   codici di errore:
648   \begin{errlist}
649   \item \macro{EBADF} il file descriptor non è valido.
650   \item \macro{EINVAL} il socket ha già un indirizzo assegnato.
651   \item \macro{ENOTSOCK} il file descriptor non è associato ad un socket.
652   \item \macro{EACCESS} si è cercato di usare una porta riservata senza
653     sufficienti privilegi. 
654   \end{errlist}
655 \end{prototype}
656
657 Con il TCP la chiamata \func{bind} permette di specificare l'indirizzo, la
658 porta, entrambi o nessuno dei due. In genere i server utilizzano una porta
659 nota che assegnano all'avvio, se questo non viene fatto è il kernel a
660 scegliere una porta effimera quando vengono eseguite la funzioni
661 \func{connect} o \func{listen}, ma se questo è normale per il client non lo è
662 per il server\footnote{un'eccezione a tutto ciò sono i server che usano RPC.
663   In questo caso viene fatta assegnare dal kernel una porta effimera che poi
664   viene registrata presso il \textit{portmapper}; quest'ultimo è un altro
665   demone che deve essere contattato dai client per ottenere la porta effimera
666   su cui si trova il server} che in genere viene identificato dalla porta su
667 cui risponde.
668
669 Con \func{bind} si può assegnare un IP specifico ad un socket, purché questo
670 appartenga ad una interfaccia della macchina.  Per un client TCP questo
671 diventerà l'indirizzo sorgente usato per i tutti i pacchetti inviati sul
672 socket, mentre per un server TCP questo restringerà l'accesso al socket solo
673 alle connessioni che arrivano verso tale indirizzo.
674
675 Normalmente un client non specifica mai un indirizzo ad un suo socket, ed il
676 kernel sceglie l'indirizzo di origine quando viene effettuata la connessione
677 sulla base dell'interfaccia usata per trasmettere i pacchetti, (che dipende
678 dalle regole di instradamento usate per raggiungere il server).
679 Se un server non specifica il suo indirizzo locale il kernel userà come
680 indirizzo di origine l'indirizzo di destinazione specificato dal SYN del
681 client. 
682
683 Per specificare un indirizzo generico con IPv4 si usa il valore
684 \macro{INADDR\_ANY}, il cui valore, come visto anche negli esempi precedenti
685 è pari a zero, nell'esempio \figref{fig:net_serv_code} si è usata
686 un'assegnazione immediata del tipo:
687
688 \footnotesize
689 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
690   serv_add.sin_addr.s_addr = htonl(INADDR_ANY);   /* connect from anywhere */
691 \end{lstlisting}
692 \normalsize
693
694 Si noti che si è usato \func{htonl} per assegnare il valore
695 \macro{INADDR\_ANY}; benché essendo questo pari a zero il riordinamento sia
696 inutile; ma dato che tutte le costanti \macro{INADDR\_} sono definite
697 secondo l'ordinamento della macchina è buona norma usare sempre la funzione
698 \macro{htonl}.
699
700 L'esempio precedete funziona con IPv4 dato che l'indirizzo è rappresentabile
701 anche con un intero a 32 bit; non si può usare lo stesso metodo con IPv6,
702 in cui l'indirizzo è specificato come struttura, perché il linguaggio C non
703 consente l'uso di una struttura costante come operando a destra in una
704 assegnazione.  
705
706 Per questo nell'header \file{netinet/in.h} è definita una variabile
707 \type{in6addr\_any} (dichiarata come \type{extern}, ed inizializzata dal
708 sistema al valore \macro{IN6ADRR\_ANY\_INIT}) che permette di effettuare una
709 assegnazione del tipo: \footnotesize
710 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
711    serv_add.sin6_addr = in6addr_any;   /* connect from anywhere */
712 \end{lstlisting}
713 \normalsize
714
715
716 \subsection{La funzione \func{connect}}
717 \label{sec:TCPel_func_connect}
718
719 La funzione \func{connect} è usata da un client TCP per stabilire la
720 connessione con un server TCP, il prototipo della funzione è il seguente:
721
722 \begin{prototype}{sys/socket.h}
723 {int connect(int sockfd, const struct sockaddr *servaddr, socklen\_t addrlen)}
724   
725   Il primo argomento è un file descriptor ottenuto da una precedente chiamata
726   a \func{socket}, mentre il secondo e terzo argomento sono rispettivamente
727   l'indirizzo e la dimensione della struttura che contiene l'indirizzo del
728   socket, già descritta in \secref{sec:sock_sockaddr}.
729
730   La funzione restituisce zero in caso di successo e -1 per un errore, in caso
731   di errore la variabile \var{errno} viene settata secondo i seguenti
732   codici di errore:
733   \begin{errlist}
734   \item \texttt{EISCONN} il socket è già connesso.
735   \item \texttt{ECONNREFUSED} non c'è nessuno in ascolto sull'indirizzo remoto.
736   \item \texttt{ETIMEDOUT} si è avuto timeout durante il tentativo di
737     connessione.
738   \item \texttt{ENETUNREACH} la rete non è raggiungibile.
739   \item \texttt{EADDRINUSE} l'indirizzo locale è in uso.
740   \item \texttt{EINPROGRESS} il socket è non bloccante e la connessione non
741     può essere conclusa immediatamente.
742   \item \texttt{EALREADY} il socket è non bloccante e un tentativo precedente
743     di connessione non si è ancora concluso.
744   \item \texttt{EAGAIN} non ci sono più porte locali libere. 
745   \item \texttt{EAFNOSUPPORT} l'indirizzo non ha una famiglia di indirizzi
746     corretta nel relativo campo.
747   \item \texttt{EACCESS, EPERM} si è tentato di eseguire una connessione ad un
748     indirizzo broadcast senza che il socket fosse stato abilitato per il
749     broadcast.
750   \end{errlist}
751   altri errori possibili sono: \macro{EFAULT}, \macro{EBADF},
752   \macro{ENOTSOCK}.
753 \end{prototype}
754
755 La struttura dell'indirizzo deve essere inizializzata con l'indirizzo IP e il
756 numero di porta del server a cui ci si vuole connettere, come mostrato
757 nell'esempio \secref{sec:net_cli_sample} usando le funzioni illustrate in
758 \secref{sec:sock_addr_func}.
759
760 Nel caso di socket TCP la funzione \texttt{connect} avvia il \textit{three way
761   handshake}, e ritorna solo quando la connessione è stabilita o si è
762 verificato un errore. Le possibili cause di errore sono molteplici (ed i
763 relativi codici riportati sopra), quelle che però dipendono dalla situazione
764 della rete e non da errori o problemi nella chiamata della funzione sono le
765 seguenti:
766 \begin{enumerate}
767 \item Il client non riceve risposta al SYN: l'errore restituito è
768   \macro{ETIMEDOUT}. Stevens riporta che BSD invia un primo SYN alla chiamata
769   di \func{connect}, un'altro dopo 6 secondi, un terzo dopo 24 secondi, se
770   dopo 75 secondi non ha ricevuto risposta viene ritornato l'errore. Linux
771   invece ripete l'emissione del SYN ad intervalli di 30 secondi per un numero
772   di volte che può essere stabilito dall'utente sia con una opportuna
773   \func{sysctl} che attraverso il filesystem \file{/proc} scrivendo il valore
774   voluto in \file{/proc/sys/net/ipv4/tcp\_syn\_retries}. Il valore di default
775   per la ripetizione dell'invio è di 5 volte, che comporta un timeout dopo
776   circa 180 secondi.
777 %
778 % Le informazioni su tutte le opzioni settabili via /proc stanno in
779 % Linux/Documentation/networking/ip-sysctl.txt
780 %
781 \item Il client riceve come risposta al SYN un RST significa che non c'è
782   nessun programma in ascolto per la connessione sulla porta specificata (il
783   che vuol dire probabilmente che o si è sbagliato il numero della porta o che
784   non è stato avviato il server), questo è un errore fatale e la funzione
785   ritorna non appena il RST viene ricevuto riportando un errore
786   \macro{ECONNREFUSED}.
787   
788   Il flag RST sta per \textit{reset} ed è un segmento inviato direttamente
789   dal TCP quando qualcosa non va. Tre condizioni che generano un RST sono:
790   quando arriva un SYN per una porta che non ha nessun server in ascolto,
791   quando il TCP abortisce una connessione in corso, quando TCP riceve un
792   segmento per una connessione che non esiste.
793   
794 \item Il SYN del client provoca l'emissione di un messaggio ICMP di
795   destinazione non raggiungibile. In questo caso dato che il messaggio può
796   essere dovuto ad una condizione transitoria si ripete l'emissione dei SYN
797   come nel caso precedente, fino al timeout, e solo allora si restituisce il
798   codice di errore dovuto al messaggio ICMP, che da luogo ad un
799   \macro{ENETUNREACH}.
800    
801 \end{enumerate}
802
803 Se si fa riferimento al diagramma degli stati del TCP riportato in
804 \figref{fig:TCP_state_diag} la funzione \func{connect} porta un socket
805 dallo stato \texttt{CLOSED} (lo stato iniziale in cui si trova un socket
806 appena creato) prima allo stato \texttt{SYN\_SENT} e poi, al ricevimento del
807 ACK, nello stato \texttt{ESTABLISHED}. Se invece la connessione fallisce il
808 socket non è più utilizzabile e deve essere chiuso.
809
810 Si noti infine che con la funzione \func{connect} si è specificato solo
811 indirizzo e porta del server, quindi solo una metà della socket pair; essendo
812 questa funzione usata nei client l'altra metà contenente indirizzo e porta
813 locale viene lasciata all'assegnazione automatica del kernel, e non è
814 necessario effettuare una \func{bind}.
815
816
817 \subsection{La funzione \func{listen}}
818 \label{sec:TCPel_func_listen}
819
820 La funzione \func{listen} è usata per usare un socket in modalità passiva,
821 cioè, come dice il nome, per metterlo in ascolto di eventuali connessioni; in
822 sostanza l'effetto della funzione è di portare il socket dallo stato
823 \texttt{CLOSED} a quello \texttt{LISTEN}. In genere si chiama la funzione in
824 un server dopo le chiamate a \func{socket} e \func{bind} e prima della
825 chiamata ad \func{accept}. Il prototipo della funzione come definito dalla
826 man page è:
827
828 \begin{prototype}{sys/socket.h}{int listen(int sockfd, int backlog)}
829   La funzione pone il socket specificato da \var{sockfd} in modalità
830   passiva e predispone una coda per le connessioni in arrivo di lunghezza pari
831   a \var{backlog}. La funzione si può applicare solo a socket di tipo
832   \macro{SOCK\_STREAM} o \macro{SOCK\_SEQPACKET}.
833
834   La funzione restituisce 0 in caso di successo e -1 in caso di errore. I
835   codici di errore restituiti in \var{errno} sono i seguenti:
836   \begin{errlist}
837   \item \macro{EBADF} l'argomento \var{sockfd} non è un file descriptor
838     valido.
839   \item \macro{ENOTSOCK} l'argomento \var{sockfd} non è un socket.
840   \item \macro{EOPNOTSUPP} il socket è di un tipo che non supporta questa
841     operazione.
842   \end{errlist}
843 \end{prototype}
844
845
846 Il parametro \var{backlog} indica il numero massimo di connessioni pendenti
847 accettate; se esso viene ecceduto il client riceverà una errore di tipo
848 \macro{ECONNREFUSED}, o se il protocollo, come nel caso del TCP, supporta la
849 ritrasmissione, la richiesta sarà ignorata in modo che la connessione possa
850 essere ritentata.
851
852 Per capire meglio il significato di tutto ciò occorre approfondire la modalità
853 con cui il kernel tratta le connessioni in arrivo. Per ogni socket in ascolto
854 infatti vengono mantenute due code:
855 \begin{enumerate}
856 \item Una coda delle connessioni incomplete (\textit{incomplete connection
857     queue} che contiene un ingresso per ciascun socket per il quale è arrivato
858   un SYN ma il three way handshake non si è ancora concluso.  Questi socket
859   sono tutti nello stato \texttt{SYN\_RECV}.
860 \item Una coda delle connessioni complete (\textit{complete connection queue}
861   che contiene un ingresso per ciascun socket per il quale il three way
862   handshake è stato completato ma ancora \texttt{accept} non è ritornata.
863   Questi socket sono tutti nello stato \texttt{ESTABLISHED}.
864 \end{enumerate}
865
866 Lo schema di funzionamento è descritto in \nfig, quando arriva un SYN da un
867 client il server crea una nuova entrata nella coda delle connessioni
868 incomplete, e poi risponde con il SYN$+$ACK. La entrata resterà nella coda
869 delle connessioni incomplete fino al ricevimento dell'ACK dal client o fino ad
870 un timeout. Nel caso di completamento del three way handshake l'entrata viene
871 sostata nella coda delle connessioni complete. Quando il processo chiama la
872 funzione \texttt{accept} (vedi \secref{sec:TCPel_func_accept}) la prima
873 entrata nella coda delle connessioni complete è passata al programma, o, se la
874 coda è vuota, il processo viene posto in attesa e risvegliato all'arrivo della
875 prima connessione completa.
876
877 Storicamente il valore del parametro \texttt{backlog} era corrispondente al
878 massimo valore della somma del numero di entrate possibili per ciascuna di
879 dette code. Stevens riporta che BSD ha sempre applicato un fattore di 1.5 al
880 valore, e provvede una tabella con i risultati ottenuti con vari kernel,
881 compreso Linux 2.0, che mostrano le differenze fra diverse implementazioni. 
882
883 In Linux il significato di questo valore è cambiato a partire dal kernel
884 2.2 per prevenire l'attacco chiamato \texttt{syn flood}. Questo si basa
885 sull'emissione da parte dell'attaccante di un grande numero di pacchetti SYN
886 indirizzati verso una porta forgiati con indirizzo IP fasullo\footnote{con la
887   tecnica che viene detta \textit{ip spoofing}} così che i SYN$+$ACK vanno
888 perduti e la coda delle connessioni incomplete viene saturata, impedendo di
889 fatto ulteriori connessioni.
890
891 Per ovviare a questo il significato del \texttt{backlog} è stato cambiato a
892 indicare la lunghezza della coda delle connessioni complete. La lunghezza
893 della coda delle connessioni incomplete può essere ancora controllata usando
894 la \texttt{sysctl} o scrivendola direttamente in
895 \texttt{/proc/sys/net/ipv4/tcp\_max\_syn\_backlog}. Quando si attiva la
896 protezione dei syncookies però (con l'opzione da compilare nel kernel e da
897 attivare usando \texttt{/proc/sys/net/ipv4/tcp\_syncookies}) questo valore
898 viene ignorato e non esiste più un valore massimo.  In ogni caso in Linux il
899 valore di \texttt{backlog} viene troncato ad un massimo di \texttt{SOMAXCONN}
900 se è superiore a detta costante (che di default vale 128).
901
902 La scelta storica per il valore di questo parametro è di 5, e alcuni vecchi
903 kernel non supportavano neanche valori superiori, ma la situazione corrente è
904 molto cambiata per via della presenza di server web che devono gestire un gran
905 numero di connessioni per cui un tale valore non è più adeguato. Non esiste
906 comunque una risposta univoca per la scelta del valore, per questo non
907 conviene specificarlo con una costante (il cui cambiamento richiederebbe la
908 ricompilazione del server) ma usare piuttosto una variabile di ambiente (vedi
909 \secref{sec:proc_environ}).  
910
911 Lo Stevens tratta accuratamente questo argomento, con esempi presi da casi
912 reali su web server, ed in particolare evidenzia come non sia più vero che il
913 compito principale della coda sia quello di gestire il caso in cui il server è
914 occupato fra chiamate successive alla \texttt{accept} (per cui la coda più
915 occupata sarebbe quella delle connessioni completate), ma piuttosto quello di
916 gestire la presenza di un gran numero di SYN in attesa di concludere il
917 three way handshake.
918
919 Infine va messo in evidenza che nel caso di socket TCP quando un SYN arriva
920 con tutte le code piene, il pacchetto deve essere ignorato. Questo perché la
921 condizione in cui le code sono piene è ovviamente transitoria, per cui se il
922 client ritrasmette il SYN è probabile che passato un po' di tempo possa
923 trovare nella coda lo spazio per una nuova connessione. Se invece si
924 rispondesse con un RST per indicare l'impossibilità di effettuare la
925 connessione la chiamata a \texttt{connect} nel client ritornerebbe con una
926 condizione di errore, costringendo a inserire nell'applicazione la gestione
927 dei tentativi di riconnessione che invece può essere effettuata in maniera
928 trasparente dal protocollo TCP.
929
930
931 \subsection{La funzione \texttt{accept}}
932 \label{sec:TCPel_func_accept}
933
934 La funzione \texttt{accept} è chiamata da un server TCP per gestire la
935 connessione una volta che sia stato completato il three way handshake, la
936 funzione restituisce un nuovo socket descriptor su cui si potrà operare per
937 effettuare la comunicazione. Se non ci sono connessioni completate il processo
938 viene messo in attesa. Il prototipo della funzione è il seguente:
939
940 \begin{prototype}{sys/socket.h}
941 {int listen(int sockfd, struct sockaddr *addr, socklen\_t *addrlen)} 
942   La funzione estrae la prima connessione relativa al socket \texttt{sockfd}
943   in attesa sulla coda delle connessioni complete, che associa ad nuovo socket
944   con le stesse caratteristiche di \texttt{sockfd} (restituito dalla funzione
945   stessa).  Il socket originale non viene toccato. Nella struttura
946   \texttt{addr} e nella variabile \texttt{addrlen} vengono restituiti
947   indirizzo e relativa lunghezza del client che si è connesso.
948  
949   La funzione restituisce un numero di socket descriptor positivo in caso di
950   successo e -1 in caso di errore, nel qual caso la variabile \texttt{errno}
951   viene settata ai seguenti valori:
952
953   \begin{errlist}
954   \item \texttt{EBADF} l'argomento \texttt{sockfd} non è un file descriptor
955     valido.
956   \item \texttt{ENOTSOCK} l'argomento \texttt{sockfd} non è un socket.
957   \item \texttt{EOPNOTSUPP} il socket è di un tipo che non supporta questa
958     operazione.    
959   \item \texttt{EAGAIN} o \item \texttt{EWOULDBLOCK} il socket è stato
960     settato come non bloccante, e non ci sono connessioni in attesa di essere
961     accettate.              
962   \item \texttt{EFAULT} l'argomento \texttt{addr} .
963   \item \texttt{EPERM} Firewall rules forbid connection.
964     
965   \item \texttt{ENOBUFS, ENOMEM} Not enough free memory.  This often means
966     that the memory allocation is limited by the socket buffer limits, not by
967     the system memory.
968  
969     Inoltre possono essere restituiti gli errori di rete relativi al nuovo
970     socket come: \texttt{EMFILE}, \texttt{EINVAL}, \texttt{ENOSR},
971     \texttt{ENOBUFS}, \texttt{EPERM}, \texttt{ECONNABORTED},
972     \texttt{ESOCKTNOSUPPORT}, \texttt{EPROTONOSUPPORT}, \texttt{ETIMEDOUT},
973     \texttt{ERESTARTSYS}.
974
975   \end{errlist}
976 \end{prototype}
977
978 La funzione può essere usata solo con socket che supportino la connessione
979 (cioè di tipo \texttt{SOCK\_STREAM}, \texttt{SOCK\_SEQPACKET} o
980 \texttt{SOCK\_RDM}). Per alcuni protocolli che richiedono una conferma
981 esplicita della connessione, (attualmente in Linux solo DECnet ha questo
982 comportamento), la funzione opera solo l'estrazione dalla coda delle
983 connessioni, la conferma della connessione viene fatta implicitamente dalla
984 prima chiamata ad una \texttt{read} o una \texttt{write} mentre il rifiuto
985 della connessione viene fatto con la funzione \texttt{close}.
986
987 È da chiarire che Linux presenta un comportamento diverso nella gestione degli
988 errori rispetto ad altre implementazioni dei socket BSD, infatti la funzione
989 \texttt{accept} passa gli errori di rete pendenti sul nuovo socket come codici
990 di errore per \texttt{accept}. Inoltre la funzione non fa ereditare ai nuovi
991 socket flag come \texttt{O\_NONBLOCK}, che devono essere rispecificati volta
992 volta, questo è un comportamento diverso rispetto a quanto accade con BSD e
993 deve essere tenuto in conto per scrivere programmi portabili.
994
995 I due argomenti \texttt{cliaddr} e \texttt{addrlen} (si noti che quest'ultimo
996 è passato per indirizzo per avere indietro il valore) sono usati per ottenere
997 l'indirizzo del client da cui proviene la connessione. Prima della chiamata
998 \texttt{addrlen} deve essere inizializzato alle dimensioni della struttura il
999 cui indirizzo è passato come argomento in \texttt{cliaddr}, al ritorno della
1000 funzione \texttt{addrlen} conterrà il numero di bytes scritti dentro
1001 \texttt{cliaddr}. Se questa informazione non interessa basterà inizializzare a
1002 \texttt{NULL} detti puntatori.
1003
1004 Se la funzione ha successo restituisce il descrittore di un nuovo socket
1005 creato dal kernel (detto \textit{connected socket}) a cui viene associata la
1006 prima connessione completa (estratta dalla relativa coda, vedi
1007 \secref{sec:TCPel_func_listen}) che il client TCP ha effettuato verso il
1008 socket \texttt{sockfd}. Quest'ultimo (detto \textit{listening socket}) è
1009 quello creato all'inizio e messo in ascolto con \texttt{listen}, e non viene
1010 toccato dalla funzione.  
1011 Se non ci sono connessioni pendenti da accettare la funzione mette in attesa
1012 il processo\footnote{a meno che non si sia settato il socket per essere
1013   non-bloccante, nel qual caso ritorna con l'errore \texttt{EAGAIN},
1014   torneremo su questa modalità di operazione in \secref{sec:xxx_sock_noblock}}
1015 fintanto che non ne arriva una.
1016  
1017 Il meccanismo di funzionamento di \texttt{accept} è essenziale per capire il
1018 funzionamento di un server: in generale infatti c'è sempre un solo socket in
1019 ascolto, che resta per tutto il tempo nello stato \texttt{LISTEN}, mentre le
1020 connessioni vengono gestite dai nuovi socket ritornati da \texttt{accept} che
1021 si trovano automaticamente nello stato \texttt{ESTABLISHED} e utilizzati fino
1022 alla chiusura della connessione che avviene su di essi.  Si può riconoscere
1023 questo schema anche nell'esempio elementare in \figref{fig:net_serv_code} dove
1024 per ogni connessione il socket creato da \texttt{accept} viene chiuso dopo
1025 l'invio dei dati.
1026
1027
1028 \subsection{La funzione \texttt{close}}
1029 \label{sec:TCPel_func_close}
1030
1031 La funzione standard unix \texttt{close} (vedi \secref{sec:file_close}) che si
1032 usa sui file può essere usata con lo stesso effetto anche sui socket
1033 descriptor.
1034
1035 L'azione standard di questa funzione quando applicata a socket è di marcarlo
1036 come chiuso e ritornare immediatamente al processo. Una volta chiamata il
1037 socket descriptor non è più utilizzabile dal processo e non può essere usato
1038 come argomento per una \texttt{write} o una \texttt{read} (anche se l'altro
1039 capo della connessione non avesse chiuso la sua parte).  Il kernel invierà
1040 comunque tutti i dati che ha in coda prima di iniziare la sequenza di chiusura.
1041
1042 Vedremo più avanti in \secref{sec:TCPadv_so_linger} come è possibile cambiare
1043 questo comportamento, e cosa deve essere fatto perché il processo possa
1044 assicurarsi che l'altro capo abbia ricevuto tutti i dati.
1045
1046 Come per i file anche per i socket descriptor viene mantenuto un numero di
1047 riferimenti, per cui se più di un processo ha lo stesso socket aperto
1048 l'emissione del FIN e la sequenza di chiusura di TCP non viene innescata
1049 fintanto che il numero di riferimenti non si annulla. Questo è il
1050 comportamento normale che ci si aspetta in un'applicazione client/server quale
1051 quella che illustreremo in \secref{sec:TCPel_cunc_serv}.
1052
1053 Per attivare immediatamente l'emissione del FIN e la sequenza di chiusura si
1054 può usare la funzione \texttt{shutdown} su cui torneremo in seguito. 
1055
1056
1057 \section{I server concorrenti su TCP}
1058 \label{sec:TCPel_cunc_serv}
1059
1060 Il server \texttt{daytime} dell'esempio in \secref{sec:net_cli_sample} è un
1061 tipico esempio di server iterativo, in cui viene servita una richiesta alla
1062 volta; in generale però, specie se il servizio è più complesso e comporta uno
1063 scambio di dati più sostanzioso di quello in questione, non è opportuno
1064 bloccare un server nel servizio di un client per volta; per questo si ricorre
1065 alle capacità di multitasking del sistema.
1066
1067 Il modo più immediato per creare un server concorrente è allora quello di
1068 usare la funzione \texttt{fork} per far creare al server per ogni richiesta da
1069 parte di un client un processo figlio che si incarichi della gestione della
1070 comunicazione.
1071
1072
1073 \subsection{Un esempio di server \textit{daytime} concorrente}
1074 \label{sec:TCPel_cunc_daytime}
1075
1076 Per illustrare il meccanismo usato in generale per creare un server
1077 concorrente abbiamo riscritto il server \texttt{daytime} dell'esempio
1078 precedente in forma concorrente, inserendo anche una opzione per la stampa
1079 degli indirizzi delle connessioni ricevute.
1080
1081 In \nfig\ è mostrato un estratto del codice, in cui si sono tralasciati il
1082 trattamento delle opzioni e le parti rimaste invariate rispetto al precedente
1083 esempio. Al solito il sorgente completo del server
1084 \texttt{ElemDaytimeTCPCuncServ.c} è allegato nella directory dei sorgenti.
1085
1086 \begin{figure}[!htb]
1087   \footnotesize
1088   \begin{lstlisting}{}
1089 #include <sys/types.h>   /* predefined types */
1090 #include <unistd.h>      /* include unix standard library */
1091 #include <arpa/inet.h>   /* IP addresses conversion utiliites */
1092 #include <sys/socket.h>  /* socket library */
1093 #include <stdio.h>       /* include standard I/O library */
1094 #include <time.h>
1095
1096 int main(int argc, char *argv[])
1097 {
1098     int list_fd, conn_fd;
1099     int i;
1100     struct sockaddr_in serv_add, client;
1101     char buffer[MAXLINE];
1102     socklen_t len;
1103     time_t timeval;
1104     pid_t pid;
1105     int logging=0;
1106      ...
1107     /* write daytime to client */
1108     while (1) {
1109         if ( (conn_fd = accept(list_fd, (struct sockaddr *)&client, &len)) 
1110              <0 ) {
1111             perror("accept error");
1112             exit(-1);
1113         }
1114         /* fork to handle connection */
1115         if ( (pid = fork()) < 0 ){
1116             perror("fork error");
1117             exit(-1);
1118         }
1119         if (pid == 0) {                 /* child */
1120             close(list_fd);
1121             timeval = time(NULL);
1122             snprintf(buffer, sizeof(buffer), "%.24s\r\n", ctime(&timeval));
1123             if ( (write(conn_fd, buffer, strlen(buffer))) < 0 ) {
1124                 perror("write error");
1125                 exit(-1);
1126             }
1127             if (logging) {
1128                 inet_ntop(AF_INET, &client.sin_addr, buffer, sizeof(buffer));
1129                 printf("Request from host %s, port %d\n", buffer,
1130                        ntohs(client.sin_port));
1131             }
1132             close(conn_fd);
1133             exit(0);
1134         } else {                        /* parent */
1135             close(conn_fd);
1136         }
1137     }
1138     /* normal exit, never reached */
1139     exit(0);
1140 }
1141   \end{lstlisting}
1142   \caption{Esempio di codice di un server concorrente elementare per il 
1143     servizio daytime.}
1144   \label{fig:TCPel_serv_code}
1145 \end{figure}
1146
1147 Come si può vedere (alle linee \texttt{\small 21--25}) la funzione
1148 \texttt{accept} stavolta è chiamata fornendo una struttura di indirizzi in cui
1149 saranno ritornati numero IP e porta da cui il client effettua la connessione,
1150 che stamperemo, se avremo abilitato il logging, sullo standard output
1151 (\texttt{\small 39--43}). 
1152
1153 Quando \texttt{accept} ritorna il server chiama la funzione \texttt{fork}
1154 (\texttt{\small 26--30}) per creare il processo figlio che effettuerà tutte le
1155 operazioni relative a quella connessione (\texttt{\small 31--45}), mentre il
1156 padre resterà in attesa di ulteriori connessioni. 
1157
1158 Si noti come il figlio operi solo sul socket connesso, chiudendo
1159 immediatamente il socket \texttt{list\_fd}; mentre il padre continua ad
1160 operare solo sul socket in ascolto chiudendo \texttt{sock\_fd} dopo ciascuna
1161 \texttt{accept}. Per quanto abbiamo detto in \secref{sec:TCPel_func_close}
1162 queste due chiusure non causano l'innesco della sequenza di chiusura perché il
1163 numero di riferimenti non si è annullato.
1164
1165 Infatti subito dopo la creazione del socket \texttt{list\_fd} ha una
1166 referenza, e lo stesso vale per \texttt{sock\_fd} dopo il ritorno di
1167 \texttt{accept}, ma dopo la fork i descrittori vengono duplicati nel padre e
1168 nel figlio per cui entrambi i socket si trovano con due referenze. Questo fa
1169 si che quando il padre chiude \texttt{sock\_fd} esso resta con una referenza
1170 da parte del figlio, e sarà definitivamente chiuso solo quando quest'ultimo,
1171 dopo aver completato le sue operazioni, chiamerà la funzione \texttt{close}.
1172
1173 In realtà per il figlio non sarebbero necessarie nessuna delle due chiamate a
1174 \texttt{close} in quanto nella \texttt{exit} tutti i file ed i socket vengono
1175 chiusi, ma si è preferito effettuare la chiusura esplicitamente per avere una
1176 maggiore chiarezza del codice ed evitare possibili errori.
1177
1178 Si noti come sia essenziale che il padre chiuda ogni volta il socket connesso
1179 dopo la \texttt{accept}; se così non fosse nessuno di questi socket sarebbe
1180 effettivamente chiuso dato che alla chiusura da parte del figlio resterebbe
1181 ancora un riferimento. Si avrebbero così due effetti, il padre potrebbe
1182 esaurire i descrittori disponibili (che sono un numero limitato per ogni
1183 processo) e soprattutto nessuna delle connessioni con i client verrebbe
1184 chiusa.
1185
1186
1187 \subsection{Le funzioni \texttt{getsockname} e \texttt{getpeername}}
1188 \label{sec:TCPel_get_names}
1189
1190 Queste due funzioni vengono usate per ottenere la socket pair associata ad un
1191 certo socket; la prima restituisce l'indirizzo locale, la seconda quello
1192 remoto. 
1193
1194 \begin{prototype}{sys/socket.h}
1195 {int getsockname(int sockfd, struct sockaddr * name, socklen\_t * namelen)}
1196
1197   La funzione restituisce 0 in caso di successo e -1 in caso di errore. I
1198   codici di errore restituiti in \texttt{errno} sono i seguenti:
1199   \begin{errlist}
1200   \item \texttt{EBADF} l'argomento \texttt{sockfd} non è un file descriptor
1201     valido.
1202   \item \texttt{ENOTSOCK} l'argomento \texttt{sockfd} non è un socket.
1203   \item \texttt{ENOBUFS} non ci sono risorse sufficienti nel sistema per
1204     eseguire l'operazione.
1205   \item \texttt{EFAULT} l'argomento \texttt{name} punta al di fuori dello
1206     spazio di indirizzi del processo.
1207   \end{errlist}
1208 \end{prototype}
1209
1210 La funzione \texttt{getsockname} si usa tutte le volte che si vuole avere
1211 l'indirizzo locale di un socket; ad esempio può essere usata da un client (che
1212 usualmente non chiama \texttt{bind}) per ottenere numero IP e porta locale
1213 associati al socket restituito da una \texttt{connect}, o da un server che ha
1214 chiamato \texttt{bind} su un socket usando 0 come porta locale per ottenere il
1215 numero di porta effimera assegnato dal kernel. 
1216
1217 Inoltre quando un server esegue una \texttt{bind} su un indirizzo generico, se
1218 chiamata dopo il completamento di una connessione sul socket restituito da
1219 \texttt{accept}, restituisce l'indirizzo locale che il kernel ha assegnato a
1220 quella connessione.
1221
1222
1223 \begin{prototype}{sys/socket.h}
1224 {int getpeername(int sockfd, struct sockaddr * name, socklen\_t * namelen)}
1225
1226   La funzione restituisce 0 in caso di successo e -1 in caso di errore. I
1227   codici di errore restituiti in \texttt{errno} sono i seguenti:
1228   \begin{errlist}
1229   \item \texttt{EBADF} l'argomento \texttt{sockfd} non è un file descriptor
1230     valido.
1231   \item \texttt{ENOTSOCK} l'argomento \texttt{sockfd} non è un socket.
1232   \item \texttt{ENOTCONN} il socket non è connesso.
1233   \item \texttt{ENOBUFS} non ci sono risorse sufficienti nel sistema per
1234     eseguire l'operazione.
1235   \item \texttt{EFAULT} l'argomento \texttt{name} punta al di fuori dello
1236     spazio di indirizzi del processo.
1237   \end{errlist}
1238 \end{prototype}
1239
1240
1241 La funzione \texttt{getpeername} si usa tutte le volte che si vuole avere
1242 l'indirizzo remoto di un socket. 
1243
1244 Ci si può chiedere a cosa serva questa funzione dato che dal lato client
1245 l'indirizzo remoto è sempre noto quando si esegue la \texttt{connect} mentre
1246 dal lato server si possono usare, come si è fatto nell'esempio precedente, i
1247 valori di ritorno di \texttt{accept}.
1248
1249 In generale però questa ultima possibilità è sempre possibile. In particolare
1250 questo avviene quando il server invece di far gestire la connessione
1251 direttamente a un processo figlio, come nell'esempio precedente, lancia un
1252 opportuno programma per ciascuna connessione usando \texttt{exec} (questa ad
1253 esempio è la modailità con cui opera il \textsl{super-server} \texttt{inetd}
1254 che gestisce tutta una serie di servizi lanciando per ogni connessione
1255 l'opportuno server).
1256
1257 In questo caso benché il processo figlio abbia una immagine della memoria che
1258 è copia di quella del processo padre (e contiene quindi anche la struttura
1259 ritornata da \texttt{accept}), all'esecuzione di \texttt{exec} viene caricata
1260 in memoria l'immagine del programma eseguito che a questo punto perde ogni
1261 riferimento. Il socket descriptor però resta aperto. Allora se una opportuna
1262 convenzione è seguita per rendere noto al programma eseguito qual'è il socket
1263 connesso (\texttt{inetd} ad esempio fa sempre in modo che i file descriptor 0,
1264 1 e 2 corrispondano al socket connesso) quest'ultimo potrà usare la funzione
1265 \texttt{getpeername} per determinare l'indirizzo remoto del client.
1266
1267 Infine è da chiarire (si legga la man page) che come per \texttt{accept} il
1268 terzo parametro che è specificato dallo standard POSIX 1003.1g come di tipo
1269 \texttt{socklen\_t *} in realtà deve sempre corrispondere ad un \texttt{int *}
1270 come prima dello standard perché tutte le implementazioni dei socket BSD fanno
1271 questa assunzione.
1272