3 %% Copyright (C) 2000-2006 Simone Piccardi. Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
11 \chapter{I socket TCP}
12 \label{cha:TCP_socket}
14 In questo capitolo tratteremo le basi dei socket TCP, iniziando con una
15 descrizione delle principali caratteristiche del funzionamento di una
16 connessione TCP; vedremo poi le varie funzioni che servono alla creazione di
17 una connessione fra client e server, fornendo alcuni esempi elementari, e
18 finiremo prendendo in esame l'uso dell'I/O multiplexing.
21 \section{Il funzionamento di una connessione TCP}
22 \label{sec:TCP_connession}
24 Prima di entrare nei dettagli delle singole funzioni usate nelle applicazioni
25 che utilizzano i socket TCP, è fondamentale spiegare alcune delle basi del
26 funzionamento del protocollo, poiché questa conoscenza è essenziale per
27 comprendere il comportamento di dette funzioni per questo tipo di socket, ed
28 il relativo modello di programmazione.
30 Si ricordi che il protocollo TCP serve a creare degli \textit{stream socket},
31 cioè una forma di canale di comunicazione che stabilisce una connessione
32 stabile fra due stazioni, in modo che queste possano scambiarsi dei dati. In
33 questa sezione ci concentreremo sulle modalità con le quali il protocollo dà
34 inizio e conclude una connessione e faremo inoltre un breve accenno al
35 significato di alcuni dei vari \textsl{stati} ad essa associati.
38 \subsection{La creazione della connessione: il \textit{three way handshake}}
39 \label{sec:TCP_conn_cre}
41 \itindbeg{three~way~handshake}
42 Il processo che porta a creare una connessione TCP è chiamato \textit{three
43 way handshake}; la successione tipica degli eventi (e dei
44 \textsl{segmenti}\footnote{Si ricordi che il segmento è l'unità elementare di
45 dati trasmessa dal protocollo TCP al livello successivo; tutti i segmenti
46 hanno un header che contiene le informazioni che servono allo \textit{stack
47 TCP} (così viene di solito chiamata la parte del kernel che implementa il
48 protocollo) per realizzare la comunicazione, fra questi dati ci sono una
49 serie di flag usati per gestire la connessione, come SYN, ACK, URG, FIN,
50 alcuni di essi, come SYN (che sta per \textit{syncronize}) corrispondono a
51 funzioni particolari del protocollo e danno il nome al segmento, (per
52 maggiori dettagli vedere sez.~\ref{sec:tcp_protocol}).} di dati che vengono
53 scambiati) che porta alla creazione di una connessione è la seguente:
56 \item Il server deve essere preparato per accettare le connessioni in arrivo;
57 il procedimento si chiama \textsl{apertura passiva} del socket (in inglese
58 \textit{passive open}). Questo viene fatto chiamando la sequenza di funzioni
59 \func{socket}, \func{bind} e \func{listen}. Completata l'apertura passiva il
60 server chiama la funzione \func{accept} e il processo si blocca in attesa di
63 \item Il client richiede l'inizio della connessione usando la funzione
64 \func{connect}, attraverso un procedimento che viene chiamato
65 \textsl{apertura attiva}, dall'inglese \textit{active open}. La chiamata di
66 \func{connect} blocca il processo e causa l'invio da parte del client di un
67 segmento SYN, in sostanza viene inviato al server un pacchetto IP che
68 contiene solo gli header IP e TCP (con il numero di sequenza iniziale e il
69 flag SYN) e le opzioni di TCP.
71 \item il server deve dare ricevuto (l'\textit{acknowledge}) del SYN del
72 client, inoltre anche il server deve inviare il suo SYN al client (e
73 trasmettere il suo numero di sequenza iniziale) questo viene fatto
74 ritrasmettendo un singolo segmento in cui sono impostati entrambi i flag SYN
77 \item una volta che il client ha ricevuto l'acknowledge dal server la funzione
78 \func{connect} ritorna, l'ultimo passo è dare il ricevuto del SYN del
79 server inviando un ACK. Alla ricezione di quest'ultimo la funzione
80 \func{accept} del server ritorna e la connessione è stabilita.
83 Il procedimento viene chiamato \textit{three way handshake} dato che per
84 realizzarlo devono essere scambiati tre segmenti. In fig.~\ref{fig:TCP_TWH}
85 si è rappresentata graficamente la sequenza di scambio dei segmenti che
86 stabilisce la connessione.
88 % Una analogia citata da R. Stevens per la connessione TCP è quella con il
89 % sistema del telefono. La funzione \func{socket} può essere considerata
90 % l'equivalente di avere un telefono. La funzione \func{bind} è analoga al
91 % dire alle altre persone qual è il proprio numero di telefono perché possano
92 % chiamare. La funzione \func{listen} è accendere il campanello del telefono
93 % per sentire le chiamate in arrivo. La funzione \func{connect} richiede di
94 % conoscere il numero di chi si vuole chiamare. La funzione \func{accept} è
95 % quando si risponde al telefono.
99 \includegraphics[width=10cm]{img/three_way_handshake}
100 \caption{Il \textit{three way handshake} del TCP.}
104 Si è accennato in precedenza ai \textsl{numeri di sequenza} (che sono anche
105 riportati in fig.~\ref{fig:TCP_TWH}): per gestire una connessione affidabile
106 infatti il protocollo TCP prevede nell'header la presenza di un numero a 32
107 bit (chiamato appunto \textit{sequence number}) che identifica a quale byte
108 nella sequenza del flusso corrisponde il primo byte della sezione dati
109 contenuta nel segmento.
111 Il numero di sequenza di ciascun segmento viene calcolato a partire da un
112 \textsl{numero di sequenza iniziale} generato in maniera casuale del kernel
113 all'inizio della connessione e trasmesso con il SYN; l'acknowledgement di
114 ciascun segmento viene effettuato dall'altro capo della connessione impostando
115 il flag ACK e restituendo nell'apposito campo dell'header un
116 \textit{acknowledge number}) pari al numero di sequenza che il ricevente si
117 aspetta di ricevere con il pacchetto successivo; dato che il primo pacchetto
118 SYN consuma un byte, nel \textit{three way handshake} il numero di acknowledge
119 è sempre pari al numero di sequenza iniziale incrementato di uno; lo stesso
120 varrà anche (vedi fig.~\ref{fig:TCP_close}) per l'acknowledgement di un FIN.
122 \itindend{three~way~handshake}
125 \subsection{Le opzioni TCP.}
126 \label{sec:TCP_TCP_opt}
128 Ciascun segmento SYN contiene in genere delle opzioni per il protocollo TCP
129 (le cosiddette \textit{TCP options}, che vengono inserite fra l'header e i
130 dati) che servono a comunicare all'altro capo una serie di parametri utili a
131 regolare la connessione. Normalmente vengono usate le seguenti opzioni:
134 \item \textit{MSS option}, dove MMS sta per \textit{maximum segment size}, con
135 questa opzione ciascun capo della connessione annuncia all'altro il massimo
136 ammontare di dati che vorrebbe accettare per ciascun segmento nella
137 connessione corrente. È possibile leggere e scrivere questo valore
138 attraverso l'opzione del socket \const{TCP\_MAXSEG}.
140 \item \textit{window scale
141 option}, %come spiegato in sez.~\ref{sec:tcp_protocol}
142 il protocollo TCP implementa il controllo di flusso attraverso una
143 \textsl{finestra annunciata} (\textit{advertized window}) con la quale
144 ciascun capo della comunicazione dichiara quanto spazio disponibile ha in
145 memoria per i dati. Questo è un numero a 16 bit dell'header, che così può
146 indicare un massimo di 65535 byte;\footnote{ Linux usa come massimo 32767
147 per evitare problemi con alcune implementazioni che usano l'aritmetica con
148 segno per implementare lo stack TCP.} ma alcuni tipi di connessione come
149 quelle ad alta velocità (sopra i 45Mbit/sec) e quelle che hanno grandi
150 ritardi nel cammino dei pacchetti (come i satelliti) richiedono una finestra
151 più grande per poter ottenere il massimo dalla trasmissione, per questo
152 esiste questa opzione che indica un fattore di scala da applicare al valore
153 della finestra annunciata\footnote{essendo una nuova opzione per garantire
154 la compatibilità con delle vecchie implementazioni del protocollo la
155 procedura che la attiva prevede come negoziazione che l'altro capo della
156 connessione riconosca esplicitamente l'opzione inserendola anche lui nel
157 suo SYN di risposta dell'apertura della connessione.} per la connessione
158 corrente (espresso come numero di bit cui spostare a sinistra il valore
159 della finestra annunciata inserito nel pacchetto).
161 \item \textit{timestamp option}, è anche questa una nuova opzione necessaria
162 per le connessioni ad alta velocità per evitare possibili corruzioni di dati
163 dovute a pacchetti perduti che riappaiono; anche questa viene negoziata come
168 La MSS è generalmente supportata da quasi tutte le implementazioni del
169 protocollo, le ultime due opzioni (trattate
170 nell'\href{http://www.ietf.org/rfc/rfc1323.txt}{RFC~1323}) sono meno comuni;
171 vengono anche dette \textit{long fat pipe options} dato che questo è il nome
172 che viene dato alle connessioni caratterizzate da alta velocità o da ritardi
173 elevati. In ogni caso Linux supporta pienamente entrambe le opzioni.
175 \subsection{La terminazione della connessione}
176 \label{sec:TCP_conn_term}
178 Mentre per la creazione di una connessione occorre un interscambio di tre
179 segmenti, la procedura di chiusura ne richiede normalmente quattro. In questo
180 caso la successione degli eventi è la seguente:
183 \item Un processo ad uno dei due capi chiama la funzione \func{close}, dando
184 l'avvio a quella che viene chiamata \textsl{chiusura attiva} (o
185 \textit{active close}). Questo comporta l'emissione di un segmento FIN, che
186 serve ad indicare che si è finito con l'invio dei dati sulla connessione.
188 \item L'altro capo della connessione riceve il FIN e dovrà eseguire la
189 \textsl{chiusura passiva} (o \textit{passive close}). Al FIN, come ad ogni
190 altro pacchetto, viene risposto con un ACK, inoltre il ricevimento del FIN
191 viene segnalato al processo che ha aperto il socket (dopo che ogni altro
192 eventuale dato rimasto in coda è stato ricevuto) come un end-of-file sulla
193 lettura: questo perché il ricevimento di un FIN significa che non si
194 riceveranno altri dati sulla connessione.
196 \item Una volta rilevata l'end-of-file anche il secondo processo chiamerà la
197 funzione \func{close} sul proprio socket, causando l'emissione di un altro
200 \item L'altro capo della connessione riceverà il FIN conclusivo e risponderà
204 Dato che in questo caso sono richiesti un FIN ed un ACK per ciascuna direzione
205 normalmente i segmenti scambiati sono quattro. Questo non è vero sempre
206 giacché in alcune situazioni il FIN del passo 1) è inviato insieme a dei dati.
207 Inoltre è possibile che i segmenti inviati nei passi 2 e 3 dal capo che
208 effettua la chiusura passiva, siano accorpati in un singolo segmento. In
209 fig.~\ref{fig:TCP_close} si è rappresentato graficamente lo sequenza di
210 scambio dei segmenti che conclude la connessione.
214 \includegraphics[width=10cm]{img/tcp_close}
215 \caption{La chiusura di una connessione TCP.}
216 \label{fig:TCP_close}
219 Come per il SYN anche il FIN occupa un byte nel numero di sequenza, per cui
220 l'ACK riporterà un \textit{acknowledge number} incrementato di uno.
222 Si noti che, nella sequenza di chiusura, fra i passi 2 e 3, è in teoria
223 possibile che si mantenga un flusso di dati dal capo della connessione che
224 deve ancora eseguire la chiusura passiva a quello che sta eseguendo la
225 chiusura attiva. Nella sequenza indicata i dati verrebbero persi, dato che si
226 è chiuso il socket dal lato che esegue la chiusura attiva; esistono tuttavia
227 situazioni in cui si vuole poter sfruttare questa possibilità, usando una
228 procedura che è chiamata \textit{half-close}; torneremo su questo aspetto e su
229 come utilizzarlo in sez.~\ref{sec:TCP_shutdown}, quando parleremo della
230 funzione \func{shutdown}.
232 La emissione del FIN avviene quando il socket viene chiuso, questo però non
233 avviene solo per la chiamata esplicita della funzione \func{close}, ma anche
234 alla terminazione di un processo, quando tutti i file vengono chiusi. Questo
235 comporta ad esempio che se un processo viene terminato da un segnale tutte le
236 connessioni aperte verranno chiuse.
238 Infine occorre sottolineare che, benché nella figura (e nell'esempio che
239 vedremo più avanti in sez.~\ref{sec:TCP_echo}) sia stato il client ad eseguire
240 la chiusura attiva, nella realtà questa può essere eseguita da uno qualunque
241 dei due capi della comunicazione (come nell'esempio di
242 fig.~\ref{fig:TCP_daytime_iter_server_code}), e anche se il caso più comune
243 resta quello del client, ci sono alcuni servizi, il principale dei quali è
244 l'HTTP, per i quali è il server ad effettuare la chiusura attiva.
247 \subsection{Un esempio di connessione}
248 \label{sec:TCP_conn_dia}
250 Come abbiamo visto le operazioni del TCP nella creazione e conclusione di una
251 connessione sono piuttosto complesse, ed abbiamo esaminato soltanto quelle
252 relative ad un andamento normale. In sez.~\ref{sec:TCP_states} vedremo con
253 maggiori dettagli che una connessione può assumere vari stati, che ne
254 caratterizzano il funzionamento, e che sono quelli che vengono riportati dal
255 comando \cmd{netstat}, per ciascun socket TCP aperto, nel campo
258 Non possiamo affrontare qui una descrizione completa del funzionamento del
259 protocollo; un approfondimento sugli aspetti principali si trova in
260 sez.~\ref{sec:tcp_protocol}, ma per una trattazione completa il miglior
261 riferimento resta \cite{TCPIll1}. Qui ci limiteremo a descrivere brevemente un
262 semplice esempio di connessione e le transizioni che avvengono nei due casi
263 appena citati (creazione e terminazione della connessione).
265 In assenza di connessione lo stato del TCP è \texttt{CLOSED}; quando una
266 applicazione esegue una apertura attiva il TCP emette un SYN e lo stato
267 diventa \texttt{SYN\_SENT}; quando il TCP riceve la risposta del SYN$+$ACK
268 emette un ACK e passa allo stato \texttt{ESTABLISHED}; questo è lo stato
269 finale in cui avviene la gran parte del trasferimento dei dati.
271 Dal lato server in genere invece il passaggio che si opera con l'apertura
272 passiva è quello di portare il socket dallo stato \texttt{CLOSED} allo
273 stato \texttt{LISTEN} in cui vengono accettate le connessioni.
275 Dallo stato \texttt{ESTABLISHED} si può uscire in due modi; se un'applicazione
276 chiama la funzione \func{close} prima di aver ricevuto un
277 \textit{end-of-file} (chiusura attiva) la transizione è verso lo stato
278 \texttt{FIN\_WAIT\_1}; se invece l'applicazione riceve un FIN nello stato
279 \texttt{ESTABLISHED} (chiusura passiva) la transizione è verso lo stato
280 \texttt{CLOSE\_WAIT}.
282 In fig.~\ref{fig:TCP_conn_example} è riportato lo schema dello scambio dei
283 pacchetti che avviene per una un esempio di connessione, insieme ai vari stati
284 che il protocollo viene ad assumere per i due lati, server e client.
288 \includegraphics[width=9cm]{img/tcp_connection}
289 \caption{Schema dello scambio di pacchetti per un esempio di connessione.}
290 \label{fig:TCP_conn_example}
293 La connessione viene iniziata dal client che annuncia un MSS di 1460, un
294 valore tipico con Linux per IPv4 su Ethernet, il server risponde con lo stesso
295 valore (ma potrebbe essere anche un valore diverso).
297 Una volta che la connessione è stabilita il client scrive al server una
298 richiesta (che assumiamo stare in un singolo segmento, cioè essere minore dei
299 1460 byte annunciati dal server), quest'ultimo riceve la richiesta e
300 restituisce una risposta (che di nuovo supponiamo stare in un singolo
301 segmento). Si noti che l'acknowledge della richiesta è mandato insieme alla
302 risposta: questo viene chiamato \textit{piggybacking} ed avviene tutte le
303 volte che il server è sufficientemente veloce a costruire la risposta; in
304 caso contrario si avrebbe prima l'emissione di un ACK e poi l'invio della
307 Infine si ha lo scambio dei quattro segmenti che terminano la connessione
308 secondo quanto visto in sez.~\ref{sec:TCP_conn_term}; si noti che il capo della
309 connessione che esegue la chiusura attiva entra nello stato
310 \texttt{TIME\_WAIT}, sul cui significato torneremo fra poco.
312 È da notare come per effettuare uno scambio di due pacchetti (uno di richiesta
313 e uno di risposta) il TCP necessiti di ulteriori otto segmenti, se invece si
314 fosse usato UDP sarebbero stati sufficienti due soli pacchetti. Questo è il
315 costo che occorre pagare per avere l'affidabilità garantita dal TCP, se si
316 fosse usato UDP si sarebbe dovuto trasferire la gestione di tutta una serie di
317 dettagli (come la verifica della ricezione dei pacchetti) dal livello del
318 trasporto all'interno dell'applicazione.
320 Quello che è bene sempre tenere presente è allora quali sono le esigenze che
321 si hanno in una applicazione di rete, perché non è detto che TCP sia la
322 miglior scelta in tutti i casi (ad esempio se si devono solo scambiare dati
323 già organizzati in piccoli pacchetti l'overhead aggiunto può essere eccessivo)
324 per questo esistono applicazioni che usano UDP e lo fanno perché nel caso
325 specifico le sue caratteristiche di velocità e compattezza nello scambio dei
326 dati rispondono meglio alle esigenze che devono essere affrontate.
328 \subsection{Lo stato \texttt{TIME\_WAIT}}
329 \label{sec:TCP_time_wait}
331 Come riportato da Stevens in \cite{UNP1} lo stato \texttt{TIME\_WAIT} è
332 probabilmente uno degli aspetti meno compresi del protocollo TCP, è infatti
333 comune trovare domande su come sia possibile evitare che un'applicazione resti
334 in questo stato lasciando attiva una connessione ormai conclusa; la risposta è
335 che non deve essere fatto, ed il motivo cercheremo di spiegarlo adesso.
337 Come si è visto nell'esempio precedente (vedi fig.~\ref{fig:TCP_conn_example})
338 \texttt{TIME\_WAIT} è lo stato finale in cui il capo di una connessione che
339 esegue la chiusura attiva resta prima di passare alla chiusura definitiva
340 della connessione. Il tempo in cui l'applicazione resta in questo stato deve
341 essere due volte la MSL (\textit{Maximum Segment Lifetime}).
343 La MSL è la stima del massimo periodo di tempo che un pacchetto IP può vivere
344 sulla rete; questo tempo è limitato perché ogni pacchetto IP può essere
345 ritrasmesso dai router un numero massimo di volte (detto \textit{hop limit}).
346 Il numero di ritrasmissioni consentito è indicato dal campo TTL dell'header di
347 IP (per maggiori dettagli vedi sez.~\ref{sec:ip_protocol}), e viene
348 decrementato ad ogni passaggio da un router; quando si annulla il pacchetto
349 viene scartato. Siccome il numero è ad 8 bit il numero massimo di
350 ``\textsl{salti}'' è di 255, pertanto anche se il TTL (da \textit{time to
351 live}) non è propriamente un limite sul tempo di vita, si stima che un
352 pacchetto IP non possa restare nella rete per più di MSL secondi.
354 Ogni implementazione del TCP deve scegliere un valore per la MSL
355 (l'\href{http://www.ietf.org/rfc/rfc1122.txt}{RFC~1122} raccomanda 2 minuti,
356 Linux usa 30 secondi), questo comporta una durata dello stato
357 \texttt{TIME\_WAIT} che a seconda delle implementazioni può variare fra 1 a 4
358 minuti. Lo stato \texttt{TIME\_WAIT} viene utilizzato dal protocollo per due
361 \item implementare in maniera affidabile la terminazione della connessione
362 in entrambe le direzioni.
363 \item consentire l'eliminazione dei segmenti duplicati dalla rete.
366 Il punto è che entrambe le ragioni sono importanti, anche se spesso si fa
367 riferimento solo alla prima; ma è solo se si tiene conto della seconda che si
368 capisce il perché della scelta di un tempo pari al doppio della MSL come
369 durata di questo stato.
371 Il primo dei due motivi precedenti si può capire tornando a
372 fig.~\ref{fig:TCP_conn_example}: assumendo che l'ultimo ACK della sequenza
373 (quello del capo che ha eseguito la chiusura attiva) venga perso, chi esegue
374 la chiusura passiva non ricevendo risposta rimanderà un ulteriore FIN, per
375 questo motivo chi esegue la chiusura attiva deve mantenere lo stato della
376 connessione per essere in grado di rinviare l'ACK e chiuderla correttamente.
377 Se non fosse così la risposta sarebbe un RST (un altro tipo si segmento) che
378 verrebbe interpretato come un errore.
380 Se il TCP deve poter chiudere in maniera pulita entrambe le direzioni della
381 connessione allora deve essere in grado di affrontare la perdita di uno
382 qualunque dei quattro segmenti che costituiscono la chiusura. Per questo
383 motivo un socket deve rimanere attivo nello stato \texttt{TIME\_WAIT} anche
384 dopo l'invio dell'ultimo ACK, per potere essere in grado di gestirne
385 l'eventuale ritrasmissione, in caso esso venga perduto.
387 Il secondo motivo è più complesso da capire, e necessita di una spiegazione
388 degli scenari in cui può accadere che i pacchetti TCP si possano perdere nella
389 rete o restare intrappolati, per poi riemergere in un secondo tempo.
391 Il caso più comune in cui questo avviene è quello di anomalie
392 nell'instradamento; può accadere cioè che un router smetta di funzionare o che
393 una connessione fra due router si interrompa. In questo caso i protocolli di
394 instradamento dei pacchetti possono impiegare diverso tempo (anche dell'ordine
395 dei minuti) prima di trovare e stabilire un percorso alternativo per i
396 pacchetti. Nel frattempo possono accadere casi in cui un router manda i
397 pacchetti verso un altro e quest'ultimo li rispedisce indietro, o li manda ad
398 un terzo router che li rispedisce al primo, si creano cioè dei circoli (i
399 cosiddetti \textit{routing loop}) in cui restano intrappolati i pacchetti.
401 Se uno di questi pacchetti intrappolati è un segmento TCP, chi l'ha inviato,
402 non ricevendo un ACK in risposta, provvederà alla ritrasmissione e se nel
403 frattempo sarà stata stabilita una strada alternativa il pacchetto ritrasmesso
404 giungerà a destinazione.
406 Ma se dopo un po' di tempo (che non supera il limite dell'MSL, dato che
407 altrimenti verrebbe ecceduto il TTL) l'anomalia viene a cessare, il circolo di
408 instradamento viene spezzato i pacchetti intrappolati potranno essere inviati
409 alla destinazione finale, con la conseguenza di avere dei pacchetti duplicati;
410 questo è un caso che il TCP deve essere in grado di gestire.
412 Allora per capire la seconda ragione per l'esistenza dello stato
413 \texttt{TIME\_WAIT} si consideri il caso seguente: si supponga di avere una
414 connessione fra l'IP \texttt{195.110.112.236} porta 1550 e l'IP
415 \texttt{192.84.145.100} porta 22 (affronteremo il significato delle porte
416 nella prossima sezione), che questa venga chiusa e che poco dopo si
417 ristabilisca la stessa connessione fra gli stessi IP sulle stesse porte
418 (quella che viene detta, essendo gli stessi porte e numeri IP, una nuova
419 \textsl{incarnazione} della connessione precedente); in questo caso ci si
420 potrebbe trovare con dei pacchetti duplicati relativi alla precedente
421 connessione che riappaiono nella nuova.
423 Ma fintanto che il socket non è chiuso una nuova incarnazione non può essere
424 creata: per questo un socket TCP resta sempre nello stato \texttt{TIME\_WAIT}
425 per un periodo di 2MSL, in modo da attendere MSL secondi per essere sicuri che
426 tutti i pacchetti duplicati in arrivo siano stati ricevuti (e scartati) o che
427 nel frattempo siano stati eliminati dalla rete, e altri MSL secondi per essere
428 sicuri che lo stesso avvenga per le risposte nella direzione opposta.
430 In questo modo, prima che venga creata una nuova connessione, il protocollo
431 TCP si assicura che tutti gli eventuali segmenti residui di una precedente
432 connessione, che potrebbero causare disturbi, siano stati eliminati dalla
436 \subsection{I numeri di porta}
437 \label{sec:TCP_port_num}
439 In un ambiente multitasking in un dato momento più processi devono poter usare
440 sia UDP che TCP, e ci devono poter essere più connessioni in contemporanea.
441 Per poter tenere distinte le diverse connessioni entrambi i protocolli usano i
442 \textsl{numeri di porta}, che fanno parte, come si può vedere in
443 sez.~\ref{sec:sock_sa_ipv4} e sez.~\ref{sec:sock_sa_ipv6} pure delle strutture
444 degli indirizzi del socket.
446 Quando un client contatta un server deve poter identificare con quale dei vari
447 possibili server attivi intende parlare. Sia TCP che UDP definiscono un gruppo
448 di \textsl{porte conosciute} (le cosiddette \textit{well-known port}) che
449 identificano una serie di servizi noti (ad esempio la porta 22 identifica il
450 servizio SSH) effettuati da appositi server che rispondono alle connessioni
453 D'altra parte un client non ha necessità di usare un numero di porta
454 specifico, per cui in genere vengono usate le cosiddette \textsl{porte
455 effimere} (o \textit{ephemeral ports}) cioè porte a cui non è assegnato
456 nessun servizio noto e che vengono assegnate automaticamente dal kernel alla
457 creazione della connessione. Queste sono dette effimere in quanto vengono
458 usate solo per la durata della connessione, e l'unico requisito che deve
459 essere soddisfatto è che ognuna di esse sia assegnata in maniera univoca.
461 La lista delle porte conosciute è definita
462 dall'\href{http://www.ietf.org/rfc/rfc1700.txt}{RFC~1700} che contiene
463 l'elenco delle porte assegnate dalla IANA (la \textit{Internet Assigned Number
464 Authority}) ma l'elenco viene costantemente aggiornato e pubblicato su
465 internet (una versione aggiornata si può trovare all'indirizzo
466 \href{ftp://ftp.isi.edu/in-notes/iana/assignements/port-number}
467 {\texttt{ftp://ftp.isi.edu/in-notes/iana/assignements/port-numbers}}); inoltre
468 in un sistema unix-like un analogo elenco viene mantenuto nel file
469 \file{/etc/services}, con la corrispondenza fra i vari numeri di porta ed il
470 nome simbolico del servizio. I numeri sono divisi in tre intervalli:
473 \item \textsl{le porte note}. I numeri da 0 a 1023. Queste sono controllate e
474 assegnate dalla IANA. Se è possibile la stessa porta è assegnata allo stesso
475 servizio sia su UDP che su TCP (ad esempio la porta 22 è assegnata a SSH su
476 entrambi i protocolli, anche se viene usata solo dal TCP).
478 \item \textsl{le porte registrate}. I numeri da 1024 a 49151. Queste porte non
479 sono controllate dalla IANA, che però registra ed elenca chi usa queste
480 porte come servizio agli utenti. Come per le precedenti si assegna una porta
481 ad un servizio sia per TCP che UDP anche se poi il servizio è implementato
482 solo su TCP. Ad esempio X Window usa le porte TCP e UDP dal 6000 al 6063
483 anche se il protocollo è implementato solo tramite TCP.
485 \item \textsl{le porte private} o \textsl{dinamiche}. I numeri da 49152 a
486 65535. La IANA non dice nulla riguardo a queste porte che pertanto
487 sono i candidati naturali ad essere usate come porte effimere.
490 In realtà rispetto a quanto indicato
491 nell'\href{http://www.ietf.org/rfc/rfc1700.txt}{RFC~1700} i vari sistemi hanno
492 fatto scelte diverse per le porte effimere, in particolare in
493 fig.~\ref{fig:TCP_port_alloc} sono riportate quelle di BSD e Linux.
497 \includegraphics[width=13cm]{img/port_alloc}
498 \caption{Allocazione dei numeri di porta.}
499 \label{fig:TCP_port_alloc}
502 I sistemi Unix hanno inoltre il concetto di \textsl{porte riservate} (che
503 corrispondono alle porte con numero minore di 1024 e coincidono quindi con le
504 \textsl{porte note}). La loro caratteristica è che possono essere assegnate a
505 un socket solo da un processo con i privilegi di amministratore, per far sì
506 che solo l'amministratore possa allocare queste porte per far partire i
509 Le \textsl{glibc} definiscono (in \texttt{netinet/in.h})
510 \const{IPPORT\_RESERVED} e \const{IPPORT\_USERRESERVED}, in cui la prima (che
511 vale 1024) indica il limite superiore delle porte riservate, e la seconda (che
512 vale 5000) il limite inferiore delle porte a disposizione degli utenti. La
513 convenzione vorrebbe che le porte \textsl{effimere} siano allocate fra questi
514 due valori. Nel caso di Linux questo è vero solo in uno dei due casi di
515 fig.~\ref{fig:TCP_port_alloc}, e la scelta fra i due possibili intervalli
516 viene fatta dinamicamente dal kernel a seconda della memoria disponibile per
517 la gestione delle relative tabelle.
519 Si tenga conto poi che ci sono alcuni client, in particolare \cmd{rsh} e
520 \cmd{rlogin}, che richiedono una connessione su una porta riservata anche dal
521 lato client come parte dell'autenticazione, contando appunto sul fatto che
522 solo l'amministratore può usare queste porte. Data l'assoluta inconsistenza in
523 termini di sicurezza di un tale metodo, al giorno d'oggi esso è in completo
526 Data una connessione TCP si suole chiamare \textit{socket pair}\footnote{da
527 non confondere con la coppia di socket della omonima funzione
528 \func{socketpair} che fanno riferimento ad una coppia di socket sulla stessa
529 macchina, non ai capi di una connessione TCP.} la combinazione dei quattro
530 numeri che definiscono i due capi della connessione e cioè l'indirizzo IP
531 locale e la porta TCP locale, e l'indirizzo IP remoto e la porta TCP remota.
532 Questa combinazione, che scriveremo usando una notazione del tipo
533 (\texttt{195.110.112.152:22}, \texttt{192.84.146.100:20100}), identifica
534 univocamente una connessione su internet. Questo concetto viene di solito
535 esteso anche a UDP, benché in questo caso non abbia senso parlare di
536 connessione. L'utilizzo del programma \cmd{netstat} permette di visualizzare
537 queste informazioni nei campi \textit{Local Address} e \textit{Foreing
541 \subsection{Le porte ed il modello client/server}
542 \label{sec:TCP_port_cliserv}
544 Per capire meglio l'uso delle porte e come vengono utilizzate quando si ha a
545 che fare con un'applicazione client/server (come quelle che descriveremo in
546 sez.~\ref{sec:TCP_daytime_application} e sez.~\ref{sec:TCP_echo_application})
547 esamineremo cosa accade con le connessioni nel caso di un server TCP che deve
548 gestire connessioni multiple.
550 Se eseguiamo un \cmd{netstat} su una macchina di prova (il cui indirizzo sia
551 \texttt{195.110.112.152}) potremo avere un risultato del tipo:
553 Active Internet connections (servers and established)
554 Proto Recv-Q Send-Q Local Address Foreign Address State
555 tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN
556 tcp 0 0 0.0.0.0:25 0.0.0.0:* LISTEN
557 tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN
559 essendo presenti e attivi un server SSH, un server di posta e un DNS per il
562 Questo ci mostra ad esempio che il server SSH ha compiuto un'apertura passiva,
563 mettendosi in ascolto sulla porta 22 riservata a questo servizio, e che si è
564 posto in ascolto per connessioni provenienti da uno qualunque degli indirizzi
565 associati alle interfacce locali. La notazione \texttt{0.0.0.0} usata da
566 \cmd{netstat} è equivalente all'asterisco utilizzato per il numero di porta,
567 indica il valore generico, e corrisponde al valore \const{INADDR\_ANY}
568 definito in \file{arpa/inet.h} (vedi \ref{tab:TCP_ipv4_addr}).
570 Inoltre si noti come la porta e l'indirizzo di ogni eventuale connessione
571 esterna non sono specificati; in questo caso la \textit{socket pair} associata
572 al socket potrebbe essere indicata come (\texttt{*:22}, \texttt{*:*}), usando
573 anche per gli indirizzi l'asterisco come carattere che indica il valore
576 Dato che in genere una macchina è associata ad un solo indirizzo IP, ci si può
577 chiedere che senso abbia l'utilizzo dell'indirizzo generico per specificare
578 l'indirizzo locale; ma a parte il caso di macchine che hanno più di un
579 indirizzo IP (il cosiddetto \textit{multihoming}) esiste sempre anche
580 l'indirizzo di loopback, per cui con l'uso dell'indirizzo generico si possono
581 accettare connessioni indirizzate verso uno qualunque degli indirizzi IP
582 presenti. Ma, come si può vedere nell'esempio con il DNS che è in ascolto
583 sulla porta 53, è possibile anche restringere l'accesso ad uno specifico
584 indirizzo, cosa che nel caso è fatta accettando solo connessioni che arrivino
585 sull'interfaccia di loopback.
587 Una volta che ci si vorrà collegare a questa macchina da un'altra, per esempio
588 quella con l'indirizzo \texttt{192.84.146.100}, si dovrà lanciare su
589 quest'ultima un client \cmd{ssh} per creare una connessione, e il kernel gli
590 assocerà una porta effimera (ad esempio la 21100), per cui la connessione sarà
591 espressa dalla socket pair (\texttt{192.84.146.100:21100},
592 \texttt{195.110.112.152:22}).
594 Alla ricezione della richiesta dal client il server creerà un processo figlio
595 per gestire la connessione, se a questo punto eseguiamo nuovamente il
596 programma \cmd{netstat} otteniamo come risultato:
598 Active Internet connections (servers and established)
599 Proto Recv-Q Send-Q Local Address Foreign Address State
600 tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN
601 tcp 0 0 0.0.0.0:25 0.0.0.0:* LISTEN
602 tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN
603 tcp 0 0 195.110.112.152:22 192.84.146.100:21100 ESTABLISHED
606 Come si può notare il server è ancora in ascolto sulla porta 22, però adesso
607 c'è un nuovo socket (con lo stato \texttt{ESTABLISHED}) che utilizza anch'esso
608 la porta 22, ed ha specificato l'indirizzo locale, questo è il socket con cui
609 il processo figlio gestisce la connessione mentre il padre resta in ascolto
610 sul socket originale.
612 Se a questo punto lanciamo un'altra volta il client \cmd{ssh} per una seconda
613 connessione quello che otterremo usando \cmd{netstat} sarà qualcosa del
616 Active Internet connections (servers and established)
617 Proto Recv-Q Send-Q Local Address Foreign Address State
618 tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN
619 tcp 0 0 0.0.0.0:25 0.0.0.0:* LISTEN
620 tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN
621 tcp 0 0 195.110.112.152:22 192.84.146.100:21100 ESTABLISHED
622 tcp 0 0 195.110.112.152:22 192.84.146.100:21101 ESTABLISHED
624 cioè il client effettuerà la connessione usando un'altra porta effimera: con
625 questa sarà aperta la connessione, ed il server creerà un altro processo
628 Tutto ciò mostra come il TCP, per poter gestire le connessioni con un server
629 concorrente, non può suddividere i pacchetti solo sulla base della porta di
630 destinazione, ma deve usare tutta l'informazione contenuta nella socket pair,
631 compresa la porta dell'indirizzo remoto. E se andassimo a vedere quali sono i
632 processi\footnote{ad esempio con il comando \cmd{fuser}, o con \cmd{lsof}, o
633 usando l'opzione \texttt{-p}.} a cui fanno riferimento i vari socket
634 vedremmo che i pacchetti che arrivano dalla porta remota 21100 vanno al primo
635 figlio e quelli che arrivano alla porta 21101 al secondo.
638 \section{Le funzioni di base per la gestione dei socket}
639 \label{sec:TCP_functions}
641 In questa sezione descriveremo in maggior dettaglio le varie funzioni che
642 vengono usate per la gestione di base dei socket TCP, non torneremo però sulla
643 funzione \func{socket}, che è già stata esaminata accuratamente nel capitolo
644 precedente in sez.~\ref{sec:sock_socket}.
647 \subsection{La funzione \func{bind}}
648 \label{sec:TCP_func_bind}
650 La funzione \funcd{bind} assegna un indirizzo locale ad un
651 socket.\footnote{nel nostro caso la utilizzeremo per socket TCP, ma la
652 funzione è generica e deve essere usata per qualunque tipo di socket
653 \const{SOCK\_STREAM} prima che questo possa accettare connessioni.} È usata
654 cioè per specificare la prima parte dalla socket pair. Viene usata sul lato
655 server per specificare la porta (e gli eventuali indirizzi locali) su cui poi
656 ci si porrà in ascolto. Il prototipo della funzione è il seguente:
657 \begin{prototype}{sys/socket.h}
658 {int bind(int sockfd, const struct sockaddr *serv\_addr, socklen\_t addrlen)}
660 Assegna un indirizzo ad un socket.
662 \bodydesc{La funzione restituisce 0 in caso di successo e -1 per un errore;
663 in caso di errore la variabile \var{errno} viene impostata secondo i
664 seguenti codici di errore:
666 \item[\errcode{EBADF}] il file descriptor non è valido.
667 \item[\errcode{EINVAL}] il socket ha già un indirizzo assegnato.
668 \item[\errcode{ENOTSOCK}] il file descriptor non è associato ad un socket.
669 \item[\errcode{EACCES}] si è cercato di usare una porta riservata senza
670 sufficienti privilegi.
671 \item[\errcode{EADDRNOTAVAIL}] Il tipo di indirizzo specificato non è
673 \item[\errcode{EADDRINUSE}] qualche altro socket sta già usando l'indirizzo.
675 ed anche \errval{EFAULT} e per i socket di tipo \const{AF\_UNIX},
676 \errval{ENOTDIR}, \errval{ENOENT}, \errval{ENOMEM}, \errval{ELOOP},
677 \errval{ENOSR} e \errval{EROFS}.}
680 Il primo argomento è un file descriptor ottenuto da una precedente chiamata a
681 \func{socket}, mentre il secondo e terzo argomento sono rispettivamente
682 l'indirizzo (locale) del socket e la dimensione della struttura che lo
683 contiene, secondo quanto già trattato in sez.~\ref{sec:sock_sockaddr}.
685 Con i socket TCP la chiamata \func{bind} permette di specificare l'indirizzo,
686 la porta, entrambi o nessuno dei due. In genere i server utilizzano una porta
687 nota che assegnano all'avvio, se questo non viene fatto è il kernel a
688 scegliere una porta effimera quando vengono eseguite la funzioni
689 \func{connect} o \func{listen}, ma se questo è normale per il client non lo è
690 per il server\footnote{un'eccezione a tutto ciò sono i server che usano RPC.
691 In questo caso viene fatta assegnare dal kernel una porta effimera che poi
692 viene registrata presso il \textit{portmapper}; quest'ultimo è un altro
693 demone che deve essere contattato dai client per ottenere la porta effimera
694 su cui si trova il server.} che in genere viene identificato dalla porta su
695 cui risponde (l'elenco di queste porte, e dei relativi servizi, è in
696 \file{/etc/services}).
698 Con \func{bind} si può assegnare un indirizzo IP specifico ad un socket,
699 purché questo appartenga ad una interfaccia della macchina. Per un client TCP
700 questo diventerà l'indirizzo sorgente usato per i tutti i pacchetti inviati
701 sul socket, mentre per un server TCP questo restringerà l'accesso al socket
702 solo alle connessioni che arrivano verso tale indirizzo.
704 Normalmente un client non specifica mai l'indirizzo di un socket, ed il kernel
705 sceglie l'indirizzo di origine quando viene effettuata la connessione, sulla
706 base dell'interfaccia usata per trasmettere i pacchetti, (che dipenderà dalle
707 regole di instradamento usate per raggiungere il server). Se un server non
708 specifica il suo indirizzo locale il kernel userà come indirizzo di origine
709 l'indirizzo di destinazione specificato dal SYN del client.
711 Per specificare un indirizzo generico, con IPv4 si usa il valore
712 \const{INADDR\_ANY}, il cui valore, come accennato in
713 sez.~\ref{sec:sock_sa_ipv4}, è pari a zero; nell'esempio
714 fig.~\ref{fig:TCP_daytime_iter_server_code} si è usata un'assegnazione
715 immediata del tipo: \includecodesnip{listati/serv_addr_sin_addr.c}
717 Si noti che si è usato \func{htonl} per assegnare il valore
718 \const{INADDR\_ANY}, anche se, essendo questo nullo, il riordinamento è
719 inutile. Si tenga presente comunque che tutte le costanti \val{INADDR\_}
720 (riportate in tab.~\ref{tab:TCP_ipv4_addr}) sono definite secondo
721 l'\textit{endianess}\itindex{endianess} della macchina, ed anche se
722 esse possono essere invarianti rispetto all'ordinamento dei bit, è comunque
723 buona norma usare sempre la funzione \func{htonl}.
728 \begin{tabular}[c]{|l|l|}
730 \textbf{Costante} & \textbf{Significato} \\
733 \const{INADDR\_ANY} & Indirizzo generico (\texttt{0.0.0.0})\\
734 \const{INADDR\_BROADCAST}& Indirizzo di \itindex{broadcast}
735 \textit{broadcast}.\\
736 \const{INADDR\_LOOPBACK} & Indirizzo di \textit{loopback}
737 (\texttt{127.0.0.1}).\\
738 \const{INADDR\_NONE} & Indirizzo errato.\\
741 \caption{Costanti di definizione di alcuni indirizzi generici per IPv4.}
742 \label{tab:TCP_ipv4_addr}
745 L'esempio precedente funziona correttamente con IPv4 poiché che l'indirizzo è
746 rappresentabile anche con un intero a 32 bit; non si può usare lo stesso
747 metodo con IPv6, in cui l'indirizzo deve necessariamente essere specificato
748 con una struttura, perché il linguaggio C non consente l'uso di una struttura
749 costante come operando a destra in una assegnazione.
751 Per questo motivo nell'header \file{netinet/in.h} è definita una variabile
752 \macro{in6addr\_any} (dichiarata come \direct{extern}, ed inizializzata dal
753 sistema al valore \const{IN6ADRR\_ANY\_INIT}) che permette di effettuare una
754 assegnazione del tipo: \includecodesnip{listati/serv_addr_sin6_addr.c} in
755 maniera analoga si può utilizzare la variabile \macro{in6addr\_loopback} per
756 indicare l'indirizzo di \textit{loopback}, che a sua volta viene inizializzata
757 staticamente a \const{IN6ADRR\_LOOPBACK\_INIT}.
761 \subsection{La funzione \func{connect}}
762 \label{sec:TCP_func_connect}
764 La funzione \funcd{connect} è usata da un client TCP per stabilire la
765 connessione con un server TCP,\footnote{di nuovo la funzione è generica e
766 supporta vari tipi di socket, la differenza è che per socket senza
767 connessione come quelli di tipo \const{SOCK\_DGRAM} la sua chiamata si
768 limiterà ad impostare l'indirizzo dal quale e verso il quale saranno inviati
769 e ricevuti i pacchetti, mentre per socket di tipo \const{SOCK\_STREAM} o
770 \const{SOCK\_SEQPACKET}, essa attiverà la procedura di avvio (nel caso del
771 TCP il \itindex{three~way~handshake}\textit{three way handshake}) della
772 connessione.} il prototipo della funzione è il seguente:
773 \begin{prototype}{sys/socket.h}
774 {int connect(int sockfd, const struct sockaddr *servaddr, socklen\_t
777 Stabilisce una connessione fra due socket.
779 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
780 errore, nel qual caso \var{errno} assumerà i valori:
782 \item[\errcode{ECONNREFUSED}] non c'è nessuno in ascolto sull'indirizzo
784 \item[\errcode{ETIMEDOUT}] si è avuto timeout durante il tentativo di
786 \item[\errcode{ENETUNREACH}] la rete non è raggiungibile.
787 \item[\errcode{EINPROGRESS}] il socket è non bloccante (vedi
788 sez.~\ref{sec:file_noblocking}) e la connessione non può essere conclusa
790 \item[\errcode{EALREADY}] il socket è non bloccante (vedi
791 sez.~\ref{sec:file_noblocking}) e un tentativo precedente di connessione
792 non si è ancora concluso.
793 \item[\errcode{EAGAIN}] non ci sono più porte locali libere.
794 \item[\errcode{EAFNOSUPPORT}] l'indirizzo non ha una famiglia di indirizzi
795 corretta nel relativo campo.
796 \item[\errcode{EACCES}, \errcode{EPERM}] si è tentato di eseguire una
797 connessione ad un indirizzo \itindex{broadcast} \textit{broadcast} senza
798 che il socket fosse stato abilitato per il \itindex{broadcast}
801 altri errori possibili sono: \errval{EFAULT}, \errval{EBADF},
802 \errval{ENOTSOCK}, \errval{EISCONN} e \errval{EADDRINUSE}.}
805 Il primo argomento è un file descriptor ottenuto da una precedente chiamata a
806 \func{socket}, mentre il secondo e terzo argomento sono rispettivamente
807 l'indirizzo e la dimensione della struttura che contiene l'indirizzo del
808 socket, già descritta in sez.~\ref{sec:sock_sockaddr}.
810 La struttura dell'indirizzo deve essere inizializzata con l'indirizzo IP e il
811 numero di porta del server a cui ci si vuole connettere, come mostrato
812 nell'esempio sez.~\ref{sec:TCP_daytime_client}, usando le funzioni illustrate
813 in sez.~\ref{sec:sock_addr_func}.
815 Nel caso di socket TCP la funzione \func{connect} avvia il
816 \itindex{three~way~handshake}\textit{three way handshake}, e ritorna
817 solo quando la connessione è stabilita o si è verificato un errore. Le
818 possibili cause di errore sono molteplici (ed i relativi codici riportati
819 sopra), quelle che però dipendono dalla situazione della rete e non da errori
820 o problemi nella chiamata della funzione sono le seguenti:
822 \item Il client non riceve risposta al SYN: l'errore restituito è
823 \errcode{ETIMEDOUT}. Stevens riporta che BSD invia un primo SYN alla chiamata
824 di \func{connect}, un altro dopo 6 secondi, un terzo dopo 24 secondi, se
825 dopo 75 secondi non ha ricevuto risposta viene ritornato l'errore. Linux
826 invece ripete l'emissione del SYN ad intervalli di 30 secondi per un numero
827 di volte che può essere stabilito dall'utente sia con una opportuna
828 \func{sysctl} che attraverso il filesystem \file{/proc} scrivendo il valore
829 voluto in \file{/proc/sys/net/ipv4/tcp\_syn\_retries}. Il valore predefinito
830 per la ripetizione dell'invio è di 5 volte, che comporta un timeout dopo
833 \item Il client riceve come risposta al SYN un RST significa che non c'è
834 nessun programma in ascolto per la connessione sulla porta specificata (il
835 che vuol dire probabilmente che o si è sbagliato il numero della porta o che
836 non è stato avviato il server), questo è un errore fatale e la funzione
837 ritorna non appena il RST viene ricevuto riportando un errore
838 \errcode{ECONNREFUSED}.
840 Il flag RST sta per \textit{reset} ed è un segmento inviato direttamente
841 dal TCP quando qualcosa non va. Tre condizioni che generano un RST sono:
842 quando arriva un SYN per una porta che non ha nessun server in ascolto,
843 quando il TCP abortisce una connessione in corso, quando TCP riceve un
844 segmento per una connessione che non esiste.
846 \item Il SYN del client provoca l'emissione di un messaggio ICMP di
847 destinazione non raggiungibile. In questo caso dato che il messaggio può
848 essere dovuto ad una condizione transitoria si ripete l'emissione dei SYN
849 come nel caso precedente, fino al timeout, e solo allora si restituisce il
850 codice di errore dovuto al messaggio ICMP, che da luogo ad un
851 \errcode{ENETUNREACH}.
855 Se si fa riferimento al diagramma degli stati del TCP riportato in
856 fig.~\ref{fig:TCP_state_diag} la funzione \func{connect} porta un socket
857 dallo stato \texttt{CLOSED} (lo stato iniziale in cui si trova un socket
858 appena creato) prima allo stato \texttt{SYN\_SENT} e poi, al ricevimento del
859 ACK, nello stato \texttt{ESTABLISHED}. Se invece la connessione fallisce il
860 socket non è più utilizzabile e deve essere chiuso.
862 Si noti infine che con la funzione \func{connect} si è specificato solo
863 indirizzo e porta del server, quindi solo una metà della socket pair; essendo
864 questa funzione usata nei client l'altra metà contenente indirizzo e porta
865 locale viene lasciata all'assegnazione automatica del kernel, e non è
866 necessario effettuare una \func{bind}.
869 \subsection{La funzione \func{listen}}
870 \label{sec:TCP_func_listen}
872 La funzione \funcd{listen} serve ad usare un socket in modalità passiva, cioè,
873 come dice il nome, per metterlo in ascolto di eventuali
874 connessioni;\footnote{questa funzione può essere usata con socket che
875 supportino le connessioni, cioè di tipo \const{SOCK\_STREAM} o
876 \const{SOCK\_SEQPACKET}.} in sostanza l'effetto della funzione è di portare
877 il socket dallo stato \texttt{CLOSED} a quello \texttt{LISTEN}. In genere si
878 chiama la funzione in un server dopo le chiamate a \func{socket} e \func{bind}
879 e prima della chiamata ad \func{accept}. Il prototipo della funzione, come
880 definito dalla pagina di manuale, è:
881 \begin{prototype}{sys/socket.h}{int listen(int sockfd, int backlog)}
882 Pone un socket in attesa di una connessione.
884 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
885 errore. I codici di errore restituiti in \var{errno} sono i seguenti:
887 \item[\errcode{EBADF}] l'argomento \param{sockfd} non è un file descriptor
889 \item[\errcode{ENOTSOCK}] l'argomento \param{sockfd} non è un socket.
890 \item[\errcode{EOPNOTSUPP}] il socket è di un tipo che non supporta questa
895 La funzione pone il socket specificato da \param{sockfd} in modalità passiva e
896 predispone una coda per le connessioni in arrivo di lunghezza pari a
897 \param{backlog}. La funzione si può applicare solo a socket di tipo
898 \const{SOCK\_STREAM} o \const{SOCK\_SEQPACKET}.
900 L'argomento \param{backlog} indica il numero massimo di connessioni pendenti
901 accettate; se esso viene ecceduto il client al momento della richiesta della
902 connessione riceverà un errore di tipo \errcode{ECONNREFUSED}, o se il
903 protocollo, come accade nel caso del TCP, supporta la ritrasmissione, la
904 richiesta sarà ignorata in modo che la connessione possa venire ritentata.
906 Per capire meglio il significato di tutto ciò occorre approfondire la modalità
907 con cui il kernel tratta le connessioni in arrivo. Per ogni socket in ascolto
908 infatti vengono mantenute due code:
910 \item La coda delle connessioni incomplete (\textit{incomplete connection
911 queue} che contiene un riferimento per ciascun socket per il quale è
912 arrivato un SYN ma il \itindex{three~way~handshake}\textit{three way
913 handshake} non si è ancora concluso. Questi socket sono tutti nello stato
915 \item La coda delle connessioni complete (\textit{complete connection queue}
916 che contiene un ingresso per ciascun socket per il quale il \textit{three
917 way handshake} è stato completato ma ancora \func{accept} non è ritornata.
918 Questi socket sono tutti nello stato \texttt{ESTABLISHED}.
921 Lo schema di funzionamento è descritto in fig.~\ref{fig:TCP_listen_backlog}:
922 quando arriva un SYN da un client il server crea una nuova voce nella coda
923 delle connessioni incomplete, e poi risponde con il SYN$+$ACK. La voce resterà
924 nella coda delle connessioni incomplete fino al ricevimento dell'ACK dal
925 client o fino ad un timeout. Nel caso di completamento del
926 \itindex{three~way~handshake}\textit{three way handshake} la voce viene
927 spostata nella coda delle connessioni complete. Quando il processo chiama la
928 funzione \func{accept} (vedi sez.~\ref{sec:TCP_func_accept}) la prima voce
929 nella coda delle connessioni complete è passata al programma, o, se la coda è
930 vuota, il processo viene posto in attesa e risvegliato all'arrivo della prima
931 connessione completa.
935 \includegraphics[width=11cm]{img/tcp_listen_backlog}
936 \caption{Schema di funzionamento delle code delle connessioni complete ed
938 \label{fig:TCP_listen_backlog}
941 Storicamente il valore dell'argomento \param{backlog} era corrispondente al
942 massimo valore della somma del numero di voci possibili per ciascuna delle due
943 code. Stevens in \cite{UNP1} riporta che BSD ha sempre applicato un fattore di
944 1.5 a detto valore, e fornisce una tabella con i risultati ottenuti con vari
945 kernel, compreso Linux 2.0, che mostrano le differenze fra diverse
948 In Linux il significato di questo valore è cambiato a partire dal kernel 2.2
949 per prevenire l'attacco chiamato \textit{syn flood}. Questo si basa
950 sull'emissione da parte dell'attaccante di un grande numero di pacchetti SYN
951 indirizzati verso una porta, forgiati con indirizzo IP fasullo\footnote{con la
952 tecnica che viene detta \textit{ip spoofing}.} così che i SYN$+$ACK vanno
953 perduti e la coda delle connessioni incomplete viene saturata, impedendo di
954 fatto ulteriori connessioni.
956 Per ovviare a questo il significato del \param{backlog} è stato cambiato a
957 indicare la lunghezza della coda delle connessioni complete. La lunghezza
958 della coda delle connessioni incomplete può essere ancora controllata usando
959 la funzione \func{sysctl} con il parametro \const{NET\_TCP\_MAX\_SYN\_BACKLOG}
960 o scrivendola direttamente in
961 \file{/proc/sys/net/ipv4/tcp\_max\_syn\_backlog}. Quando si attiva la
962 protezione dei syncookies però (con l'opzione da compilare nel kernel e da
963 attivare usando \file{/proc/sys/net/ipv4/tcp\_syncookies}) questo valore viene
964 ignorato e non esiste più un valore massimo. In ogni caso in Linux il valore
965 di \param{backlog} viene troncato ad un massimo di \const{SOMAXCONN} se è
966 superiore a detta costante (che di default vale 128).
968 La scelta storica per il valore di questo parametro era di 5, e alcuni vecchi
969 kernel non supportavano neanche valori superiori, ma la situazione corrente è
970 molto cambiata per via della presenza di server web che devono gestire un gran
971 numero di connessioni per cui un tale valore non è più adeguato. Non esiste
972 comunque una risposta univoca per la scelta del valore, per questo non
973 conviene specificarlo con una costante (il cui cambiamento richiederebbe la
974 ricompilazione del server) ma usare piuttosto una variabile di ambiente (vedi
975 sez.~\ref{sec:proc_environ}).
977 Stevens tratta accuratamente questo argomento in \cite{UNP1}, con esempi presi
978 da casi reali su web server, ed in particolare evidenzia come non sia più vero
979 che il compito principale della coda sia quello di gestire il caso in cui il
980 server è occupato fra chiamate successive alla \func{accept} (per cui la coda
981 più occupata sarebbe quella delle connessioni completate), ma piuttosto quello
982 di gestire la presenza di un gran numero di SYN in attesa di concludere il
983 \textit{three way handshake}\itindex{three~way~handshake}.
985 Infine va messo in evidenza che, nel caso di socket TCP, quando un SYN arriva
986 con tutte le code piene, il pacchetto deve essere ignorato. Questo perché la
987 condizione in cui le code sono piene è ovviamente transitoria, per cui se il
988 client ritrasmette il SYN è probabile che passato un po' di tempo possa
989 trovare nella coda lo spazio per una nuova connessione. Se invece si
990 rispondesse con un RST, per indicare l'impossibilità di effettuare la
991 connessione, la chiamata a \func{connect} nel client ritornerebbe con una
992 condizione di errore, costringendo a inserire nell'applicazione la gestione
993 dei tentativi di riconnessione, che invece può essere effettuata in maniera
994 trasparente dal protocollo TCP.
997 \subsection{La funzione \func{accept}}
998 \label{sec:TCP_func_accept}
1000 La funzione \funcd{accept} è chiamata da un server per gestire la connessione
1001 una volta che sia stato completato il \itindex{three~way~handshake}
1002 \textit{three way handshake},\footnote{la funzione è comunque generica ed è
1003 utilizzabile su socket di tipo \const{SOCK\_STREAM}, \const{SOCK\_SEQPACKET}
1004 e \const{SOCK\_RDM}.} la funzione restituisce un nuovo socket descriptor su
1005 cui si potrà operare per effettuare la comunicazione. Se non ci sono
1006 connessioni completate il processo viene messo in attesa. Il prototipo della
1007 funzione è il seguente:
1008 \begin{prototype}{sys/socket.h}
1009 {int accept(int sockfd, struct sockaddr *addr, socklen\_t *addrlen)}
1011 Accetta una connessione sul socket specificato.
1013 \bodydesc{La funzione restituisce un numero di socket descriptor positivo in
1014 caso di successo e -1 in caso di errore, nel qual caso \var{errno} viene
1015 impostata ai seguenti valori:
1018 \item[\errcode{EBADF}] l'argomento \param{sockfd} non è un file descriptor
1020 \item[\errcode{ENOTSOCK}] l'argomento \param{sockfd} non è un socket.
1021 \item[\errcode{EOPNOTSUPP}] il socket è di un tipo che non supporta questa
1023 \item[\errcode{EAGAIN} o \errcode{EWOULDBLOCK}] il socket è stato impostato
1024 come non bloccante (vedi sez.~\ref{sec:file_noblocking}), e non ci sono
1025 connessioni in attesa di essere accettate.
1026 \item[\errcode{EPERM}] Le regole del firewall non consentono la connessione.
1027 \item[\errcode{ENOBUFS}, \errcode{ENOMEM}] questo spesso significa che
1028 l'allocazione della memoria è limitata dai limiti sui buffer dei socket,
1029 non dalla memoria di sistema.
1030 \item[\errcode{EINTR}] La funzione è stata interrotta da un segnale.
1032 Inoltre possono essere restituiti gli errori di rete relativi al nuovo
1033 socket, diversi a secondo del protocollo, come: \errval{EMFILE},
1034 \errval{EINVAL}, \errval{ENOSR}, \errval{ENOBUFS}, \errval{EFAULT},
1035 \errval{EPERM}, \errval{ECONNABORTED}, \errval{ESOCKTNOSUPPORT},
1036 \errval{EPROTONOSUPPORT}, \errval{ETIMEDOUT}, \errval{ERESTARTSYS}.}
1039 La funzione estrae la prima connessione relativa al socket \param{sockfd} in
1040 attesa sulla coda delle connessioni complete, che associa ad nuovo socket con
1041 le stesse caratteristiche di \param{sockfd}. Il socket originale non viene
1042 toccato e resta nello stato di \texttt{LISTEN}, mentre il nuovo socket viene
1043 posto nello stato \texttt{ESTABLISHED}. Nella struttura \param{addr} e nella
1044 variabile \param{addrlen} vengono restituiti indirizzo e relativa lunghezza
1045 del client che si è connesso.
1047 I due argomenti \param{addr} e \param{addrlen} (si noti che quest'ultimo è
1048 passato per indirizzo per avere indietro il valore) sono usati per ottenere
1049 l'indirizzo del client da cui proviene la connessione. Prima della chiamata
1050 \param{addrlen} deve essere inizializzato alle dimensioni della struttura il
1051 cui indirizzo è passato come argomento in \param{addr}; al ritorno della
1052 funzione \param{addrlen} conterrà il numero di byte scritti dentro
1053 \param{addr}. Se questa informazione non interessa basterà inizializzare a
1054 \val{NULL} detti puntatori.
1056 Se la funzione ha successo restituisce il descrittore di un nuovo socket
1057 creato dal kernel (detto \textit{connected socket}) a cui viene associata la
1058 prima connessione completa (estratta dalla relativa coda, vedi
1059 sez.~\ref{sec:TCP_func_listen}) che il client ha effettuato verso il socket
1060 \param{sockfd}. Quest'ultimo (detto \textit{listening socket}) è quello creato
1061 all'inizio e messo in ascolto con \func{listen}, e non viene toccato dalla
1062 funzione. Se non ci sono connessioni pendenti da accettare la funzione mette
1063 in attesa il processo\footnote{a meno che non si sia impostato il socket per
1064 essere non bloccante (vedi sez.~\ref{sec:file_noblocking}), nel qual caso
1065 ritorna con l'errore \errcode{EAGAIN}. Torneremo su questa modalità di
1066 operazione in sez.~\ref{sec:TCP_sock_multiplexing}.} fintanto che non ne
1069 La funzione può essere usata solo con socket che supportino la connessione
1070 (cioè di tipo \const{SOCK\_STREAM}, \const{SOCK\_SEQPACKET} o
1071 \const{SOCK\_RDM}). Per alcuni protocolli che richiedono una conferma
1072 esplicita della connessione,\footnote{attualmente in Linux solo DECnet ha
1073 questo comportamento.} la funzione opera solo l'estrazione dalla coda delle
1074 connessioni, la conferma della connessione viene eseguita implicitamente dalla
1075 prima chiamata ad una \func{read} o una \func{write}, mentre il rifiuto della
1076 connessione viene eseguito con la funzione \func{close}.
1078 È da chiarire che Linux presenta un comportamento diverso nella gestione degli
1079 errori rispetto ad altre implementazioni dei socket BSD, infatti la funzione
1080 \func{accept} passa gli errori di rete pendenti sul nuovo socket come codici
1081 di errore per \func{accept}, per cui l'applicazione deve tenerne conto ed
1082 eventualmente ripetere la chiamata alla funzione come per l'errore di
1083 \errcode{EAGAIN} (torneremo su questo in sez.~\ref{sec:TCP_echo_critical}).
1084 Un'altra differenza con BSD è che la funzione non fa ereditare al nuovo socket
1085 i flag del socket originale, come \const{O\_NONBLOCK},\footnote{ed in generale
1086 tutti quelli che si possono impostare con \func{fcntl}, vedi
1087 sez.~\ref{sec:file_fcntl}.} che devono essere rispecificati ogni volta. Tutto
1088 questo deve essere tenuto in conto se si devono scrivere programmi portabili.
1090 Il meccanismo di funzionamento di \func{accept} è essenziale per capire il
1091 funzionamento di un server: in generale infatti c'è sempre un solo socket in
1092 ascolto, detto per questo \textit{listening socket}, che resta per tutto il
1093 tempo nello stato \texttt{LISTEN}, mentre le connessioni vengono gestite dai
1094 nuovi socket, detti \textit{connected socket}, ritornati da \func{accept}, che
1095 si trovano automaticamente nello stato \texttt{ESTABLISHED}, e vengono
1096 utilizzati per lo scambio dei dati, che avviene su di essi, fino alla chiusura
1097 della connessione. Si può riconoscere questo schema anche nell'esempio
1098 elementare di fig.~\ref{fig:TCP_daytime_iter_server_code}, dove per ogni
1099 connessione il socket creato da \func{accept} viene chiuso dopo l'invio dei
1103 \subsection{Le funzioni \func{getsockname} e \func{getpeername}}
1104 \label{sec:TCP_get_names}
1106 Oltre a tutte quelle viste finora, dedicate all'utilizzo dei socket, esistono
1107 alcune funzioni ausiliarie che possono essere usate per recuperare alcune
1108 informazioni relative ai socket ed alle connessioni ad essi associate. Le due
1109 funzioni più elementari sono queste, che vengono usate per ottenere i dati
1110 relativi alla socket pair associata ad un certo socket.
1112 La prima funzione è \funcd{getsockname} e serve ad ottenere l'indirizzo locale
1113 associato ad un socket; il suo prototipo è:
1114 \begin{prototype}{sys/socket.h}
1115 {int getsockname(int sockfd, struct sockaddr *name, socklen\_t *namelen)}
1116 Legge l'indirizzo locale di un socket.
1118 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1119 errore. I codici di errore restituiti in \var{errno} sono i seguenti:
1121 \item[\errcode{EBADF}] l'argomento \param{sockfd} non è un file descriptor
1123 \item[\errcode{ENOTSOCK}] l'argomento \param{sockfd} non è un socket.
1124 \item[\errcode{ENOBUFS}] non ci sono risorse sufficienti nel sistema per
1125 eseguire l'operazione.
1126 \item[\errcode{EFAULT}] l'indirizzo \param{name} non è valido.
1130 La funzione restituisce la struttura degli indirizzi del socket \param{sockfd}
1131 nella struttura indicata dal puntatore \param{name} la cui lunghezza è
1132 specificata tramite l'argomento \param{namlen}. Quest'ultimo viene passato
1133 come indirizzo per avere indietro anche il numero di byte effettivamente
1134 scritti nella struttura puntata da \param{name}. Si tenga presente che se si è
1135 utilizzato un buffer troppo piccolo per \param{name} l'indirizzo risulterà
1138 La funzione si usa tutte le volte che si vuole avere l'indirizzo locale di un
1139 socket; ad esempio può essere usata da un client (che usualmente non chiama
1140 \func{bind}) per ottenere numero IP e porta locale associati al socket
1141 restituito da una \func{connect}, o da un server che ha chiamato \func{bind}
1142 su un socket usando 0 come porta locale per ottenere il numero di porta
1143 effimera assegnato dal kernel.
1145 Inoltre quando un server esegue una \func{bind} su un indirizzo generico, se
1146 chiamata dopo il completamento di una connessione sul socket restituito da
1147 \func{accept}, restituisce l'indirizzo locale che il kernel ha assegnato a
1150 Tutte le volte che si vuole avere l'indirizzo remoto di un socket si usa la
1151 funzione \funcd{getpeername}, il cui prototipo è:
1152 \begin{prototype}{sys/socket.h}
1153 {int getpeername(int sockfd, struct sockaddr * name, socklen\_t * namelen)}
1154 Legge l'indirizzo remoto di un socket.
1156 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1157 errore. I codici di errore restituiti in \var{errno} sono i seguenti:
1159 \item[\errcode{EBADF}] l'argomento \param{sockfd} non è un file descriptor
1161 \item[\errcode{ENOTSOCK}] l'argomento \param{sockfd} non è un socket.
1162 \item[\errcode{ENOTCONN}] il socket non è connesso.
1163 \item[\errcode{ENOBUFS}] non ci sono risorse sufficienti nel sistema per
1164 eseguire l'operazione.
1165 \item[\errcode{EFAULT}] l'argomento \param{name} punta al di fuori dello
1166 spazio di indirizzi del processo.
1170 La funzione è identica a \func{getsockname}, ed usa la stessa sintassi, ma
1171 restituisce l'indirizzo remoto del socket, cioè quello associato all'altro
1172 capo della connessione. Ci si può chiedere a cosa serva questa funzione dato
1173 che dal lato client l'indirizzo remoto è sempre noto quando si esegue la
1174 \func{connect} mentre dal lato server si possono usare, come vedremo in
1175 fig.~\ref{fig:TCP_daytime_cunc_server_code}, i valori di ritorno di
1178 Il fatto è che in generale quest'ultimo caso non è sempre possibile. In
1179 particolare questo avviene quando il server, invece di gestire la connessione
1180 direttamente in un processo figlio, come vedremo nell'esempio di server
1181 concorrente di sez.~\ref{sec:TCP_daytime_cunc_server}, lancia per ciascuna
1182 connessione un altro programma, usando \func{exec}.\footnote{questa ad esempio
1183 è la modalità con cui opera il \textsl{super-server} \cmd{inetd}, che può
1184 gestire tutta una serie di servizi diversi, eseguendo su ogni connessione
1185 ricevuta sulle porte tenute sotto controllo, il relativo server.}
1187 In questo caso benché il processo figlio abbia una immagine della memoria che
1188 è copia di quella del processo padre (e contiene quindi anche la struttura
1189 ritornata da \func{accept}), all'esecuzione di \func{exec} verrà caricata in
1190 memoria l'immagine del programma eseguito, che a questo punto perde ogni
1191 riferimento ai valori tornati da \func{accept}. Il socket descriptor però
1192 resta aperto, e se si è seguita una opportuna convenzione per rendere noto al
1193 programma eseguito qual è il socket connesso, \footnote{ad esempio il solito
1194 \cmd{inetd} fa sempre in modo che i file descriptor 0, 1 e 2 corrispondano
1195 al socket connesso.} quest'ultimo potrà usare la funzione \func{getpeername}
1196 per determinare l'indirizzo remoto del client.
1198 Infine è da chiarire (si legga la pagina di manuale) che, come per
1199 \func{accept}, il terzo argomento, che è specificato dallo standard POSIX.1g
1200 come di tipo \code{socklen\_t *} in realtà deve sempre corrispondere ad un
1201 \ctyp{int *} come prima dello standard perché tutte le implementazioni dei
1202 socket BSD fanno questa assunzione.
1205 \subsection{La funzione \func{close}}
1206 \label{sec:TCP_func_close}
1208 La funzione standard Unix \func{close} (vedi sez.~\ref{sec:file_close}) che si
1209 usa sui file può essere usata con lo stesso effetto anche sui file descriptor
1210 associati ad un socket.
1212 L'azione di questa funzione quando applicata a socket è di marcarlo come
1213 chiuso e ritornare immediatamente al processo. Una volta chiamata il socket
1214 descriptor non è più utilizzabile dal processo e non può essere usato come
1215 argomento per una \func{write} o una \func{read} (anche se l'altro capo della
1216 connessione non avesse chiuso la sua parte). Il kernel invierà comunque tutti
1217 i dati che ha in coda prima di iniziare la sequenza di chiusura.
1219 Vedremo più avanti in sez.~\ref{sec:sock_generic_options} come sia possibile
1220 cambiare questo comportamento, e cosa può essere fatto perché il processo
1221 possa assicurarsi che l'altro capo abbia ricevuto tutti i dati.
1223 Come per tutti i file descriptor anche per i socket viene mantenuto un numero
1224 di riferimenti, per cui se più di un processo ha lo stesso socket aperto
1225 l'emissione del FIN e la sequenza di chiusura di TCP non viene innescata
1226 fintanto che il numero di riferimenti non si annulla, questo si applica, come
1227 visto in sez.~\ref{sec:file_sharing}, sia ai file descriptor duplicati che a
1228 quelli ereditati dagli eventuali processi figli, ed è il comportamento che ci
1229 si aspetta in una qualunque applicazione client/server.
1231 Per attivare immediatamente l'emissione del FIN e la sequenza di chiusura
1232 descritta in sez.~\ref{sec:TCP_conn_term}, si può invece usare la funzione
1233 \func{shutdown} su cui torneremo in seguito (vedi
1234 sez.~\ref{sec:TCP_shutdown}).
1238 \section{Un esempio elementare: il servizio \textit{daytime}}
1239 \label{sec:TCP_daytime_application}
1241 Avendo introdotto le funzioni di base per la gestione dei socket, potremo
1242 vedere in questa sezione un primo esempio di applicazione elementare che
1243 implementa il servizio \textit{daytime} su TCP, secondo quanto specificato
1244 dall'\href{http://www.ietf.org/rfc/rfc867.txt}{RFC~867}. Prima di passare
1245 agli esempi del client e del server, inizieremo riesaminando con maggiori
1246 dettagli una peculiarità delle funzioni di I/O, già accennata in
1247 sez.~\ref{sec:file_read} e sez.~\ref{sec:file_write}, che nel caso dei socket è
1248 particolarmente rilevante. Passeremo poi ad illustrare gli esempi
1249 dell'implementazione, sia dal lato client, che dal lato server, che si è
1250 realizzato sia in forma iterativa che concorrente.
1253 \subsection{Il comportamento delle funzioni di I/O}
1254 \label{sec:sock_io_behav}
1256 Una cosa che si tende a dimenticare quando si ha a che fare con i socket è che
1257 le funzioni di input/output non sempre hanno lo stesso comportamento che
1258 avrebbero con i normali file di dati (in particolare questo accade per i
1259 socket di tipo stream).
1261 Infatti con i socket è comune che funzioni come \func{read} o \func{write}
1262 possano restituire in input o scrivere in output un numero di byte minore di
1263 quello richiesto. Come già accennato in sez.~\ref{sec:file_read} questo è un
1264 comportamento normale per le funzioni di I/O, ma con i normali file di dati il
1265 problema si avverte solo in lettura, quando si incontra la fine del file. In
1266 generale non è così, e con i socket questo è particolarmente evidente.
1270 \footnotesize \centering
1271 \begin{minipage}[c]{15cm}
1272 \includecodesample{listati/FullRead.c}
1275 \caption{La funzione \func{FullRead}, che legge esattamente \var{count} byte
1276 da un file descriptor, iterando opportunamente le letture.}
1277 \label{fig:sock_FullRead_code}
1280 Quando ci si trova ad affrontare questo comportamento tutto quello che si deve
1281 fare è semplicemente ripetere la lettura (o la scrittura) per la quantità di
1282 byte restanti, tenendo conto che le funzioni si possono bloccare se i dati non
1283 sono disponibili: è lo stesso comportamento che si può avere scrivendo più di
1284 \const{PIPE\_BUF} byte in una pipe (si riveda quanto detto in
1285 sez.~\ref{sec:ipc_pipes}).
1287 Per questo motivo, seguendo l'esempio di R. W. Stevens in \cite{UNP1}, si sono
1288 definite due funzioni, \func{FullRead} e \func{FullWrite}, che eseguono
1289 lettura e scrittura tenendo conto di questa caratteristica, ed in grado di
1290 ritornare solo dopo avere letto o scritto esattamente il numero di byte
1291 specificato; il sorgente è riportato rispettivamente in
1292 fig.~\ref{fig:sock_FullRead_code} e fig.~\ref{fig:sock_FullWrite_code} ed è
1293 disponibile fra i sorgenti allegati alla guida nei file \file{FullRead.c} e
1298 \footnotesize \centering
1299 \begin{minipage}[c]{15cm}
1300 \includecodesample{listati/FullWrite.c}
1303 \caption{La funzione \func{FullWrite}, che scrive esattamente \var{count}
1304 byte su un file descriptor, iterando opportunamente le scritture.}
1305 \label{fig:sock_FullWrite_code}
1308 Come si può notare le due funzioni ripetono la lettura/scrittura in un ciclo
1309 fino all'esaurimento del numero di byte richiesti, in caso di errore viene
1310 controllato se questo è \errcode{EINTR} (cioè un'interruzione della system
1311 call dovuta ad un segnale), nel qual caso l'accesso viene ripetuto, altrimenti
1312 l'errore viene ritornato al programma chiamante, interrompendo il ciclo.
1314 Nel caso della lettura, se il numero di byte letti è zero, significa che si è
1315 arrivati alla fine del file (per i socket questo significa in genere che
1316 l'altro capo è stato chiuso, e quindi non sarà più possibile leggere niente) e
1317 pertanto si ritorna senza aver concluso la lettura di tutti i byte
1318 richiesti. Entrambe le funzioni restituiscono 0 in caso di successo, ed un
1319 valore negativo in caso di errore, \func{FullRead} restituisce il numero di
1320 byte non letti in caso di end-of-file prematuro.
1323 \subsection{Il client \textit{daytime}}
1324 \label{sec:TCP_daytime_client}
1326 Il primo esempio di applicazione delle funzioni di base illustrate in
1327 sez.~\ref{sec:TCP_functions} è relativo alla creazione di un client elementare
1328 per il servizio \textit{daytime}, un servizio elementare, definito
1329 nell'\href{http://www.ietf.org/rfc/rfc867.txt}{RFC~867}, che restituisce
1330 l'ora locale della macchina a cui si effettua la richiesta, e che è assegnato
1333 In fig.~\ref{fig:TCP_daytime_client_code} è riportata la sezione principale
1334 del codice del nostro client. Il sorgente completo del programma
1335 (\texttt{TCP\_daytime.c}, che comprende il trattamento delle opzioni ed una
1336 funzione per stampare un messaggio di aiuto) è allegato alla guida nella
1337 sezione dei codici sorgente e può essere compilato su una qualunque macchina
1340 \begin{figure}[!htb]
1341 \footnotesize \centering
1342 \begin{minipage}[c]{15cm}
1343 \includecodesample{listati/TCP_daytime.c}
1346 \caption{Esempio di codice di un client elementare per il servizio
1348 \label{fig:TCP_daytime_client_code}
1351 Il programma anzitutto (\texttt{\small 1--5}) include gli header necessari;
1352 dopo la dichiarazione delle variabili (\texttt{\small 9--12}) si è omessa
1353 tutta la parte relativa al trattamento degli argomenti passati dalla linea di
1354 comando (effettuata con le apposite funzioni illustrate in
1355 sez.~\ref{sec:proc_opt_handling}).
1357 Il primo passo (\texttt{\small 14--18}) è creare un socket TCP (quindi di tipo
1358 \const{SOCK\_STREAM} e di famiglia \const{AF\_INET}). La funzione
1359 \func{socket} ritorna il descrittore che viene usato per identificare il
1360 socket in tutte le chiamate successive. Nel caso la chiamata fallisca si
1361 stampa un errore (\texttt{\small 16}) con la funzione \func{perror} e si esce
1362 (\texttt{\small 17}) con un codice di errore.
1364 Il passo seguente (\texttt{\small 19--27}) è quello di costruire un'apposita
1365 struttura \struct{sockaddr\_in} in cui sarà inserito l'indirizzo del server ed
1366 il numero della porta del servizio. Il primo passo (\texttt{\small 20}) è
1367 inizializzare tutto a zero, per poi inserire il tipo di indirizzo
1368 (\texttt{\small 21}) e la porta (\texttt{\small 22}), usando per quest'ultima
1369 la funzione \func{htons} per convertire il formato dell'intero usato dal
1370 computer a quello usato nella rete, infine \texttt{\small 23--27} si può
1371 utilizzare la funzione \func{inet\_pton} per convertire l'indirizzo numerico
1372 passato dalla linea di comando.
1374 A questo punto (\texttt{\small 28--32}) usando la funzione \func{connect} sul
1375 socket creato in precedenza (\texttt{\small 29}) si può stabilire la
1376 connessione con il server. Per questo si deve utilizzare come secondo
1377 argomento la struttura preparata in precedenza con il relativo indirizzo; si
1378 noti come, esistendo diversi tipi di socket, si sia dovuto effettuare un cast.
1379 Un valore di ritorno della funzione negativo implica il fallimento della
1380 connessione, nel qual caso si stampa un errore (\texttt{\small 30}) e si
1381 ritorna (\texttt{\small 31}).
1383 Completata con successo la connessione il passo successivo (\texttt{\small
1384 34--40}) è leggere la data dal socket; il protocollo prevede che il server
1385 invii sempre una stringa alfanumerica, il formato della stringa non è
1386 specificato dallo standard, per cui noi useremo il formato usato dalla
1387 funzione \func{ctime}, seguito dai caratteri di terminazione \verb|\r\n|, cioè
1390 Wed Apr 4 00:53:00 2001\r\n
1392 questa viene letta dal socket (\texttt{\small 34}) con la funzione \func{read}
1393 in un buffer temporaneo; la stringa poi deve essere terminata (\texttt{\small
1394 35}) con il solito carattere nullo per poter essere stampata (\texttt{\small
1395 36}) sullo standard output con l'uso di \func{fputs}.
1397 Come si è già spiegato in sez.~\ref{sec:sock_io_behav} la risposta dal socket
1398 potrà arrivare in un unico pacchetto di 26 byte (come avverrà senz'altro nel
1399 caso in questione) ma potrebbe anche arrivare in 26 pacchetti di un byte. Per
1400 questo nel caso generale non si può mai assumere che tutti i dati arrivino con
1401 una singola lettura, pertanto quest'ultima deve essere effettuata in un ciclo
1402 in cui si continui a leggere fintanto che la funzione \func{read} non ritorni
1403 uno zero (che significa che l'altro capo ha chiuso la connessione) o un numero
1404 minore di zero (che significa un errore nella connessione).
1406 Si noti come in questo caso la fine dei dati sia specificata dal server che
1407 chiude la connessione (anche questo è quanto richiesto dal protocollo); questa
1408 è una delle tecniche possibili (è quella usata pure dal protocollo HTTP), ma
1409 ce ne possono essere altre, ad esempio FTP marca la conclusione di un blocco
1410 di dati con la sequenza ASCII \verb|\r\n| (carriage return e line feed),
1411 mentre il DNS mette la lunghezza in testa ad ogni blocco che trasmette. Il
1412 punto essenziale è che TCP non provvede nessuna indicazione che permetta di
1413 marcare dei blocchi di dati, per cui se questo è necessario deve provvedere il
1416 Se abilitiamo il servizio \textit{daytime}\footnote{in genere questo viene
1417 fornito direttamente dal \textsl{superdemone} \cmd{inetd}, pertanto basta
1418 assicurarsi che esso sia abilitato nel relativo file di configurazione.}
1419 possiamo verificare il funzionamento del nostro client, avremo allora:
1421 [piccardi@gont sources]$ ./daytime 127.0.0.1
1422 Mon Apr 21 20:46:11 2003
1424 e come si vede tutto funziona regolarmente.
1427 \subsection{Un server \textit{daytime} iterativo}
1428 \label{sec:TCP_daytime_iter_server}
1430 Dopo aver illustrato il client daremo anche un esempio di un server
1431 elementare, che sia anche in grado di rispondere al precedente client. Come
1432 primo esempio realizzeremo un server iterativo, in grado di fornire una sola
1433 risposta alla volta. Il codice del programma è nuovamente mostrato in
1434 fig.~\ref{fig:TCP_daytime_iter_server_code}, il sorgente completo
1435 (\texttt{TCP\_iter\_daytimed.c}) è allegato insieme agli altri file degli
1438 \begin{figure}[!htbp]
1439 \footnotesize \centering
1440 \begin{minipage}[c]{15cm}
1441 \includecodesample{listati/TCP_iter_daytimed.c}
1444 \caption{Esempio di codice di un semplice server per il servizio daytime.}
1445 \label{fig:TCP_daytime_iter_server_code}
1448 Come per il client si includono (\texttt{\small 1--9}) gli header necessari a
1449 cui è aggiunto quello per trattare i tempi, e si definiscono (\texttt{\small
1450 14--18}) alcune costanti e le variabili necessarie in seguito. Come nel caso
1451 precedente si sono omesse le parti relative al trattamento delle opzioni da
1454 La creazione del socket (\texttt{\small 20--24}) è analoga al caso precedente,
1455 come pure l'inizializzazione (\texttt{\small 25--29}) della struttura
1456 \struct{sockaddr\_in}. Anche in questo caso (\texttt{\small 28}) si usa la
1457 porta standard del servizio daytime, ma come indirizzo IP si usa
1458 (\texttt{\small 27}) il valore predefinito \const{INET\_ANY}, che corrisponde
1459 all'indirizzo generico.
1461 Si effettua poi (\texttt{\small 30--34}) la chiamata alla funzione \func{bind}
1462 che permette di associare la precedente struttura al socket, in modo che
1463 quest'ultimo possa essere usato per accettare connessioni su una qualunque
1464 delle interfacce di rete locali. In caso di errore si stampa (\texttt{\small
1465 31}) un messaggio, e si termina (\texttt{\small 32}) immediatamente il
1468 Il passo successivo (\texttt{\small 35--39}) è quello di mettere ``\textsl{in
1469 ascolto}'' il socket; questo viene fatto (\texttt{\small 36}) con la
1470 funzione \func{listen} che dice al kernel di accettare connessioni per il
1471 socket che abbiamo creato; la funzione indica inoltre, con il secondo
1472 argomento, il numero massimo di connessioni che il kernel accetterà di mettere
1473 in coda per il suddetto socket. Di nuovo in caso di errore si stampa
1474 (\texttt{\small 37}) un messaggio, e si esce (\texttt{\small 38})
1477 La chiamata a \func{listen} completa la preparazione del socket per l'ascolto
1478 (che viene chiamato anche \textit{listening descriptor}) a questo punto si può
1479 procedere con il ciclo principale (\texttt{\small 40--53}) che viene eseguito
1480 indefinitamente. Il primo passo (\texttt{\small 42}) è porsi in attesa di
1481 connessioni con la chiamata alla funzione \func{accept}, come in precedenza in
1482 caso di errore si stampa (\texttt{\small 43}) un messaggio, e si esce
1483 (\texttt{\small 44}).
1485 Il processo resterà in stato di \textit{sleep} fin quando non arriva e viene
1486 accettata una connessione da un client; quando questo avviene \func{accept}
1487 ritorna, restituendo un secondo descrittore, che viene chiamato
1488 \textit{connected descriptor}, e che è quello che verrà usato dalla successiva
1489 chiamata alla \func{write} per scrivere la risposta al client.
1491 Il ciclo quindi proseguirà determinando (\texttt{\small 46}) il tempo corrente
1492 con una chiamata a \texttt{time}, con il quale si potrà opportunamente
1493 costruire (\texttt{\small 47}) la stringa con la data da trasmettere
1494 (\texttt{\small 48}) con la chiamata a \func{write}. Completata la
1495 trasmissione il nuovo socket viene chiuso (\texttt{\small 52}). A questo
1496 punto il ciclo si chiude ricominciando da capo in modo da poter ripetere
1497 l'invio della data in risposta ad una successiva connessione.
1499 È importante notare che questo server è estremamente elementare, infatti, a
1500 parte il fatto di poter essere usato solo con indirizzi IPv4, esso è in grado
1501 di rispondere ad un solo un client alla volta: è cioè, come dicevamo, un
1502 \textsl{server iterativo}. Inoltre è scritto per essere lanciato da linea di
1503 comando, se lo si volesse utilizzare come demone occorrerebbero le opportune
1504 modifiche\footnote{come una chiamata a \func{daemon} prima dell'inizio del
1505 ciclo principale.} per tener conto di quanto illustrato in
1506 sez.~\ref{sec:sess_daemon}. Si noti anche che non si è inserita nessuna forma
1507 di gestione della terminazione del processo, dato che tutti i file descriptor
1508 vengono chiusi automaticamente alla sua uscita, e che, non generando figli,
1509 non è necessario preoccuparsi di gestire la loro terminazione.
1512 \subsection{Un server \textit{daytime} concorrente}
1513 \label{sec:TCP_daytime_cunc_server}
1515 Il server \texttt{daytime} dell'esempio in
1516 sez.~\ref{sec:TCP_daytime_iter_server} è un tipico esempio di server iterativo,
1517 in cui viene servita una richiesta alla volta; in generale però, specie se il
1518 servizio è più complesso e comporta uno scambio di dati più sostanzioso di
1519 quello in questione, non è opportuno bloccare un server nel servizio di un
1520 client per volta; per questo si ricorre alle capacità di multitasking del
1523 Come accennato anche in sez.~\ref{sec:proc_gen} una delle modalità più comuni
1524 di funzionamento da parte dei server è quella di usare la funzione \func{fork}
1525 per creare, ad ogni richiesta da parte di un client, un processo figlio che si
1526 incarichi della gestione della comunicazione. Si è allora riscritto il server
1527 \textit{daytime} dell'esempio precedente in forma concorrente, inserendo anche
1528 una opzione per la stampa degli indirizzi delle connessioni ricevute.
1530 In fig.~\ref{fig:TCP_daytime_cunc_server_code} è mostrato un estratto del
1531 codice, in cui si sono tralasciati il trattamento delle opzioni e le parti
1532 rimaste invariate rispetto al precedente esempio (cioè tutta la parte
1533 riguardante l'apertura passiva del socket). Al solito il sorgente completo del
1534 server, nel file \texttt{TCP\_cunc\_daytimed.c}, è allegato insieme ai
1535 sorgenti degli altri esempi.
1537 \begin{figure}[!htb]
1538 \footnotesize \centering
1539 \begin{minipage}[c]{15cm}
1540 \includecodesample{listati/TCP_cunc_daytimed.c}
1543 \caption{Esempio di codice di un server concorrente elementare per il
1545 \label{fig:TCP_daytime_cunc_server_code}
1548 Stavolta (\texttt{\small 21--26}) la funzione \func{accept} è chiamata
1549 fornendo una struttura di indirizzi in cui saranno ritornati l'indirizzo IP e
1550 la porta da cui il client effettua la connessione, che in un secondo tempo,
1551 (\texttt{\small 40--44}), se il logging è abilitato, stamperemo sullo standard
1554 Quando \func{accept} ritorna il server chiama la funzione \func{fork}
1555 (\texttt{\small 27--31}) per creare il processo figlio che effettuerà
1556 (\texttt{\small 32--46}) tutte le operazioni relative a quella connessione,
1557 mentre il padre proseguirà l'esecuzione del ciclo principale in attesa di
1558 ulteriori connessioni.
1560 Si noti come il figlio operi solo sul socket connesso, chiudendo
1561 immediatamente (\texttt{\small 33}) il socket \var{list\_fd}; mentre il padre
1562 continua ad operare solo sul socket in ascolto chiudendo (\texttt{\small 48})
1563 \var{conn\_fd} al ritorno dalla \func{fork}. Per quanto abbiamo detto in
1564 sez.~\ref{sec:TCP_func_close} nessuna delle due chiamate a \func{close} causa
1565 l'innesco della sequenza di chiusura perché il numero di riferimenti al file
1566 descriptor non si è annullato.
1568 Infatti subito dopo la creazione del socket \var{list\_fd} ha una referenza, e
1569 lo stesso vale per \var{conn\_fd} dopo il ritorno di \func{accept}, ma dopo la
1570 \func{fork} i descrittori vengono duplicati nel padre e nel figlio per cui
1571 entrambi i socket si trovano con due referenze. Questo fa si che quando il
1572 padre chiude \var{sock\_fd} esso resta con una referenza da parte del figlio,
1573 e sarà definitivamente chiuso solo quando quest'ultimo, dopo aver completato
1574 le sue operazioni, chiamerà (\texttt{\small 45}) la funzione \func{close}.
1576 In realtà per il figlio non sarebbe necessaria nessuna chiamata a
1577 \func{close}, in quanto con la \func{exit} finale (\texttt{\small 45}) tutti i
1578 file descriptor, quindi anche quelli associati ai socket, vengono
1579 automaticamente chiusi. Tuttavia si è preferito effettuare esplicitamente le
1580 chiusure per avere una maggiore chiarezza del codice, e per evitare eventuali
1581 errori, prevenendo ad esempio un uso involontario del \textit{listening
1584 Si noti invece come sia essenziale che il padre chiuda ogni volta il socket
1585 connesso dopo la \func{fork}; se così non fosse nessuno di questi socket
1586 sarebbe effettivamente chiuso dato che alla chiusura da parte del figlio
1587 resterebbe ancora un riferimento nel padre. Si avrebbero così due effetti: il
1588 padre potrebbe esaurire i descrittori disponibili (che sono un numero limitato
1589 per ogni processo) e soprattutto nessuna delle connessioni con i client
1592 Come per ogni server iterativo il lavoro di risposta viene eseguito
1593 interamente dal processo figlio. Questo si incarica (\texttt{\small 34}) di
1594 chiamare \func{time} per leggere il tempo corrente, e di stamparlo
1595 (\texttt{\small 35}) sulla stringa contenuta in \var{buffer} con l'uso di
1596 \func{snprintf} e \func{ctime}. Poi la stringa viene scritta (\texttt{\small
1597 36--39}) sul socket, controllando che non ci siano errori. Anche in questo
1598 caso si è evitato il ricorso a \func{FullWrite} in quanto la stringa è
1599 estremamente breve e verrà senz'altro scritta in un singolo segmento.
1601 Inoltre nel caso sia stato abilitato il \textit{logging} delle connessioni, si
1602 provvede anche (\texttt{\small 40--43}) a stampare sullo standard output
1603 l'indirizzo e la porta da cui il client ha effettuato la connessione, usando i
1604 valori contenuti nelle strutture restituite da \func{accept}, eseguendo le
1605 opportune conversioni con \func{inet\_ntop} e \func{ntohs}.
1607 Ancora una volta l'esempio è estremamente semplificato, si noti come di nuovo
1608 non si sia gestita né la terminazione del processo né il suo uso come demone,
1609 che tra l'altro sarebbe stato incompatibile con l'uso della opzione di logging
1610 che stampa gli indirizzi delle connessioni sullo standard output. Un altro
1611 aspetto tralasciato è la gestione della terminazione dei processi figli,
1612 torneremo su questo più avanti quando tratteremo alcuni esempi di server più
1617 \section{Un esempio più completo: il servizio \textit{echo}}
1618 \label{sec:TCP_echo_application}
1620 L'esempio precedente, basato sul servizio \textit{daytime}, è un esempio molto
1621 elementare, in cui il flusso dei dati va solo nella direzione dal server al
1622 client. In questa sezione esamineremo un esempio di applicazione client/server
1623 un po' più complessa, che usi i socket TCP per una comunicazione in entrambe
1626 Ci limiteremo a fornire una implementazione elementare, che usi solo le
1627 funzioni di base viste finora, ma prenderemo in esame, oltre al comportamento
1628 in condizioni normali, anche tutti i possibili scenari particolari (errori,
1629 sconnessione della rete, crash del client o del server durante la connessione)
1630 che possono avere luogo durante l'impiego di un'applicazione di rete, partendo
1631 da una versione primitiva che dovrà essere rimaneggiata di volta in volta per
1632 poter tenere conto di tutte le evenienze che si possono manifestare nella vita
1633 reale di un'applicazione di rete, fino ad arrivare ad un'implementazione
1637 \subsection{Il servizio \textit{echo}}
1638 \label{sec:TCP_echo}
1641 Nella ricerca di un servizio che potesse fare da esempio per una comunicazione
1642 bidirezionale, si è deciso, seguendo la scelta di Stevens in \cite{UNP1}, di
1643 usare il servizio \textit{echo}, che si limita a restituire in uscita quanto
1644 immesso in ingresso. Infatti, nonostante la sua estrema semplicità, questo
1645 servizio costituisce il prototipo ideale per una generica applicazione di rete
1646 in cui un server risponde alle richieste di un client. Nel caso di una
1647 applicazione più complessa quello che si potrà avere in più è una elaborazione
1648 dell'input del client, che in molti casi viene interpretato come un comando,
1649 da parte di un server che risponde fornendo altri dati in uscita.
1651 Il servizio \textit{echo} è uno dei servizi standard solitamente provvisti
1652 direttamente dal superserver \cmd{inetd}, ed è definito
1653 dall'\href{http://www.ietf.org/rfc/rfc862.txt}{RFC~862}. Come dice il nome il
1654 servizio deve riscrivere indietro sul socket i dati che gli vengono inviati in
1655 ingresso. L'RFC descrive le specifiche del servizio sia per TCP che UDP, e per
1656 il primo stabilisce che una volta stabilita la connessione ogni dato in
1657 ingresso deve essere rimandato in uscita fintanto che il chiamante non ha
1658 chiude la connessione. Al servizio è assegnata la porta riservata 7.
1660 Nel nostro caso l'esempio sarà costituito da un client che legge una linea di
1661 caratteri dallo standard input e la scrive sul server. A sua volta il server
1662 leggerà la linea dalla connessione e la riscriverà immutata all'indietro. Sarà
1663 compito del client leggere la risposta del server e stamparla sullo standard
1667 \subsection{Il client \textit{echo}: prima versione}
1668 \label{sec:TCP_echo_client}
1670 Il codice della prima versione del client per il servizio \textit{echo},
1671 disponibile nel file \texttt{TCP\_echo\_first.c}, è riportato in
1672 fig.~\ref{fig:TCP_echo_client_1}. Esso ricalca la struttura del precedente
1673 client per il servizio \textit{daytime} (vedi
1674 sez.~\ref{sec:TCP_daytime_client}), e la prima parte (\texttt{\small 10--27})
1675 è sostanzialmente identica, a parte l'uso di una porta diversa.
1677 \begin{figure}[!htb]
1678 \footnotesize \centering
1679 \begin{minipage}[c]{15.6 cm}
1680 \includecodesample{listati/TCP_echo_first.c}
1683 \caption{Codice della prima versione del client \textit{echo}.}
1684 \label{fig:TCP_echo_client_1}
1687 Al solito si è tralasciata la sezione relativa alla gestione delle opzioni a
1688 riga di comando. Una volta dichiarate le variabili, si prosegue
1689 (\texttt{\small 10--13}) con della creazione del socket con l'usuale controllo
1690 degli errori, alla preparazione (\texttt{\small 14--17}) della struttura
1691 dell'indirizzo, che stavolta usa la porta 7 riservata al servizio
1692 \textit{echo}, infine si converte (\texttt{\small 18--22}) l'indirizzo
1693 specificato a riga di comando. A questo punto (\texttt{\small 23--27}) si può
1694 eseguire la connessione al server secondo la stessa modalità usata in
1695 sez.~\ref{sec:TCP_daytime_client}.
1697 Completata la connessione, per gestire il funzionamento del protocollo si usa
1698 la funzione \code{ClientEcho}, il cui codice si è riportato a parte in
1699 fig.~\ref{fig:TCP_client_echo_sub}. Questa si preoccupa di gestire tutta la
1700 comunicazione, leggendo una riga alla volta dallo standard input \file{stdin},
1701 scrivendola sul socket e ristampando su \file{stdout} quanto ricevuto in
1702 risposta dal server. Al ritorno dalla funzione (\texttt{\small 30--31}) anche
1703 il programma termina.
1705 La funzione \code{ClientEcho} utilizza due buffer (\texttt{\small 3}) per
1706 gestire i dati inviati e letti sul socket. La comunicazione viene gestita
1707 all'interno di un ciclo (\texttt{\small 5--10}), i dati da inviare sulla
1708 connessione vengono presi dallo \file{stdin} usando la funzione \func{fgets},
1709 che legge una linea di testo (terminata da un \texttt{CR} e fino al massimo di
1710 \const{MAXLINE} caratteri) e la salva sul buffer di invio.
1712 Si usa poi (\texttt{\small 6}) la funzione \func{FullWrite}, vista in
1713 sez.~\ref{sec:sock_io_behav}, per scrivere i dati sul socket, gestendo
1714 automaticamente l'invio multiplo qualora una singola \func{write} non sia
1715 sufficiente. I dati vengono riletti indietro (\texttt{\small 7}) con una
1716 \func{read}\footnote{si è fatta l'assunzione implicita che i dati siano
1717 contenuti tutti in un solo segmento, così che la chiamata a \func{read} li
1718 restituisca sempre tutti; avendo scelto una dimensione ridotta per il buffer
1719 questo sarà sempre vero, vedremo più avanti come superare il problema di
1720 rileggere indietro tutti e soli i dati disponibili, senza bloccarsi.} sul
1721 buffer di ricezione e viene inserita (\texttt{\small 8}) la terminazione della
1722 stringa e per poter usare (\texttt{\small 9}) la funzione \func{fputs} per
1723 scriverli su \file{stdout}.
1725 \begin{figure}[!htb]
1726 \footnotesize \centering
1727 \begin{minipage}[c]{15.6cm}
1728 \includecodesample{listati/ClientEcho_first.c}
1731 \caption{Codice della prima versione della funzione \texttt{ClientEcho} per
1732 la gestione del servizio \textit{echo}.}
1733 \label{fig:TCP_client_echo_sub}
1736 Quando si concluderà l'invio di dati mandando un end-of-file sullo standard
1737 input si avrà il ritorno di \func{fgets} con un puntatore nullo (si riveda
1738 quanto spiegato in sez.~\ref{sec:file_line_io}) e la conseguente uscita dal
1739 ciclo; al che la subroutine ritorna ed il nostro programma client termina.
1741 Si può effettuare una verifica del funzionamento del client abilitando il
1742 servizio \textit{echo} nella configurazione di \cmd{initd} sulla propria
1743 macchina ed usandolo direttamente verso di esso in locale, vedremo in
1744 dettaglio più avanti (in sez.~\ref{sec:TCP_echo_startup}) il funzionamento del
1745 programma, usato però con la nostra versione del server \textit{echo}, che
1746 illustriamo immediatamente.
1749 \subsection{Il server \textit{echo}: prima versione}
1750 \label{sec:TCPsimp_server_main}
1752 La prima versione del server, contenuta nel file \texttt{TCP\_echod\_first.c},
1753 è riportata in fig.~\ref{fig:TCP_echo_server_first_code}. Come abbiamo fatto
1754 per il client anche il server è stato diviso in un corpo principale,
1755 costituito dalla funzione \code{main}, che è molto simile a quello visto nel
1756 precedente esempio per il server del servizio \textit{daytime} di
1757 sez.~\ref{sec:TCP_daytime_cunc_server}, e da una funzione ausiliaria
1758 \code{ServEcho} che si cura della gestione del servizio.
1760 \begin{figure}[!htbp]
1761 \footnotesize \centering
1762 \begin{minipage}[c]{15.6cm}
1763 \includecodesample{listati/TCP_echod_first.c}
1766 \caption{Codice del corpo principale della prima versione del server
1767 per il servizio \textit{echo}.}
1768 \label{fig:TCP_echo_server_first_code}
1771 In questo caso però, rispetto a quanto visto nell'esempio di
1772 fig.~\ref{fig:TCP_daytime_cunc_server_code} si è preferito scrivere il server
1773 curando maggiormente alcuni dettagli, per tenere conto anche di alcune
1774 esigenze generali (che non riguardano direttamente la rete), come la
1775 possibilità di lanciare il server anche in modalità interattiva e la cessione
1776 dei privilegi di amministratore non appena questi non sono più necessari.
1778 La sezione iniziale del programma (\texttt{\small 8--21}) è la stessa del
1779 server di sez.~\ref{sec:TCP_daytime_cunc_server}, ed ivi descritta in
1780 dettaglio: crea il socket, inizializza l'indirizzo e esegue \func{bind}; dato
1781 che quest'ultima funzione viene usata su una porta riservata, il server dovrà
1782 essere eseguito da un processo con i privilegi di amministratore, pena il
1783 fallimento della chiamata.
1785 Una volta eseguita la funzione \func{bind} però i privilegi di amministratore
1786 non sono più necessari, per questo è sempre opportuno rilasciarli, in modo da
1787 evitare problemi in caso di eventuali vulnerabilità del server. Per questo
1788 prima (\texttt{\small 22--26}) si esegue \func{setgid} per assegnare il
1789 processo ad un gruppo senza privilegi,\footnote{si è usato il valore 65534,
1790 ovvero -1 per il formato \ctyp{short}, che di norma in tutte le
1791 distribuzioni viene usato per identificare il gruppo \texttt{nogroup} e
1792 l'utente \texttt{nobody}, usati appunto per eseguire programmi che non
1793 richiedono nessun privilegio particolare.} e poi si ripete (\texttt{\small
1794 27--30}) l'operazione usando \func{setuid} per cambiare anche
1795 l'utente.\footnote{si tenga presente che l'ordine in cui si eseguono queste
1796 due operazioni è importante, infatti solo avendo i privilegi di
1797 amministratore si può cambiare il gruppo di un processo ad un altro di cui
1798 non si fa parte, per cui chiamare prima \func{setuid} farebbe fallire una
1799 successiva chiamata a \func{setgid}. Inoltre si ricordi (si riveda quanto
1800 esposto in sez.~\ref{sec:proc_perms}) che usando queste due funzioni il
1801 rilascio dei privilegi è irreversibile.} Infine (\texttt{\small 30--36}),
1802 qualora sia impostata la variabile \var{demonize}, prima (\texttt{\small 31})
1803 si apre il sistema di logging per la stampa degli errori, e poi
1804 (\texttt{\small 32--35}) si invoca \func{daemon} per eseguire in background il
1805 processo come demone.
1807 A questo punto il programma riprende di nuovo lo schema già visto usato dal
1808 server per il servizio \textit{daytime}, con l'unica differenza della chiamata
1809 alla funzione \code{PrintErr}, riportata in fig.~\ref{fig:TCP_PrintErr}, al
1810 posto di \func{perror} per la stampa degli errori.
1812 Si inizia con il porre (\texttt{\small 37--41}) in ascolto il socket, e poi si
1813 esegue indefinitamente il ciclo principale (\texttt{\small 42--59}).
1814 All'interno di questo si ricevono (\texttt{\small 43--47}) le connessioni,
1815 creando (\texttt{\small 48--51}) un processo figlio per ciascuna di esse.
1816 Quest'ultimo (\texttt{\small 52--56}), chiuso (\texttt{\small 53}) il
1817 \textit{listening socket}, esegue (\texttt{\small 54}) la funzione di gestione
1818 del servizio \code{ServEcho}, ed al ritorno di questa esce (\texttt{\small
1821 Il padre invece si limita (\texttt{\small 57}) a chiudere il \textit{connected
1822 socket} per ricominciare da capo il ciclo in attesa di nuove connessioni. In
1823 questo modo si ha un server concorrente. La terminazione del padre non è
1824 gestita esplicitamente, e deve essere effettuata inviando un segnale al
1827 Avendo trattato direttamente la gestione del programma come demone, si è
1828 dovuto anche provvedere alla necessità di poter stampare eventuali messaggi di
1829 errore attraverso il sistema del \textit{syslog} trattato in
1830 sez.~\ref{sec:sess_daemon}. Come accennato questo è stato fatto utilizzando
1831 come \textit{wrapper} la funzione \code{PrintErr}, il cui codice è riportato
1832 in fig.~\ref{fig:TCP_PrintErr}.
1834 In essa ci si limita a controllare (\texttt{\small 2}) se è stato impostato
1835 (valore attivo per default) l'uso come demone, nel qual caso (\texttt{\small
1836 3}) si usa \func{syslog} (vedi sez.~\ref{sec:sess_daemon}) per stampare il
1837 messaggio di errore fornito come argomento sui log di sistema. Se invece si è
1838 in modalità interattiva (attivabile con l'opzione \texttt{-i}) si usa
1839 (\texttt{\small 5}) semplicemente la funzione \func{perror} per stampare sullo
1842 \begin{figure}[!htb]
1843 \footnotesize \centering
1844 \begin{minipage}[c]{15.6cm}
1845 \includecodesample{listati/PrintErr.c}
1848 \caption{Codice della funzione \code{PrintErr} per la
1849 generalizzazione della stampa degli errori sullo standard input o
1850 attraverso il \texttt{syslog}.}
1851 \label{fig:TCP_PrintErr}
1854 La gestione del servizio \textit{echo} viene effettuata interamente nella
1855 funzione \code{ServEcho}, il cui codice è mostrato in
1856 fig.~\ref{fig:TCP_ServEcho_first}, e la comunicazione viene gestita all'interno
1857 di un ciclo (\texttt{\small 6--13}). I dati inviati dal client vengono letti
1858 (\texttt{\small 6}) dal socket con una semplice \func{read}, di cui non si
1859 controlla lo stato di uscita, assumendo che ritorni solo in presenza di dati
1860 in arrivo. La riscrittura (\texttt{\small 7}) viene invece gestita dalla
1861 funzione \func{FullWrite} (descritta in fig.~\ref{fig:sock_FullWrite_code}) che
1862 si incarica di tenere conto automaticamente della possibilità che non tutti i
1863 dati di cui è richiesta la scrittura vengano trasmessi con una singola
1866 \begin{figure}[!htb]
1867 \footnotesize \centering
1868 \begin{minipage}[c]{15.6cm}
1869 \includecodesample{listati/ServEcho_first.c}
1872 \caption{Codice della prima versione della funzione \code{ServEcho} per la
1873 gestione del servizio \textit{echo}.}
1874 \label{fig:TCP_ServEcho_first}
1877 In caso di errore di scrittura (si ricordi che \func{FullWrite} restituisce un
1878 valore nullo in caso di successo) si provvede (\texttt{\small 8--10}) a
1879 stampare il relativo messaggio con \func{PrintErr}. Quando il client chiude
1880 la connessione il ricevimento del FIN fa ritornare la \func{read} con un
1881 numero di byte letti pari a zero, il che causa l'uscita dal ciclo e il ritorno
1882 (\texttt{\small 12}) della funzione, che a sua volta causa la terminazione del
1886 \subsection{L'avvio e il funzionamento normale}
1887 \label{sec:TCP_echo_startup}
1889 Benché il codice dell'esempio precedente sia molto ridotto, esso ci permetterà
1890 di considerare in dettaglio le varie problematiche che si possono incontrare
1891 nello scrivere un'applicazione di rete. Infatti attraverso l'esame delle sue
1892 modalità di funzionamento normali, all'avvio e alla terminazione, e di quello
1893 che avviene nelle varie situazioni limite, da una parte potremo approfondire
1894 la comprensione del protocollo TCP/IP e dall'altra ricavare le indicazioni
1895 necessarie per essere in grado di scrivere applicazioni robuste, in grado di
1896 gestire anche i casi limite.
1898 Il primo passo è compilare e lanciare il server (da root, per poter usare la
1899 porta 7 che è riservata), alla partenza esso eseguirà l'apertura passiva con
1900 la sequenza delle chiamate a \func{socket}, \func{bind}, \func{listen} e poi
1901 si bloccherà nella \func{accept}. A questo punto si potrà controllarne lo
1902 stato con \cmd{netstat}:
1904 [piccardi@roke piccardi]$ netstat -at
1905 Active Internet connections (servers and established)
1906 Proto Recv-Q Send-Q Local Address Foreign Address State
1908 tcp 0 0 *:echo *:* LISTEN
1911 che ci mostra come il socket sia in ascolto sulla porta richiesta, accettando
1912 connessioni da qualunque indirizzo e da qualunque porta e su qualunque
1915 A questo punto si può lanciare il client, esso chiamerà \func{socket} e
1916 \func{connect}; una volta completato il \itindex{three~way~handshake}
1917 \textit{three way handshake} la connessione è stabilita; la \func{connect}
1918 ritornerà nel client\footnote{si noti che è sempre la \func{connect} del
1919 client a ritornare per prima, in quanto questo avviene alla ricezione del
1920 secondo segmento (l'ACK del server) del \textit{three way handshake}, la
1921 \func{accept} del server ritorna solo dopo un altro mezzo RTT quando il
1922 terzo segmento (l'ACK del client) viene ricevuto.} e la \func{accept} nel
1923 server, ed usando di nuovo \cmd{netstat} otterremmo che:
1925 Active Internet connections (servers and established)
1926 Proto Recv-Q Send-Q Local Address Foreign Address State
1927 tcp 0 0 *:echo *:* LISTEN
1928 tcp 0 0 roke:echo gont:32981 ESTABLISHED
1930 mentre per quanto riguarda l'esecuzione dei programmi avremo che:
1932 \item il client chiama la funzione \code{ClientEcho} che si blocca sulla
1933 \func{fgets} dato che non si è ancora scritto nulla sul terminale.
1934 \item il server eseguirà una \func{fork} facendo chiamare al processo figlio
1935 la funzione \code{ServEcho}, quest'ultima si bloccherà sulla \func{read}
1936 dal socket sul quale ancora non sono presenti dati.
1937 \item il processo padre del server chiamerà di nuovo \func{accept}
1938 bloccandosi fino all'arrivo di un'altra connessione.
1940 e se usiamo il comando \cmd{ps} per esaminare lo stato dei processi otterremo
1941 un risultato del tipo:
1943 [piccardi@roke piccardi]$ ps ax
1944 PID TTY STAT TIME COMMAND
1946 2356 pts/0 S 0:00 ./echod
1947 2358 pts/1 S 0:00 ./echo 127.0.0.1
1948 2359 pts/0 S 0:00 ./echod
1950 (dove si sono cancellate le righe inutili) da cui si evidenzia la presenza di
1951 tre processi, tutti in stato di \textit{sleep} (vedi
1952 tab.~\ref{tab:proc_proc_states}).
1954 Se a questo punto si inizia a scrivere qualcosa sul client non sarà trasmesso
1955 niente fin tanto che non si prema il tasto di a capo (si ricordi quanto detto
1956 in sez.~\ref{sec:file_line_io} a proposito dell'I/O su terminale), solo allora
1957 \func{fgets} ritornerà ed il client scriverà quanto immesso sul socket, per
1958 poi passare a rileggere quanto gli viene inviato all'indietro dal server, che
1959 a sua volta sarà inviato sullo standard output, che nel caso ne provoca
1960 l'immediatamente stampa a video.
1963 \subsection{La conclusione normale}
1964 \label{sec:TCP_echo_conclusion}
1966 Tutto quello che scriveremo sul client sarà rimandato indietro dal server e
1967 ristampato a video fintanto che non concluderemo l'immissione dei dati; una
1968 sessione tipica sarà allora del tipo:
1970 [piccardi@roke sources]$ ./echo 127.0.0.1
1976 che termineremo inviando un EOF dal terminale (usando la combinazione di tasti
1977 ctrl-D, che non compare a schermo); se eseguiamo un \cmd{netstat} a questo
1980 [piccardi@roke piccardi]$ netstat -at
1981 tcp 0 0 *:echo *:* LISTEN
1982 tcp 0 0 localhost:33032 localhost:echo TIME_WAIT
1984 con il client che entra in \texttt{TIME\_WAIT}.
1986 Esaminiamo allora in dettaglio la sequenza di eventi che porta alla
1987 terminazione normale della connessione, che ci servirà poi da riferimento
1988 quando affronteremo il comportamento in caso di conclusioni anomale:
1991 \item inviando un carattere di EOF da terminale la \func{fgets} ritorna
1992 restituendo un puntatore nullo che causa l'uscita dal ciclo di \code{while},
1993 così la funzione \code{ClientEcho} ritorna.
1994 \item al ritorno di \code{ClientEcho} ritorna anche la funzione \code{main}, e
1995 come parte del processo terminazione tutti i file descriptor vengono chiusi
1996 (si ricordi quanto detto in sez.~\ref{sec:proc_term_conclusion}); questo
1997 causa la chiusura del socket di comunicazione; il client allora invierà un
1998 FIN al server a cui questo risponderà con un ACK. A questo punto il client
1999 verrà a trovarsi nello stato \texttt{FIN\_WAIT\_2} ed il server nello stato
2000 \texttt{CLOSE\_WAIT} (si riveda quanto spiegato in
2001 sez.~\ref{sec:TCP_conn_term}).
2002 \item quando il server riceve il FIN la \func{read} del processo figlio che
2003 gestisce la connessione ritorna restituendo 0 causando così l'uscita dal
2004 ciclo e il ritorno di \code{ServEcho}, a questo punto il processo figlio
2005 termina chiamando \func{exit}.
2006 \item all'uscita del figlio tutti i file descriptor vengono chiusi, la
2007 chiusura del socket connesso fa sì che venga effettuata la sequenza finale
2008 di chiusura della connessione, viene emesso un FIN dal server che riceverà
2009 un ACK dal client, a questo punto la connessione è conclusa e il client
2010 resta nello stato \texttt{TIME\_WAIT}.
2014 \subsection{La gestione dei processi figli}
2015 \label{sec:TCP_child_hand}
2017 Tutto questo riguarda la connessione, c'è però da tenere conto dell'effetto
2018 del procedimento di chiusura del processo figlio nel server (si veda quanto
2019 esaminato in sez.~\ref{sec:proc_termination}). In questo caso avremo l'invio
2020 del segnale \const{SIGCHLD} al padre, ma dato che non si è installato un
2021 gestore e che l'azione predefinita per questo segnale è quella di essere
2022 ignorato, non avendo predisposto la ricezione dello stato di terminazione,
2023 otterremo che il processo figlio entrerà nello stato di zombie\index{zombie}
2024 (si riveda quanto illustrato in sez.~\ref{sec:sig_sigchld}), come risulterà
2025 ripetendo il comando \cmd{ps}:
2027 2356 pts/0 S 0:00 ./echod
2028 2359 pts/0 Z 0:00 [echod <defunct>]
2031 Dato che non è il caso di lasciare processi zombie\index{zombie}, occorrerà
2032 ricevere opportunamente lo stato di terminazione del processo (si veda
2033 sez.~\ref{sec:proc_wait}), cosa che faremo utilizzando \const{SIGCHLD} secondo
2034 quanto illustrato in sez.~\ref{sec:sig_sigchld}. Una prima modifica al nostro
2035 server è pertanto quella di inserire la gestione della terminazione dei
2036 processi figli attraverso l'uso di un gestore. Per questo useremo la funzione
2037 \code{Signal} (che abbiamo illustrato in fig.~\ref{fig:sig_Signal_code}), per
2038 installare il gestore che riceve i segnali dei processi figli terminati già
2039 visto in fig.~\ref{fig:sig_sigchld_handl}. Basterà allora aggiungere il
2040 seguente codice: \includecodesnip{listati/sigchildhand.c}
2042 all'esempio illustrato in fig.~\ref{fig:TCP_echo_server_first_code}.
2044 In questo modo però si introduce un altro problema. Si ricordi infatti che,
2045 come spiegato in sez.~\ref{sec:sig_gen_beha}, quando un programma si trova in
2046 stato di \texttt{sleep} durante l'esecuzione di una system call, questa viene
2047 interrotta alla ricezione di un segnale. Per questo motivo, alla fine
2048 dell'esecuzione del gestore del segnale, se questo ritorna, il programma
2049 riprenderà l'esecuzione ritornando dalla system call interrotta con un errore
2052 Vediamo allora cosa comporta tutto questo nel nostro caso: quando si chiude il
2053 client, il processo figlio che gestisce la connessione terminerà, ed il padre,
2054 per evitare la creazione di zombie, riceverà il segnale \const{SIGCHLD}
2055 eseguendo il relativo gestore. Al ritorno del gestore però l'esecuzione nel
2056 padre ripartirà subito con il ritorno della funzione \func{accept} (a meno di
2057 un caso fortuito in cui il segnale arriva durante l'esecuzione del programma
2058 in risposta ad una connessione) con un errore di \errcode{EINTR}. Non avendo
2059 previsto questa eventualità il programma considera questo un errore fatale
2060 terminando a sua volta con un messaggio del tipo:
2062 [root@gont sources]# ./echod -i
2063 accept error: Interrupted system call
2066 Come accennato in sez.~\ref{sec:sig_gen_beha} le conseguenze di questo
2067 comportamento delle system call possono essere superate in due modi diversi,
2068 il più semplice è quello di modificare il codice di \func{Signal} per
2069 richiedere il riavvio automatico delle system call interrotte secondo la
2070 semantica di BSD, usando l'opzione \const{SA\_RESTART} di \func{sigaction};
2071 rispetto a quanto visto in fig.~\ref{fig:sig_Signal_code}. Definiremo allora la
2072 nuova funzione \func{SignalRestart}\footnote{anche questa è definita, insieme
2073 alle altre funzioni riguardanti la gestione dei segnali, nel file
2074 \file{SigHand.c}, il cui contento completo può essere trovato negli esempi
2075 allegati.} come mostrato in fig.~\ref{fig:sig_SignalRestart_code}, ed
2076 installeremo il gestore usando quest'ultima.
2078 \begin{figure}[!htb]
2079 \footnotesize \centering
2080 \begin{minipage}[c]{15.6cm}
2081 \includecodesample{listati/SignalRestart.c}
2084 \caption{La funzione \func{SignalRestart}, che installa un gestore di
2085 segnali in semantica BSD per il riavvio automatico delle system call
2087 \label{fig:sig_SignalRestart_code}
2090 Come si può notare questa funzione è identica alla precedente \func{Signal},
2091 illustrata in fig.~\ref{fig:sig_Signal_code}, solo che in questo caso invece di
2092 inizializzare a zero il campo \var{sa\_flags} di \struct{sigaction}, lo si
2093 inizializza (\texttt{\small 5}) al valore \const{SA\_RESTART}. Usando questa
2094 funzione al posto di \func{Signal} nel server non è necessaria nessuna altra
2095 modifica: le system call interrotte saranno automaticamente riavviate, e
2096 l'errore \errcode{EINTR} non si manifesterà più.
2098 La seconda soluzione è più invasiva e richiede di controllare tutte le volte
2099 l'errore restituito dalle varie system call, ripetendo la chiamata qualora
2100 questo corrisponda ad \errcode{EINTR}. Questa soluzione ha però il pregio
2101 della portabilità, infatti lo standard POSIX dice che la funzionalità di
2102 riavvio automatico delle system call, fornita da \const{SA\_RESTART}, è
2103 opzionale, per cui non è detto che essa sia disponibile su qualunque sistema.
2104 Inoltre in certi casi,\footnote{Stevens in \cite{UNP1} accenna che la maggior
2105 parte degli Unix derivati da BSD non fanno ripartire \func{select}; altri
2106 non riavviano neanche \func{accept} e \func{recvfrom}, cosa che invece nel
2107 caso di Linux viene sempre fatta.} anche quando questa è presente, non è
2108 detto possa essere usata con \func{accept}.
2111 La portabilità nella gestione dei segnali però viene al costo di una
2112 riscrittura parziale del server, la nuova versione di questo, in cui si sono
2113 introdotte una serie di nuove opzioni che ci saranno utili per il debug, è
2114 mostrata in fig.~\ref{fig:TCP_echo_server_code_second}, dove si sono riportate
2115 la sezioni di codice modificate nella seconda versione del programma, il
2116 codice completo di quest'ultimo si trova nel file
2117 \texttt{TCP\_echod\_second.c} dei sorgenti allegati alla guida.
2119 La prima modifica effettuata è stata quella di introdurre una nuova opzione a
2120 riga di comando, \texttt{-c}, che permette di richiedere il comportamento
2121 compatibile nella gestione di \const{SIGCHLD} al posto della semantica BSD
2122 impostando la variabile \var{compat} ad un valore non nullo. Questa è
2123 preimpostata al valore nullo, cosicché se non si usa questa opzione il
2124 comportamento di default del server è di usare la semantica BSD.
2126 Una seconda opzione aggiunta è quella di inserire un tempo di attesa fisso
2127 specificato in secondi fra il ritorno della funzione \func{listen} e la
2128 chiamata di \func{accept}, specificabile con l'opzione \texttt{-w}, che
2129 permette di impostare la variabile \var{waiting}. Infine si è introdotta una
2130 opzione \texttt{-d} per abilitare il debugging che imposta ad un valore non
2131 nullo la variabile \var{debugging}. Al solito si è omessa da
2132 fig.~\ref{fig:TCP_echo_server_code_second} la sezione di codice relativa alla
2133 gestione di tutte queste opzioni, che può essere trovata nel sorgente del
2136 \begin{figure}[!htb]
2137 \footnotesize \centering
2138 \begin{minipage}[c]{15.6cm}
2139 \includecodesample{listati/TCP_echod_second.c}
2142 \caption{La sezione nel codice della seconda versione del server
2143 per il servizio \textit{echo} modificata per tener conto dell'interruzione
2145 \label{fig:TCP_echo_server_code_second}
2148 Vediamo allora come è cambiato il nostro server; una volta definite le
2149 variabili e trattate le opzioni il primo passo (\texttt{\small 9--13}) è
2150 verificare la semantica scelta per la gestione di \const{SIGCHLD}, a seconda
2151 del valore di \var{compat} (\texttt{\small 9}) si installa il gestore con la
2152 funzione \func{Signal} (\texttt{\small 10}) o con \texttt{SignalRestart}
2153 (\texttt{\small 12}), essendo quest'ultimo il valore di default.
2155 Tutta la sezione seguente, che crea il socket, cede i privilegi di
2156 amministratore ed eventualmente lancia il programma come demone, è rimasta
2157 invariata e pertanto è stata omessa in
2158 fig.~\ref{fig:TCP_echo_server_code_second}; l'unica modifica effettuata prima
2159 dell'entrata nel ciclo principale è stata quella di aver introdotto, subito
2160 dopo la chiamata (\texttt{\small 17--20}) alla funzione \func{listen}, una
2161 eventuale pausa con una condizione (\texttt{\small 21}) sulla variabile
2162 \var{waiting}, che viene inizializzata, con l'opzione \texttt{-w Nsec}, al
2163 numero di secondi da aspettare (il valore preimpostato è nullo).
2165 Si è potuto lasciare inalterata tutta la sezione di creazione del socket
2166 perché nel server l'unica chiamata ad una system call lenta, che può essere
2167 interrotta dall'arrivo di \const{SIGCHLD}, è quella ad \func{accept}, che è
2168 l'unica funzione che può mettere il processo padre in stato di sleep nel
2169 periodo in cui un figlio può terminare; si noti infatti come le altre
2170 \index{system~call~lente} \textit{slow system call}\footnote{si ricordi la
2171 distinzione fatta in sez.~\ref{sec:sig_gen_beha}.} o sono chiamate prima di
2172 entrare nel ciclo principale, quando ancora non esistono processi figli, o
2173 sono chiamate dai figli stessi e non risentono di \const{SIGCHLD}.
2175 Per questo l'unica modifica sostanziale nel ciclo principale (\texttt{\small
2176 23--42}), rispetto precedente versione di fig.~\ref{fig:TCP_ServEcho_first},
2177 è nella sezione (\texttt{\small 25--31}) in cui si effettua la chiamata di
2178 \func{accept}. Quest'ultima viene effettuata (\texttt{\small 26--27})
2179 all'interno di un ciclo di \code{while}\footnote{la sintassi del C relativa a
2180 questo ciclo può non essere del tutto chiara. In questo caso infatti si è
2181 usato un ciclo vuoto che non esegue nessuna istruzione, in questo modo
2182 quello che viene ripetuto con il ciclo è soltanto il codice che esprime la
2183 condizione all'interno del \code{while}.} che la ripete indefinitamente
2184 qualora in caso di errore il valore di \var{errno} sia \errcode{EINTR}. Negli
2185 altri casi si esce in caso di errore effettivo (\texttt{\small 27--29}),
2186 altrimenti il programma prosegue.
2188 Si noti che in questa nuova versione si è aggiunta una ulteriore sezione
2189 (\texttt{\small 32--40}) di aiuto per il debug del programma, che eseguita con
2190 un controllo (\texttt{\small 33}) sul valore della variabile \var{debugging}
2191 impostato dall'opzione \texttt{-d}. Qualora questo sia nullo, come
2192 preimpostato, non accade nulla. altrimenti (\texttt{\small 33}) l'indirizzo
2193 ricevuto da \var{accept} viene convertito in una stringa che poi
2194 (\texttt{\small 34--39}) viene opportunamente stampata o sullo schermo o nei
2197 Infine come ulteriore miglioria si è perfezionata la funzione \code{ServEcho},
2198 sia per tenere conto della nuova funzionalità di debugging, che per effettuare
2199 un controllo in caso di errore; il codice della nuova versione è mostrato in
2200 fig.~\ref{fig:TCP_ServEcho_second}.
2202 \begin{figure}[!htb]
2203 \footnotesize \centering
2204 \begin{minipage}[c]{15.6cm}
2205 \includecodesample{listati/ServEcho_second.c}
2208 \caption{Codice della seconda versione della funzione \code{ServEcho} per la
2209 gestione del servizio \textit{echo}.}
2210 \label{fig:TCP_ServEcho_second}
2213 Rispetto alla precedente versione di fig.~\ref{fig:TCP_ServEcho_first} in
2214 questo caso si è provveduto a controllare (\texttt{\small 7--10}) il valore di
2215 ritorno di \func{read} per rilevare un eventuale errore, in modo da stampare
2216 (\texttt{\small 8}) un messaggio di errore e ritornare (\texttt{\small 9})
2217 concludendo la connessione.
2219 Inoltre qualora sia stata attivata la funzionalità di debug (avvalorando
2220 \var{debugging} tramite l'apposita opzione \texttt{-d}) si provvederà a
2221 stampare (tenendo conto della modalità di invocazione del server, se
2222 interattiva o in forma di demone) il numero di byte e la stringa letta dal
2223 client (\texttt{\small 16--24}).
2226 \section{I vari scenari critici}
2227 \label{sec:TCP_echo_critical}
2229 Con le modifiche viste in sez.~\ref{sec:TCP_child_hand} il nostro esempio
2230 diventa in grado di affrontare la gestione ordinaria delle connessioni, ma un
2231 server di rete deve tenere conto che, al contrario di quanto avviene per i
2232 server che operano nei confronti di processi presenti sulla stessa macchina,
2233 la rete è di sua natura inaffidabile, per cui è necessario essere in grado di
2234 gestire tutta una serie di situazioni critiche che non esistono per i processi
2238 \subsection{La terminazione precoce della connessione}
2239 \label{sec:TCP_conn_early_abort}
2241 La prima situazione critica è quella della terminazione precoce, causata da un
2242 qualche errore sulla rete, della connessione effettuata da un client. Come
2243 accennato in sez.~\ref{sec:TCP_func_accept} la funzione \func{accept} riporta
2244 tutti gli eventuali errori di rete pendenti su una connessione sul
2245 \textit{connected socket}. Di norma questo non è un problema, in quanto non
2246 appena completata la connessione, \func{accept} ritorna e l'errore sarà
2247 rilevato in seguito, dal processo che gestisce la connessione, alla prima
2248 chiamata di una funzione che opera sul socket.
2250 È però possibile, dal punto di vista teorico, incorrere anche in uno scenario
2251 del tipo di quello mostrato in fig.~\ref{fig:TCP_early_abort}, in cui la
2252 connessione viene abortita sul lato client per un qualche errore di rete con
2253 l'invio di un segmento RST, prima che nel server sia stata chiamata la
2254 funzione \func{accept}.
2258 \includegraphics[width=10cm]{img/tcp_client_early_abort}
2259 \caption{Un possibile caso di terminazione precoce della connessione.}
2260 \label{fig:TCP_early_abort}
2263 Benché questo non sia un fatto comune, un evento simile può essere osservato
2264 con dei server molto occupati. In tal caso, con una struttura del server
2265 simile a quella del nostro esempio, in cui la gestione delle singole
2266 connessioni è demandata a processi figli, può accadere che il \textit{three
2267 way handshake}\itindex{three~way~handshake} venga completato e la relativa
2268 connessione abortita subito dopo, prima che il padre, per via del carico della
2269 macchina, abbia fatto in tempo ad eseguire la chiamata ad \func{accept}. Di
2270 nuovo si ha una situazione analoga a quella illustrata in
2271 fig.~\ref{fig:TCP_early_abort}, in cui la connessione viene stabilita, ma
2272 subito dopo si ha una condizione di errore che la chiude prima che essa sia
2273 stata accettata dal programma.
2275 Questo significa che, oltre alla interruzione da parte di un segnale, che
2276 abbiamo trattato in sez.~\ref{sec:TCP_child_hand} nel caso particolare di
2277 \const{SIGCHLD}, si possono ricevere altri errori non fatali all'uscita di
2278 \func{accept}, che come nel caso precedente, necessitano semplicemente la
2279 ripetizione della chiamata senza che si debba uscire dal programma. In questo
2280 caso anche la versione modificata del nostro server non sarebbe adatta, in
2281 quanto uno di questi errori causerebbe la terminazione dello stesso. In Linux
2282 i possibili errori di rete non fatali, riportati sul socket connesso al
2283 ritorno di \func{accept}, sono \errcode{ENETDOWN}, \errcode{EPROTO},
2284 \errcode{ENOPROTOOPT}, \errcode{EHOSTDOWN}, \errcode{ENONET},
2285 \errcode{EHOSTUNREACH}, \errcode{EOPNOTSUPP} e \errcode{ENETUNREACH}.
2287 Si tenga presente che questo tipo di terminazione non è riproducibile
2288 terminando il client prima della chiamata ad \func{accept}, come si potrebbe
2289 fare usando l'opzione \texttt{-w} per introdurre una pausa dopo il lancio del
2290 demone, in modo da poter avere il tempo per lanciare e terminare una
2291 connessione usando il programma client. In tal caso infatti, alla terminazione
2292 del client, il socket associato alla connessione viene semplicemente chiuso,
2293 attraverso la sequenza vista in sez.~\ref{sec:TCP_conn_term}, per cui la
2294 \func{accept} ritornerà senza errori, e si avrà semplicemente un end-of-file
2295 al primo accesso al socket. Nel caso di Linux inoltre, anche qualora si
2296 modifichi il client per fargli gestire l'invio di un segmento di RST alla
2297 chiusura dal socket (usando l'opzione \const{SO\_LINGER}, vedi
2298 sez.~\ref{sec:sock_options_main}), non si ha nessun errore al ritorno di
2299 \func{accept}, quanto un errore di \errcode{ECONNRESET} al primo tentativo di
2304 \subsection{La terminazione precoce del server}
2305 \label{sec:TCP_server_crash}
2307 Un secondo caso critico è quello in cui si ha una terminazione precoce del
2308 server, ad esempio perché il programma ha un crash. In tal caso si suppone che
2309 il processo termini per un errore fatale, cosa che potremo simulare
2310 inviandogli un segnale di terminazione. La conclusione del processo comporta
2311 la chiusura di tutti i file descriptor aperti, compresi tutti i socket
2312 relativi a connessioni stabilite; questo significa che al momento del crollo
2313 del servizio il client riceverà un FIN dal server in corrispondenza della
2314 chiusura del socket.
2316 Vediamo allora cosa succede nel nostro caso, facciamo partire una connessione
2317 con il server e scriviamo una prima riga, poi terminiamo il server con un
2318 \texttt{C-c}. A questo punto scriviamo una seconda riga e poi un'altra riga
2319 ancora. Il risultato finale della sessione è il seguente:
2321 [piccardi@gont sources]$ ./echo 192.168.1.141
2324 Seconda riga dopo il C-c
2326 [piccardi@gont sources]$
2329 Come si vede il nostro client, nonostante la connessione sia stata interrotta
2330 prima dell'invio della seconda riga, non solo accetta di inviarla, ma prende
2331 anche un'altra riga prima di terminare senza riportare nessun
2334 Per capire meglio cosa è successo conviene analizzare il flusso dei pacchetti
2335 utilizzando un analizzatore di traffico come \cmd{tcpdump}. Il comando
2336 permette di selezionare, nel traffico di rete generato su una macchina, i
2337 pacchetti che interessano, stampando a video (o salvando su disco) il loro
2338 contenuto. Non staremo qui ad entrare nei dettagli dell'uso del programma, che
2339 sono spiegati dalla pagina di manuale; per l'uso che vogliamo farne quello che
2340 ci interessa è, posizionandosi sulla macchina che fa da client, selezionare
2341 tutti i pacchetti che sono diretti o provengono dalla macchina che fa da
2342 server. In questo modo (posto che non ci siano altre connessioni col server,
2343 cosa che avremo cura di evitare) tutti i pacchetti rilevati apparterranno alla
2344 nostra sessione di interrogazione del servizio.
2346 Il comando \cmd{tcpdump} permette selezioni molto complesse, basate sulle
2347 interfacce su cui passano i pacchetti, sugli indirizzi IP, sulle porte, sulle
2348 caratteristiche ed il contenuto dei pacchetti stessi, inoltre permette di
2349 combinare fra loro diversi criteri di selezione con degli operatori logici;
2350 quando un pacchetto che corrisponde ai criteri di selezione scelti viene
2351 rilevato i suoi dati vengono stampati sullo schermo (anche questi secondo un
2352 formato configurabile in maniera molto precisa).
2354 Lanciando il comando prima di ripetere la sessione di lavoro mostrata
2355 nell'esempio precedente potremo allora catturare tutti pacchetti scambiati fra
2356 il client ed il server; i risultati\footnote{in realtà si è ridotta la
2357 lunghezza dell'output rispetto al reale tagliando alcuni dati non necessari
2358 alla comprensione del flusso.} prodotti in questa occasione da \cmd{tcpdump}
2359 sono allora i seguenti:
2361 [root@gont gapil]# tcpdump src 192.168.1.141 or dst 192.168.1.141 -N -t
2362 tcpdump: listening on eth0
2363 gont.34559 > anarres.echo: S 800922320:800922320(0) win 5840
2364 anarres.echo > gont.34559: S 511689719:511689719(0) ack 800922321 win 5792
2365 gont.34559 > anarres.echo: . ack 1 win 5840
2366 gont.34559 > anarres.echo: P 1:12(11) ack 1 win 5840
2367 anarres.echo > gont.34559: . ack 12 win 5792
2368 anarres.echo > gont.34559: P 1:12(11) ack 12 win 5792
2369 gont.34559 > anarres.echo: . ack 12 win 5840
2370 anarres.echo > gont.34559: F 12:12(0) ack 12 win 5792
2371 gont.34559 > anarres.echo: . ack 13 win 5840
2372 gont.34559 > anarres.echo: P 12:37(25) ack 13 win 5840
2373 anarres.echo > gont.34559: R 511689732:511689732(0) win 0
2376 Le prime tre righe vengono prodotte al momento in cui lanciamo il nostro
2377 client, e corrispondono ai tre pacchetti del
2378 \itindex{three~way~handshake}\textit{three way handshake}. L'output del
2379 comando riporta anche i numeri di sequenza iniziali, mentre la lettera
2380 \texttt{S} indica che per quel pacchetto si aveva il SYN flag attivo. Si noti
2381 come a partire dal secondo pacchetto sia sempre attivo il campo \texttt{ack},
2382 seguito dal numero di sequenza per il quale si da il ricevuto; quest'ultimo, a
2383 partire dal terzo pacchetto, viene espresso in forma relativa per maggiore
2384 compattezza. Il campo \texttt{win} in ogni riga indica la \textit{advertising
2385 window} di cui parlavamo in sez.~\ref{sec:TCP_TCP_opt}. Allora si può
2386 verificare dall'output del comando come venga appunto realizzata la sequenza
2387 di pacchetti descritta in sez.~\ref{sec:TCP_conn_cre}: prima viene inviato dal
2388 client un primo pacchetto con il SYN che inizia la connessione, a cui il
2389 server risponde dando il ricevuto con un secondo pacchetto, che a sua volta
2390 porta un SYN, cui il client risponde con un il terzo pacchetto di ricevuto.
2392 Ritorniamo allora alla nostra sessione con il servizio echo: dopo le tre righe
2393 del \textit{three way handshake}\itindex{three~way~handshake} non avremo nulla
2394 fin tanto che non scriveremo una prima riga sul client; al momento in cui
2395 facciamo questo si genera una sequenza di altri quattro pacchetti. Il primo,
2396 dal client al server, contraddistinto da una lettera \texttt{P} che significa
2397 che il flag PSH è impostato, contiene la nostra riga (che è appunto di 11
2398 caratteri), e ad esso il server risponde immediatamente con un pacchetto vuoto
2399 di ricevuto. Poi tocca al server riscrivere indietro quanto gli è stato
2400 inviato, per cui sarà lui a mandare indietro un terzo pacchetto con lo stesso
2401 contenuto appena ricevuto, e a sua volta riceverà dal client un ACK nel quarto
2402 pacchetto. Questo causerà la ricezione dell'eco nel client che lo stamperà a
2405 A questo punto noi procediamo ad interrompere l'esecuzione del server con un
2406 \texttt{C-c} (cioè con l'invio di \const{SIGTERM}): nel momento in cui
2407 facciamo questo vengono immediatamente generati altri due pacchetti. La
2408 terminazione del processo infatti comporta la chiusura di tutti i suoi file
2409 descriptor, il che comporta, per il socket che avevamo aperto, l'inizio della
2410 sequenza di chiusura illustrata in sez.~\ref{sec:TCP_conn_term}. Questo
2411 significa che dal server partirà un FIN, che è appunto il primo dei due
2412 pacchetti, contraddistinto dalla lettera \texttt{F}, cui seguirà al solito un
2413 ACK da parte del client.
2415 A questo punto la connessione dalla parte del server è chiusa, ed infatti se
2416 usiamo \cmd{netstat} per controllarne lo stato otterremo che sul server si ha:
2418 anarres:/home/piccardi# netstat -ant
2419 Active Internet connections (servers and established)
2420 Proto Recv-Q Send-Q Local Address Foreign Address State
2421 ... ... ... ... ... ...
2422 tcp 0 0 192.168.1.141:7 192.168.1.2:34626 FIN_WAIT2
2424 cioè essa è andata nello stato \texttt{FIN\_WAIT2}, che indica l'avvenuta
2425 emissione del segmento FIN, mentre sul client otterremo che essa è andata
2426 nello stato \texttt{CLOSE\_WAIT}:
2428 [root@gont gapil]# netstat -ant
2429 Active Internet connections (servers and established)
2430 Proto Recv-Q Send-Q Local Address Foreign Address State
2431 ... ... ... ... ... ...
2432 tcp 1 0 192.168.1.2:34582 192.168.1.141:7 CLOSE_WAIT
2435 Il problema è che in questo momento il client è bloccato dentro la funzione
2436 \texttt{ClientEcho} nella chiamata a \func{fgets}, e sta attendendo dell'input
2437 dal terminale, per cui non è in grado di accorgersi di nulla. Solo quando
2438 inseriremo la seconda riga il comando uscirà da \func{fgets} e proverà a
2439 scriverla sul socket. Questo comporta la generazione degli ultimi due
2440 pacchetti riportati da \cmd{tcpdump}: il primo, inviato dal client contenente
2441 i 25 caratteri della riga appena letta, e ad esso la macchina server
2442 risponderà, non essendoci più niente in ascolto sulla porta 7, con un segmento
2443 di RST, contraddistinto dalla lettera \texttt{R}, che causa la conclusione
2444 definitiva della connessione anche nel client, dove non comparirà più
2445 nell'output di \cmd{netstat}.
2447 Come abbiamo accennato in sez.~\ref{sec:TCP_conn_term} e come vedremo più
2448 avanti in sez.~\ref{sec:TCP_shutdown} la chiusura di un solo capo di un socket
2449 è una operazione lecita, per cui la nostra scrittura avrà comunque successo
2450 (come si può constatare lanciando usando \cmd{strace}\footnote{il comando
2451 \cmd{strace} è un comando di debug molto utile che prende come argomento un
2452 altro comando e ne stampa a video tutte le invocazioni di una system call,
2453 coi relativi argomenti e valori di ritorno, per cui usandolo in questo
2454 contesto potremo verificare che effettivamente la \func{write} ha scritto la
2455 riga, che in effetti è stata pure trasmessa via rete.}), in quanto il nostro
2456 programma non ha a questo punto alcun modo di sapere che dall'altra parte non
2457 c'è più nessuno processo in grado di leggere quanto scriverà. Questo sarà
2458 chiaro solo dopo il tentativo di scrittura, e la ricezione del segmento RST di
2459 risposta che indica che dall'altra parte non si è semplicemente chiuso un capo
2460 del socket, ma è completamente terminato il programma.
2462 Per questo motivo il nostro client proseguirà leggendo dal socket, e dato che
2463 questo è stato chiuso avremo che, come spiegato in
2464 sez.~\ref{sec:TCP_conn_term}, la funzione \func{read} ritorna normalmente con
2465 un valore nullo. Questo comporta che la seguente chiamata a \func{fputs} non
2466 ha effetto (viene stampata una stringa nulla) ed il client si blocca di nuovo
2467 nella successiva chiamata a \func{fgets}. Per questo diventa possibile
2468 inserire una terza riga e solo dopo averlo fatto si avrà la terminazione del
2471 Per capire come questa avvenga comunque, non avendo inserito nel codice nessun
2472 controllo di errore, occorre ricordare che, a parte la bidirezionalità del
2473 flusso dei dati, dal punto di vista del funzionamento nei confronti delle
2474 funzioni di lettura e scrittura, i socket sono del tutto analoghi a delle
2475 pipe. Allora, da quanto illustrato in sez.~\ref{sec:ipc_pipes}, sappiamo che
2476 tutte le volte che si cerca di scrivere su una pipe il cui altro capo non è
2477 aperto il lettura il processo riceve un segnale di \const{SIGPIPE}, e questo è
2478 esattamente quello che avviene in questo caso, e siccome non abbiamo un
2479 gestore per questo segnale, viene eseguita l'azione preimpostata, che è quella
2480 di terminare il processo.
2482 Per gestire in maniera più corretta questo tipo di evento dovremo allora
2483 modificare il nostro client perché sia in grado di trattare le varie tipologie
2484 di errore, per questo dovremo riscrivere la funzione \func{ClientEcho}, in
2485 modo da controllare gli stati di uscita delle varie chiamate. Si è riportata
2486 la nuova versione della funzione in fig.~\ref{fig:TCP_ClientEcho_second}.
2488 \begin{figure}[!htb]
2489 \footnotesize \centering
2490 \begin{minipage}[c]{15.6cm}
2491 \includecodesample{listati/ClientEcho_second.c}
2494 \caption{La sezione nel codice della seconda versione della funzione
2495 \func{ClientEcho} usata dal client per il servizio \textit{echo}
2496 modificata per tener conto degli eventuali errori.}
2497 \label{fig:TCP_ClientEcho_second}
2500 Come si può vedere in questo caso si controlla il valore di ritorno di tutte
2501 le funzioni, ed inoltre si verifica la presenza di un eventuale end of file in
2502 caso di lettura. Con questa modifica il nostro client echo diventa in grado di
2503 accorgersi della chiusura del socket da parte del server, per cui ripetendo la
2504 sequenza di operazioni precedenti stavolta otterremo che:
2506 [piccardi@gont sources]$ ./echo 192.168.1.141
2509 Seconda riga dopo il C-c
2512 ma di nuovo si tenga presente che non c'è modo di accorgersi della chiusura
2513 del socket fin quando non si esegue la scrittura della seconda riga; il
2514 protocollo infatti prevede che ci debba essere una scrittura prima di ricevere
2515 un RST che confermi la chiusura del file, e solo alle successive scritture si
2516 potrà ottenere un errore.
2518 Questa caratteristica dei socket ci mette di fronte ad un altro problema
2519 relativo al nostro client, e che cioè esso non è in grado di accorgersi di
2520 nulla fintanto che è bloccato nella lettura del terminale fatta con
2521 \func{gets}. In questo caso il problema è minimo, ma esso riemergerà più
2522 avanti, ed è quello che si deve affrontare tutte le volte quando si ha a che
2523 fare con la necessità di lavorare con più descrittori, nel qual caso diventa
2524 si pone la questione di come fare a non restare bloccati su un socket quando
2525 altri potrebbero essere liberi. Vedremo come affrontare questa problematica in
2526 sez.~\ref{sec:TCP_sock_multiplexing}.
2529 \subsection{Altri scenari di terminazione della connessione}
2530 \label{sec:TCP_conn_crash}
2532 La terminazione del server è solo uno dei possibili scenari di terminazione
2533 della connessione, un altro caso è ad esempio quello in cui si ha un crollo
2534 della rete, cosa che potremo simulare facilmente staccando il cavo di rete.
2535 Un'altra condizione è quella di un blocco della macchina completo della su cui
2536 gira il server che deve essere riavviata, cosa che potremo simulare sia
2537 premendo il bottone di reset,\footnote{un normale shutdown non va bene; in tal
2538 caso infatti il sistema provvede a terminare tutti i processi, per cui la
2539 situazione sarebbe sostanzialmente identica alla precedente.} che, in
2540 maniera più gentile, riavviando la macchina dopo aver interrotto la
2541 connessione di rete.
2543 Cominciamo ad analizzare il primo caso, il crollo della rete. Ripetiamo la
2544 nostra sessione di lavoro precedente, lanciamo il client, scriviamo una prima
2545 riga, poi stacchiamo il cavo e scriviamo una seconda riga. Il risultato che
2548 [piccardi@gont sources]$ ./echo 192.168.1.141
2551 Seconda riga dopo l'interruzione
2552 Errore in lettura: No route to host
2555 Quello che succede in questo è che il programma, dopo aver scritto la seconda
2556 riga, resta bloccato per un tempo molto lungo, prima di dare l'errore
2557 \errcode{EHOSTUNREACH}. Se andiamo ad osservare con \cmd{strace} cosa accade
2558 nel periodo in cui il programma è bloccato vedremo che stavolta, a differenza
2559 del caso precedente, il programma è bloccato nella lettura dal socket.
2561 Se poi, come nel caso precedente, usiamo l'accortezza di analizzare il
2562 traffico di rete fra client e server con \cmd{tcpdump}, otterremo il seguente
2565 [root@gont sources]# tcpdump src 192.168.1.141 or dst 192.168.1.141 -N -t
2566 tcpdump: listening on eth0
2567 gont.34685 > anarres.echo: S 1943495663:1943495663(0) win 5840
2568 anarres.echo > gont.34685: S 1215783131:1215783131(0) ack 1943495664 win 5792
2569 gont.34685 > anarres.echo: . ack 1 win 5840
2570 gont.34685 > anarres.echo: P 1:12(11) ack 1 win 5840
2571 anarres.echo > gont.34685: . ack 12 win 5792
2572 anarres.echo > gont.34685: P 1:12(11) ack 12 win 5792
2573 gont.34685 > anarres.echo: . ack 12 win 5840
2574 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2575 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2576 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2577 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2578 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2579 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2580 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2581 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2582 gont.34685 > anarres.echo: P 12:45(33) ack 12 win 5840
2583 arp who-has anarres tell gont
2584 arp who-has anarres tell gont
2585 arp who-has anarres tell gont
2586 arp who-has anarres tell gont
2587 arp who-has anarres tell gont
2588 arp who-has anarres tell gont
2592 In questo caso l'andamento dei primi sette pacchetti è esattamente lo stesso
2593 di prima. Solo che stavolta, non appena inviata la seconda riga, il programma
2594 si bloccherà nella successiva chiamata a \func{read}, non ottenendo nessuna
2595 risposta. Quello che succede è che nel frattempo il kernel provvede, come
2596 richiesto dal protocollo TCP, a tentare la ritrasmissione della nostra riga un
2597 certo numero di volte, con tempi di attesa crescente fra un tentativo ed il
2598 successivo, per tentare di ristabilire la connessione.
2600 Il risultato finale qui dipende dall'implementazione dello stack TCP, e nel
2601 caso di Linux anche dall'impostazione di alcuni dei parametri di sistema che
2602 si trovano in \file{/proc/sys/net/ipv4}, che ne controllano il comportamento:
2603 in questo caso in particolare da \file{tcp\_retries2} (vedi
2604 sez.~\ref{sec:sock_sysctl}). Questo parametro infatti specifica il numero di
2605 volte che deve essere ritentata la ritrasmissione di un pacchetto nel mezzo di
2606 una connessione prima di riportare un errore di timeout. Il valore
2607 preimpostato è pari a 15, il che comporterebbe 15 tentativi di ritrasmissione,
2608 ma nel nostro caso le cose sono andate diversamente, dato che le
2609 ritrasmissioni registrate da \cmd{tcpdump} sono solo 8; inoltre l'errore
2610 riportato all'uscita del client non è stato \errcode{ETIMEDOUT}, come dovrebbe
2611 essere in questo caso, ma \errcode{EHOSTUNREACH}.
2613 Per capire l'accaduto continuiamo ad analizzare l'output di \cmd{tcpdump}:
2614 esso ci mostra che a un certo punto i tentativi di ritrasmissione del
2615 pacchetto sono cessati, per essere sostituiti da una serie di richieste di
2616 protocollo ARP in cui il client richiede l'indirizzo del server.
2618 Come abbiamo accennato in sez.~\ref{sec:net_tcpip_general} ARP è il protocollo
2619 che si incarica di trovare le corrispondenze fra indirizzo IP e indirizzo
2620 hardware sulla scheda di rete. È evidente allora che nel nostro caso, essendo
2621 client e server sulla stessa rete, è scaduta la voce nella \textit{ARP
2622 cache}\footnote{la \textit{ARP cache} è una tabella mantenuta internamente
2623 dal kernel che contiene tutte le corrispondenze fra indirizzi IP e indirizzi
2624 fisici, ottenute appunto attraverso il protocollo ARP; le voci della tabella
2625 hanno un tempo di vita limitato, passato il quale scadono e devono essere
2626 nuovamente richieste.} relativa ad \texttt{anarres}, ed il nostro client ha
2627 iniziato ad effettuare richieste ARP sulla rete per sapere l'IP di
2628 quest'ultimo, che essendo scollegato non poteva rispondere. Anche per questo
2629 tipo di richieste esiste un timeout, per cui dopo un certo numero di tentativi
2630 il meccanismo si è interrotto, e l'errore riportato al programma a questo
2631 punto è stato \errcode{EHOSTUNREACH}, in quanto non si era più in grado di
2632 contattare il server.
2634 Un altro errore possibile in questo tipo di situazione, che si può avere
2635 quando la macchina è su una rete remota, è \errcode{ENETUNREACH}; esso viene
2636 riportato alla ricezione di un pacchetto ICMP di \textit{destination
2637 unreachable} da parte del router che individua l'interruzione della
2638 connessione. Di nuovo anche qui il risultato finale dipende da quale è il
2639 meccanismo più veloce ad accorgersi del problema.
2641 Se però agiamo sui parametri del kernel, e scriviamo in \file{tcp\_retries2}
2642 un valore di tentativi più basso, possiamo evitare la scadenza della
2643 \textit{ARP cache} e vedere cosa succede. Così se ad esempio richiediamo 4
2644 tentativi di ritrasmissione, l'analisi di \cmd{tcpdump} ci riporterà il
2645 seguente scambio di pacchetti:
2647 [root@gont gapil]# tcpdump src 192.168.1.141 or dst 192.168.1.141 -N -t
2648 tcpdump: listening on eth0
2649 gont.34752 > anarres.echo: S 3646972152:3646972152(0) win 5840
2650 anarres.echo > gont.34752: S 2735190336:2735190336(0) ack 3646972153 win 5792
2651 gont.34752 > anarres.echo: . ack 1 win 5840
2652 gont.34752 > anarres.echo: P 1:12(11) ack 1 win 5840
2653 anarres.echo > gont.34752: . ack 12 win 5792
2654 anarres.echo > gont.34752: P 1:12(11) ack 12 win 5792
2655 gont.34752 > anarres.echo: . ack 12 win 5840
2656 gont.34752 > anarres.echo: P 12:45(33) ack 12 win 5840
2657 gont.34752 > anarres.echo: P 12:45(33) ack 12 win 5840
2658 gont.34752 > anarres.echo: P 12:45(33) ack 12 win 5840
2659 gont.34752 > anarres.echo: P 12:45(33) ack 12 win 5840
2660 gont.34752 > anarres.echo: P 12:45(33) ack 12 win 5840
2662 e come si vede in questo caso i tentativi di ritrasmissione del pacchetto
2663 iniziale sono proprio 4 (per un totale di 5 voci con quello trasmesso la prima
2664 volta), ed in effetti, dopo un tempo molto più breve rispetto a prima ed in
2665 corrispondenza dell'invio dell'ultimo tentativo, quello che otterremo come
2666 errore all'uscita del client sarà diverso, e cioè:
2668 [piccardi@gont sources]$ ./echo 192.168.1.141
2671 Seconda riga dopo l'interruzione
2672 Errore in lettura: Connection timed out
2674 che corrisponde appunto, come ci aspettavamo, alla ricezione di un
2675 \errcode{ETIMEDOUT}.
2677 Analizziamo ora il secondo scenario, in cui si ha un crollo della macchina che
2678 fa da server. Al solito lanciamo il nostro client, scriviamo una prima riga
2679 per verificare che sia tutto a posto, poi stacchiamo il cavo e riavviamo il
2680 server. A questo punto, ritornato attivo il server, scriviamo una seconda
2681 riga. Quello che otterremo in questo caso è:
2683 [piccardi@gont sources]$ ./echo 192.168.1.141
2686 Seconda riga dopo l'interruzione
2687 Errore in lettura Connection reset by peer
2689 e l'errore ricevuti da \func{read} stavolta è \errcode{ECONNRESET}. Se al
2690 solito riportiamo l'analisi dei pacchetti effettuata con \cmd{tcpdump},
2693 [root@gont gapil]# tcpdump src 192.168.1.141 or dst 192.168.1.141 -N -t
2694 tcpdump: listening on eth0
2695 gont.34756 > anarres.echo: S 904864257:904864257(0) win 5840
2696 anarres.echo > gont.34756: S 4254564871:4254564871(0) ack 904864258 win 5792
2697 gont.34756 > anarres.echo: . ack 1 win 5840
2698 gont.34756 > anarres.echo: P 1:12(11) ack 1 win 5840
2699 anarres.echo > gont.34756: . ack 12 win 5792
2700 anarres.echo > gont.34756: P 1:12(11) ack 12 win 5792
2701 gont.34756 > anarres.echo: . ack 12 win 5840
2702 gont.34756 > anarres.echo: P 12:45(33) ack 12 win 5840
2703 anarres.echo > gont.34756: R 4254564883:4254564883(0) win 0
2706 Ancora una volta i primi sette pacchetti sono gli stessi; ma in questo caso
2707 quello che succede dopo lo scambio iniziale è che, non avendo inviato nulla
2708 durante il periodo in cui si è riavviato il server, il client è del tutto
2709 ignaro dell'accaduto per cui quando effettuerà una scrittura, dato che la
2710 macchina server è stata riavviata e che tutti gli stati relativi alle
2711 precedenti connessioni sono completamente persi, anche in presenza di una
2712 nuova istanza del server echo non sarà possibile consegnare i dati in arrivo,
2713 per cui alla loro ricezione il kernel risponderà con un segmento di RST.
2715 Il client da parte sua, dato che neanche in questo caso non è stato emesso un
2716 FIN, dopo aver scritto verrà bloccato nella successiva chiamata a \func{read},
2717 che però adesso ritornerà immediatamente alla ricezione del segmento RST,
2718 riportando appunto come errore \errcode{ECONNRESET}. Occorre precisare che se
2719 si vuole che il client sia in grado di accorgersi del crollo del server anche
2720 quando non sta effettuando uno scambio di dati, è possibile usare una
2721 impostazione speciale del socket (ci torneremo in
2722 sez.~\ref{sec:sock_generic_options}) che provvede all'esecuzione di questo
2725 \section{L'uso dell'I/O multiplexing}
2726 \label{sec:TCP_sock_multiplexing}
2728 Affronteremo in questa sezione l'utilizzo dell'I/O multiplexing, affrontato in
2729 sez.~\ref{sec:file_multiplexing}, nell'ambito delle applicazioni di rete. Già
2730 in sez.~\ref{sec:TCP_server_crash} era emerso il problema relativo al client
2731 del servizio echo che non era in grado di accorgersi della terminazione
2732 precoce del server, essendo bloccato nella lettura dei dati immessi da
2735 Abbiamo visto in sez.~\ref{sec:file_multiplexing} quali sono le funzionalità
2736 del sistema che ci permettono di tenere sotto controllo più file descriptor in
2737 contemporanea; in quella occasione non abbiamo fatto esempi, in quanto quando
2738 si tratta con file normali questa tipologia di I/O normalmente non viene
2739 usata, è invece un caso tipico delle applicazioni di rete quello di dover
2740 gestire varie connessioni da cui possono arrivare dati comuni in maniera
2741 asincrona, per cui riprenderemo l'argomento in questa sezione.
2744 \subsection{Il comportamento della funzione \func{select} con i socket.}
2745 \label{sec:TCP_sock_select}
2747 Iniziamo con la prima delle funzioni usate per l'I/O multiplexing,
2748 \func{select}; il suo funzionamento è già stato descritto in dettaglio in
2749 sez.~\ref{sec:file_multiplexing} e non staremo a ripetere quanto detto lì;
2750 sappiamo che la funzione ritorna quando uno o più dei file descriptor messi
2751 sotto controllo è pronto per la relativa operazione.
2753 In quell'occasione non abbiamo però definito cosa si intende per pronto,
2754 infatti per dei normali file, o anche per delle pipe, la condizione di essere
2755 pronti per la lettura o la scrittura è ovvia; invece lo è molto meno nel caso
2756 dei socket, visto che possono intervenire tutte una serie di possibili
2757 condizioni di errore dovute alla rete. Occorre allora specificare chiaramente
2758 quali sono le condizioni per cui un socket risulta essere ``\textsl{pronto}''
2759 quando viene passato come membro di uno dei tre \textit{file descriptor set}
2760 usati da \func{select}.
2762 Le condizioni che fanno si che la funzione \func{select} ritorni segnalando
2763 che un socket (che sarà riportato nel primo insieme di file descriptor) è
2764 pronto per la lettura sono le seguenti:
2766 \item nel buffer di ricezione del socket sono arrivati dei dati in quantità
2767 sufficiente a superare il valore di una \textsl{soglia di basso livello} (il
2768 cosiddetto \textit{low watermark}). Questo valore è espresso in numero di
2769 byte e può essere impostato con l'opzione del socket \const{SO\_RCVLOWAT}
2770 (tratteremo l'uso di questa opzione in sez.~\ref{sec:sock_generic_options});
2771 il suo valore di default è 1 per i socket TCP e UDP. In questo caso una
2772 operazione di lettura avrà successo e leggerà un numero di byte maggiore di
2774 \item il lato in lettura della connessione è stato chiuso; si è cioè ricevuto
2775 un segmento FIN (si ricordi quanto illustrato in
2776 sez.~\ref{sec:TCP_conn_term}) sulla connessione. In questo caso una
2777 operazione di lettura avrà successo, ma non risulteranno presenti dati (in
2778 sostanza \func{read} ritornerà con un valore nullo) per indicare la
2779 condizione di end-of-file.
2780 \item c'è stato un errore sul socket. In questo caso una operazione di lettura
2781 non si bloccherà ma restituirà una condizione di errore (ad esempio
2782 \func{read} restituirà -1) e imposterà la variabile \var{errno} al relativo
2783 valore. Vedremo in sez.~\ref{sec:sock_generic_options} come sia possibile
2784 estrarre e cancellare errori pendenti su un socket usando l'opzione
2786 \item quando si sta utilizzando un \textit{listening socket} ed ci sono delle
2787 connessioni completate. In questo caso la funzione \func{accept} non si
2788 bloccherà.\footnote{in realtà questo non è sempre vero, come accennato in
2789 sez.~\ref{sec:TCP_conn_early_abort} una connessione può essere abortita
2790 dalla ricezione di un segmento RST una volta che è stata completata,
2791 allora se questo avviene dopo che \func{select} è ritornata, ma prima
2792 della chiamata ad \func{accept}, quest'ultima, in assenza di altre
2793 connessioni, potrà bloccarsi.}
2796 Le condizioni che fanno si che la funzione \func{select} ritorni segnalando
2797 che un socket (che sarà riportato nel secondo insieme di file descriptor) è
2798 pronto per la scrittura sono le seguenti:
2800 \item nel buffer di invio è disponibile una quantità di spazio superiore al
2801 valore della \textsl{soglia di basso livello} in scrittura ed inoltre o il
2802 socket è già connesso o non necessita (ad esempio è UDP) di connessione. Il
2803 valore della soglia è espresso in numero di byte e può essere impostato con
2804 l'opzione del socket \const{SO\_SNDLOWAT} (trattata in
2805 sez.~\ref{sec:sock_generic_options}); il suo valore di default è 2048 per i
2806 socket TCP e UDP. In questo caso una operazione di scrittura non si
2807 bloccherà e restituirà un valore positivo pari al numero di byte accettati
2808 dal livello di trasporto.
2809 \item il lato in scrittura della connessione è stato chiuso. In questo caso
2810 una operazione di scrittura sul socket genererà il segnale \const{SIGPIPE}.
2811 \item c'è stato un errore sul socket. In questo caso una operazione di
2812 scrittura non si bloccherà ma restituirà una condizione di errore ed
2813 imposterà opportunamente la variabile \var{errno}. Vedremo in
2814 sez.~\ref{sec:sock_generic_options} come sia possibile estrarre e cancellare
2815 errori pendenti su un socket usando l'opzione \const{SO\_ERROR}.
2818 Infine c'è una sola condizione che fa si che \func{select} ritorni segnalando
2819 che un socket (che sarà riportato nel terzo insieme di file descriptor) ha una
2820 condizione di eccezione pendente, e cioè la ricezione sul socket di dati
2821 \textsl{fuori banda} (o \textit{out-of-band}), una caratteristica specifica
2822 dei socket TCP su cui torneremo in sez.~\ref{sec:TCP_urgent_data}.
2824 Si noti come nel caso della lettura \func{select} si applichi anche ad
2825 operazioni che non hanno nulla a che fare con l'I/O di dati come il
2826 riconoscimento della presenza di connessioni pronte, in modo da consentire
2827 anche l'utilizzo di \func{accept} in modalità non bloccante. Si noti infine
2828 come in caso di errore un socket venga sempre riportato come pronto sia per la
2829 lettura che per la scrittura.
2831 Lo scopo dei due valori di soglia per i buffer di ricezione e di invio è
2832 quello di consentire maggiore flessibilità nell'uso di \func{select} da parte
2833 dei programmi, se infatti si sa che una applicazione non è in grado di fare
2834 niente fintanto che non può ricevere o inviare una certa quantità di dati, si
2835 possono utilizzare questi valori per far si che \func{select} ritorni solo
2836 quando c'è la certezza di avere dati a sufficienza.\footnote{questo tipo di
2837 controllo è utile di norma solo per la lettura, in quanto in genere le
2838 operazioni di scrittura sono già controllate dall'applicazione, che sà
2839 sempre quanti dati invia, mentre non è detto possa conoscere la quantità di
2840 dati in ricezione; per cui, nella situazione in cui si conosce almeno un
2841 valore minimo, per evitare la penalizzazione dovuta alla ripetizione delle
2842 operazioni di lettura per accumulare dati sufficienti, si può lasciare al
2843 kernel il compito di impostare un minimo al di sotto del quale il file
2844 descriptor, pur avendo disponibili dei dati, non viene dato per pronto in
2849 \subsection{Un esempio di I/O multiplexing}
2850 \label{sec:TCP_multiplex_example}
2852 Abbiamo incontrato la problematica tipica che conduce all'uso dell'I/O
2853 multiplexing nella nostra analisi degli errori in
2854 sez.~\ref{sec:TCP_conn_early_abort}, quando il nostro client non era in grado
2855 di rendersi conto di errori sulla connessione essendo impegnato nella attesa
2856 di dati in ingresso dallo standard input.
2858 In questo caso il problema è quello di dover tenere sotto controllo due
2859 diversi file descriptor, lo standard input, da cui viene letto il testo che
2860 vogliamo inviare al server, e il socket connesso con il server su cui detto
2861 testo sarà scritto e dal quale poi si vorrà ricevere la risposta. L'uso
2862 dell'I/O multiplexing consente di tenere sotto controllo entrambi, senza
2865 Nel nostro caso quello che ci interessa è non essere bloccati in lettura sullo
2866 standard input in caso di errori sulla connessione o chiusura della stessa da
2867 parte del server. Entrambi questi casi possono essere rilevati usando
2868 \func{select}, per quanto detto in sez.~\ref{sec:TCP_sock_select}, mettendo
2869 sotto osservazione i file descriptor per la condizione di essere pronti in
2870 lettura: sia infatti che si ricevano dati, che la connessione sia chiusa
2871 regolarmente (con la ricezione di un segmento FIN) che si riceva una
2872 condizione di errore (con un segmento RST) il socket connesso sarà pronto in
2873 lettura (nell'ultimo caso anche in scrittura, ma questo non è necessario ai
2876 \begin{figure}[!htb]
2877 \footnotesize \centering
2878 \begin{minipage}[c]{15.6cm}
2879 \includecodesample{listati/ClientEcho_third.c}
2882 \caption{La sezione nel codice della terza versione della funzione
2883 \func{ClientEcho} usata dal client per il servizio \textit{echo}
2884 modificata per l'uso di \func{select}.}
2885 \label{fig:TCP_ClientEcho_third}
2888 Riprendiamo allora il codice del client, modificandolo per l'uso di
2889 \func{select}. Quello che dobbiamo modificare è la funzione \func{ClientEcho}
2890 di fig.~\ref{fig:TCP_ClientEcho_second}, dato che tutto il resto, che riguarda
2891 le modalità in cui viene stabilita la connessione con il server, resta
2892 assolutamente identico. La nostra nuova versione di \func{ClientEcho}, la
2893 terza della serie, è riportata in fig.~\ref{fig:TCP_ClientEcho_third}, il
2894 codice completo si trova nel file \file{TCP\_echo\_third.c} dei sorgenti
2895 allegati alla guida.
2897 In questo caso la funzione comincia (\texttt{\small 8--9}) con l'azzeramento
2898 del file descriptor set \var{fset} e l'impostazione del valore \var{maxfd}, da
2899 passare a \func{select} come massimo per il numero di file descriptor. Per
2900 determinare quest'ultimo si usa la macro \code{max} definita nel nostro file
2901 \file{macro.h} che raccoglie una collezione di macro di preprocessore di varia
2904 La funzione prosegue poi (\texttt{\small 10--41}) con il ciclo principale, che
2905 viene ripetuto indefinitamente. Per ogni ciclo si reinizializza
2906 (\texttt{\small 11--12}) il file descriptor set, impostando i valori per il
2907 file descriptor associato al socket \var{socket} e per lo standard input (il
2908 cui valore si recupera con la funzione \func{fileno}). Questo è necessario in
2909 quanto la successiva (\texttt{\small 13}) chiamata a \func{select} comporta
2910 una modifica dei due bit relativi, che quindi devono essere reimpostati
2911 all'inizio di ogni ciclo.
2913 Si noti come la chiamata a \func{select} venga eseguita usando come primo
2914 argomento il valore di \var{maxfd}, precedentemente calcolato, e passando poi
2915 il solo file descriptor set per il controllo dell'attività in lettura, negli
2916 altri argomenti sono passati tutti puntatori nulli, non interessando né il
2917 controllo delle altre attività, né l'impostazione di un valore di timeout.
2919 Al ritorno di \func{select} si provvede a controllare quale dei due file
2920 descriptor presenta attività in lettura, cominciando (\texttt{\small 14--24})
2921 con il file descriptor associato allo standard input. In caso di attività
2922 (quando cioè \macro{FD\_ISSET} ritorna una valore diverso da zero) si esegue
2923 (\texttt{\small 15}) una \func{fgets} per leggere gli eventuali dati presenti;
2924 se non ve ne sono (e la funzione restituisce pertanto un puntatore nullo) si
2925 ritorna immediatamente (\texttt{\small 16}) dato che questo significa che si è
2926 chiuso lo standard input e quindi concluso l'utilizzo del client; altrimenti
2927 (\texttt{\small 18--22}) si scrivono i dati appena letti sul socket,
2928 prevedendo una uscita immediata in caso di errore di scrittura.
2930 Controllato lo standard input si passa a controllare (\texttt{\small 25--40})
2931 il socket connesso, in caso di attività (\texttt{\small 26}) si esegue subito
2932 una \func{read} di cui si controlla il valore di ritorno; se questo è negativo
2933 (\texttt{\small 27--30}) si è avuto un errore e pertanto si esce
2934 immediatamente segnalandolo, se è nullo (\texttt{\small 31--34}) significa che
2935 il server ha chiuso la connessione, e di nuovo si esce con stampando prima un
2936 messaggio di avviso, altrimenti (\texttt{\small 35--39}) si effettua la
2937 terminazione della stringa e la si stampa a sullo standard output (uscendo in
2938 caso di errore), per ripetere il ciclo da capo.
2940 Con questo meccanismo il programma invece di essere bloccato in lettura sullo
2941 standard input resta bloccato sulla \func{select}, che ritorna soltanto quando
2942 viene rilevata attività su uno dei due file descriptor posti sotto controllo.
2943 Questo di norma avviene solo quando si è scritto qualcosa sullo standard
2944 input, o quando si riceve dal socket la risposta a quanto si era appena
2945 scritto. Ma adesso il client diventa capace di accorgersi immediatamente della
2946 terminazione del server; in tal caso infatti il server chiuderà il socket
2947 connesso, ed alla ricezione del FIN la funzione \func{select} ritornerà (come
2948 illustrato in sez.~\ref{sec:TCP_sock_select}) segnalando una condizione di end
2949 of file, per cui il nostro client potrà uscire immediatamente.
2951 Riprendiamo la situazione affrontata in sez.~\ref{sec:TCP_server_crash},
2952 terminando il server durante una connessione, in questo caso quello che
2953 otterremo, una volta scritta una prima riga ed interrotto il server con un
2956 [piccardi@gont sources]$ ./echo 192.168.1.1
2961 dove l'ultima riga compare immediatamente dopo aver interrotto il server. Il
2962 nostro client infatti è in grado di accorgersi immediatamente che il socket
2963 connesso è stato chiuso ed uscire immediatamente.
2965 Veniamo allora agli altri scenari di terminazione anomala visti in
2966 sez.~\ref{sec:TCP_conn_crash}. Il primo di questi è l'interruzione fisica della
2967 connessione; in questo caso avremo un comportamento analogo al precedente, in
2968 cui si scrive una riga e non si riceve risposta dal server e non succede
2969 niente fino a quando non si riceve un errore di \errcode{EHOSTUNREACH} o
2970 \errcode{ETIMEDOUT} a seconda dei casi.
2972 La differenza è che stavolta potremo scrivere più righe dopo l'interruzione,
2973 in quanto il nostro client dopo aver inviato i dati non si bloccherà più nella
2974 lettura dal socket, ma nella \func{select}; per questo potrà accettare
2975 ulteriore dati che scriverà di nuovo sul socket, fintanto che c'è spazio sul
2976 buffer di uscita (ecceduto il quale si bloccherà in scrittura). Si ricordi
2977 infatti che il client non ha modo di determinare se la connessione è attiva o
2978 meno (dato che in molte situazioni reali l'inattività può essere temporanea).
2979 Tra l'altro se si ricollega la rete prima della scadenza del timeout, potremo
2980 anche verificare come tutto quello che si era scritto viene poi effettivamente
2981 trasmesso non appena la connessione ridiventa attiva, per cui otterremo
2984 [piccardi@gont sources]$ ./echo 192.168.1.1
2987 Seconda riga dopo l'interruzione
2990 Seconda riga dopo l'interruzione
2994 in cui, una volta riconnessa la rete, tutto quello che abbiamo scritto durante
2995 il periodo di disconnessione restituito indietro e stampato immediatamente.
2997 Lo stesso comportamento visto in sez.~\ref{sec:TCP_server_crash} si riottiene
2998 nel caso di un crollo completo della macchina su cui sta il server. In questo
2999 caso di nuovo il client non è in grado di accorgersi di niente dato che si
3000 suppone che il programma server non venga terminato correttamente, ma si
3001 blocchi tutto senza la possibilità di avere l'emissione di un segmento FIN che
3002 segnala la terminazione della connessione. Di nuovo fintanto che la
3003 connessione non si riattiva (con il riavvio della macchina del server) il
3004 client non è in grado di fare altro che accettare dell'input e tentare di
3005 inviarlo. La differenza in questo caso è che non appena la connessione
3006 ridiventa attiva i dati verranno sì trasmessi, ma essendo state perse tutte le
3007 informazioni relative alle precedenti connessioni ai tentativi di scrittura
3008 del client sarà risposto con un segmento RST che provocherà il ritorno di
3009 \func{select} per la ricezione di un errore di \errcode{ECONNRESET}.
3012 \subsection{La funzione \func{shutdown}}
3013 \label{sec:TCP_shutdown}
3015 Come spiegato in sez.~\ref{sec:TCP_conn_term} il procedimento di chiusura di un
3016 socket TCP prevede che da entrambe le parti venga emesso un segmento FIN. È
3017 pertanto del tutto normale dal punto di vista del protocollo che uno dei due
3018 capi chiuda la connessione, quando l'altro capo la lascia
3019 aperta.\footnote{abbiamo incontrato questa situazione nei vari scenari critici
3020 di sez.~\ref{sec:TCP_echo_critical}.}
3022 È pertanto possibile avere una situazione in cui un capo della connessione non
3023 avendo più nulla da scrivere, possa chiudere il socket, segnalando così
3024 l'avvenuta terminazione della trasmissione (l'altro capo riceverà infatti un
3025 end-of-file in lettura) mentre dall'altra parte si potrà proseguire la
3026 trasmissione dei dati scrivendo sul socket che da quel lato è ancora aperto.
3027 Questa è quella situazione in cui si dice che il socket è \textit{half
3030 Il problema che si pone è che se la chiusura del socket è effettuata con la
3031 funzione \func{close}, come spiegato in sez.~\ref{sec:TCP_func_close}, si perde
3032 ogni possibilità di poter rileggere quanto l'altro capo può continuare a
3033 scrivere. Per poter permettere allora di segnalare che si è concluso con la
3034 scrittura, continuando al contempo a leggere quanto può provenire dall'altro
3035 capo del socket si può allora usare la funzione \funcd{shutdown}, il cui
3037 \begin{prototype}{sys/socket.h}
3038 {int shutdown(int sockfd, int how)}
3040 Chiude un lato della connessione fra due socket.
3042 \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
3043 errore, nel qual caso \var{errno} assumerà i valori:
3045 \item[\errcode{ENOTSOCK}] il file descriptor non corrisponde a un socket.
3046 \item[\errcode{ENOTCONN}] il socket non è connesso.
3048 ed inoltre \errval{EBADF}.}
3051 La funzione prende come primo argomento il socket \param{sockfd} su cui si
3052 vuole operare e come secondo argomento un valore intero \param{how} che indica
3053 la modalità di chiusura del socket, quest'ultima può prendere soltanto tre
3055 \begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}}
3056 \item[\macro{SHUT\_RD}] chiude il lato in lettura del socket, non sarà più
3057 possibile leggere dati da esso, tutti gli eventuali dati trasmessi
3058 dall'altro capo del socket saranno automaticamente scartati dal kernel, che,
3059 in caso di socket TCP, provvederà comunque ad inviare i relativi segmenti di
3061 \item[\macro{SHUT\_WR}] chiude il lato in scrittura del socket, non sarà più
3062 possibile scrivere dati su di esso. Nel caso di socket TCP la chiamata causa
3063 l'emissione di un segmento FIN, secondo la procedura chiamata
3064 \textit{half-close}. Tutti i dati presenti nel buffer di scrittura prima
3065 della chiamata saranno inviati, seguiti dalla sequenza di chiusura
3066 illustrata in sez.~\ref{sec:TCP_conn_term}.
3067 \item[\macro{SHUT\_RDWR}] chiude sia il lato in lettura che quello in
3068 scrittura del socket. È equivalente alla chiamata in sequenza con
3069 \macro{SHUT\_RD} e \macro{SHUT\_WR}.
3072 Ci si può chiedere quale sia l'utilità di avere introdotto \macro{SHUT\_RDWR}
3073 quando questa sembra rendere \funcd{shutdown} del tutto equivalente ad una
3074 \func{close}. In realtà non è così, esiste infatti un'altra differenza con
3075 \func{close}, più sottile. Finora infatti non ci siamo presi la briga di
3076 sottolineare in maniera esplicita che, come per i file e le fifo, anche per i
3077 socket possono esserci più riferimenti contemporanei ad uno stesso socket. Per
3078 cui si avrebbe potuto avere l'impressione che sia una corrispondenza univoca
3079 fra un socket ed il file descriptor con cui vi si accede. Questo non è
3080 assolutamente vero, (e lo abbiamo già visto nel codice del server di
3081 fig.~\ref{fig:TCP_echo_server_first_code}), ed è invece assolutamente normale
3082 che, come per gli altri oggetti, ci possano essere più file descriptor che
3083 fanno riferimento allo stesso socket.
3085 Allora se avviene uno di questi casi quello che succederà è che la chiamata a
3086 \func{close} darà effettivamente avvio alla sequenza di chiusura di un socket
3087 soltanto quando il numero di riferimenti a quest'ultimo diventerà nullo.
3088 Fintanto che ci sono file descriptor che fanno riferimento ad un socket l'uso
3089 di \func{close} si limiterà a deallocare nel processo corrente il file
3090 descriptor utilizzato, ma il socket resterà pienamente accessibile attraverso
3091 tutti gli altri riferimenti. Se torniamo all'esempio originale del server di
3092 fig.~\ref{fig:TCP_echo_server_first_code} abbiamo infatti che ci sono due
3093 \func{close}, una sul socket connesso nel padre, ed una sul socket in ascolto
3094 nel figlio, ma queste non effettuano nessuna chiusura reale di detti socket,
3095 dato che restano altri riferimenti attivi, uno al socket connesso nel figlio
3096 ed uno a quello in ascolto nel padre.
3098 Questo non avviene affatto se si usa \func{shutdown} con argomento
3099 \macro{SHUT\_RDWR} al posto di \func{close}; in questo caso infatti la
3100 chiusura del socket viene effettuata immediatamente, indipendentemente dalla
3101 presenza di altri riferimenti attivi, e pertanto sarà efficace anche per tutti
3102 gli altri file descriptor con cui, nello stesso o in altri processi, si fa
3103 riferimento allo stesso socket.
3105 Il caso più comune di uso di \func{shutdown} è comunque quello della chiusura
3106 del lato in scrittura, per segnalare all'altro capo della connessione che si è
3107 concluso l'invio dei dati, restando comunque in grado di ricevere quanto
3108 questi potrà ancora inviarci. Questo è ad esempio l'uso che ci serve per
3109 rendere finalmente completo il nostro esempio sul servizio \textit{echo}. Il
3110 nostro client infatti presenta ancora un problema, che nell'uso che finora ne
3111 abbiamo fatto non è emerso, ma che ci aspetta dietro l'angolo non appena
3112 usciamo dall'uso interattivo e proviamo ad eseguirlo redirigendo standard
3113 input e standard output. Così se eseguiamo:
3115 [piccardi@gont sources]$ ./echo 192.168.1.1 < ../fileadv.tex > copia
3117 vedremo che il file \texttt{copia} risulta mancare della parte finale.
3119 Per capire cosa avviene in questo caso occorre tenere presente come avviene la
3120 comunicazione via rete; quando redirigiamo lo standard input il nostro client
3121 inizierà a leggere il contenuto del file \texttt{../fileadv.tex} a blocchi di
3122 dimensione massima pari a \texttt{MAXLINE} per poi scriverlo, alla massima
3123 velocità consentitagli dalla rete, sul socket. Dato che la connessione è con
3124 una macchina remota occorre un certo tempo perché i pacchetti vi arrivino,
3125 vengano processati, e poi tornino indietro. Considerando trascurabile il tempo
3126 di processo, questo tempo è quello impiegato nella trasmissione via rete, che
3127 viene detto RTT (dalla denominazione inglese \textit{Round Trip Time}) ed è
3128 quello che viene stimato con l'uso del comando \cmd{ping}.
3130 A questo punto, se torniamo al codice mostrato in
3131 fig.~\ref{fig:TCP_ClientEcho_third}, possiamo vedere che mentre i pacchetti
3132 sono in transito sulla rete il client continua a leggere e a scrivere fintanto
3133 che il file in ingresso finisce. Però non appena viene ricevuto un end-of-file
3134 in ingresso il nostro client termina. Nel caso interattivo, in cui si
3135 inviavano brevi stringhe una alla volta, c'era sempre il tempo di eseguire la
3136 lettura completa di quanto il server rimandava indietro. In questo caso
3137 invece, quando il client termina, essendo la comunicazione saturata e a piena
3138 velocità, ci saranno ancora pacchetti in transito sulla rete che devono
3139 arrivare al server e poi tornare indietro, ma siccome il client esce
3140 immediatamente dopo la fine del file in ingresso, questi non faranno a tempo a
3141 completare il percorso e verranno persi.
3143 Per evitare questo tipo di problema, invece di uscire una volta completata la
3144 lettura del file in ingresso, occorre usare \func{shutdown} per effettuare la
3145 chiusura del lato in scrittura del socket. In questo modo il client segnalerà
3146 al server la chiusura del flusso dei dati, ma potrà continuare a leggere
3147 quanto il server gli sta ancora inviando indietro, fino a quando anch'esso,
3148 riconosciuta la chiusura del socket in scrittura da parte del client,
3149 effettuerà la chiusura dalla sua parte. Solo alla ricezione della chiusura del
3150 socket da parte del server il client potrà essere sicuro della ricezione di
3151 tutti i dati e della terminazione effettiva della connessione.
3153 \begin{figure}[!htb]
3154 \footnotesize \centering
3155 \begin{minipage}[c]{15.6cm}
3156 \includecodesample{listati/ClientEcho.c}
3159 \caption{La sezione nel codice della versione finale della funzione
3160 \func{ClientEcho}, che usa \func{shutdown} per una conclusione corretta
3162 \label{fig:TCP_ClientEcho}
3165 Si è allora riportato in fig.~\ref{fig:TCP_ClientEcho} la versione finale
3166 della nostra funzione \func{ClientEcho}, in grado di gestire correttamente
3167 l'intero flusso di dati fra client e server. Il codice completo del client,
3168 comprendente la gestione delle opzioni a riga di comando e le istruzioni per
3169 la creazione della connessione, si trova nel file
3170 \texttt{TCP\_echo\_fourth.c}, distribuito coi sorgenti allegati alla guida.
3172 La nuova versione è molto simile alla precedente di
3173 fig.~\ref{fig:TCP_ClientEcho_third}; la prima differenza è l'introduzione
3174 (\texttt{\small 7}) della variabile \var{eof}, inizializzata ad un valore
3175 nullo, che serve a mantenere traccia dell'avvenuta conclusione della lettura
3176 del file in ingresso.
3178 La seconda modifica (\texttt{\small 12--15}) è stata quella di rendere
3179 subordinato ad un valore nullo di \var{eof} l'impostazione del file descriptor
3180 set per l'osservazione dello standard input. Se infatti il valore di \var{eof}
3181 è non nullo significa che si è già raggiunta la fine del file in ingresso ed è
3182 pertanto inutile continuare a tenere sotto controllo lo standard input nella
3183 successiva (\texttt{\small 16}) chiamata a \func{select}.
3185 Le maggiori modifiche rispetto alla precedente versione sono invece nella
3186 gestione (\texttt{\small 18--22}) del caso in cui la lettura con \func{fgets}
3187 restituisce un valore nullo, indice della fine del file. Questa nella
3188 precedente versione causava l'immediato ritorno della funzione; in questo caso
3189 prima (\texttt{\small 19}) si imposta opportunamente \var{eof} ad un valore
3190 non nullo, dopo di che (\texttt{\small 20}) si effettua la chiusura del lato
3191 in scrittura del socket con \func{shutdown}. Infine (\texttt{\small 21}) si
3192 usa la macro \macro{FD\_CLR} per togliere lo standard input dal file
3195 In questo modo anche se la lettura del file in ingresso è conclusa, la
3196 funzione non esce dal ciclo principale (\texttt{\small 11--50}), ma continua
3197 ad eseguirlo ripetendo la chiamata a \func{select} per tenere sotto controllo
3198 soltanto il socket connesso, dal quale possono arrivare altri dati, che
3199 saranno letti (\texttt{\small 31}), ed opportunamente trascritti
3200 (\texttt{\small 44--48}) sullo standard output.
3202 Il ritorno della funzione, e la conseguente terminazione normale del client,
3203 viene invece adesso gestito all'interno (\texttt{\small 30--49}) della lettura
3204 dei dati dal socket; se infatti dalla lettura del socket si riceve una
3205 condizione di end-of-file, la si tratterà (\texttt{\small 36--43}) in maniera
3206 diversa a seconda del valore di \var{eof}. Se infatti questa è diversa da zero
3207 (\texttt{\small 37--39}), essendo stata completata la lettura del file in
3208 ingresso, vorrà dire che anche il server ha concluso la trasmissione dei dati
3209 restanti, e si potrà uscire senza errori, altrimenti si stamperà
3210 (\texttt{\small 40--42}) un messaggio di errore per la chiusura precoce della
3214 \subsection{Un server basato sull'I/O multiplexing}
3215 \label{sec:TCP_serv_select}
3217 Seguendo di nuovo le orme di Stevens in \cite{UNP1} vediamo ora come con
3218 l'utilizzo dell'I/O multiplexing diventi possibile riscrivere completamente il
3219 nostro server \textit{echo} con una architettura completamente diversa, in
3220 modo da evitare di dover creare un nuovo processo tutte le volte che si ha una
3221 connessione.\footnote{ne faremo comunque una implementazione diversa rispetto
3222 a quella presentata da Stevens in \cite{UNP1}.}
3224 La struttura del nuovo server è illustrata in
3225 fig.~\ref{fig:TCP_echo_multiplex}, in questo caso avremo un solo processo che
3226 ad ogni nuova connessione da parte di un client sul socket in ascolto si
3227 limiterà a registrare l'entrata in uso di un nuovo file descriptor ed
3228 utilizzerà \func{select} per rilevare la presenza di dati in arrivo su tutti i
3229 file descriptor attivi, operando direttamente su ciascuno di essi.
3233 \includegraphics[width=13cm]{img/TCPechoMult}
3234 \caption{Schema del nuovo server echo basato sull'I/O multiplexing.}
3235 \label{fig:TCP_echo_multiplex}
3238 La sezione principale del codice del nuovo server è illustrata in
3239 fig.~\ref{fig:TCP_SelectEchod}. Si è tralasciata al solito la gestione delle
3240 opzioni, che è identica alla versione precedente. Resta invariata anche tutta
3241 la parte relativa alla gestione dei segnali, degli errori, e della cessione
3242 dei privilegi, così come è identica la gestione della creazione del socket (si
3243 può fare riferimento al codice già illustrato in
3244 sez.~\ref{sec:TCPsimp_server_main}); al solito il codice completo del server è
3245 disponibile coi sorgenti allegati nel file \texttt{select\_echod.c}.
3247 \begin{figure}[!htbp]
3248 \footnotesize \centering
3249 \begin{minipage}[c]{15.6cm}
3250 \includecodesample{listati/select_echod.c}
3253 \caption{La sezione principale del codice della nuova versione di server
3254 \textit{echo} basati sull'uso della funzione \func{select}.}
3255 \label{fig:TCP_SelectEchod}
3258 In questo caso, una volta aperto e messo in ascolto il socket, tutto quello
3259 che ci servirà sarà chiamare \func{select} per rilevare la presenza di nuove
3260 connessioni o di dati in arrivo, e processarli immediatamente. Per
3261 implementare lo schema mostrato in fig.~\ref{fig:TCP_echo_multiplex}, il
3262 programma usa una tabella dei socket connessi mantenuta nel vettore
3263 \var{fd\_open} dimensionato al valore di \const{FD\_SETSIZE}, ed una variabile
3264 \var{max\_fd} per registrare il valore più alto dei file descriptor aperti.
3266 Prima di entrare nel ciclo principale (\texttt{\small 6--56}) la nostra
3267 tabella viene inizializzata (\texttt{\small 2}) a zero (valore che
3268 utilizzeremo come indicazione del fatto che il relativo file descriptor non è
3269 aperto), mentre il valore massimo (\texttt{\small 3}) per i file descriptor
3270 aperti viene impostato a quello del socket in ascolto,\footnote{in quanto esso
3271 è l'unico file aperto, oltre i tre standard, e pertanto avrà il valore più
3272 alto.} che verrà anche (\texttt{\small 4}) inserito nella tabella.
3274 La prima sezione (\texttt{\small 7--10}) del ciclo principale esegue la
3275 costruzione del \textit{file descriptor set} \var{fset} in base ai socket
3276 connessi in un certo momento; all'inizio ci sarà soltanto il socket in
3277 ascolto, ma nel prosieguo delle operazioni, verranno utilizzati anche tutti i
3278 socket connessi registrati nella tabella \var{fd\_open}. Dato che la chiamata
3279 di \func{select} modifica il valore del \textit{file descriptor set}, è
3280 necessario ripetere (\texttt{\small 7}) ogni volta il suo azzeramento, per poi
3281 procedere con il ciclo (\texttt{\small 8--10}) in cui si impostano i socket
3284 Per far questo si usa la caratteristica dei file descriptor, descritta in
3285 sez.~\ref{sec:file_open}, per cui il kernel associa sempre ad ogni nuovo file
3286 il file descriptor con il valore più basso disponibile. Questo fa sì che si
3287 possa eseguire il ciclo (\texttt{\small 8}) a partire da un valore minimo, che
3288 sarà sempre quello del socket in ascolto, mantenuto in \var{list\_fd}, fino al
3289 valore massimo di \var{max\_fd} che dovremo aver cura di tenere aggiornato.
3290 Dopo di che basterà controllare (\texttt{\small 9}) nella nostra tabella se il
3291 file descriptor è in uso o meno,\footnote{si tenga presente che benché il
3292 kernel assegni sempre il primo valore libero, dato che nelle operazioni i
3293 socket saranno aperti e chiusi in corrispondenza della creazione e
3294 conclusione delle connessioni, si potranno sempre avere dei \textsl{buchi}
3295 nella nostra tabella.} e impostare \var{fset} di conseguenza.
3297 Una volta inizializzato con i socket aperti il nostro \textit{file descriptor
3298 set} potremo chiamare \func{select} per fargli osservare lo stato degli
3299 stessi (in lettura, presumendo che la scrittura sia sempre consentita). Come
3300 per il precedente esempio di sez.~\ref{sec:TCP_child_hand}, essendo questa
3301 l'unica funzione che può bloccarsi, ed essere interrotta da un segnale, la
3302 eseguiremo (\texttt{\small 11--12}) all'interno di un ciclo di \code{while}
3303 che la ripete indefinitamente qualora esca con un errore di \errcode{EINTR}.
3304 Nel caso invece di un errore normale si provvede (\texttt{\small 13--16}) ad
3305 uscire stampando un messaggio di errore.
3307 Se invece la funzione ritorna normalmente avremo in \var{n} il numero di
3308 socket da controllare. Nello specifico si danno due possibili casi diversi per
3309 cui \func{select} può essere ritornata: o si è ricevuta una nuova connessione
3310 ed è pronto il socket in ascolto, sul quale si può eseguire \func{accept} o
3311 c'è attività su uno dei socket connessi, sui quali si può eseguire
3314 Il primo caso viene trattato immediatamente (\texttt{\small 17--26}): si
3315 controlla (\texttt{\small 17}) che il socket in ascolto sia fra quelli attivi,
3316 nel qual caso anzitutto (\texttt{\small 18}) se ne decrementa il numero in
3317 \var{n}; poi, inizializzata (\texttt{\small 19}) la lunghezza della struttura
3318 degli indirizzi, si esegue \func{accept} per ottenere il nuovo socket connesso
3319 controllando che non ci siano errori (\texttt{\small 20--23}). In questo caso
3320 non c'è più la necessità di controllare per interruzioni dovute a segnali, in
3321 quanto siamo sicuri che \func{accept} non si bloccherà. Per completare la
3322 trattazione occorre a questo punto aggiungere (\texttt{\small 24}) il nuovo
3323 file descriptor alla tabella di quelli connessi, ed inoltre, se è il caso,
3324 aggiornare (\texttt{\small 25}) il valore massimo in \var{max\_fd}.
3326 Una volta controllato l'arrivo di nuove connessioni si passa a verificare se
3327 vi sono dati sui socket connessi, per questo si ripete un ciclo
3328 (\texttt{\small 29--55}) fintanto che il numero di socket attivi \var{n} resta
3329 diverso da zero; in questo modo se l'unico socket con attività era quello
3330 connesso, avendo opportunamente decrementato il contatore, il ciclo verrà
3331 saltato, e si ritornerà immediatamente (ripetuta l'inizializzazione del file
3332 descriptor set con i nuovi valori nella tabella) alla chiamata di
3333 \func{accept}. Se il socket attivo non è quello in ascolto, o ce ne sono
3334 comunque anche altri, il valore di \var{n} non sarà nullo ed il controllo sarà
3335 eseguito. Prima di entrare nel ciclo comunque si inizializza (\texttt{\small
3336 28}) il valore della variabile \var{i} che useremo come indice nella tabella
3337 \var{fd\_open} al valore minimo, corrispondente al file descriptor del socket
3340 Il primo passo (\texttt{\small 30}) nella verifica è incrementare il valore
3341 dell'indice \var{i} per posizionarsi sul primo valore possibile per un file
3342 descriptor associato ad un eventuale socket connesso, dopo di che si controlla
3343 (\texttt{\small 31}) se questo è nella tabella dei socket connessi, chiedendo
3344 la ripetizione del ciclo in caso contrario. Altrimenti si passa a verificare
3345 (\texttt{\small 32}) se il file descriptor corrisponde ad uno di quelli
3346 attivi, e nel caso si esegue (\texttt{\small 33}) una lettura, uscendo con un
3347 messaggio in caso di errore (\texttt{\small 34--38}).
3349 Se (\texttt{\small 39}) il numero di byte letti \var{nread} è nullo si è in
3350 presenza del caso di un \textit{end-of-file}, indice che una connessione che
3351 si è chiusa, che deve essere trattato (\texttt{\small 39--48}) opportunamente.
3352 Il primo passo è chiudere (\texttt{\small 40}) anche il proprio capo del
3353 socket e rimuovere (\texttt{\small 41}) il file descriptor dalla tabella di
3354 quelli aperti, inoltre occorre verificare (\texttt{\small 42}) se il file
3355 descriptor chiuso è quello con il valore più alto, nel qual caso occorre
3356 trovare (\texttt{\small 42--46}) il nuovo massimo, altrimenti (\texttt{\small
3357 47}) si può ripetere il ciclo da capo per esaminare (se ne restano)
3358 ulteriori file descriptor attivi.
3360 Se però è stato chiuso il file descriptor più alto, dato che la scansione dei
3361 file descriptor attivi viene fatta a partire dal valore più basso, questo
3362 significa che siamo anche arrivati alla fine della scansione, per questo
3363 possiamo utilizzare direttamente il valore dell'indice \var{i} con un ciclo
3364 all'indietro (\texttt{\small 43}) che trova il primo valore per cui la tabella
3365 presenta un file descriptor aperto, e lo imposta (\texttt{\small 44}) come
3366 nuovo massimo, per poi tornare (\texttt{\small 44}) al ciclo principale con un
3367 \code{break}, e rieseguire \func{select}.
3369 Se infine si sono effettivamente letti dei dati dal socket (ultimo caso
3370 rimasto) si potrà invocare immediatamente (\texttt{\small 49})
3371 \func{FullWrite} per riscriverli indietro sul socket stesso, avendo cura di
3372 uscire con un messaggio in caso di errore (\texttt{\small 50--53}). Si noti
3373 che nel ciclo si esegue una sola lettura, contrariamente a quanto fatto con la
3374 precedente versione (si riveda il codice di fig.~\ref{fig:TCP_ServEcho_second})
3375 in cui si continuava a leggere fintanto che non si riceveva un
3376 \textit{end-of-file}, questo perché usando l'\textit{I/O multiplexing} non si
3377 vuole essere bloccati in lettura. L'uso di \func{select} ci permette di
3378 trattare automaticamente anche il caso in cui la \func{read} non è stata in
3379 grado di leggere tutti i dati presenti sul socket, dato che alla iterazione
3380 successiva \func{select} ritornerà immediatamente segnalando l'ulteriore
3383 Il nostro server comunque soffre di una vulnerabilità per un attacco di tipo
3384 \textit{Denial of Service}. Il problema è che in caso di blocco di una
3385 qualunque delle funzioni di I/O, non avendo usato processi separati, tutto il
3386 server si ferma e non risponde più a nessuna richiesta. Abbiamo scongiurato
3387 questa evenienza per l'I/O in ingresso con l'uso di \func{select}, ma non vale
3388 altrettanto per l'I/O in uscita. Il problema pertanto può sorgere qualora una
3389 delle chiamate a \func{write} effettuate da \func{FullWrite} si blocchi. Con
3390 il funzionamento normale questo non accade in quanto il server si limita a
3391 scrivere quanto riceve in ingresso, ma qualora venga utilizzato un client
3392 malevolo che esegua solo scritture e non legga mai indietro l'\textsl{eco} del
3393 server, si potrebbe giungere alla saturazione del buffer di scrittura, ed al
3394 conseguente blocco del server su di una \func{write}.
3396 Le possibili soluzioni in questo caso sono quelle di ritornare ad eseguire il
3397 ciclo di risposta alle richieste all'interno di processi separati, utilizzare
3398 un timeout per le operazioni di scrittura, o eseguire queste ultime in
3399 modalità non bloccante, concludendo le operazioni qualora non vadano a buon
3404 \subsection{I/O multiplexing con \func{poll}}
3405 \label{sec:TCP_serv_poll}
3407 Finora abbiamo trattato le problematiche risolubili con l'I/O multiplexing
3408 impiegando la funzione \func{select}; questo è quello che avviene nella
3409 maggior parte dei casi, in quanto essa è nata sotto BSD proprio per affrontare
3410 queste problematiche con i socket. Abbiamo però visto in
3411 sez.~\ref{sec:file_multiplexing} come la funzione \func{poll} possa costituire
3412 una alternativa a \func{select}, con alcuni vantaggi.\footnote{non soffrendo
3413 delle limitazioni dovute all'uso dei \textit{file descriptor set}.}
3415 Ancora una volta in sez.~\ref{sec:file_poll} abbiamo trattato la funzione in
3416 maniera generica, parlando di file descriptor, ma come per \func{select}
3417 quando si ha a che fare con dei socket il concetto di essere \textsl{pronti}
3418 per l'I/O deve essere specificato nei dettagli, per tener conto delle
3419 condizioni della rete. Inoltre deve essere specificato come viene classificato
3420 il traffico nella suddivisione fra dati normali e prioritari. In generale
3423 \item i dati inviati su un socket vengono considerati traffico normale,
3424 pertanto vengono rilevati alla loro ricezione sull'altro capo da una
3425 selezione effettuata con \const{POLLIN} o \const{POLLRDNORM};
3426 \item i dati \textit{out-of-band} su un socket TCP vengono considerati
3427 traffico prioritario e vengono rilevati da una condizione \const{POLLIN},
3428 \const{POLLPRI} o \const{POLLRDBAND}.
3429 \item la chiusura di una connessione (cioè la ricezione di un segmento FIN)
3430 viene considerato traffico normale, pertanto viene rilevato da una
3431 condizione \const{POLLIN} o \const{POLLRDNORM}, ma una conseguente chiamata
3432 a \func{read} restituirà 0.
3433 \item la disponibilità di spazio sul socket per la scrittura di dati viene
3434 segnalata con una condizione \const{POLLOUT}.
3435 \item quando uno dei due capi del socket chiude un suo lato della connessione
3436 con \func{shutdown} si riceve una condizione di \const{POLLHUP}.
3437 \item la presenza di un errore sul socket (sia dovuta ad un segmento RST che a
3438 timeout) viene considerata traffico normale, ma viene segnalata anche dalla
3439 condizione \const{POLLERR}.
3440 \item la presenza di una nuova connessione su un socket in ascolto può essere
3441 considerata sia traffico normale che prioritario, nel caso di Linux
3442 l'implementazione la classifica come normale.
3445 Come esempio dell'uso di \func{poll} proviamo allora a reimplementare il
3446 server \textit{echo} secondo lo schema di fig.~\ref{fig:TCP_echo_multiplex}
3447 usando \func{poll} al posto di \func{select}. In questo caso dovremo fare
3448 qualche modifica, per tenere conto della diversa sintassi delle due funzioni,
3449 ma la struttura del programma resta sostanzialmente la stessa.
3452 \begin{figure}[!htbp]
3453 \footnotesize \centering
3454 \begin{minipage}[c]{15.6cm}
3455 \includecodesample{listati/poll_echod.c}
3458 \caption{La sezione principale del codice della nuova versione di server
3459 \textit{echo} basati sull'uso della funzione \func{poll}.}
3460 \label{fig:TCP_PollEchod}
3463 In fig.~\ref{fig:TCP_PollEchod} è riportata la sezione principale della nuova
3464 versione del server, la versione completa del codice è riportata nel file
3465 \texttt{poll\_echod.c} dei sorgenti allegati alla guida. Al solito nella
3466 figura si sono tralasciate la gestione delle opzioni, la creazione del socket
3467 in ascolto, la cessione dei privilegi e le operazioni necessarie a far
3468 funzionare il programma come demone, privilegiando la sezione principale del
3471 Come per il precedente server basato su \func{select} il primo passo
3472 (\texttt{\small 2--8}) è quello di inizializzare le variabili necessarie. Dato
3473 che in questo caso dovremo usare un vettore di strutture occorre anzitutto
3474 (\texttt{\small 2}) allocare la memoria necessaria utilizzando il numero
3475 massimo \var{n} di socket osservabili, che viene impostato attraverso
3476 l'opzione \texttt{-n} ed ha un valore di default di 256.
3478 Dopo di che si preimposta (\texttt{\small 3}) il valore \var{max\_fd} del file
3479 descriptor aperto con valore più alto a quello del socket in ascolto (al
3480 momento l'unico), e si provvede (\texttt{\small 4--7}) ad inizializzare le
3481 strutture, disabilitando (\texttt{\small 5}) l'osservazione con un valore
3482 negativo del campo \var{fd} ma predisponendo (\texttt{\small 6}) il campo
3483 \var{events} per l'osservazione dei dati normali con \const{POLLRDNORM}.
3484 Infine (\texttt{\small 8}) si attiva l'osservazione del socket in ascolto
3485 inizializzando la corrispondente struttura. Questo metodo comporta, in
3486 modalità interattiva, lo spreco di tre strutture (quelle relative a standard
3487 input, output ed error) che non vengono mai utilizzate in quanto la prima è
3488 sempre quella relativa al socket in ascolto.
3490 Una volta completata l'inizializzazione tutto il lavoro viene svolto
3491 all'interno del ciclo principale \texttt{\small 10--55}) che ha una struttura
3492 sostanzialmente identica a quello usato per il precedente esempio basato su
3493 \func{select}. La prima istruzione (\texttt{\small 11--12}) è quella di
3494 eseguire \func{poll} all'interno di un ciclo che la ripete qualora venisse
3495 interrotta da un segnale, da cui si esce soltanto quando la funzione ritorna,
3496 restituendo nella variabile \var{n} il numero di file descriptor trovati
3497 attivi. Qualora invece si sia ottenuto un errore si procede (\texttt{\small
3498 13--16}) alla terminazione immediata del processo provvedendo a stampare una
3499 descrizione dello stesso.
3501 Una volta ottenuta dell'attività su un file descriptor si hanno di nuovo due
3502 possibilità. La prima possibilità è che ci sia attività sul socket in ascolto,
3503 indice di una nuova connessione, nel qual caso si controlla (\texttt{\small
3504 17}) se il campo \var{revents} della relativa struttura è attivo; se è così
3505 si provvede (\texttt{\small 18}) a decrementare la variabile \var{n} (che
3506 assume il significato di numero di file descriptor attivi rimasti da
3507 controllare) per poi (\texttt{\small 19--23}) effettuare la chiamata ad
3508 \func{accept}, terminando il processo in caso di errore. Se la chiamata ad
3509 \func{accept} ha successo si procede attivando (\texttt{\small 24}) la
3510 struttura relativa al nuovo file descriptor da essa ottenuto, modificando
3511 (\texttt{\small 24}) infine quando necessario il valore massimo dei file
3512 descriptor aperti mantenuto in \var{max\_fd}.
3514 La seconda possibilità è che vi sia dell'attività su uno dei socket aperti in
3515 precedenza, nel qual caso si inizializza (\texttt{\small 27}) l'indice \var{i}
3516 del vettore delle strutture \struct{pollfd} al valore del socket in ascolto,
3517 dato che gli ulteriori socket aperti avranno comunque un valore superiore. Il
3518 ciclo (\texttt{\small 28--54}) prosegue fintanto che il numero di file
3519 descriptor attivi, mantenuto nella variabile \var{n}, è diverso da zero. Se
3520 pertanto ci sono ancora socket attivi da individuare si comincia con
3521 l'incrementare (\texttt{\small 30}) l'indice e controllare (\texttt{\small
3522 31}) se corrisponde ad un file descriptor in uso analizzando il valore del
3523 campo \var{fd} della relativa struttura e chiudendo immediatamente il ciclo
3524 qualora non lo sia. Se invece il file descriptor è in uso si verifica
3525 (\texttt{\small 31}) se c'è stata attività controllando il campo
3528 Di nuovo se non si verifica la presenza di attività il ciclo si chiude subito,
3529 altrimenti si provvederà (\texttt{\small 32}) a decrementare il numero \var{n}
3530 di file descriptor attivi da controllare e ad eseguire (\texttt{\small 33}) la
3531 lettura, ed in caso di errore (\texttt{\small 34--37}) al solito lo si
3532 notificherà uscendo immediatamente. Qualora invece si ottenga una condizione
3533 di end-of-file (\texttt{\small 38--47}) si provvederà a chiudere
3534 (\texttt{\small 39}) anche il nostro capo del socket e a marcarlo
3535 (\texttt{\small 40}) nella struttura ad esso associata come inutilizzato.
3536 Infine dovrà essere ricalcolato (\texttt{\small 41--45}) un eventuale nuovo
3537 valore di \var{max\_fd}. L'ultimo passo è (\texttt{\small 46}) chiudere il
3538 ciclo in quanto in questo caso non c'è più niente da riscrivere all'indietro
3541 Se invece si sono letti dei dati si provvede (\texttt{\small 48}) ad
3542 effettuarne la riscrittura all'indietro, con il solito controllo ed eventuale
3543 uscita e notifica in caso si errore (\texttt{\small 49--52}).
3545 Come si può notare la logica del programma è identica a quella vista in
3546 fig.~\ref{fig:TCP_SelectEchod} per l'analogo server basato su \func{select}; la
3547 sola differenza significativa è che in questo caso non c'è bisogno di
3548 rigenerare i file descriptor set in quanto l'uscita è indipendente dai dati in
3549 ingresso. Si applicano comunque anche a questo server le considerazioni finali
3550 di sez.~\ref{sec:TCP_serv_select}.
3554 %%% Local Variables:
3556 %%% TeX-master: "gapil"
3559 % LocalWords: socket TCP client dell'I multiplexing stream three way handshake
3560 % LocalWords: header stack kernel SYN ACK URG syncronize sez bind listen fig
3561 % LocalWords: accept connect active acknowledge l'acknowledge nell'header MSS
3562 % LocalWords: sequence number l'acknowledgement dell'header options l'header
3563 % LocalWords: option MMS segment size MAXSEG window advertized Mbit sec nell'
3564 % LocalWords: timestamp RFC long fat close of l'end l'ACK half shutdown CLOSED
3565 % LocalWords: netstat SENT ESTABLISHED WAIT IPv Ethernet piggybacking UDP MSL
3566 % LocalWords: l'overhead Stevens Lifetime router hop limit TTL to live RST SSH
3567 % LocalWords: routing dell'MSL l'IP multitasking well known port ephemeral BSD
3568 % LocalWords: ports dall' IANA Assigned Authority like glibc netinet IPPORT AF
3569 % LocalWords: RESERVED USERRESERVED rsh rlogin pair socketpair Local Address
3570 % LocalWords: Foreing DNS caching INADDR ANY multihoming loopback ssh fuser ip
3571 % LocalWords: lsof SOCK sys int sockfd const struct sockaddr serv addr socklen
3572 % LocalWords: addrlen errno EBADF descriptor EINVAL ENOTSOCK EACCES EADDRINUSE
3573 % LocalWords: EADDRNOTAVAIL EFAULT ENOTDIR ENOENT ENOMEM ELOOP ENOSR EROFS RPC
3574 % LocalWords: portmapper htonl tab endianess BROADCAST broadcast any extern fd
3575 % LocalWords: ADRR INIT DGRAM SEQPACKET servaddr ECONNREFUSED ETIMEDOUT EAGAIN
3576 % LocalWords: ENETUNREACH EINPROGRESS EALREADY EAFNOSUPPORT EPERM EISCONN proc
3577 % LocalWords: sysctl filesystem syn retries reset ICMP backlog EOPNOTSUPP RECV
3578 % LocalWords: connection queue dell'ACK flood spoofing syncookies SOMAXCONN CR
3579 % LocalWords: RDM EWOULDBLOCK firewall ENOBUFS EINTR EMFILE ECONNABORTED NULL
3580 % LocalWords: ESOCKTNOSUPPORT EPROTONOSUPPORT ERESTARTSYS connected listening
3581 % LocalWords: DECnet read write NONBLOCK fcntl getsockname getpeername name ps
3582 % LocalWords: namelen namlen ENOTCONN exec inetd POSIX daytime FullRead count
3583 % LocalWords: BUF FullWrite system call INET perror htons inet pton ctime FTP
3584 % LocalWords: fputs carriage return line feed superdemone daytimed sleep fork
3585 % LocalWords: daemon cunc logging list conn sock exit snprintf ntop ntohs echo
3586 % LocalWords: crash superserver L'RFC first ClientEcho stdin stdout fgets main
3587 % LocalWords: MAXLINE initd echod ServEcho setgid short nogroup nobody setuid
3588 % LocalWords: demonize PrintErr syslog wrapper log error root RTT EOF ctrl ack
3589 % LocalWords: while SIGCHLD Signal RESTART sigaction SignalRestart SigHand win
3590 % LocalWords: flags select recvfrom debug second compat waiting Nsec ENETDOWN
3591 % LocalWords: EPROTO ENOPROTOOPT EHOSTDOWN ENONET EHOSTUNREACH LINGER tcpdump
3592 % LocalWords: ECONNRESET advertising PSH SIGTERM strace SIGPIPE gets tcp ARP
3593 % LocalWords: cache anarres destination unreachable l'I low watermark RCVLOWAT
3594 % LocalWords: SNDLOWAT third fset maxfd fileno ISSET closed how SHUT RD WR eof
3595 % LocalWords: RDWR fifo Trip ping fourth CLR sull'I SETSIZE nread break Denial
3596 % LocalWords: Service poll POLLIN POLLRDNORM POLLPRI POLLRDBAND POLLOUT events
3597 % LocalWords: POLLHUP POLLERR revents pollfd