elemtcp.tex

   1 %% elemtcp.tex
   2 %%
   3 %% Copyright (C) 2000-2002 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11 \chapter{Socket TCP elementari}
  12 \label{cha:elem_TCP_sock}
  13
  14 In questo capitolo iniziamo ad approfondire la conoscenza dei socket TCP,
  15 tratteremo qui dunque il funzionamento delle varie funzioni che si sono usate
  16 nei due esempi elementari forniti in precedenza (vedi
  17 \secref{sec:net_cli_sample} e \secref{sec:net_serv_sample}), previa una
  18 descrizione delle principali caratteristiche del funzionamento di una
  19 connessione TCP.
  20
  21
  22 \section{Il funzionamento di una connessione TCP}
  23 \label{sec:TCPel_connession}
  24
  25 Prima di entrare nei dettagli delle funzioni usate nelle applicazioni che
  26 utilizzano i socket TCP, è fondamentale spiegare alcune basi del funzionamento
  27 del TCP; la conoscenza del funzionamento del protocollo è infatti essenziale
  28 per capire il modello di programmazione ed il funzionamento delle API.
  29
  30 In particolare ci concentreremo sulle modalità con le quali il protocollo dà
  31 inizio e conclude una connessione; faremo inoltre anche un breve accenno al
  32 significato di alcuni dei vari stati che il protocollo assume durante la vita
  33 di una connessione, che possono essere osservati per ciascun
  34 socket\index{socket} attivo con l'uso del programma \cmd{netstat}.
  35
  36 \subsection{La creazione della connessione: il \textit{three way handshake}}
  37 \label{sec:TCPel_conn_cre}
  38
  39 Il processo che porta a creare una connessione TCP è chiamato \textit{three
  40   way handshake}; la successione tipica degli eventi (la stessa che si
  41 verifica utilizzando il codice dei due precedenti esempi elementari
  42 \figref{fig:net_cli_code} e \figref{fig:net_serv_code}) che porta alla
  43 creazione di una connessione è la seguente:
  44
  45 \begin{enumerate}
  46 \item Il server deve essere preparato per accettare le connessioni in arrivo;
  47   il procedimento si chiama \textsl{apertura passiva} del socket (in inglese
  48   \textit{passive open}); questo viene fatto chiamando la sequenza di funzioni
  49   \func{socket}, \func{bind} e \func{listen}. Completata l'apertura passiva il
  50   server chiama la funzione \func{accept} e il processo si blocca in attesa di
  51   connessioni.
  52
  53 \item Il client richiede l'inizio della connessione usando la funzione
  54   \func{connect}, attraverso un procedimento che viene chiamato
  55   \textsl{apertura attiva}, dall'inglese \textit{active open}. La chiamata di
  56   \func{connect} blocca il processo e causa l'invio da parte del client di un
  57   segmento SYN,\footnote{Si ricordi che il segmento è l'unità elementare di
  58     dati trasmessa dal protocollo TCP al livello superiore; tutti i segmenti
  59     hanno un header che contiene le informazioni che servono allo
  60     \textit{stack TCP} (così viene di solito chiamata la parte del kernel che
  61     implementa il protocollo) per realizzare la comunicazione, fra questi dati
  62     ci sono una serie di flag usati per gestire la connessione, come SYN, ACK,
  63     URG, FIN, alcuni di essi, come SYN (che sta per \textit{syncronize})
  64     corrispondono a funzioni particolari del protocollo e danno il nome al
  65     segmento, (per maggiori dettagli vedere \capref{cha:tcp_protocol}).} in
  66   sostanza viene inviato al server un pacchetto IP che contiene solo gli
  67   header IP e TCP (con il numero di sequenza iniziale e il flag SYN) e le
  68   opzioni di TCP.
  69
  70 \item il server deve dare ricevuto (l'\textit{acknowledge}) del SYN del
  71   client, inoltre anche il server deve inviare il suo SYN al client (e
  72   trasmettere il suo numero di sequenza iniziale) questo viene fatto
  73   ritrasmettendo un singolo segmento in cui sono impostati entrambi i flag SYN
  74   ACK.
  75
  76 \item una volta che il client ha ricevuto l'acknowledge dal server la funzione
  77   \func{connect} ritorna, l'ultimo passo è dare dare il ricevuto del SYN del
  78   server inviando un ACK. Alla ricezione di quest'ultimo la funzione
  79   \func{accept} del server ritorna e la connessione è stabilita.
  80 \end{enumerate}
  81
  82 Il procedimento viene chiamato \textit{three way handshake} dato che per
  83 realizzarlo devono essere scambiati tre segmenti.  In \figref{fig:TCPel_TWH}
  84 si è rappresentata graficamente la sequenza di scambio dei segmenti che
  85 stabilisce la connessione.
  86
  87 % Una analogia citata da R. Stevens per la connessione TCP è quella con il
  88 % sistema del telefono. La funzione \texttt{socket} può essere considerata
  89 % l'equivalente di avere un telefono. La funzione \texttt{bind} è analoga al
  90 % dire alle altre persone qual'è il proprio numero di telefono perché possano
  91 % chiamare. La funzione \texttt{listen} è accendere il campanello del telefono
  92 % per sentire le chiamate in arrivo.  La funzione \texttt{connect} richiede di
  93 % conoscere il numero di chi si vuole chiamare. La funzione \texttt{accept} è
  94 % quando si risponde al telefono.
  95
  96 \begin{figure}[htb]
  97   \centering
  98   \includegraphics[width=10cm]{img/three_way_handshake}
  99   \caption{Il \textit{three way handshake} del TCP}
 100   \label{fig:TCPel_TWH}
 101 \end{figure}
 102
 103 Si è accennato in precedenza ai \textsl{numeri di sequenza} (che sono anche
 104 riportati in \figref{fig:TCPel_TWH}); per gestire una connessione affidabile
 105 infatti il protocollo TCP prevede nell'header la presenza di un numero a 32
 106 bit (chiamato appunto \textit{sequence number}) che identifica a quale byte
 107 nella sequenza del flusso corrisponde il primo byte della sezione dati
 108 contenuta nel segmento.
 109
 110 Il numero di sequenza di ciascun segmento viene calcolato a partire da un
 111 \textsl{numero di sequenza iniziale} generato in maniera casuale del kernel
 112 all'inizio della connessione e trasmesso con il SYN; l'acknowledgement di
 113 ciascun segmento viene effettuato dall'altro capo della connessione impostando
 114 il flag ACK e restituendo nell'apposito campo dell'header un
 115 \textit{acknowledge number}) pari al numero di sequenza che il ricevente si
 116 aspetta di ricevere con il pacchetto successivo; dato che il primo pacchetto
 117 SYN consuma un byte, nel \textit{three way handshake} il numero di acknowledge
 118 è sempre pari al numero di sequenza iniziale incrementato di uno; lo stesso
 119 varrà anche (vedi \figref{fig:TCPel_close}) per l'acknowledgement di un FIN.
 120
 121 \subsection{Le opzioni TCP.}
 122 \label{sec:TCPel_TCP_opt}
 123
 124 Ciascun segmento SYN contiene in genere delle opzioni per il protocollo TCP
 125 (le cosiddette \textit{TCP options}, che vengono inserite fra l'header e i
 126 dati) che servono a comunicare all'altro capo una serie di parametri utili a
 127 regolare la connessione. Normalmente vengono usate le seguenti opzioni:
 128
 129 \begin{itemize}
 130 \item \textit{MSS option}, dove MMS sta per \textit{maximum segment size}, con
 131   questa opzione ciascun capo della connessione annuncia all'altro il massimo
 132   ammontare di dati che vorrebbe accettare per ciascun segmento nella
 133   connessione corrente. È possibile leggere e scrivere questo valore
 134   attraverso l'opzione del socket \const{TCP\_MAXSEG}.
 135
 136 \item \textit{window scale option}; come spiegato in \capref{cha:tcp_protocol}
 137   il protocollo TCP implementa il controllo di flusso attraverso una
 138   \textsl{finestra annunciata} (\textit{advertized window}) con la quale
 139   ciascun capo della comunicazione dichiara quanto spazio disponibile ha in
 140   memoria per i dati. Questo è un numero a 16 bit dell'header, che così può
 141   indicare un massimo di 65535 byte (anche se Linux usa come massimo 32767 per
 142   evitare problemi con alcuni stack bacati che usano l'aritmetica con segno
 143   per implementare lo stack TCP); ma alcuni tipi di connessione come quelle ad
 144   alta velocità (sopra i 45Mbits/sec) e quelle che hanno grandi ritardi nel
 145   cammino dei pacchetti (come i satelliti) richiedono una finestra più grande
 146   per poter ottenere il massimo dalla trasmissione, per questo esiste questa
 147   opzione che indica un fattore di scala da applicare al valore della finestra
 148   annunciata\footnote{essendo una nuova opzione per garantire la compatibilità
 149     con delle vecchie implementazioni del protocollo la procedura che la
 150     attiva prevede come negoziazione che l'altro capo della connessione
 151     riconosca esplicitamente l'opzione inserendola anche lui nel suo SYN di
 152     risposta dell'apertura della connessione.} per la connessione corrente
 153   (espresso come numero di bit cui shiftare a sinistra il valore della
 154   finestra annunciata inserito nel pacchetto).
 155
 156 \item \textit{timestamp option}, è anche questa una nuova opzione necessaria
 157   per le connessioni ad alta velocità per evitare possibili corruzioni di dati
 158   dovute a pacchetti perduti che riappaiono; anche questa viene negoziata come
 159   la precedente.
 160
 161 \end{itemize}
 162
 163 La MSS è generalmente supportata da quasi tutte le implementazioni del
 164 protocollo, le ultime due opzioni (trattate nell'RFC~1323) sono meno comuni;
 165 vengono anche dette \textit{long fat pipe options} dato che questo è il nome
 166 che viene dato alle connessioni caratterizzate da alta velocità o da ritardi
 167 elevati. In ogni caso Linux supporta pienamente entrambe le opzioni.
 168
 169 \subsection{La terminazione della connessione}
 170 \label{sec:TCPel_conn_term}
 171
 172 Mentre per creare una connessione occorre un interscambio di tre segmenti, la
 173 procedura di chiusura ne richiede quattro; ancora una volta si può fare
 174 riferimento al codice degli esempi \figref{fig:net_cli_code} e
 175 \figref{fig:net_serv_code}, in questo caso la successione degli eventi è la
 176 seguente:
 177
 178 \begin{enumerate}
 179 \item Un processo ad uno dei due capi chiama la funzione \func{close}, dando
 180   l'avvio a quella che viene chiamata \textsl{chiusura attiva} (o
 181   \textit{active close}). Questo comporta l'emissione di un segmento FIN, che
 182   significa che si è finito con l'invio dei dati sulla connessione.
 183
 184 \item L'altro capo della connessione riceve il FIN ed esegue la
 185   \textit{chiusura passiva} (o \textit{passive close}); al FIN, come ad ogni
 186   altro pacchetto, viene risposto con un ACK. Inoltre il ricevimento del FIN
 187   viene segnalato al processo che ha aperto il socket (dopo che ogni altro
 188   eventuale dato rimasto in coda è stato ricevuto) come un end-of-file sulla
 189   lettura, questo perché il ricevimento di un FIN significa che non si
 190   riceveranno altri dati sulla connessione.
 191
 192 \item Dopo un certo tempo anche il secondo processo chiamerà la funzione
 193   \func{close} sul proprio socket, causando l'emissione di un altro segmento
 194   FIN.
 195
 196 \item L'altro capo della connessione riceverà il FIN conclusivo e risponderà
 197   con un ACK.
 198 \end{enumerate}
 199
 200 Dato che in questo caso sono richiesti un FIN ed un ACK per ciascuna direzione
 201 normalmente i segmenti scambiati sono quattro.  Questo non è vero sempre
 202 giacché in alcune situazioni il FIN del passo 1) è inviato insieme a dei dati.
 203 Inoltre è possibile che i segmenti inviati nei passi 2 e 3 dal capo che
 204 effettua la chiusura passiva, siano accorpati in un singolo segmento. In
 205 \figref{fig:TCPel_close} si è rappresentato graficamente lo sequenza di
 206 scambio dei segmenti che stabilisce la connessione.
 207
 208 \begin{figure}[htb]
 209   \centering
 210   \includegraphics[width=10cm]{img/tcp_close}
 211   \caption{La chiusura di una connessione TCP}
 212   \label{fig:TCPel_close}
 213 \end{figure}
 214
 215 Come per il SYN anche il FIN occupa un byte nel numero di sequenza, per cui
 216 l'ACK riporterà un \textit{acknowledge number} incrementato di uno.
 217
 218 Si noti che nella sequenza di chiusura fra i passi 2 e 3 è in teoria possibile
 219 che si mantenga un flusso di dati dal capo della connessione che deve ancora
 220 eseguire la chiusura passiva a quello che sta eseguendo la chiusura attiva.
 221 Nella sequenza indicata i dati verrebbero persi, dato che si è chiuso il
 222 socket dal lato che esegue la chiusura attiva; esistono tuttavia situazioni in
 223 cui si vuole poter sfruttare questa possibilità, usando una procedura che è
 224 chiamata \textit{half-close}; torneremo su questo aspetto e su come
 225 utilizzarlo più avanti, quando parleremo della funzione \func{shutdown}.
 226
 227 La emissione del FIN avviene quando il socket viene chiuso, questo però non
 228 avviene solo per la chiamata della funzione \func{close} (come in
 229 \figref{fig:net_serv_code}), ma anche alla terminazione di un processo (come
 230 in \figref{fig:net_cli_code}). Questo vuol dire ad esempio che se un processo
 231 viene terminato da un segnale tutte le connessioni aperte verranno chiuse.
 232
 233 Infine è da sottolineare che, benché nella figura (e nell'esempio che vedremo
 234 più avanti in \secref{sec:TCPsimp_echo}) sia stato il client ad eseguire la
 235 chiusura attiva, nella realtà questa può essere eseguita da uno qualunque dei
 236 due capi della comunicazione (come in fatto in precedenza nell'esempio di
 237 \figref{fig:net_serv_code}), e anche se il caso più comune resta quello del
 238 client, ci sono alcuni servizi, il principale dei quali è l'HTTP, per i
 239 quali è il server ad effettuare la chiusura attiva.
 240
 241
 242 \subsection{Un esempio di connessione}
 243 \label{sec:TCPel_conn_dia}
 244
 245 Le operazioni del TCP nella creazione e conclusione di una connessione sono
 246 specificate attraverso il diagramma di transizione degli stati riportato in
 247 \figref{fig:TPCel_conn_example}. TCP prevede l'esistenza di 11 diversi stati
 248 per un socket ed un insieme di regole per le transizioni da uno stato
 249 all'altro basate sullo stato corrente e sul tipo di segmento ricevuto; i nomi
 250 degli stati sono gli stessi che vengono riportati del comando \cmd{netstat}
 251 nel campo \textit{State}.
 252
 253 Una descrizione completa del funzionamento del protocollo va al di là degli
 254 obiettivi di questo libro; un approfondimento sugli aspetti principali si
 255 trova in \capref{cha:tcp_protocol}, ma per una trattazione esauriente il
 256 miglior riferimento resta \cite{TCPIll1}; qui ci limiteremo a descrivere
 257 brevemente un semplice esempio di connessione e le transizioni che avvengono
 258 nei due casi appena citati (creazione e terminazione della connessione).
 259
 260 In assenza di connessione lo stato del TCP è \texttt{CLOSED}; quando una
 261 applicazione esegue una apertura attiva il TCP emette un SYN e lo stato
 262 diventa \texttt{SYN\_SENT}; quando il TCP riceve la risposta del SYN$+$ACK
 263 emette un ACK e passa allo stato \texttt{ESTABLISHED}; questo è lo stato
 264 finale in cui avviene la gran parte del trasferimento dei dati.
 265
 266 Dal lato server in genere invece il passaggio che si opera con l'apertura
 267 passiva è quello di portare il socket dallo stato \texttt{CLOSED} allo
 268 stato \texttt{LISTEN} in cui vengono accettate le connessioni.
 269
 270 Dallo stato \texttt{ESTABLISHED} si può uscire in due modi; se un'applicazione
 271 chiama la \texttt{close} prima di aver ricevuto un end of file (chiusura
 272 attiva) la transizione è verso lo stato \texttt{FIN\_WAIT\_1}; se invece
 273 l'applicazione riceve un FIN nello stato \texttt{ESTABLISHED} (chiusura
 274 passiva) la transizione è verso lo stato \texttt{CLOSE\_WAIT}.
 275
 276 In \figref{fig:TPCel_conn_example} è riportato lo schema dello scambio dei
 277 pacchetti che avviene per una un esempio di connessione, insieme ai vari stati
 278 che il protocollo viene ad assumere per i due lati, server e client.
 279
 280 \begin{figure}[htb]
 281   \centering
 282   \includegraphics[width=9cm]{img/tcp_connection}
 283   \caption{Schema dello scambio di pacchetti per un esempio di connessione}
 284   \label{fig:TPCel_conn_example}
 285 \end{figure}
 286
 287 La connessione viene iniziata dal client che annuncia un MSS di 1460 (un
 288 valore tipico per IPv4 su Ethernet) con Linux, il server risponde con lo
 289 stesso valore (ma potrebbe essere anche un valore diverso).
 290
 291 Una volta che la connessione è stabilita il client scrive al server una
 292 richiesta (che assumiamo stare in un singolo segmento, cioè essere minore dei
 293 1460 byte annunciati dal server), quest'ultimo riceve la richiesta e
 294 restituisce una risposta (che di nuovo supponiamo stare in un singolo
 295 segmento). Si noti che l'acknowledge della richiesta è mandato insieme alla
 296 risposta, questo viene chiamato \textit{piggybacking} ed avviene tutte le
 297 volte che che il server è sufficientemente veloce a costruire la risposta, in
 298 caso contrario si avrebbe prima l'emissione di un ACK e poi l'invio della
 299 risposta.
 300
 301 Infine si ha lo scambio dei quattro segmenti che terminano la connessione
 302 secondo quanto visto in \secref{sec:TCPel_conn_term}; si noti che il capo
 303 della connessione che esegue la chiusura attiva entra nello stato
 304 \texttt{TIME\_WAIT} su cui torneremo fra poco.
 305
 306 È da notare come per effettuare uno scambio di due pacchetti (uno di richiesta
 307 e uno di risposta) il TCP necessiti di ulteriori otto segmenti, se invece si
 308 fosse usato UDP sarebbero stati sufficienti due soli pacchetti. Questo è il
 309 costo che occorre pagare per avere l'affidabilità garantita dal TCP, se si
 310 fosse usato UDP si sarebbe dovuto trasferire la gestione di tutta una serie di
 311 dettagli (come la verifica della ricezione dei pacchetti) dal livello del
 312 trasporto all'interno dell'applicazione.
 313
 314 Quello che è bene sempre tenere presente è allora quali sono le esigenze che
 315 si hanno in una applicazione di rete, perché non è detto che TCP sia la
 316 miglior scelta in tutti i casi (ad esempio se si devono solo scambiare dati
 317 già organizzati in piccoli pacchetti l'overhead aggiunto può essere eccessivo)
 318 per questo esistono applicazioni che usano UDP e lo fanno perché nel caso
 319 specifico le sue caratteristiche di velocità e compattezza nello scambio dei
 320 dati rispondono meglio alle esigenze che devono essere affrontate.
 321
 322 \subsection{Lo stato \texttt{TIME\_WAIT}}
 323 \label{sec:TCPel_time_wait}
 324
 325 Come riportato da Stevens in \cite{UNP1} lo stato \texttt{TIME\_WAIT} è
 326 probabilmente uno degli aspetti meno compresi del protocollo TCP, è infatti
 327 comune trovare nei newsgroup domande su come sia possibile evitare che
 328 un'applicazione resti in questo stato lasciando attiva una connessione ormai
 329 conclusa; la risposta è che non deve essere fatto, ed il motivo cercheremo di
 330 spiegarlo adesso.
 331
 332 Come si è visto nell'esempio precedente (vedi \figref{fig:TPCel_conn_example})
 333 \texttt{TIME\_WAIT} è lo stato finale in cui il capo di una connessione che
 334 esegue la chiusura attiva resta prima di passare alla chiusura definitiva
 335 della connessione. Il tempo in cui l'applicazione resta in questo stato deve
 336 essere due volte la MSL (\textit{Maximum Segment Lifetime}).
 337
 338 La MSL è la stima del massimo periodo di tempo che un pacchetto IP può vivere
 339 sulla rete; questo tempo è limitato perché ogni pacchetto IP può essere
 340 ritrasmesso dai router un numero massimo di volte (detto \textit{hop limit}).
 341 Il numero di ritrasmissioni consentito è indicato dal campo TTL dell'header di
 342 IP (per maggiori dettagli vedi \secref{sec:IP_xxx}), e viene decrementato
 343 ad ogni passaggio da un router; quando si annulla il pacchetto viene scartato.
 344 Siccome il numero è ad 8 bit il numero massimo di ``salti'' è di 255, pertanto
 345 anche se il TTL (da \textit{time to live}) non è propriamente un limite sul
 346 tempo di vita, si stima che un pacchetto IP non possa restare nella rete per
 347 più di MSL secondi.
 348
 349 Ogni implementazione del TCP deve scegliere un valore per la MSL (l'RFC~1122
 350 raccomanda 2 minuti, Linux usa 30 secondi), questo comporta una durata dello
 351 stato \texttt{TIME\_WAIT} che a seconda delle implementazioni può variare fra
 352 1 a 4 minuti.
 353
 354 Lo stato \texttt{TIME\_WAIT} viene utilizzato dal protocollo per due motivi
 355 principali:
 356 \begin{enumerate}
 357 \item implementare in maniera affidabile la terminazione della connessione
 358   in entrambe le direzioni.
 359 \item consentire l'eliminazione dei segmenti duplicati dalla rete.
 360 \end{enumerate}
 361
 362 Il punto è che entrambe le ragioni sono importanti, anche se spesso si fa
 363 riferimento solo alla prima; ma è solo se si tiene conto della seconda che si
 364 capisce il perché della scelta di un tempo pari al doppio della MSL come
 365 durata di questo stato.
 366
 367 Il primo dei due motivi precedenti si può capire tornando a
 368 \figref{fig:TPCel_conn_example}: assumendo che l'ultimo ACK della sequenza
 369 (quello del capo che ha eseguito la chiusura attiva) vanga perso, chi esegue
 370 la chiusura passiva non ricevendo risposta rimanderà un ulteriore FIN, per
 371 questo motivo chi esegue la chiusura attiva deve mantenere lo stato della
 372 connessione per essere in grado di reinviare l'ACK e chiuderla correttamente.
 373 Se non fosse così la risposta sarebbe un RST (un altro tipo si segmento) che
 374 verrebbe interpretato come un errore.
 375
 376 Se il TCP deve poter chiudere in maniera pulita entrambe le direzioni della
 377 connessione allora deve essere in grado di affrontare la perdita di uno
 378 qualunque dei quattro segmenti che costituiscono la chiusura. Per questo
 379 motivo lo stato \texttt{TIME\_WAIT} deve essere mantenuto anche dopo l'invio
 380 dell'ultimo ACK per poter essere in grado di poterne gestire l'eventuale
 381 ritrasmissione in caso di perdita.
 382
 383 Il secondo motivo è più complesso da capire, e necessita di spiegare meglio
 384 gli scenari in cui accade che i pacchetti si possono perdere nella rete o
 385 restare intrappolati, per poi riemergere.
 386
 387 Il caso più comune in cui questo avviene è quello di anomalie
 388 nell'instradamento; può accadere cioè che un router smetta di funzionare o che
 389 una connessione fra due router si interrompa. In questo caso i protocolli di
 390 instradamento dei pacchetti possono impiegare diverso tempo (anche dell'ordine
 391 dei minuti) prima di trovare e stabilire un percorso alternativo per i
 392 pacchetti. Nel frattempo possono accadere casi in cui un router manda i
 393 pacchetti verso un'altro e quest'ultimo li rispedisce indietro, o li manda ad
 394 un terzo router che li rispedisce al primo, si creano cioè dei circoli (i
 395 cosiddetti \textit{routing loop}) in cui restano intrappolati i pacchetti.
 396
 397 Se uno di questi pacchetti intrappolati è un segmento di TCP chi l'ha inviato,
 398 non ricevendo risposta, provvederà alla ritrasmissione e se nel frattempo sarà
 399 stata stabilita una strada alternativa il pacchetto ritrasmesso giungerà a
 400 destinazione.
 401
 402 Ma se dopo un po' di tempo (che non supera il limite dell'MSL, dato che
 403 altrimenti verrebbe ecceduto il TTL) l'anomalia viene a cessare il circolo di
 404 instradamento viene spezzato i pacchetti intrappolati potranno essere inviati
 405 alla destinazione finale, con la conseguenza di avere dei pacchetti duplicati;
 406 questo è un caso che il TCP deve essere in grado di gestire.
 407
 408 Allora per capire la seconda ragione per l'esistenza dello stato
 409 \texttt{TIME\_WAIT} si consideri il caso seguente: si supponga di avere una
 410 connessione fra l'IP 195.110.112.236 porta 1550 e l'IP 192.84.145.100 porta
 411 22, che questa venga chiusa e che poco dopo si ristabilisca la stessa
 412 connessione fra gli stessi IP sulle stesse porte (quella che viene detta,
 413 essendo gli stessi porte e numeri IP, una nuova \textsl{incarnazione} della
 414 connessione precedente); in questo caso ci si potrebbe trovare con dei
 415 pacchetti duplicati relativi alla precedente connessione che riappaiono nella
 416 nuova.
 417
 418 Ma fintanto che il socket non è chiuso una nuova incarnazione non può essere
 419 creata, per questo un socket TCP resta sempre nello stato \texttt{TIME\_WAIT}
 420 per un periodo di 2MSL, in modo da attendere MSL secondi per essere sicuri che
 421 tutti i pacchetti duplicati in arrivo siano stati ricevuti (e scartati) o che
 422 nel frattempo siano stati eliminati dalla rete, e altri MSL secondi per essere
 423 sicuri che lo stesso avvenga le risposte nella direzione opposta.
 424
 425 In questo modo il TCP si assicura che quando una viene creata una nuova
 426 connessione tutti gli eventuali segmenti residui di una precedente connessione
 427 che possono causare disturbi sono stati eliminati dalla rete.
 428
 429
 430 \subsection{I numeri di porta}
 431 \label{sec:TCPel_port_num}
 432
 433 In un ambiente multitasking in un dato momento più processi possono dover
 434 usare sia UDP che TCP, e ci devono poter essere più connessioni in
 435 contemporanea. Per poter tenere distinte le diverse connessioni entrambi i
 436 protocolli usano i \textsl{numeri di porta}, che fanno parte, come si può
 437 vedere in \secref{sec:sock_sa_ipv4} e \secref{sec:sock_sa_ipv6} pure delle
 438 strutture degli indirizzi del socket.
 439
 440 Quando un client contatta un server deve poter identificare con quale dei vari
 441 possibili server attivi intende parlare. Sia TCP che UDP definiscono un gruppo
 442 di \textsl{porte conosciute} (le cosiddette \textit{well-known port}) che
 443 identificano una serie di servizi noti (ad esempio la porta 22 identifica il
 444 servizio \texttt{ssh}) effettuati da appositi server che rispondono alle
 445 connessioni verso tali porte.
 446
 447 D'altra parte un client non ha necessità di usare un numero di porta
 448 specifico, per cui in genere vengono usate le cosiddette \textsl{porte
 449   effimere} (o \textit{ephemeral ports}) cioè porte a cui non è assegnato
 450 nessun servizio noto e che vengono assegnate automaticamente dal kernel alla
 451 creazione della connessione. Queste sono dette effimere in quanto vengono
 452 usate solo per la durata della connessione, e l'unico requisito che deve
 453 essere soddisfatto è che ognuna di esse sia assegnata in maniera univoca.
 454
 455 La lista delle porte conosciute è definita dall'RFC~1700 che contiene l'elenco
 456 delle porte assegnate dalla IANA (\textit{Internet Assigned Number Authority})
 457 ma l'elenco viene costantemente aggiornato e pubblicato all'indirizzo
 458 \texttt{ftp://ftp.isi.edu/in-notes/iana/assignements/port-numbers}, inoltre il
 459 file \file{/etc/services} contiene un analogo elenco, con la corrispondenza
 460 fra i numeri di porta ed il nome simbolico del servizio. I numeri sono divisi
 461 in tre intervalli:
 462
 463 \begin{enumerate}
 464 \item \textsl{le porte conosciute}. I numeri da 0 a 1023. Queste sono
 465   controllate e assegnate dalla IANA. Se è possibile la stessa porta è
 466   assegnata allo stesso servizio sia su UDP che su TCP (ad esempio la porta 22
 467   è assegnata a ssh su entrambi i protocolli, anche se viene usata solo dal
 468   TCP).
 469
 470 \item \textsl{le porte registrate}. I numeri da 1024 a 49151. Queste porte non
 471   sono controllate dalla IANA, che però registra ed elenca chi usa queste
 472   porte come servizio agli utenti. Come per le precedenti si assegna una porta
 473   ad un servizio sia per TCP che UDP anche se poi il servizio è implementato
 474   solo su TCP. Ad esempio X Window usa le porte TCP e UDP dal 6000 al 6063
 475   anche se il protocollo è implementato solo tramite TCP.
 476
 477 \item \textsl{le porte private} o \textsl{dinamiche}. I numeri da 49152 a
 478   65535. La IANA non dice nulla riguardo a queste porte che pertanto
 479   sono i candidati naturali ad essere usate come porte effimere.
 480 \end{enumerate}
 481
 482 In realtà rispetto a quanto indicato nell'RFC~1700 i vari sistemi hanno fatto
 483 scelte diverse per le porte effimere, in particolare in
 484 \figref{fig:TCPel_port_alloc} sono riportate quelle di BSD, Solaris e Linux.
 485 Nel caso di Linux poi la scelta fra i due intervalli possibili viene fatta
 486 dinamicamente a seconda della memoria a disposizione del kernel per gestire le
 487 relative tabelle.
 488
 489 \begin{figure}[!htb]
 490   \centering
 491   \includegraphics[width=15cm]{img/port_alloc}
 492   \caption{Allocazione dei numeri di porta}
 493   \label{fig:TCPel_port_alloc}
 494 \end{figure}
 495
 496 I sistemi unix hanno inoltre il concetto di \textsl{porte riservate} (che
 497 corrispondono alle porte con numero minore di 1024 e coincidono quindi con le
 498 porte conosciute). La loro caratteristica è che possono essere assegnate a un
 499 socket solo da un processo con i privilegi di root, per far si che solo
 500 l'amministratore possa allocare queste porte per far partire i relativi
 501 servizi.
 502
 503 Si tenga conto poi che ci sono alcuni client (in particolare \cmd{rsh} e
 504 \cmd{rlogin}) che richiedono una connessione su una porta riservata anche
 505 dal lato client come parte dell'autenticazione. Questo viene fatto tramite la
 506 funzione \func{rresvport} assegnando al socket una porta libera
 507 nell'intervallo fra 512 e 1023.
 508
 509 Data una connessione TCP si suole chiamare \textit{socket pair}\footnote{da
 510   non confondere con la coppia di socket della omonima funzione
 511   \func{socketpair} che fanno riferimento ad una coppia di socket sulla stessa
 512   macchina, non ai capi di una connessione TCP.} la combinazione dei quattro
 513 numeri che definiscono i due capi della connessione e cioè l'indirizzo IP
 514 locale e la porta TCP locale, e l'indirizzo IP remoto e la porta TCP remota;
 515 questa combinazione, che scriveremo usando una notazione del tipo
 516 (195.110.112.152:22, 192.84.146.100:20100), identifica univocamente una
 517 connessione su internet.  Questo concetto viene di solito esteso anche a UDP,
 518 benché in questo caso non abbia senso parlare di connessione. L'utilizzo del
 519 programma \cmd{netstat} permette di visualizzare queste informazioni nei campi
 520 \textit{Local Address} e \textit{Foreing Address}.
 521
 522
 523 \subsection{Le porte ed il modello client/server}
 524 \label{sec:TCPel_port_cliserv}
 525
 526 Per capire meglio l'uso delle porte e come vengono utilizzate quando si ha a
 527 che fare con un'applicazione client/server (come quella che scriveremo in
 528 \secref{sec:TCPel_cunc_serv}) esamineremo cosa accade con le connessioni nel
 529 caso di un server TCP che deve gestire connessioni multiple.
 530
 531 Se eseguiamo un \cmd{netstat} su una macchina di prova (che supponiamo avere
 532 indirizzo 195.110.112.152) potremo avere un risultato del tipo:
 533 \begin{verbatim}
 534 Active Internet connections (servers and established)
 535 Proto Recv-Q Send-Q Local Address           Foreign Address         State
 536 tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
 537 tcp        0      0 0.0.0.0:25              0.0.0.0:*               LISTEN
 538 tcp        0      0 127.0.0.1:53            0.0.0.0:*               LISTEN
 539 \end{verbatim}
 540 essendo presenti e attivi un server ssh, un server di posta e un DNS per il
 541 caching locale.
 542
 543 Questo ci mostra ad esempio che il server ssh ha compiuto un'apertura passiva
 544 mettendosi in ascolto sulla porta 22 riservata a questo servizio e che si è
 545 posto in ascolto per connessioni provenienti da uno qualunque degli indirizzi
 546 associati alle interfacce locali; la notazione 0.0.0.0 usata da netstat è
 547 equivalente all'asterisco utilizzato per il numero di porta ed indica il
 548 valore generico, e corrisponde al valore \const{INADDR\_ANY} definito in
 549 \file{arpa/inet.h}.
 550
 551 Inoltre la porta e l'indirizzo di ogni eventuale connessione esterna non sono
 552 specificati; in questo caso la \textit{socket pair} associata al socket può
 553 essere indicata come (*:22, *:*), usando l'asterisco anche per gli indirizzi
 554 come carattere di \textit{wildchard}.
 555
 556 In genere avendo le macchine associato un solo IP ci si può chiedere che senso
 557 abbia l'utilizzo dell'indirizzo generico per l'indirizzo locale, ma esistono
 558 anche macchine che hanno più di un indirizzo IP (il cosiddetto
 559 \textit{multihoming}) in questo modo si possono accettare connessioni
 560 indirizzate verso uno qualunque di essi. Ma come si può vedere nell'esempio
 561 con il DNS in ascolto sulla porta 53 è anche possibile restringere l'accesso
 562 solo alle connessioni che provengono da uno specifico indirizzo, cosa che nel
 563 caso è fatta accettando solo connessioni che arrivino sull'interfaccia di
 564 loopback.
 565
 566 Una volta che ci si vorrà collegare a questa macchina da un'altra posta
 567 all'indirizzo 192.84.146.100 si potrà lanciare un client \cmd{ssh} per
 568 creare una connessione verso la precedente, e il kernel assocerà al suddetto
 569 una porta effimera che per esempio potrà essere la 21100, la connessione
 570 allora sarà espressa dalla socket pair (192.84.146.100:21100,
 571 195.110.112.152.22).
 572
 573 Alla ricezione della richiesta dal client il server creerà un processo figlio
 574 per gestire la connessione, se a questo punto eseguiamo nuovamente il
 575 programma netstat otterremo come risultato:
 576 \begin{verbatim}
 577 Active Internet connections (servers and established)
 578 Proto Recv-Q Send-Q Local Address           Foreign Address         State
 579 tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
 580 tcp        0      0 0.0.0.0:25              0.0.0.0:*               LISTEN
 581 tcp        0      0 127.0.0.1:53            0.0.0.0:*               LISTEN
 582 tcp        0      0 195.110.112.152:22      192.84.146.100:21100    ESTABLISHED
 583 \end{verbatim}
 584
 585 Come si può notare il server è ancora in ascolto sulla porta 22, però adesso
 586 c'è un nuovo socket (con lo stato \texttt{ESTABLISHED}) che anch'esso utilizza
 587 la porta 22, ed ha specificato l'indirizzo locale, questo è il socket con cui
 588 il processo figlio gestisce la connessione mentre il padre resta in ascolto
 589 sul socket originale.
 590
 591 Se a questo punto lanciamo un'altra volta il client ssh per una seconda
 592 connessione quello che otterremo usando netstat sarà qualcosa del genere:
 593 \begin{verbatim}
 594 Active Internet connections (servers and established)
 595 Proto Recv-Q Send-Q Local Address           Foreign Address         State
 596 tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
 597 tcp        0      0 0.0.0.0:25              0.0.0.0:*               LISTEN
 598 tcp        0      0 127.0.0.1:53            0.0.0.0:*               LISTEN
 599 tcp        0      0 195.110.112.152:22      192.84.146.100:21100    ESTABLISHED
 600 tcp        0      0 195.110.112.152:22      192.84.146.100:21101    ESTABLISHED
 601 \end{verbatim}
 602 cioè il client effettuerà la connessione usando un'altra porta effimera, con
 603 questa sarà aperta la connessione, ed il server creerà un'altro processo
 604 figlio sarà creato per gestirla.
 605
 606 Tutto ciò mostra come TCP, per poter gestire le connessioni con un server
 607 concorrente, non può suddividere i pacchetti solo sulla base della porta di
 608 destinazione, ma deve usare tutta l'informazione contenuta nella socket pair,
 609 compresa la porta dell'indirizzo remoto.  E se andassimo a vedere quali sono i
 610 processi a cui fanno riferimento i vari socket vedremmo che i pacchetti che
 611 arrivano dalla porta remota 21100 vanno al primo figlio e quelli che arrivano
 612 alla porta 21101 al secondo.
 613
 614
 615 \section{Le funzioni dei socket TCP}
 616 \label{sec:TCPel_functions}
 617
 618 In questa sezione descriveremo in dettaglio le varie funzioni necessarie per
 619 l'uso dei socket TCP già citate in precedenza (e utilizzate nei due esempi
 620 \secref{sec:net_cli_sample} e \secref{sec:net_serv_sample}) con l'eccezione
 621 della funzione \func{socket} che è già stata esaminata in dettaglio in
 622 \secref{sec:sock_socket}.
 623
 624 In \figref{fig:TCPel_cliserv_func} abbiamo un tipico schema di funzionamento
 625 di un'applicazione client-server che usa i socket TCP: prima il server viene
 626 avviato ed in seguito il client si connette, in questo caso, a differenza di
 627 quanto accadeva con gli esempi elementari del \capref{cha:network} si assume
 628 che sia il client ad effettuare delle richieste a cui il server risponde, il
 629 client notifica poi di avere concluso inviando un end-of-file a cui il server
 630 risponderà anche lui chiudendo la connessione per aspettarne una nuova.
 631
 632 \begin{figure}[!htb]
 633   \centering
 634
 635   \caption{Struttura delle funzioni dei socket per una semplice applicazione
 636     client/server su TCP.}
 637   \label{fig:TCPel_cliserv_func}
 638 \end{figure}
 639
 640 Useremo questo schema anche per l'esempio di reimplementazione del servizio
 641 \texttt{daytime} che illustreremo in \secref{sec:TCPel_cunc_serv}.
 642
 643
 644 \subsection{La funzione \func{bind}}
 645 \label{sec:TCPel_func_bind}
 646
 647 La funzione \func{bind} assegna un indirizzo locale ad un socket. È usata
 648 cioè per specificare la prima parte dalla socket pair. Viene usata sul lato
 649 server per specificare la porta (e gli eventuali indirizzi locali) su cui poi
 650 ci si porrà in ascolto. Il prototipo della funzione è il seguente:
 651 \begin{prototype}{sys/socket.h}
 652 {int bind(int sockfd, const struct sockaddr *serv\_addr, socklen\_t addrlen)}
 653
 654   Assegna un indirizzo ad un socket.
 655
 656   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 657     errore; in caso di errore la variabile \var{errno} viene impostata secondo
 658     i seguenti codici di errore:
 659   \begin{errlist}
 660   \item[\errcode{EBADF}] il file descriptor non è valido.
 661   \item[\errcode{EINVAL}] il socket ha già un indirizzo assegnato.
 662   \item[\errcode{ENOTSOCK}] il file descriptor non è associato ad un socket.
 663   \item[\errcode{EACCES}] si è cercato di usare una porta riservata senza
 664     sufficienti privilegi.
 665   \end{errlist}}
 666 \end{prototype}
 667
 668 Il primo argomento è un file descriptor ottenuto da una precedente chiamata a
 669 \func{socket}, mentre il secondo e terzo argomento sono rispettivamente
 670 l'indirizzo (locale) del socket e la dimensione della struttura che lo
 671 contiene, secondo quanto già trattato in \secref{sec:sock_sockaddr}.
 672
 673 Con il TCP la chiamata \func{bind} permette di specificare l'indirizzo, la
 674 porta, entrambi o nessuno dei due. In genere i server utilizzano una porta
 675 nota che assegnano all'avvio, se questo non viene fatto è il kernel a
 676 scegliere una porta effimera quando vengono eseguite la funzioni
 677 \func{connect} o \func{listen}, ma se questo è normale per il client non lo è
 678 per il server\footnote{un'eccezione a tutto ciò sono i server che usano RPC.
 679   In questo caso viene fatta assegnare dal kernel una porta effimera che poi
 680   viene registrata presso il \textit{portmapper}; quest'ultimo è un altro
 681   demone che deve essere contattato dai client per ottenere la porta effimera
 682   su cui si trova il server.} che in genere viene identificato dalla porta su
 683 cui risponde (l'elenco di queste porte, e dei relativi servizi, è in
 684 \file{/etc/services}).
 685
 686 Con \func{bind} si può assegnare un IP specifico ad un socket, purché questo
 687 appartenga ad una interfaccia della macchina.  Per un client TCP questo
 688 diventerà l'indirizzo sorgente usato per i tutti i pacchetti inviati sul
 689 socket, mentre per un server TCP questo restringerà l'accesso al socket solo
 690 alle connessioni che arrivano verso tale indirizzo.
 691
 692 Normalmente un client non specifica mai un indirizzo ad un suo socket, ed il
 693 kernel sceglie l'indirizzo di origine quando viene effettuata la connessione
 694 sulla base dell'interfaccia usata per trasmettere i pacchetti, (che dipende
 695 dalle regole di instradamento usate per raggiungere il server).
 696 Se un server non specifica il suo indirizzo locale il kernel userà come
 697 indirizzo di origine l'indirizzo di destinazione specificato dal SYN del
 698 client.
 699
 700 Per specificare un indirizzo generico con IPv4 si usa il valore
 701 \const{INADDR\_ANY}, il cui valore, come visto anche negli esempi precedenti
 702 è pari a zero, nell'esempio \figref{fig:net_serv_code} si è usata
 703 un'assegnazione immediata del tipo:
 704
 705 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
 706 serv_add.sin_addr.s_addr = htonl(INADDR_ANY);   /* connect from anywhere */
 707 \end{lstlisting}
 708
 709 Si noti che si è usato \func{htonl} per assegnare il valore
 710 \const{INADDR\_ANY}, benché essendo questo pari a zero il riordinamento sia
 711 inutile.  Si tenga presente comunque che tutte le costanti \val{INADDR\_}
 712 (riportate in ) sono definite secondo l'ordinamento della macchina, ed anche
 713 se esse possono essere invarianti rispetto all'ordinamento, è comunque buona
 714 norma usare sempre la funzione \func{htonl}.
 715
 716 \begin{table}[htb]
 717   \centering
 718   \footnotesize
 719   \begin{tabular}[c]{|l|l|}
 720     \hline
 721     \textbf{Costante} & \textbf{Significato} \\
 722     \hline
 723     \hline
 724     \const{INADDR\_ANY}      & Indirizzo generico (\texttt{0.0.0.0})\\
 725     \const{INADDR\_BROADCAST}& Indirizzo di \textit{broadcast}.\\
 726     \const{INADDR\_LOOPBACK} & Indirizzo di \textit{loopback}
 727                                (\texttt{127.0.0.1}).\\
 728     \const{INADDR\_NONE}     & Indirizzo errato.\\
 729     \hline
 730   \end{tabular}
 731   \caption{Costanti di definizione di alcuni indirizzi generici per IPv4.}
 732   \label{tab:TCPel_ipv4_addr}
 733 \end{table}
 734
 735 L'esempio precedente funziona correttamente con IPv4 poiché che l'indirizzo è
 736 rappresentabile anche con un intero a 32 bit; non si può usare lo stesso
 737 metodo con IPv6, in cui l'indirizzo deve necessariamente essere specificato
 738 con una struttura, perché il linguaggio C non consente l'uso di una struttura
 739 costante come operando a destra in una assegnazione.
 740
 741 Per questo motivo nell'header \file{netinet/in.h} è definita una variabile
 742 \type{in6addr\_any} (dichiarata come \ctyp{extern}, ed inizializzata dal
 743 sistema al valore \const{IN6ADRR\_ANY\_INIT}) che permette di effettuare una
 744 assegnazione del tipo:
 745
 746 \begin{lstlisting}[labelstep=0,frame=,indent=1cm]{}
 747 serv_add.sin6_addr = in6addr_any;   /* connect from anywhere */
 748 \end{lstlisting}
 749
 750
 751 \subsection{La funzione \func{connect}}
 752 \label{sec:TCPel_func_connect}
 753
 754 La funzione \func{connect} è usata da un client TCP per stabilire la
 755 connessione con un server TCP, il prototipo della funzione è il seguente:
 756 \begin{prototype}{sys/socket.h}
 757 {int connect(int sockfd, const struct sockaddr *servaddr, socklen\_t addrlen)}
 758
 759   Stabilisce una connessione fra due socket.
 760
 761   \bodydesc{La funzione restituisce zero in caso di successo e -1 per un
 762     errore, in caso di errore \var{errno} assumerà i valori:
 763   \begin{errlist}
 764   \item[\errcode{ECONNREFUSED}] non c'è nessuno in ascolto sull'indirizzo
 765     remoto.
 766   \item[\errcode{ETIMEDOUT}] si è avuto timeout durante il tentativo di
 767     connessione.
 768   \item[\errcode{ENETUNREACH}] la rete non è raggiungibile.
 769   \item[\errcode{EINPROGRESS}] il socket è non bloccante (vedi
 770     \secref{sec:file_noblocking}) e la connessione non può essere conclusa
 771     immediatamente.
 772   \item[\errcode{EALREADY}] il socket è non bloccante (vedi
 773     \secref{sec:file_noblocking}) e un tentativo precedente di connessione non
 774     si è ancora concluso.
 775   \item[\errcode{EAGAIN}] non ci sono più porte locali libere.
 776   \item[\errcode{EAFNOSUPPORT}] l'indirizzo non ha una famiglia di indirizzi
 777     corretta nel relativo campo.
 778   \item[\errcode{EACCES}, \errcode{EPERM}] si è tentato di eseguire una
 779     connessione ad un indirizzo broadcast senza che il socket fosse stato
 780     abilitato per il broadcast.
 781   \end{errlist}
 782   altri errori possibili sono: \errval{EFAULT}, \errval{EBADF},
 783   \errval{ENOTSOCK}, \errval{EISCONN} e \errval{EADDRINUSE}.}
 784 \end{prototype}
 785
 786 Il primo argomento è un file descriptor ottenuto da una precedente chiamata a
 787 \func{socket}, mentre il secondo e terzo argomento sono rispettivamente
 788 l'indirizzo e la dimensione della struttura che contiene l'indirizzo del
 789 socket, già descritta in \secref{sec:sock_sockaddr}.
 790
 791 La struttura dell'indirizzo deve essere inizializzata con l'indirizzo IP e il
 792 numero di porta del server a cui ci si vuole connettere, come mostrato
 793 nell'esempio \secref{sec:net_cli_sample} usando le funzioni illustrate in
 794 \secref{sec:sock_addr_func}.
 795
 796 Nel caso di socket TCP la funzione \func{connect} avvia il \textit{three way
 797   handshake}, e ritorna solo quando la connessione è stabilita o si è
 798 verificato un errore. Le possibili cause di errore sono molteplici (ed i
 799 relativi codici riportati sopra), quelle che però dipendono dalla situazione
 800 della rete e non da errori o problemi nella chiamata della funzione sono le
 801 seguenti:
 802 \begin{enumerate}
 803 \item Il client non riceve risposta al SYN: l'errore restituito è
 804   \errcode{ETIMEDOUT}. Stevens riporta che BSD invia un primo SYN alla chiamata
 805   di \func{connect}, un'altro dopo 6 secondi, un terzo dopo 24 secondi, se
 806   dopo 75 secondi non ha ricevuto risposta viene ritornato l'errore. Linux
 807   invece ripete l'emissione del SYN ad intervalli di 30 secondi per un numero
 808   di volte che può essere stabilito dall'utente sia con una opportuna
 809   \func{sysctl} che attraverso il filesystem \file{/proc} scrivendo il valore
 810   voluto in \file{/proc/sys/net/ipv4/tcp\_syn\_retries}. Il valore predefinito
 811   per la ripetizione dell'invio è di 5 volte, che comporta un timeout dopo
 812   circa 180 secondi.
 813 %
 814 % Le informazioni su tutte le opzioni impostabili via /proc stanno in
 815 % Linux/Documentation/networking/ip-sysctl.txt
 816 %
 817 \item Il client riceve come risposta al SYN un RST significa che non c'è
 818   nessun programma in ascolto per la connessione sulla porta specificata (il
 819   che vuol dire probabilmente che o si è sbagliato il numero della porta o che
 820   non è stato avviato il server), questo è un errore fatale e la funzione
 821   ritorna non appena il RST viene ricevuto riportando un errore
 822   \errcode{ECONNREFUSED}.
 823
 824   Il flag RST sta per \textit{reset} ed è un segmento inviato direttamente
 825   dal TCP quando qualcosa non va. Tre condizioni che generano un RST sono:
 826   quando arriva un SYN per una porta che non ha nessun server in ascolto,
 827   quando il TCP abortisce una connessione in corso, quando TCP riceve un
 828   segmento per una connessione che non esiste.
 829
 830 \item Il SYN del client provoca l'emissione di un messaggio ICMP di
 831   destinazione non raggiungibile. In questo caso dato che il messaggio può
 832   essere dovuto ad una condizione transitoria si ripete l'emissione dei SYN
 833   come nel caso precedente, fino al timeout, e solo allora si restituisce il
 834   codice di errore dovuto al messaggio ICMP, che da luogo ad un
 835   \errcode{ENETUNREACH}.
 836
 837 \end{enumerate}
 838
 839 Se si fa riferimento al diagramma degli stati del TCP riportato in
 840 \figref{fig:TCP_state_diag} la funzione \func{connect} porta un socket
 841 dallo stato \texttt{CLOSED} (lo stato iniziale in cui si trova un socket
 842 appena creato) prima allo stato \texttt{SYN\_SENT} e poi, al ricevimento del
 843 ACK, nello stato \texttt{ESTABLISHED}. Se invece la connessione fallisce il
 844 socket non è più utilizzabile e deve essere chiuso.
 845
 846 Si noti infine che con la funzione \func{connect} si è specificato solo
 847 indirizzo e porta del server, quindi solo una metà della socket pair; essendo
 848 questa funzione usata nei client l'altra metà contenente indirizzo e porta
 849 locale viene lasciata all'assegnazione automatica del kernel, e non è
 850 necessario effettuare una \func{bind}.
 851
 852
 853 \subsection{La funzione \func{listen}}
 854 \label{sec:TCPel_func_listen}
 855
 856 La funzione \func{listen} è usata per usare un socket in modalità passiva,
 857 cioè, come dice il nome, per metterlo in ascolto di eventuali connessioni; in
 858 sostanza l'effetto della funzione è di portare il socket dallo stato
 859 \texttt{CLOSED} a quello \texttt{LISTEN}. In genere si chiama la funzione in
 860 un server dopo le chiamate a \func{socket} e \func{bind} e prima della
 861 chiamata ad \func{accept}. Il prototipo della funzione come definito dalla
 862 pagina di manuale è:
 863 \begin{prototype}{sys/socket.h}{int listen(int sockfd, int backlog)}
 864   Pone un socket in attesa di una connessione.
 865
 866   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
 867     errore. I codici di errore restituiti in \var{errno} sono i seguenti:
 868   \begin{errlist}
 869   \item[\errcode{EBADF}] l'argomento \var{sockfd} non è un file descriptor
 870     valido.
 871   \item[\errcode{ENOTSOCK}] l'argomento \var{sockfd} non è un socket.
 872   \item[\errcode{EOPNOTSUPP}] il socket è di un tipo che non supporta questa
 873     operazione.
 874   \end{errlist}}
 875 \end{prototype}
 876
 877 La funzione pone il socket specificato da \var{sockfd} in modalità passiva e
 878 predispone una coda per le connessioni in arrivo di lunghezza pari a
 879 \var{backlog}. La funzione si può applicare solo a socket di tipo
 880 \const{SOCK\_STREAM} o \const{SOCK\_SEQPACKET}.
 881
 882 Il parametro \var{backlog} indica il numero massimo di connessioni pendenti
 883 accettate; se esso viene ecceduto il client al momento della richiesta della
 884 connessione riceverà un errore di tipo \errcode{ECONNREFUSED}, o se il
 885 protocollo, come accade nel caso del TCP, supporta la ritrasmissione, la
 886 richiesta sarà ignorata in modo che la connessione possa venire ritentata.
 887
 888 Per capire meglio il significato di tutto ciò occorre approfondire la modalità
 889 con cui il kernel tratta le connessioni in arrivo. Per ogni socket in ascolto
 890 infatti vengono mantenute due code:
 891 \begin{enumerate}
 892 \item Una coda delle connessioni incomplete (\textit{incomplete connection
 893     queue} che contiene un ingresso per ciascun socket per il quale è arrivato
 894   un SYN ma il three way handshake non si è ancora concluso.  Questi socket
 895   sono tutti nello stato \texttt{SYN\_RECV}.
 896 \item Una coda delle connessioni complete (\textit{complete connection queue}
 897   che contiene un ingresso per ciascun socket per il quale il three way
 898   handshake è stato completato ma ancora \func{accept} non è ritornata.
 899   Questi socket sono tutti nello stato \texttt{ESTABLISHED}.
 900 \end{enumerate}
 901
 902 Lo schema di funzionamento è descritto in \figref{fig:TCPel_xxx}, quando
 903 arriva un SYN da un client il server crea una nuova entrata nella coda delle
 904 connessioni incomplete, e poi risponde con il SYN$+$ACK. La entrata resterà
 905 nella coda delle connessioni incomplete fino al ricevimento dell'ACK dal
 906 client o fino ad un timeout. Nel caso di completamento del three way handshake
 907 l'entrata viene sostata nella coda delle connessioni complete. Quando il
 908 processo chiama la funzione \func{accept} (vedi
 909 \secref{sec:TCPel_func_accept}) la prima entrata nella coda delle connessioni
 910 complete è passata al programma, o, se la coda è vuota, il processo viene
 911 posto in attesa e risvegliato all'arrivo della prima connessione completa.
 912
 913 Storicamente il valore del parametro \var{backlog} era corrispondente al
 914 massimo valore della somma del numero di entrate possibili per ciascuna di
 915 dette code. Stevens riporta che BSD ha sempre applicato un fattore di 1.5 al
 916 valore, e provvede una tabella con i risultati ottenuti con vari kernel,
 917 compreso Linux 2.0, che mostrano le differenze fra diverse implementazioni.
 918
 919 In Linux il significato di questo valore è cambiato a partire dal kernel 2.2
 920 per prevenire l'attacco chiamato \textit{syn flood}. Questo si basa
 921 sull'emissione da parte dell'attaccante di un grande numero di pacchetti SYN
 922 indirizzati verso una porta forgiati con indirizzo IP fasullo\footnote{con la
 923   tecnica che viene detta \textit{ip spoofing}.} così che i SYN$+$ACK vanno
 924 perduti e la coda delle connessioni incomplete viene saturata, impedendo di
 925 fatto ulteriori connessioni.
 926
 927 Per ovviare a questo il significato del \var{backlog} è stato cambiato a
 928 indicare la lunghezza della coda delle connessioni complete. La lunghezza
 929 della coda delle connessioni incomplete può essere ancora controllata usando
 930 la \func{sysctl} o scrivendola direttamente in
 931 \file{/proc/sys/net/ipv4/tcp\_max\_syn\_backlog}. Quando si attiva la
 932 protezione dei syncookies però (con l'opzione da compilare nel kernel e da
 933 attivare usando \file{/proc/sys/net/ipv4/tcp\_syncookies}) questo valore
 934 viene ignorato e non esiste più un valore massimo.  In ogni caso in Linux il
 935 valore di \var{backlog} viene troncato ad un massimo di \const{SOMAXCONN}
 936 se è superiore a detta costante (che di default vale 128).
 937
 938 La scelta storica per il valore di questo parametro è di 5, e alcuni vecchi
 939 kernel non supportavano neanche valori superiori, ma la situazione corrente è
 940 molto cambiata per via della presenza di server web che devono gestire un gran
 941 numero di connessioni per cui un tale valore non è più adeguato. Non esiste
 942 comunque una risposta univoca per la scelta del valore, per questo non
 943 conviene specificarlo con una costante (il cui cambiamento richiederebbe la
 944 ricompilazione del server) ma usare piuttosto una variabile di ambiente (vedi
 945 \secref{sec:proc_environ}).
 946
 947 Lo Stevens tratta accuratamente questo argomento, con esempi presi da casi
 948 reali su web server, ed in particolare evidenzia come non sia più vero che il
 949 compito principale della coda sia quello di gestire il caso in cui il server è
 950 occupato fra chiamate successive alla \func{accept} (per cui la coda più
 951 occupata sarebbe quella delle connessioni completate), ma piuttosto quello di
 952 gestire la presenza di un gran numero di SYN in attesa di concludere il
 953 three way handshake.
 954
 955 Infine va messo in evidenza che nel caso di socket TCP quando un SYN arriva
 956 con tutte le code piene, il pacchetto deve essere ignorato. Questo perché la
 957 condizione in cui le code sono piene è ovviamente transitoria, per cui se il
 958 client ritrasmette il SYN è probabile che passato un po' di tempo possa
 959 trovare nella coda lo spazio per una nuova connessione. Se invece si
 960 rispondesse con un RST per indicare l'impossibilità di effettuare la
 961 connessione la chiamata a \func{connect} nel client ritornerebbe con una
 962 condizione di errore, costringendo a inserire nell'applicazione la gestione
 963 dei tentativi di riconnessione che invece può essere effettuata in maniera
 964 trasparente dal protocollo TCP.
 965
 966
 967 \subsection{La funzione \func{accept}}
 968 \label{sec:TCPel_func_accept}
 969
 970 La funzione \func{accept} è chiamata da un server TCP per gestire la
 971 connessione una volta che sia stato completato il three way handshake, la
 972 funzione restituisce un nuovo socket descriptor su cui si potrà operare per
 973 effettuare la comunicazione. Se non ci sono connessioni completate il processo
 974 viene messo in attesa. Il prototipo della funzione è il seguente:
 975 \begin{prototype}{sys/socket.h}
 976 {int accept(int sockfd, struct sockaddr *addr, socklen\_t *addrlen)}
 977
 978   Accetta una connessione sul socket specificato.
 979
 980   \bodydesc{La funzione restituisce un numero di socket descriptor positivo in
 981     caso di successo e -1 in caso di errore, nel qual caso la variabile
 982     \var{errno} viene impostata ai seguenti valori:
 983
 984   \begin{errlist}
 985   \item[\errcode{EBADF}] l'argomento \var{sockfd} non è un file descriptor
 986     valido.
 987   \item[\errcode{ENOTSOCK}] l'argomento \var{sockfd} non è un socket.
 988   \item[\errcode{EOPNOTSUPP}] il socket è di un tipo che non supporta questa
 989     operazione.
 990   \item[\errcode{EAGAIN} o \errcode{EWOULDBLOCK}] il socket è stato impostato
 991     come non bloccante (vedi \secref{sec:file_noblocking}), e non ci sono
 992     connessioni in attesa di essere accettate.
 993   \item[\errcode{EPERM}] Le regole del firewall non consentono la connessione.
 994   \item[\errcode{ENOBUFS}, \errcode{ENOMEM}] questo spesso significa che
 995     l'allocazione della memoria è limitata dai limiti sui buffer dei socket,
 996     non dalla memoria di sistema.
 997   \end{errlist}
 998   Inoltre possono essere restituiti gli errori di rete relativi al nuovo
 999   socket come: \errval{EMFILE}, \errval{EINVAL}, \errval{ENOSR},
1000   \errval{ENOBUFS}, \errval{EFAULT}, \errval{EPERM}, \errval{ECONNABORTED},
1001   \errval{ESOCKTNOSUPPORT}, \errval{EPROTONOSUPPORT}, \errval{ETIMEDOUT},
1002   \errval{ERESTARTSYS}.}
1003 \end{prototype}
1004
1005 Estrae la prima connessione relativa al socket \var{sockfd} in attesa sulla
1006 coda delle connessioni complete, che associa ad nuovo socket con le stesse
1007 caratteristiche di \var{sockfd} (restituito dalla funzione stessa).  Il socket
1008 originale non viene toccato. Nella struttura \var{addr} e nella variabile
1009 \var{addrlen} vengono restituiti indirizzo e relativa lunghezza del client che
1010 si è connesso.
1011
1012 La funzione può essere usata solo con socket che supportino la connessione
1013 (cioè di tipo \const{SOCK\_STREAM}, \const{SOCK\_SEQPACKET} o
1014 \const{SOCK\_RDM}). Per alcuni protocolli che richiedono una conferma
1015 esplicita della connessione, (attualmente in Linux solo DECnet ha questo
1016 comportamento), la funzione opera solo l'estrazione dalla coda delle
1017 connessioni, la conferma della connessione viene fatta implicitamente dalla
1018 prima chiamata ad una \func{read} o una \func{write} mentre il rifiuto della
1019 connessione viene fatto con la funzione \func{close}.
1020
1021 È da chiarire che Linux presenta un comportamento diverso nella gestione degli
1022 errori rispetto ad altre implementazioni dei socket BSD, infatti la funzione
1023 \func{accept} passa gli errori di rete pendenti sul nuovo socket come codici
1024 di errore per \func{accept}. Inoltre la funzione non fa ereditare ai nuovi
1025 socket flag come \const{O\_NONBLOCK}, che devono essere rispecificati volta
1026 volta, questo è un comportamento diverso rispetto a quanto accade con BSD e
1027 deve essere tenuto in conto per scrivere programmi portabili.
1028
1029 I due argomenti \var{cliaddr} e \var{addrlen} (si noti che quest'ultimo
1030 è passato per indirizzo per avere indietro il valore) sono usati per ottenere
1031 l'indirizzo del client da cui proviene la connessione. Prima della chiamata
1032 \var{addrlen} deve essere inizializzato alle dimensioni della struttura il
1033 cui indirizzo è passato come argomento in \var{cliaddr}, al ritorno della
1034 funzione \var{addrlen} conterrà il numero di byte scritti dentro
1035 \var{cliaddr}. Se questa informazione non interessa basterà inizializzare a
1036 \val{NULL} detti puntatori.
1037
1038 Se la funzione ha successo restituisce il descrittore di un nuovo socket
1039 creato dal kernel (detto \textit{connected socket}) a cui viene associata la
1040 prima connessione completa (estratta dalla relativa coda, vedi
1041 \secref{sec:TCPel_func_listen}) che il client TCP ha effettuato verso il
1042 socket \var{sockfd}. Quest'ultimo (detto \textit{listening socket}) è quello
1043 creato all'inizio e messo in ascolto con \func{listen}, e non viene toccato
1044 dalla funzione.  Se non ci sono connessioni pendenti da accettare la funzione
1045 mette in attesa il processo\footnote{a meno che non si sia imopstato il socket
1046   per essere non bloccante (vedi \secref{sec:file_noblocking}), nel qual caso
1047   ritorna con l'errore \errcode{EAGAIN}.  Torneremo su questa modalità di
1048   operazione in \secref{sec:xxx_sock_noblock}.}  fintanto che non ne arriva
1049 una.
1050
1051 Il meccanismo di funzionamento di \func{accept} è essenziale per capire il
1052 funzionamento di un server: in generale infatti c'è sempre un solo socket in
1053 ascolto, che resta per tutto il tempo nello stato \texttt{LISTEN}, mentre le
1054 connessioni vengono gestite dai nuovi socket ritornati da \func{accept} che
1055 si trovano automaticamente nello stato \texttt{ESTABLISHED} e utilizzati fino
1056 alla chiusura della connessione che avviene su di essi.  Si può riconoscere
1057 questo schema anche nell'esempio elementare in \figref{fig:net_serv_code} dove
1058 per ogni connessione il socket creato da \func{accept} viene chiuso dopo
1059 l'invio dei dati.
1060
1061
1062 \subsection{La funzione \func{close}}
1063 \label{sec:TCPel_func_close}
1064
1065 La funzione standard unix \func{close} (vedi \secref{sec:file_close}) che si
1066 usa sui file può essere usata con lo stesso effetto anche sui socket
1067 descriptor.
1068
1069 L'azione standard di questa funzione quando applicata a socket è di marcarlo
1070 come chiuso e ritornare immediatamente al processo. Una volta chiamata il
1071 socket descriptor non è più utilizzabile dal processo e non può essere usato
1072 come argomento per una \func{write} o una \func{read} (anche se l'altro
1073 capo della connessione non avesse chiuso la sua parte).  Il kernel invierà
1074 comunque tutti i dati che ha in coda prima di iniziare la sequenza di chiusura.
1075
1076 Vedremo più avanti in \secref{sec:TCPadv_so_linger} come è possibile cambiare
1077 questo comportamento, e cosa deve essere fatto perché il processo possa
1078 assicurarsi che l'altro capo abbia ricevuto tutti i dati.
1079
1080 Come per i file anche per i socket descriptor viene mantenuto un numero di
1081 riferimenti, per cui se più di un processo ha lo stesso socket aperto
1082 l'emissione del FIN e la sequenza di chiusura di TCP non viene innescata
1083 fintanto che il numero di riferimenti non si annulla. Questo è il
1084 comportamento normale che ci si aspetta in un'applicazione client/server quale
1085 quella che illustreremo in \secref{sec:TCPel_cunc_serv}.
1086
1087 Per attivare immediatamente l'emissione del FIN e la sequenza di chiusura si
1088 può usare la funzione \func{shutdown} su cui torneremo in seguito.
1089
1090
1091
1092 \section{I server concorrenti su TCP}
1093 \label{sec:TCPel_cunc_serv}
1094
1095 Il server \texttt{daytime} dell'esempio in \secref{sec:net_cli_sample} è un
1096 tipico esempio di server iterativo, in cui viene servita una richiesta alla
1097 volta; in generale però, specie se il servizio è più complesso e comporta uno
1098 scambio di dati più sostanzioso di quello in questione, non è opportuno
1099 bloccare un server nel servizio di un client per volta; per questo si ricorre
1100 alle capacità di multitasking del sistema.
1101
1102 Il modo più immediato per creare un server concorrente è allora quello di
1103 usare la funzione \func{fork} per far creare al server per ogni richiesta da
1104 parte di un client un processo figlio che si incarichi della gestione della
1105 comunicazione.
1106
1107
1108 \subsection{Un esempio di server \textit{daytime} concorrente}
1109 \label{sec:TCPel_cunc_daytime}
1110
1111 Per illustrare il meccanismo usato in generale per creare un server
1112 concorrente abbiamo riscritto il server \texttt{daytime} dell'esempio
1113 precedente in forma concorrente, inserendo anche una opzione per la stampa
1114 degli indirizzi delle connessioni ricevute.
1115
1116 In \figref{fig:TCPel_serv_code} è mostrato un estratto del codice, in cui si
1117 sono tralasciati il trattamento delle opzioni e le parti rimaste invariate
1118 rispetto al precedente esempio. Al solito il sorgente completo del server
1119 \file{ElemDaytimeTCPCuncServ.c} è allegato nella directory dei sorgenti.
1120
1121 \begin{figure}[!htb]
1122   \footnotesize
1123   \begin{lstlisting}{}
1124 #include <sys/types.h>   /* predefined types */
1125 #include <unistd.h>      /* include unix standard library */
1126 #include <arpa/inet.h>   /* IP addresses conversion utiliites */
1127 #include <sys/socket.h>  /* socket library */
1128 #include <stdio.h>       /* include standard I/O library */
1129 #include <time.h>
1130
1131 int main(int argc, char *argv[])
1132 {
1133     int list_fd, conn_fd;
1134     int i;
1135     struct sockaddr_in serv_add, client;
1136     char buffer[MAXLINE];
1137     socklen_t len;
1138     time_t timeval;
1139     pid_t pid;
1140     int logging=0;
1141      ...
1142     /* write daytime to client */
1143     while (1) {
1144         if ( (conn_fd = accept(list_fd, (struct sockaddr *)&client, &len))
1145              <0 ) {
1146             perror("accept error");
1147             exit(-1);
1148         }
1149         /* fork to handle connection */
1150         if ( (pid = fork()) < 0 ){
1151             perror("fork error");
1152             exit(-1);
1153         }
1154         if (pid == 0) {                 /* child */
1155             close(list_fd);
1156             timeval = time(NULL);
1157             snprintf(buffer, sizeof(buffer), "%.24s\r\n", ctime(&timeval));
1158             if ( (write(conn_fd, buffer, strlen(buffer))) < 0 ) {
1159                 perror("write error");
1160                 exit(-1);
1161             }
1162             if (logging) {
1163                 inet_ntop(AF_INET, &client.sin_addr, buffer, sizeof(buffer));
1164                 printf("Request from host %s, port %d\n", buffer,
1165                        ntohs(client.sin_port));
1166             }
1167             close(conn_fd);
1168             exit(0);
1169         } else {                        /* parent */
1170             close(conn_fd);
1171         }
1172     }
1173     /* normal exit, never reached */
1174     exit(0);
1175 }
1176   \end{lstlisting}
1177   \caption{Esempio di codice di un server concorrente elementare per il
1178     servizio daytime.}
1179   \label{fig:TCPel_serv_code}
1180 \end{figure}
1181
1182 Come si può vedere (alle linee \texttt{\small 21--25}) la funzione
1183 \func{accept} stavolta è chiamata fornendo una struttura di indirizzi in cui
1184 saranno ritornati numero IP e porta da cui il client effettua la connessione,
1185 che stamperemo, se avremo abilitato il logging, sullo standard output
1186 (\texttt{\small 39--43}).
1187
1188 Quando \func{accept} ritorna il server chiama la funzione \func{fork}
1189 (\texttt{\small 26--30}) per creare il processo figlio che effettuerà tutte le
1190 operazioni relative a quella connessione (\texttt{\small 31--45}), mentre il
1191 padre resterà in attesa di ulteriori connessioni.
1192
1193 Si noti come il figlio operi solo sul socket connesso, chiudendo
1194 immediatamente il socket \var{list\_fd}; mentre il padre continua ad operare
1195 solo sul socket in ascolto chiudendo \var{sock\_fd} dopo ciascuna
1196 \func{accept}. Per quanto abbiamo detto in \secref{sec:TCPel_func_close}
1197 queste due chiusure non causano l'innesco della sequenza di chiusura perché il
1198 numero di riferimenti non si è annullato.
1199
1200 Infatti subito dopo la creazione del socket \var{list\_fd} ha una
1201 referenza, e lo stesso vale per \var{sock\_fd} dopo il ritorno di
1202 \func{accept}, ma dopo la fork i descrittori vengono duplicati nel padre e
1203 nel figlio per cui entrambi i socket si trovano con due referenze. Questo fa
1204 si che quando il padre chiude \var{sock\_fd} esso resta con una referenza
1205 da parte del figlio, e sarà definitivamente chiuso solo quando quest'ultimo,
1206 dopo aver completato le sue operazioni, chiamerà la funzione \func{close}.
1207
1208 In realtà per il figlio non sarebbero necessarie nessuna delle due chiamate a
1209 \func{close} in quanto nella \func{exit} tutti i file ed i socket vengono
1210 chiusi, ma si è preferito effettuare la chiusura esplicitamente per avere una
1211 maggiore chiarezza del codice ed evitare possibili errori.
1212
1213 Si noti come sia essenziale che il padre chiuda ogni volta il socket connesso
1214 dopo la \func{accept}; se così non fosse nessuno di questi socket sarebbe
1215 effettivamente chiuso dato che alla chiusura da parte del figlio resterebbe
1216 ancora un riferimento. Si avrebbero così due effetti, il padre potrebbe
1217 esaurire i descrittori disponibili (che sono un numero limitato per ogni
1218 processo) e soprattutto nessuna delle connessioni con i client verrebbe
1219 chiusa.
1220
1221
1222 \subsection{Le funzioni \func{getsockname} e \func{getpeername}}
1223 \label{sec:TCPel_get_names}
1224
1225 Queste due funzioni vengono usate per ottenere la socket pair associata ad un
1226 certo socket; la prima restituisce l'indirizzo locale, la seconda quello
1227 remoto.
1228
1229 \begin{prototype}{sys/socket.h}
1230   {int getsockname(int sockfd, struct sockaddr * name, socklen\_t * namelen)}
1231   Legge l'indirizzo locale del socket \param{sockfd} nella struttura
1232   \param{name}.
1233
1234 \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1235   errore. I codici di errore restituiti in \var{errno} sono i seguenti:
1236   \begin{errlist}
1237   \item[\errcode{EBADF}] l'argomento \var{sockfd} non è un file descriptor
1238     valido.
1239   \item[\errcode{ENOTSOCK}] l'argomento \var{sockfd} non è un socket.
1240   \item[\errcode{ENOBUFS}] non ci sono risorse sufficienti nel sistema per
1241     eseguire l'operazione.
1242   \item[\errcode{EFAULT}] l'argomento \var{name} punta al di fuori dello
1243     spazio di indirizzi del processo.
1244   \end{errlist}}
1245 \end{prototype}
1246
1247 La funzione \func{getsockname} si usa tutte le volte che si vuole avere
1248 l'indirizzo locale di un socket; ad esempio può essere usata da un client (che
1249 usualmente non chiama \func{bind}) per ottenere numero IP e porta locale
1250 associati al socket restituito da una \func{connect}, o da un server che ha
1251 chiamato \func{bind} su un socket usando 0 come porta locale per ottenere il
1252 numero di porta effimera assegnato dal kernel.
1253
1254 Inoltre quando un server esegue una \func{bind} su un indirizzo generico, se
1255 chiamata dopo il completamento di una connessione sul socket restituito da
1256 \func{accept}, restituisce l'indirizzo locale che il kernel ha assegnato a
1257 quella connessione.
1258
1259 \begin{prototype}{sys/socket.h}
1260   {int getpeername(int sockfd, struct sockaddr * name, socklen\_t * namelen)}
1261   Legge l'indirizzo remoto del socket \param{sockfd} nella struttura
1262   \param{name}.
1263
1264   \bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di
1265     errore. I codici di errore restituiti in \var{errno} sono i seguenti:
1266   \begin{errlist}
1267   \item[\errcode{EBADF}] l'argomento \var{sockfd} non è un file descriptor
1268     valido.
1269   \item[\errcode{ENOTSOCK}] l'argomento \var{sockfd} non è un socket.
1270   \item[\errcode{ENOTCONN}] il socket non è connesso.
1271   \item[\errcode{ENOBUFS}] non ci sono risorse sufficienti nel sistema per
1272     eseguire l'operazione.
1273   \item[\errcode{EFAULT}] l'argomento \var{name} punta al di fuori dello
1274     spazio di indirizzi del processo.
1275   \end{errlist}}
1276 \end{prototype}
1277
1278
1279 La funzione \func{getpeername} si usa tutte le volte che si vuole avere
1280 l'indirizzo remoto di un socket.
1281
1282 Ci si può chiedere a cosa serva questa funzione dato che dal lato client
1283 l'indirizzo remoto è sempre noto quando si esegue la \func{connect} mentre
1284 dal lato server si possono usare, come si è fatto nell'esempio precedente, i
1285 valori di ritorno di \func{accept}.
1286
1287 In generale però questa ultima possibilità è sempre possibile. In particolare
1288 questo avviene quando il server invece di far gestire la connessione
1289 direttamente a un processo figlio, come nell'esempio precedente, lancia un
1290 opportuno programma per ciascuna connessione usando \func{exec} (questa ad
1291 esempio è la modalità con cui opera il \textsl{super-server} \cmd{inetd}
1292 che gestisce tutta una serie di servizi lanciando per ogni connessione
1293 l'opportuno server).
1294
1295 In questo caso benché il processo figlio abbia una immagine della memoria che
1296 è copia di quella del processo padre (e contiene quindi anche la struttura
1297 ritornata da \func{accept}), all'esecuzione di \func{exec} viene caricata
1298 in memoria l'immagine del programma eseguito che a questo punto perde ogni
1299 riferimento. Il socket descriptor però resta aperto. Allora se una opportuna
1300 convenzione è seguita per rendere noto al programma eseguito qual'è il socket
1301 connesso (\cmd{inetd} ad esempio fa sempre in modo che i file descriptor 0,
1302 1 e 2 corrispondano al socket connesso) quest'ultimo potrà usare la funzione
1303 \func{getpeername} per determinare l'indirizzo remoto del client.
1304
1305 Infine è da chiarire (si legga la pagina di manuale) che, come per
1306 \func{accept}, il terzo parametro, che è specificato dallo standard POSIX.1g
1307 come di tipo \code{socklen\_t *} in realtà deve sempre corrispondere ad un
1308 \ctyp{int *} come prima dello standard perché tutte le implementazioni dei
1309 socket BSD fanno questa assunzione.
1310
1311
1312
1313 %%% Local Variables:
1314 %%% mode: latex
1315 %%% TeX-master: "gapil"
1316 %%% End: