From 1bc5799f6c61d5cf528b5fdcf6ce88680b17cdb0 Mon Sep 17 00:00:00 2001 From: Simone Piccardi Date: Mon, 7 May 2001 20:19:02 +0000 Subject: [PATCH] Andato avanti sui socket TCP, il resto cambiamenti minimi. --- elemtcp.tex | 482 ++++++++++++++++++++++++++++++++-------------------- macro.tex | 5 +- 2 files changed, 297 insertions(+), 190 deletions(-) diff --git a/elemtcp.tex b/elemtcp.tex index 3f256c8..9ca14cd 100644 --- a/elemtcp.tex +++ b/elemtcp.tex @@ -1,4 +1,4 @@ -\chapter{Socket TCP elementari} +g\chapter{Socket TCP elementari} \label{cha:elem_TCP_sock} In questo capitolo inizieremo ad approndire la conoscenza dei socket TCP, @@ -7,7 +7,7 @@ nei due esempi elementari forniti in precedenza (vedi \ref{sec:net_cli_sample} e \ref{sec:net_serv_sample}), previa una descrizione delle principali caratteristiche del funzionamento di una connessione TCP. -La seconda parte del capitolo sarà poi dedicata alla scrittura di una prima +La seconda parte del capitolo sarà poi dedicata alla scrittura di una prima semplice applicazione client/server completa, che implementi il servizio standard \texttt{echo} su TCP. @@ -15,11 +15,11 @@ standard \texttt{echo} su TCP. \label{sec:TCPel_connession} Prima di entrare nei dettagli delle funzioni usate nelle applicazioni che -utilizzano i socket TCP, è fondamentale spiegare alcune basi del funzionamento -del TCP, la conoscenza del funzionamento del protocollo è infatti essenziale +utilizzano i socket TCP, è fondamentale spiegare alcune basi del funzionamento +del TCP, la conoscenza del funzionamento del protocollo è infatti essenziale per capire il modello di programmazione ed il funzionamento delle API. -In particolare ci concentreremo sulle modalità con le quali il protocollo da +In particolare ci concentreremo sulle modalità con le quali il protocollo da inizio e conclude una connessione; faremo anche un breve accenno al significato di alcuni dei vari stati che il protocollo assume durante la vita di una connessione, che possono essere osservati per ciascun socket attivo con @@ -28,11 +28,11 @@ l'uso del programma \texttt{netstat}. \subsection{La creazione della connessione: il \textit{three way handushake}} \label{sec:TCPel_conn_cre} -Il processo che porta a creare una connessione TCP è chiamato \textit{three +Il processo che porta a creare una connessione TCP è chiamato \textit{three way handushake}; la successione tipica degli eventi (la stessa che si verifica utilizzando il codice dei due precedenti esempi elementari \ref{fig:net_cli_code} e \ref{fig:net_serv_code}) che porta alla creazione di -una connessione è la seguente: +una connessione è la seguente: \begin{itemize} \item Il server deve essere preparato per accettare le connessioni in arrivo; @@ -46,10 +46,10 @@ una connessione \texttt{connect}, attraverso un procedimento che viene chiamato \textsl{apertura attiva}, dall'inglese \textit{active open}. La chiamata di \texttt{connect} blocca il processo e causa l'invio da parte del client di - un segmento \texttt{SYN}\footnote{Si ricordi che il segmento è l'unità + un segmento \texttt{SYN}\footnote{Si ricordi che il segmento è l'unità elementare di dati trasmessa dal protocollo TCP al livello superiore; tutti i segmenti hanno un header che contiene le informazioni che servono - allo \textit{stack TCP} (così viene di solito chiamata la parte del kernel + allo \textit{stack TCP} (così viene di solito chiamata la parte del kernel che implementa il protocollo) per realizzare la comunicazione, fra questi dati ci sono una serie di flag usati per gestire la connessione, come \texttt{SYN}, \texttt{ACK}, \texttt{URG}, \texttt{FIN}, alcuni di essi, @@ -66,24 +66,24 @@ una connessione \texttt{ACK} e sono settati. \item una volta che il client ha ricevuto l'acknowledge dal server la funzione - \texttt{connect} ritorna, l'ultimo passo è dare dare il ricevuto del + \texttt{connect} ritorna, l'ultimo passo è dare dare il ricevuto del \texttt{SYN} del server inviando un \texttt{ACK}. Alla ricezione di quest'ultimo la funzione \texttt{accept} del server ritorna e la connessione - è stabilita. + è stabilita. \end{itemize} Il procedimento viene chiamato \textit{three way handshake} dato che per -realizzarlo devono essere scambiati tre segmenti. In \nfig\ si è +realizzarlo devono essere scambiati tre segmenti. In \nfig\ si è rappresentata graficamente la sequenza di scambio dei segmenti che stabilisce la connessione. -% Una analogia citata da R. Stevens per la connessione TCP è quella con il -% sistema del telefono. La funzione \texttt{socket} può essere considerata -% l'equivalente di avere un telefono. La funzione \texttt{bind} è analoga al -% dire alle altre persone qual'è il proprio numero di telefono perché possano -% chiamare. La funzione \texttt{listen} è accendere il campanello del telefono +% Una analogia citata da R. Stevens per la connessione TCP è quella con il +% sistema del telefono. La funzione \texttt{socket} può essere considerata +% l'equivalente di avere un telefono. La funzione \texttt{bind} è analoga al +% dire alle altre persone qual'è il proprio numero di telefono perché possano +% chiamare. La funzione \texttt{listen} è accendere il campanello del telefono % per sentire le chiamate in arrivo. La funzione \texttt{connect} richiede di -% conoscere il numero di chi si vuole chiamare. La funzione \texttt{accept} è +% conoscere il numero di chi si vuole chiamare. La funzione \texttt{accept} è % quando si risponde al telefono. \begin{figure}[htb] @@ -93,7 +93,7 @@ la connessione. \label{fig:TCPel_TWH} \end{figure} -Si è accennato in precedenza ai \textsl{numeri di sequenza} (che sono anche +Si è accennato in precedenza ai \textsl{numeri di sequenza} (che sono anche riportati in \curfig); per gestire una connessione affidabile infatti il protocollo TCP prevede nell'header la presenza di un numero a 32 bit (chiamato appunto \textit{sequence number}) che identifica a quale byte nella sequenza @@ -108,8 +108,8 @@ il flag \texttt{ACK} e restituendo nell'apposito campo dell'header un \textit{acknowledge number}) pari al numero di sequenza che il ricevente si aspetta di ricevere con il pacchetto successivo; dato che il primo pacchetto SYN consuma un byte, nel \textit{three way handshake} il numero di acknowledge -è sempre pari al numero di sequenza iniziale incrementato di uno; lo stesso -varrà anche (vedi \nfig) per l'acknowledgement di un FIN. +è sempre pari al numero di sequenza iniziale incrementato di uno; lo stesso +varrà anche (vedi \nfig) per l'acknowledgement di un FIN. \subsection{Le opzioni TCP.} \label{sec:TCPel_TCP_opt} @@ -123,79 +123,79 @@ regolare la connessione. Normalmente vengono usate le seguenti opzioni: \item \textit{MSS option} Sta per \textit{maximum segment size}, con questa opzione ciascun capo della connessione annuncia all'altro il massimo ammontare di dati che vorrebbe accettare per ciascun segmento nella - connesione corrente. È possibile leggere e scrivere questo valore attraverso + connesione corrente. È possibile leggere e scrivere questo valore attraverso l'opzione del socket \texttt{TCP\_MAXSEG}. \item \textit{window scale option} come spiegato in \ref{cha:tcp_protocol} il protocollo TCP implementa il controllo di flusso attraverso una \textsl{finestra annunciata} (\textit{advertized window}) con la quale ciascun capo della comunicazione dichiara quanto spazio disponibile ha in - memoria per i dati. Questo è un numero a 16 bit dell'haeader, che così può + memoria per i dati. Questo è un numero a 16 bit dell'haeader, che così può indicare un massimo di 65535 bytes (anche se linux usa come massimo 32767 per evitare problemi con alcuni stack bacati che usano l'aritmetica con segno per implementare lo stack TCP); ma alcuni tipi di connessione come - quelle ad alta velocità (sopra i 45Mbits/sec) e quelle che hanno grandi + quelle ad alta velocità (sopra i 45Mbits/sec) e quelle che hanno grandi ritardi nel cammino dei pacchetti (come i satelliti) richiedono una finestra - più grande per poter ottenere il massimo dalla trasmissione, per questo + più grande per poter ottenere il massimo dalla trasmissione, per questo esiste questa opzione che indica un fattore di scala da applicare al valore della finestra annunciata\footnote{essendo una nuova opzione per garantire - la compatibilità con delle vecchie implementazioni del protocollo la + la compatibilità con delle vecchie implementazioni del protocollo la procedura che la attiva prevede come negoziazione che l'altro capo della connessione riconosca esplicitamente l'opzione inserendola anche lui nel suo SYN di risposta dell'apertura della connessione} per la connessione corrente (espresso come numero di bit cui shiftare a sinistra il valore della finestra annunciata inserito nel pacchetto). -\item \textit{timestamp option} è anche questa una nuova opzione necessaria - per le connessioni ad alta velocità per evitare possibili corruzioni di dati +\item \textit{timestamp option} è anche questa una nuova opzione necessaria + per le connessioni ad alta velocità per evitare possibili corruzioni di dati dovute a pacchetti perduti che riappaiono; anche questa viene negoziata come la precedente. \end{itemize} -La MSS è generalmente supportata da quasi tutte le implementazioni del +La MSS è generalmente supportata da quasi tutte le implementazioni del protocollo, le ultime due opzioni (trattate nell'RFC 1323) sono meno comuni; -vengono anche dette \textit{long fat pipe options} dato che questo è il nome -che viene dato alle connessioni caratterizzate da alta velocità o da ritardi +vengono anche dette \textit{long fat pipe options} dato che questo è il nome +che viene dato alle connessioni caratterizzate da alta velocità o da ritardi elevati. In ogni caso linux supporta pienamente entrambe le opzioni. \subsection{La terminazione della connessione} \label{sec:TCPel_conn_term} Mentre per creare una connessione occorre un interscambio di tre segmenti, la -procedura di chiusura ne richede quattro; ancora una volta si può fare +procedura di chiusura ne richede quattro; ancora una volta si può fare riferimento al codice degli esempi \ref{fig:net_cli_code} e -\ref{fig:net_serv_code}, in questo caso la successione degli eventi è la +\ref{fig:net_serv_code}, in questo caso la successione degli eventi è la seguente: \begin{enumerate} \item Un processo ad uno dei due capi chiama la funzione \texttt{close}, dando l'avvio a quella che viene chiamata \textsl{chiusura attiva} (da \textit{active close}). Questo comporta l'emissione di un segmento FIN, che - significa che si è finito con l'invio dei dati sulla connessione. + significa che si è finito con l'invio dei dati sulla connessione. \item L'altro capo della connessione riceve il FIN ed esegue la \textit{chiusura passiva} (da \textit{passive close}); al FIN, come per tutti i pacchetti, viene risposto con un ACK. Inoltre il ricevimento del FIN viene passato al processo che ha aperto il socket come un end of file sulla - lettura (dopo che ogni altro eventuale dato rimasto in coda è stato + lettura (dopo che ogni altro eventuale dato rimasto in coda è stato ricevuto), dato che il ricevimento di un FIN significa che non si riceveranno altri dati sulla connessione. -\item Dopo un certo tempo anche il secondo processo chiamerà la funzione +\item Dopo un certo tempo anche il secondo processo chiamerà la funzione \texttt{close} sul proprio socket, causando l'emissione di un altro segmento FIN. -\item L'altro capo della connessione riceverà il FIN conclusivo e risponderà +\item L'altro capo della connessione riceverà il FIN conclusivo e risponderà con un ACK. \end{enumerate} Dato che in questo caso sono richiesti un FIN ed un ACK per ciascuna direzione -normalmente i segmenti scambiati sono quattro; normalmente giacché in alcune -sitazioni il FIN del passo 1) è inviato insieme a dei dati. Comunque non è -detto, anche se è possibile, che i segmenti inviati nei passi 2 e 3, siano -accorpati in un singolo segmento. In \nfig\ si è rappresentato graficamente lo +normalmente i segmenti scambiati sono quattro; normalmente giacché in alcune +sitazioni il FIN del passo 1) è inviato insieme a dei dati. Comunque non è +detto, anche se è possibile, che i segmenti inviati nei passi 2 e 3, siano +accorpati in un singolo segmento. In \nfig\ si è rappresentato graficamente lo sequenza di scambio dei segmenti che stabilisce la connessione. \begin{figure}[htb] @@ -206,31 +206,30 @@ sequenza di scambio dei segmenti che stabilisce la connessione. \end{figure} Come per il SYN anche il FIN occupa un byte nel numero di sequenza, per cui -l'ACK riporterà un \textit{acknowledge number} incrementato di uno. +l'ACK riporterà un \textit{acknowledge number} incrementato di uno. -Si noti che nella sequenza di chiusura fra i passi 2 e 3 è in teoria possibile +Si noti che nella sequenza di chiusura fra i passi 2 e 3 è in teoria possibile che si mantenga un flusso di dati dal capo della connessione che sta eseguendo la chiusura passiva a quello che sta eseguendo la chiusura attiva. Nella -sequenza indicata i dati verrebbero persi, dato che si è chiuso il socket, ma -esistono situazione in cui si vuole che avvenga proprio questo, che è chiamato +sequenza indicata i dati verrebbero persi, dato che si è chiuso il socket, ma +esistono situazione in cui si vuole che avvenga proprio questo, che è chiamato \textit{half-close}, per cui torneremo su questo aspetto e su come utilizzarlo -più avanti, quando parleremo della funzione \texttt{shutdown}. +più avanti, quando parleremo della funzione \texttt{shutdown}. -La emissione del FIN avviene quando il socket viene chiuso, questo però non +La emissione del FIN avviene quando il socket viene chiuso, questo però non avviene solo per la chiamata della funzione \texttt{close} (come in \ref{fig:net_serv_code}), ma anche alla terminazione di un processo (come in \ref{fig:net_cli_code}). Questo vuol dire ad esempio che se un processo viene terminato da un segnale tutte le connessioni aperte verranno chiuse. -Infine è da sottolineare che, benché nella figura (e nell'esempio che vedremo +Infine è da sottolineare che, benché nella figura (e nell'esempio che vedremo in \ref{sec:TCPel_echo_example}) sia il client ad eseguire la chiusura attiva, -nella realtà questa può essere eseguita da uno qualunque dei due capi della +nella realtà questa può essere eseguita da uno qualunque dei due capi della comunicazione (come in fatto in precedenza da \ref{fig:net_serv_code}), e -benché quello del client sia il caso più comune ci sono alcuni servizi, il -principale dei quali è l'HTTP, per i quali è il server ad effettuare la +benché quello del client sia il caso più comune ci sono alcuni servizi, il +principale dei quali è l'HTTP, per i quali è il server ad effettuare la chiusura attiva. - \subsection{Un esempio di connessione} \label{sec:TCPel_conn_dia} @@ -241,30 +240,30 @@ di regole per le transizioni da uno stato all'altro basate sullo stato corrente e sul tipo di segmento ricevuto; i nomi degli stati sono gli stessi che vengono riportati del comando \texttt{netstat} nel campo \textit{State}. -Una descrizione completa del funzionamento del protocollo va al di là degli +Una descrizione completa del funzionamento del protocollo va al di là degli obiettivi di questo libro; un approfondimento sugli aspetti principali si trova in \ref{cha:tcp_protocol}, ma per una trattazione esauriente il miglior riferimento resta (FIXME citare lo Stevens); qui ci limiteremo a descrivere brevemente un semplice esempio di connessione e le transizioni che avvengono nei due casi appena citati (creazione e terminazione della connessione). -In assenza di connessione lo stato del TCP è \textsl{CLOSED}; quando una +In assenza di connessione lo stato del TCP è \textsl{CLOSED}; quando una applicazione esegue una apertura attiva il TCP emette un SYN e lo stato diventa \textsl{SYN\_SENT}; quando il TCP riceve la risposta del SYN$+$ACK -emette un ACK e passa allo stato \textsl{ESTABLISHED}; questo è lo stato +emette un ACK e passa allo stato \textsl{ESTABLISHED}; questo è lo stato finale in cui avviene la gran parte del trasferimento dei dati. Dal lato server in genere invece il passaggio che si opera con l'apertura -passiva è quello di portare il socket dallo stato \textsl{CLOSED} allo +passiva è quello di portare il socket dallo stato \textsl{CLOSED} allo stato \textsl{LISTEN} in cui vengono accettate le connessioni. -Dallo stato \textsl{ESTABLISHED} si può uscire in due modi; se un'applicazione +Dallo stato \textsl{ESTABLISHED} si può uscire in due modi; se un'applicazione chiama la \texttt{close} prima di aver ricevuto un end of file (chiusura -attiva) la transizione è verso lo stato \textsl{FIN\_WAIT\_1}; se invece +attiva) la transizione è verso lo stato \textsl{FIN\_WAIT\_1}; se invece l'applicazione riceve un FIN nello stato \textsl{ESTABLISHED} (chiusura -passiva) la transizione è verso lo stato \textsl{CLOSE\_WAIT}. +passiva) la transizione è verso lo stato \textsl{CLOSE\_WAIT}. -In \nfig\ è riportato lo schema dello scambio dei pacchetti che avviene per +In \nfig\ è riportato lo schema dello scambio dei pacchetti che avviene per una un esempio di connessione, insieme ai vari stati che il protocollo viene ad assumere per i due lati, server e client. @@ -279,13 +278,13 @@ La connessione viene iniziata dal client che annuncia un MSS di 1460 (un valore tipico per IPv4 su ethernet) con linux, il server risponde con lo stesso valore (ma potrebbe essere anche un valore diverso). -Una volta che la connessione è stabilita il client scrive al server una -richiesta (che assumiamo stare in un singolo segmento, cioè essere minore dei +Una volta che la connessione è stabilita il client scrive al server una +richiesta (che assumiamo stare in un singolo segmento, cioè essere minore dei 1460 bytes annunciati dal server), quest'ultimo riceve la richiesta e restituisce una risposta (che di nuovo supponiamo stare in un singolo -segmento). Si noti che l'acknowledge della richiesta è mandato insieme alla +segmento). Si noti che l'acknowledge della richiesta è mandato insieme alla risposta, questo viene chiamato \textit{piggybacking} ed avviene tutte le -volte che che il server è sufficientemente veloce a costruire la risposta, in +volte che che il server è sufficientemente veloce a costruire la risposta, in caso contrario si avrebbe prima l'emissione di un ACK e poi l'invio della risposta. @@ -294,52 +293,52 @@ secondo quanto visto in \ref{sec:TCPel_conn_term}; si noti che il capo della connessione che esegue la chiusura attiva entra nello stato \textsl{TIME\_WAIT} su cui torneremo fra poco. -È da notare come per effettuare uno scambio di due pacchetti (uno di richiesta +È da notare come per effettuare uno scambio di due pacchetti (uno di richiesta e uno di risposta) il TCP necessiti di ulteriori otto segmenti, se invece si -fosse usato UDP sarebbero stati sufficienti due soli pacchetti. Questo è il -costo che occorre pagare per avere l'affidabilità garantita dal TCP, se si +fosse usato UDP sarebbero stati sufficienti due soli pacchetti. Questo è il +costo che occorre pagare per avere l'affidabilità garantita dal TCP, se si fosse usato UDP si sarebbe dovuto trasferire la gestione di tutta una serie di dettagli (come la verifica della ricezione dei pacchetti) dal livello del trasporto all'interno dell'applicazione. -Quello che è bene sempre tenere presente è allora quali sono le esigenze che -si hanno in una applicazione di rete, perché non è detto che TCP sia la +Quello che è bene sempre tenere presente è allora quali sono le esigenze che +si hanno in una applicazione di rete, perché non è detto che TCP sia la miglior scelta in tutti i casi (ad esempio se si devono solo scambiare dati -già organizzati in piccoli pacchetti l'overhead aggiunto può essere eccessivo) -per questo esistono applicazioni che usano UDP e lo fanno perché nel caso -specifico le sue caratteristiche di velocità e compattezza nello scambio dei +già organizzati in piccoli pacchetti l'overhead aggiunto può essere eccessivo) +per questo esistono applicazioni che usano UDP e lo fanno perché nel caso +specifico le sue caratteristiche di velocità e compattezza nello scambio dei dati rispondono meglio alle esigenze che devono essere affrontate. \subsection{Lo stato \texttt{TIME\_WAIT}} \label{sec:TCPel_time_wait} -Come riportato da Stevens (FIXME citare) lo stato \texttt{TIME\_WAIT} è -probabilmente uno degli aspetti meno compresi del protocollo TCP, è infatti +Come riportato da Stevens (FIXME citare) lo stato \texttt{TIME\_WAIT} è +probabilmente uno degli aspetti meno compresi del protocollo TCP, è infatti comune trovare nei newsgroup domande su come sia possibile evitare che un'applicazione resti in questo stato lasciando attiva una connessione ormai -conclusa; la risposta è che non deve essere fatto, ed il motivo cercheremo di +conclusa; la risposta è che non deve essere fatto, ed il motivo cercheremo di spiegarlo adesso. -Come si è visto nell'esempio precedente (vedi \curfig) \texttt{TIME\_WAIT} è +Come si è visto nell'esempio precedente (vedi \curfig) \texttt{TIME\_WAIT} è lo stato finale in cui il capo di una connessione che esegue la chiusura attiva resta prima di passare alla chiusura definitiva della connessione. Il tempo in cui l'applicazione resta in questo stato deve essere due volte la MSL (\textit{Maximum Segment Lifetime}). -La MSL è la stima del massimo periodo di tempo che un pacchetto IP può vivere -sulla rete; questo tempo è limitato perché ogni pacchetto IP può essere +La MSL è la stima del massimo periodo di tempo che un pacchetto IP può vivere +sulla rete; questo tempo è limitato perché ogni pacchetto IP può essere ritrasmesso dai router un numero massimo di volte (detto \textit{hop limit}). -Il numero di ritrasmissioni consentito è indicato dal campo TTL dell'header di +Il numero di ritrasmissioni consentito è indicato dal campo TTL dell'header di IP (per maggiori dettagli vedi \ref{sec:appA_xxx}), e viene decrementato ad ogni passaggio da un router; quando si annulla il pacchetto viene scartato. -Siccome il numero è ad 8 bit il numero massimo di ``salti'' è di 255, pertanto -anche se il TTL (da \textit{time to live}) non è propriamente un limite sul +Siccome il numero è ad 8 bit il numero massimo di ``salti'' è di 255, pertanto +anche se il TTL (da \textit{time to live}) non è propriamente un limite sul tempo di vita, si stima che un pacchetto IP non possa restare nella rete per -più di MSL secondi. +più di MSL secondi. Ogni implementazione del TCP deve scegliere un valore per la MSL (l'RFC1122 raccomanda 2 minuti, linux usa 30 secondi), questo comporta una durata dello -stato \textsl{TIME\_WAIT} che a seconda delle implementazioni può variare fra +stato \textsl{TIME\_WAIT} che a seconda delle implementazioni può variare fra 1 a 4 minuti. Lo stato \texttt{TIME\_WAIT} viene utilizzato dal protocollo per due motivi @@ -350,17 +349,17 @@ principali: \item consentire l'eliminazione dei segmenti duplicati dalla rete. \end{itemize} -Il punto è che entrambe le ragioni sono importanti, anche se spesso si fa -riferimento solo alla prima; ma è solo se si tiene conto della seconda che si -capisce il perché della scelta di un tempo pari al doppio della MSL come +Il punto è che entrambe le ragioni sono importanti, anche se spesso si fa +riferimento solo alla prima; ma è solo se si tiene conto della seconda che si +capisce il perché della scelta di un tempo pari al doppio della MSL come durata di questo stato. -Il primo dei due motivi precedenti si può capire tornando a \curfig: assumendo +Il primo dei due motivi precedenti si può capire tornando a \curfig: assumendo che l'ultimo ACK della sequenza (quello del capo che ha eseguito la chiusura attiva) vanga perso, chi esegue la chiusura passiva non ricevndo risposta -rimanderà un ulteriore FIN, per questo motivo chi esegue la chiusura attiva +rimanderà un ulteriore FIN, per questo motivo chi esegue la chiusura attiva deve mantenere lo stato della connessione per essere in grado di reinviare -l'ACK e chiuderla correttamente. Se non fosse così la risposta sarebbe un RST +l'ACK e chiuderla correttamente. Se non fosse così la risposta sarebbe un RST (un altro tipo si segmento) che verrebbe interpretato come un errore. Se il TCP deve poter chiudere in maniera pulita entrambe le direzioni della @@ -371,27 +370,27 @@ dell'ultimo ACK per poter essere in grado di poterne gestire l'eventuale ritrasmissione in caso di perdita. -Il secondo motivo è più complesso da capire, e necessita di spiegare meglio +Il secondo motivo è più complesso da capire, e necessita di spiegare meglio gli scenari in cui accade che i pacchetti si possono perdere nella rete o restare intrappolati, per poi riemergere. -Il caso più comune in cui questo avviene è quello di anomalie -nell'instradamento; può accadere cioè che un router smetta di funzionare o che +Il caso più comune in cui questo avviene è quello di anomalie +nell'instradamento; può accadere cioè che un router smetta di funzionare o che una connessione fra due router si interrompa. In questo caso i protocolli di instradamento dei pacchetti possono impiegare diverso temo (anche dell'ordine dei minuti) prima di trovare e stabilire un percorso alternativo per i pacchetti. Nel frattempo possono accadere casi in cui un router manda i pacchetti verso un'altro e quest'ultimo li rispedisce indietro, o li manda ad -un terzo router che li rispedisce al primo, si creano cioè dei circoli (i +un terzo router che li rispedisce al primo, si creano cioè dei circoli (i cosiddetti \textit{routing loop}) in cui restano intrappolati i pacchetti. -Se uno di questi pacchetti intrappolati è un segmento di TCP chi l'ha inviato, -non ricevendo risposta, provvederà alla ritrasmissione e se nel frattempo sarà -stata stabilita una strada alternativa il pacchetto ritrasmesso giungerà a +Se uno di questi pacchetti intrappolati è un segmento di TCP chi l'ha inviato, +non ricevendo risposta, provvederà alla ritrasmissione e se nel frattempo sarà +stata stabilita una strada alternativa il pacchetto ritrasmesso giungerà a destinazione. Ma se dopo un po' di tempo (che non supera il limite dell'MSL) l'anomalia viene a cessare il circolo di instadamento viene spezzato i pacchetti intrappolati potranno essere inviati alla destinazione finale, con -la conseguenza di avere dei pacchetti duplicati; questo è un caso che il TCP +la conseguenza di avere dei pacchetti duplicati; questo è un caso che il TCP deve essere in grado di gestire. Allora per capire la seconda ragione per l'esistenza dello stato @@ -404,7 +403,7 @@ connessione precedente); in questo caso ci si potrebbe trovare con dei pacchetti duplicati relativi alla precedente connessione che riappaiono nella nuova. -Ma fintanto che il socket non è chiuso una nuova incarnazione non può essere +Ma fintanto che il socket non è chiuso una nuova incarnazione non può essere creata, per questo un socket TCP resta sempre nello stato \texttt{TIME\_WAIT} per un periodo di 2MSL, in modo da attendere MSL secondi per essere sicuri che tutti i pacchetti duplicati in arrivo siano stati ricevuti (e scartati) o che @@ -419,10 +418,10 @@ che possono causare disturbi sono stati eliminati dalla rete. \subsection{I numeri di porta} \label{sec:TCPel_port_num} -In un ambiente multitasking in un dato momento più processi possono dover -usare sia UDP che TCP, e ci devono poter essere più connessioni in +In un ambiente multitasking in un dato momento più processi possono dover +usare sia UDP che TCP, e ci devono poter essere più connessioni in contemporanea. Per poter tenere distinte le diverse connessioni entrambi i -protocolli usano i \textsl{numeri di porta}, che fanno parte, come si può +protocolli usano i \textsl{numeri di porta}, che fanno parte, come si può vedere in \ref{sec:sock_sa_ipv4} e \ref{sec:sock_sa_ipv6} pure delle strutture degli indirizzi del socket. @@ -433,15 +432,15 @@ identificano una serie di servizi noti (ad esempio la porta 22 identifica il servizio \texttt{ssh}) effettuati da appositi server che rispondono alle connessioni verso tali porte. -D'altra parte un client non ha necessità di usare un numero di porta +D'altra parte un client non ha necessità di usare un numero di porta specifico, per cui in genere vengono usate le cosiddette \textsl{porte - effimere} (o \textit{ephemeral ports}) cioè porte a cui non è assegnato + effimere} (o \textit{ephemeral ports}) cioè porte a cui non è assegnato nessun servizio noto e che vengono assegnate automaticamente dal kernel alla creazione della connessione. Queste sono dette effimere in quanto vengono usate solo per la durata della connessione, e l'unico requisito che deve -essere soddisfatto è che ognuna di esse sia assegnata in maniera univoca. +essere soddisfatto è che ognuna di esse sia assegnata in maniera univoca. -La lista delle porte conosciute è definita dall'RFC1700 che contiene l'elenco +La lista delle porte conosciute è definita dall'RFC1700 che contiene l'elenco delle porte assegnate dalla IANA (\textit{Internet Assigned Number Authority}) ma l'elenco viene costantemente aggiornato e pubblicato all'indirizzo \texttt{ftp://ftp.isi.edu/in-notes/iana/assignements/port-numbers}, inoltre il @@ -451,24 +450,24 @@ in tre intervalli: \begin{enumerate} \item \textsl{le porte conosciute}. I numeri da 0 a 1023. Queste sono - controllate e assegnate dalla IANA. Se è possibile la stessa porta è + controllate e assegnate dalla IANA. Se è possibile la stessa porta è assegnata allo stesso servizio sia su UDP che su TCP (ad esempio la porta 22 - è assegnata a ssh su entrambi i protocolli, anche se viene usata solo dal + è assegnata a ssh su entrambi i protocolli, anche se viene usata solo dal TCP). \item \textsl{le porte registrate}. I numeri da 1024 a 49151. Queste porte non - sono controllate dalla IANA, che però registra ed elenca chi usa queste + sono controllate dalla IANA, che però registra ed elenca chi usa queste porte come servizio agli utenti. Come per le precedenti si assegna una porta - ad un servizio sia per TCP che UDP anche se poi il servizio è implementato + ad un servizio sia per TCP che UDP anche se poi il servizio è implementato solo su TCP. Ad esempio X Window usa le porte TCP e UDP dal 6000 al 6063 - anche se il protocollo è implementato solo tramite TCP. + anche se il protocollo è implementato solo tramite TCP. \item \textsl{le porte private} o \textsl{dinamiche}. I numeri da 49152 a 65535. La IANA non dice nulla riguardo a queste porte che pertanto sono i candidati naturali ad essere usate come porte effimere. \end{enumerate} -In realtà rispetto a quanto indicato nell'RFC1700 i vari sistemi hanno fatto +In realtà rispetto a quanto indicato nell'RFC1700 i vari sistemi hanno fatto scelte diverse per le porte effimere, in particolare in \nfig\ sono riportate quelle di BSD, Solaris e linux. Nel caso di linux poi la scelta fra i due intervali possibili viene fatta dinamicamente a seconda della memoria a @@ -483,7 +482,7 @@ disposizione del kernel per gestire le rative tabelle. I sistemi unix hanno inoltre il concetto di \textsl{porte riservate} (che corrispondono alle porte con numero minore di 1024 e coincidono quindi con le -porte conosciute). La loro caratteristica è che possono essere assegnate a un +porte conosciute). La loro caratteristica è che possono essere assegnate a un socket solo da un processo con i privilegi di root, per far si che solo l'amministratore possa allocare queste porte per far partire relativi servizi. @@ -495,11 +494,11 @@ nell'intervallo fra 512 e 1023. Data una connessione TCP si suole chiamare \textit{socket pair} la combinazione dei quattro numeri che definiscono i due capi della connessione e -cioè l'indirizzo IP locale e la porta TCP locale, e l'indirizzo IP remoto e la +cioè l'indirizzo IP locale e la porta TCP locale, e l'indirizzo IP remoto e la porta TCP remota; questa combinazione, che scriveremo usando una notazione del tipo $(195.110.112.152:22, 192.84.146.100:20100)$, identifica univocamente una connessione su internet. Questo concetto viene di solito esteso anche a UDP, -benché in questo caso non abbia senso parlare di connessione. L'utilizzo del +benché in questo caso non abbia senso parlare di connessione. L'utilizzo del programma \texttt{netstat} permette di visualizzare queste informazioni nei campi \textit{Local Address} e \textit{Foreing Address}. @@ -507,9 +506,12 @@ campi \textit{Local Address} e \textit{Foreing Address}. \subsection{Le porte ed il modello client/server} \label{sec:TCPel_port_cliserv} -Per capire meglio l'uso delle porte e come vengono utilizzate nella -programmazione di rete consideriamo cosa accade con una serie di esempi, se -esguiamo un \texttt{netstat} su una macchina di prova (che supponiamo avere +Per capire meglio l'uso delle porte e come vengono utilizzate quando si ha a +che fare con un'applicazione client/server (come quella che scriveremo in +\ref{sec:TCPel_echo_example}) esaminaremo cosa accade con le connessioni nel +caso di un server TCP che deve gestire connessioni multiple. + +Se esguiamo un \texttt{netstat} su una macchina di prova (che supponiamo avere indirizzo 195.110.112.152) potremo avere un risultato del tipo: \begin{verbatim} Active Internet connections (servers and established) @@ -518,40 +520,40 @@ tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN tcp 0 0 0.0.0.0:25 0.0.0.0:* LISTEN tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN \end{verbatim} -essendo presenti un server ssh, un server di posta e un DNS per il caching -locale. +essendo presenti e attivi un server ssh, un server di posta e un DNS per il +caching locale. Questo ci mostra ad esempio che il server ssh ha compiuto un'apertura passiva -mettendosi in ascolto sulla porta 22 riservata a questo servizio e che si è +mettendosi in ascolto sulla porta 22 riservata a questo servizio e che si è posto in ascolto per connessioni provenienti da uno qualunque degli indirizzi -associati alle interfaccie locali; la notazione 0.0.0.0 usata da netstat è +associati alle interfaccie locali; la notazione 0.0.0.0 usata da netstat è equivalente all'asterisco utilizzato per il numero di porta ed indica il valore generico, e corrisponde al valore \texttt{INADDR\_ANY} definito in \texttt{arpa/inet.h}. Inoltre la porta e l'indirizzo di ogni eventuale connessione esterna non sono -specificati; in questo caso la \textit{socket pair} associata al socket può +specificati; in questo caso la \textit{socket pair} associata al socket può essere indicata come $(*:22, *.*)$, usando l'asterisco anche per gli indirizzi come carattere di \textit{wildchard}. -In genere avendo le macchine associato un solo IP ci si può chiedere che senso +In genere avendo le macchine associato un solo IP ci si può chiedere che senso abbia l'utilizzo dell'indirizzo generico per l'indirizzo locale, ma esistono -anche macchine che hanno più di un indirizzo IP (il cosiddetto +anche macchine che hanno più di un indirizzo IP (il cosiddetto \textit{miltihoming}) in questo modo si possono accettare connessioni -indirizzate verso uno qualunque di essi. Ma come si può vedere nell'esempio -con il DNS in ascolto sulla porta 53 è anche possibile restringere l'accesso +indirizzate verso uno qualunque di essi. Ma come si può vedere nell'esempio +con il DNS in ascolto sulla porta 53 è anche possibile restringere l'accesso solo alle connessioni che provengono da uno specifico indirizzo, cosa che nel -caso è fatta accettando solo connessioni che arrivino sull'interfaccia di +caso è fatta accettando solo connessioni che arrivino sull'interfaccia di loopback. -Una volta che ci si vorrà collegare a questa macchina da un'altra posta -all'indirizzo 192.84.146.100 si potrà lanciare un client \texttt{ssh} per -creare una connessione verso la precedente, e il kernel associerà al suddetto -una porta effimera che per esempio potrà essere la 21100, la connessione -allora sarà espressa dalla socket pair $(192.84.146.100:21100, +Una volta che ci si vorrà collegare a questa macchina da un'altra posta +all'indirizzo 192.84.146.100 si potrà lanciare un client \texttt{ssh} per +creare una connessione verso la precedente, e il kernel associerà al suddetto +una porta effimera che per esempio potrà essere la 21100, la connessione +allora sarà espressa dalla socket pair $(192.84.146.100:21100, 195.110.112.152.22)$. -Alla ricezione della richiesta dal client il server creerà un processo figlio +Alla ricezione della richiesta dal client il server creerà un processo figlio per gestire la connessione, se a questo punto eseguiamo nuovamente il programma netstat otterremo come risultato: \begin{verbatim} @@ -563,14 +565,14 @@ tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN tcp 0 0 195.110.112.152:22 192.84.146.100:21100 ESTABLISHED \end{verbatim} -Come si può notare il server è ancora in ascolto sulla porta 22, però adesso -c'è un nuovo socket (con lo stato \texttt{ESTABLISHED}) che anch'esso utilizza -la porta 22, ma ha specificato l'indirizzo locale, e che corrisponde al socket -con cui il processo figlio gestisce la connessione mentre il padre resta in -ascolto. +Come si può notare il server è ancora in ascolto sulla porta 22, però adesso +c'è un nuovo socket (con lo stato \texttt{ESTABLISHED}) che anch'esso utilizza +la porta 22, ed ha specificato l'indirizzo locale, questo è il socket con cui +il processo figlio gestisce la connessione mentre il padre resta in ascolto +sul socket originale. -Se a questo lanciamo una seconda volta il client ssh per una seconda -conessione quello che otterremo sarà qualcosa del genere: +Se a questo punto lanciamo un'altra volta il client ssh per una seconda +conessione quello che otterremo usando netstat sarà qualcosa del genere: \begin{verbatim} Active Internet connections (servers and established) Proto Recv-Q Send-Q Local Address Foreign Address State @@ -580,26 +582,26 @@ tcp 0 0 127.0.0.1:53 0.0.0.0:* LISTEN tcp 0 0 195.110.112.152:22 192.84.146.100:21100 ESTABLISHED tcp 0 0 195.110.112.152:22 192.84.146.100:21101 ESTABLISHED \end{verbatim} -cioè al client sarà stata assegnata un'altra porta effimera e con questa sarà -aperta la connessione, ed un nuovo processo figlio sarà creato per gestirla. - +cioè il client effettuerà la connessione usando un'altra porta effimera, con +questa sarà aperta la connessione, ed il server creerà un'altro processo +figlio sarà creato per gestirla. -Tutto ciò mostra come TCP, per poter gestire le due connessioni, non può -suddividere i pacchetti solo sulla base della porta di destinazione, ma deve -usare tutta l'informazione contenuta nella socket pair, compresa la porta -dell'indirizzo remoto. E se andassimo a vedere quali sono i processi a cui -fanno riferimento i vari socket vedremmo che i pacchetti che arrivano dalla -porta remota 21100 vanno al primo figlio e quelli che arrivano alla porta -21101 al secondo. +Tutto ciò mostra come TCP, per poter gestire le connessioni con un server +concorrente, non può suddividere i pacchetti solo sulla base della porta di +destinazione, ma deve usare tutta l'informazione contenuta nella socket pair, +compresa la porta dell'indirizzo remoto. E se andassimo a vedere quali sono i +processi a cui fanno riferimento i vari socket vedremmo che i pacchetti che +arrivano dalla porta remota 21100 vanno al primo figlio e quelli che arrivano +alla porta 21101 al secondo. \section{Le funzioni dei socket TCP} \label{sec:TCPel_functions} In questa sezione descriveremo in dettaglio le varie funzioni necessarie per -l'uso dei socket TCP già citate in precedenza (e utilizzate nei due esempi +l'uso dei socket TCP già citate in precedenza (e utilizzate nei due esempi \ref{sec:net_cli_sample} e \ref{sec:net_serv_sample}) con l'eccezione della -funzione \texttt{socket} che è già stata esaminata in dettaglio in +funzione \texttt{socket} che è già stata esaminata in dettaglio in \ref{sec:sock_socket}. In \nfig\ abbiamo un tipico schema di funzionamento di un'applicazione @@ -608,7 +610,7 @@ seguito il client si connette, in questo caso, a differenza di quanto accadeva con gli esempi elementari del Cap.~\ref{cha:network} si assume che sia il client ad effettuare delle richieste a cui il server risponde, il client notifica poi di avere concluso inviando un end-of-file a cui il server -risponderà anche lui chiudendo la connessione per aspettarne una nuova. +risponderà anche lui chiudendo la connessione per aspettarne una nuova. \begin{figure}[!htb] \centering @@ -621,45 +623,134 @@ risponder Useremo questo schema per l'esempio di implementazione del servizio \texttt{echo} che illustreremo in \ref{sec:TCPel_echo_example}. + +\subsection{La funzione \texttt{bind}} +\label{sec:TCPel_func_bind} + + +La funzione \texttt{bind} assegna un indirizzo locale ad un socket, è usata +cioè per specificare la prima parte dalla socket pair. Viene usata sul lato +server per specificare la porta (e gli eventuali indirizzi locali) su cui poi +ci si porrà in ascolto. + +Il prototipo della funzione, definito in \texttt{sys/socket.h}, è il seguente: + +\begin{itemize} +\item \texttt{int bind(int sockfd, const struct sockaddr *serv_addr, + socklen_t addrlen) } + + Il primo argomento è un file descriptor ottenuto da una precedente chiamata + a \texttt{socket}, mentre il secondo e terzo argomento sono rispettivamente + l'indirizzo (locale) del socket e la dimensione della struttura che lo + contiene, secondo quanto già trattato in \ref{sec:sock_sockaddr}. + + La funzione restituisce zero in caso di successo e -1 per un errore, in caso + di errore. La variabile \texttt{errno} viene settata secondo i seguenti + codici di errore: + + \begin{itemize} + \item \texttt{EBADF} Il file descriptor non è valido. + \item \texttt{EINVAL} Il socket ha già un indirizzo assegnato. + \item \texttt{ENOTSOCK} Il file descriptor non è associato ad un socket. + \item \texttt{EACCESS} Si è cercato di usare un indirizzo riservato senza + essere root. + \end{itemize} + +\end{itemize} + +Con il TCP la chiamata \texttt{bind} permette di specificare l'indirizzo, la +porta, entrambi o nessuno dei due. In genere i server utilizzano una porta +nota che assegnano all'avvio, se questo non viene fatto è il kernel a +scegliere una porta effimera quando vengono eseguite la funzioni +\texttt{connect} o \texttt{listen}, ma se questo è normale per il client non +lo è per il server\footnote{un'eccezione a tutto ciò i server che usano RPC. + In questo caso viene fatta assegnare dal kernel una porta effimera che poi + viene registrata presso il \textit{portmapper}; quest'ultimo è un altro + demone che deve essere contattato dai client per ottenere la porta effimera + su cui si trova il server} che in genere viene identificato dalla porta su +cui risponde. + +Con \texttt{bind} si può assegnare un IP specifico ad un socket, purché questo +appartenga ad una interfaccia della macchina. Per un client TCP questo +diventerà l'indirizzo sorgente usato per i tutti i pacchetti inviati sul +socket, mentre per un server TCP questo restringerà l'accesso al socket solo +alle connessioni che arrivano verso tale indirizzo. + +Normalmente un client non specifica mai un indirizzo ad un suo socket, ed il +kernel sceglie l'indirizzo di orgine quando viene effettuata la connessione +sulla base dell'interfaccia usata per trasmettere i pacchetti, (che dipende +dalle regole di instradamento usate per raggiungere il server). +Se un server non specifica il suo indirizzo locale il kernel userà come +indirizzo di origine l'indirizzo di destinazione specificato dal SYN del +client. + +Per specificare un indirizzo generico con IPv4 si usa il valore +\texttt{INADDR\_ANY}, il cui valore, come visto anche negli esempi precedenti +è pari a zero, nell'esempio \ref{fig:net_serv_sample} si è usata +un'assegnazione immediata del tipo: +\begin{verbatim} + serv_add.sin_addr.s_addr = htonl(INADDR_ANY); /* connect from anywhere */ +\end{verbatim} + +Si noti che si è usato \texttt{htonl} per assegnare il valore +\texttt{INADDR\_ANY}; benché essendo questo pari a zero il riordinamento sia +inutile; ma dato che tutte le constanti \texttt{INADDR\_} sono definite +secondo l'ordinamento della macchina è buona norma usare sempre la funzione +\texttt{htonl}. + +L'esempio precedete funziona con IPv4 dato che l'indirizzo è rappresentabile +anche con un intero a 32 bit; non si può usare lo stesso metodo con IPv6, +in cui l'indirizzo è specificato come struttura, perché il linguaggio C non +consente l'uso di una struttura costante come operando a destra in una +assegnazione. Per questo nell'header \texttt{netinet/in.h} è definita una +variabile \texttt{in6addr\_any} (dichiarata come \texttt{extern}, ed +inizializzata dal sistema al valore \texttt{IN6ADRR\_ANY\_INIT}) che permette +di effettuare una assegnazione del tipo: +\begin{verbatim} + serv_add.sin6_addr = in6addr_any; /* connect from anywhere */ +\end{verbatim} + + \subsection{La funzione \texttt{connect}} \label{sec:TCPel_func_connect} -La funzione \texttt{connect} è usata da un client TCP per stabilire la +La funzione \texttt{connect} è usata da un client TCP per stabilire la connessione con un server TCP, il prototipo della funzione, definito in -\texttt{sys/socket.h}, è il seguente: +\texttt{sys/socket.h}, è il seguente: \begin{itemize} \item \texttt{int connect(int sockfd, const struct sockaddr *serv_addr, socklen_t addrlen) } - Il primo argomento è un file descriptor ottenuto da una precedente chiamata + Il primo argomento è un file descriptor ottenuto da una precedente chiamata a \texttt{socket}, mentre il secondo e terzo argomento sono rispettivamente l'indirizzo e la dimensione della struttura che contiene l'indirizzo del - socket, già descritta in \ref{sec:sock_sockaddr}. + socket, già descritta in \ref{sec:sock_sockaddr}. La funzione restituisce zero in caso di successo e -1 per un errore, in caso di errore. La variabile \texttt{errno} viene settata secondo i seguenti - codici di errore - + codici di errore: \begin{itemize} - \item \texttt{EBADF} Il file descriptor non è valido. - \item \texttt{EFAULT} L'indirizzo della struttura di indirizzi è al di fuori + \item \texttt{EBADF} Il file descriptor non è valido. + \item \texttt{EFAULT} L'indirizzo della struttura di indirizzi è al di fuori dello spazio di indirizzi dell'utente. - \item \texttt{ENOTSOCK} Il file descriptor non è associato ad un socket - \item \texttt{EISCONN} Il socket è già connesso. - \item \texttt{ECONNREFUSED} Non c'è nessuno in ascolto sull'indirizzo remoto. - \item \texttt{ETIMEDOUT} Si è avuto timeout durante il tentativo di + \item \texttt{ENOTSOCK} Il file descriptor non è associato ad un socket. + \item \texttt{EISCONN} Il socket è già connesso. + \item \texttt{ECONNREFUSED} Non c'è nessuno in ascolto sull'indirizzo remoto. + \item \texttt{ETIMEDOUT} Si è avuto timeout durante il tentativo di connessione. - \item \texttt{ENETUNREACH} La rete non è rggiungibile/ - \item \texttt{EADDRINUSE} L'indirizzo locale è in uso. - \item \texttt{EINPROGRESS} Il socket è non bloccante e la connessione non - può essere conclusa immediatamente. - \item \texttt{EALREADY} Il socket è non bloccante e un tentativo precedente - di connessione non si è ancora concluso. - \item \texttt{EAGAIN} Non ci sono più porte locali libere. + \item \texttt{ENETUNREACH} La rete non è raggiungibile. + \item \texttt{EADDRINUSE} L'indirizzo locale è in uso. + \item \texttt{EINPROGRESS} Il socket è non bloccante e la connessione non + può essere conclusa immediatamente. + \item \texttt{EALREADY} Il socket è non bloccante e un tentativo precedente + di connessione non si è ancora concluso. + \item \texttt{EAGAIN} Non ci sono più porte locali libere. \item \texttt{EAFNOSUPPORT} L'indirizzo non ha una famiglia di indirizzi corretta nel relativo campo. - \item \texttt{EACCESS, EPERM} + \item \texttt{EACCESS, EPERM} Si è tentato di eseguire una connessione ad un + indirizzo broacast senza che il socket fosse stato abilitato per il + broadcast. \end{itemize} \end{itemize} @@ -669,45 +760,60 @@ nell'esempio \ref{sec:net_cli_sample} usando le funzioni illustrate in \ref{sec:sock_addr_func}. Nel caso di socket TCP la funzione \texttt{connect} avvia il three way -handshake, e ritorna solo quando la connessione è stabilita o si è verificato -un errore. Le possibili cause di errore sono molteplici (e brevemente -riassunte sopra), in particolare le principali sono: +handshake, e ritorna solo quando la connessione è stabilita o si è verificato +un errore. Le possibili cause di errore sono molteplici (ed i relativi codici +riportati sopra), quelle che però dipendono dalla situazione della rete e non +da errori o problemi nella chiamata della funzione sono le seguenti: \begin{enumerate} -\item Se il client non riceve risposta al SYN l'errore restituito è +\item Il client non riceve risposta al SYN: l'errore restituito è \texttt{ETIMEDOUT}. Stevens riporta che BSD invia un primo SYN alla chiamata di \texttt{connect}, un'altro dopo 6 secondi, un terzo dopo 24 secondi, se dopo 75 secondi non ha ricevuto risposta viene ritornato l'errore. Linux invece ripete l'emissione del SYN ad intervalli di 30 secondi per un numero - di volte che può essere stabilito dall'utente sia con una opportuna + di volte che può essere stabilito dall'utente sia con una opportuna \texttt{sysctl} che attraverso il filesystem \texttt{/proc} scrivendo il valore voluto in \texttt{/proc/sys/net/ipv4/tcp_syn_retries}. Il valore di - default per la ripetizione dell'invio è di 5 volte, che comporta un timeout + default per la ripetizione dell'invio è di 5 volte, che comporta un timeout dopo circa 180 secondi. % % Le informazioni su tutte le opzioni settabili via /proc stanno in % linux/Documentation/networking/ip-sysctl.txt % -\item Se il client riceve come risposta al SYN un RST significa che non c'è +\item Il client riceve come risposta al SYN un RST significa che non c'è nessun programma in ascolto per la connessione sulla porta specificata (il - che vuol dire probablmente che o si è sbagliato il numero della porta o che - non è stato avviato il server), questo è un errore fatale e la funzione + che vuol dire probablmente che o si è sbagliato il numero della porta o che + non è stato avviato il server), questo è un errore fatale e la funzione ritorna non appena il RST viene ricevuto riportando un errore \texttt{ECONNREFUSED}. - Il flag RST sta per \textit{reset} ed è un segmento inviato direttamente + Il flag RST sta per \textit{reset} ed è un segmento inviato direttamente dal TCP quando qualcosa non va. Tre condizioni che generano un RST sono: quando arriva un SYN per una porta che non ha nessun server in ascolto, quando il TCP abortisce una connessione in corso, quandi TCP riceve un segmento per una connessione che non esiste. - -\item Il SYN del client provoca l'emissione di un messaggio ICMP di - destinazione non raggiungibile. +\item Il SYN del client provoca l'emissione di un messaggio ICMP di + destinazione non raggiungibile. In questo caso dato che il messaggio può + essere dovuto ad una condizione transitoria si ripete l'emmissione dei SYN + come nel caso precedente, fino al timeout, e solo allora si restituisce il + codice di errore dovuto al messaggio ICMP, che da luogo ad un + \texttt{ENETUNREACH}. + \end{enumerate} -\subsection{La funzione \texttt{bind}} -\label{sec:TCPel_func_bind} +Se si fa riferimento al diagramma degli stati del TCP riportato in +\ref{fig:appB:tcp_state_diag} la funzione \texttt{connect} porta un socket +dallo stato \texttt{CLOSED} (lo stato iniziale in cui si trova un socket +appena creato) prima allo stato \texttt{SYN\_SENT} e poi, al ricevimento del +ACK, nello stato \texttt{ESTABLISHED}. Se invece la connessione fallisce il +socket non è più utilizzabile e deve essere chiuso. + +Si noti infine che con la funzione \texttt{connect} si è specificato solo +indirizzo e porta del server, quindi solo una metà della socket pair; nei +socket TCP infatti l'altra metà contentente indirizzo e porta locale sono +specificati automaticamente dal kernel, e non è necessario effettuare una +\texttt{bind}. diff --git a/macro.tex b/macro.tex index 7375beb..dda76fe 100644 --- a/macro.tex +++ b/macro.tex @@ -1,7 +1,7 @@ % % Defining some commands to manipulate counter to avoid ude of % \label and \ref commands (and related problem to remeber the -% used labels +% used labels) to refer nearest objects % % \newcounter{usercount} % define a new counter for internal use @@ -41,7 +41,6 @@ tab.~\thechapter.\theusercount} \setcounter{usercount}{\value{equation}}% \addtocounter{usercount}{-1}% (\thechapter.\theusercount)} - % % Macro to put picture (in format PICT) inside a figure % @@ -53,3 +52,5 @@ tab.~\thechapter.\theusercount} } % % + + -- 2.30.2