Lavoro fatto a casa senza ADSL, correzioni multiple agli indici, documentato
[gapil.git] / tcpsock.tex
index 03fb502bbaa8817ace2e0bee04347867a6f97de3..14c664b9949cd98a88675f055fd76738bc7b4136 100644 (file)
@@ -38,7 +38,7 @@ significato di alcuni dei vari \textsl{stati} ad essa associati.
 \subsection{La creazione della connessione: il \textit{three way handshake}}
 \label{sec:TCP_conn_cre}
 
-\index{\textit{three~way~handshake}|(}
+\itindbeg{three~way~handshake} 
 Il processo che porta a creare una connessione TCP è chiamato \textit{three
   way handshake}; la successione tipica degli eventi (e dei
 \textsl{segmenti}\footnote{Si ricordi che il segmento è l'unità elementare di
@@ -118,7 +118,8 @@ aspetta di ricevere con il pacchetto successivo; dato che il primo pacchetto
 SYN consuma un byte, nel \textit{three way handshake} il numero di acknowledge
 è sempre pari al numero di sequenza iniziale incrementato di uno; lo stesso
 varrà anche (vedi fig.~\ref{fig:TCP_close}) per l'acknowledgement di un FIN.
-\index{\textit{three~way~handshake}|)}
+
+\itindend{three~way~handshake}
 
 
 \subsection{Le opzioni TCP.}
@@ -136,7 +137,8 @@ regolare la connessione. Normalmente vengono usate le seguenti opzioni:
   connessione corrente. È possibile leggere e scrivere questo valore
   attraverso l'opzione del socket \const{TCP\_MAXSEG}.
   
-\item \textit{window scale option}, %come spiegato in sez.~\ref{sec:tcp_protocol}
+\item \textit{window scale
+    option}, %come spiegato in sez.~\ref{sec:tcp_protocol}
   il protocollo TCP implementa il controllo di flusso attraverso una
   \textsl{finestra annunciata} (\textit{advertized window}) con la quale
   ciascun capo della comunicazione dichiara quanto spazio disponibile ha in
@@ -392,7 +394,7 @@ una connessione fra due router si interrompa. In questo caso i protocolli di
 instradamento dei pacchetti possono impiegare diverso tempo (anche dell'ordine
 dei minuti) prima di trovare e stabilire un percorso alternativo per i
 pacchetti. Nel frattempo possono accadere casi in cui un router manda i
-pacchetti verso un'altro e quest'ultimo li rispedisce indietro, o li manda ad
+pacchetti verso un altro e quest'ultimo li rispedisce indietro, o li manda ad
 un terzo router che li rispedisce al primo, si creano cioè dei circoli (i
 cosiddetti \textit{routing loop}) in cui restano intrappolati i pacchetti.
 
@@ -620,17 +622,17 @@ tcp        0      0 195.110.112.152:22      192.84.146.100:21100    ESTABLISHED
 tcp        0      0 195.110.112.152:22      192.84.146.100:21101    ESTABLISHED
 \end{verbatim}
 cioè il client effettuerà la connessione usando un'altra porta effimera: con
-questa sarà aperta la connessione, ed il server creerà un'altro processo
+questa sarà aperta la connessione, ed il server creerà un altro processo
 figlio per gestirla.
 
 Tutto ciò mostra come il TCP, per poter gestire le connessioni con un server
 concorrente, non può suddividere i pacchetti solo sulla base della porta di
 destinazione, ma deve usare tutta l'informazione contenuta nella socket pair,
 compresa la porta dell'indirizzo remoto.  E se andassimo a vedere quali sono i
-processi\footnote{ad esempio con il comando \cmd{fuser}, o con \cmd{lsof}.} a
-cui fanno riferimento i vari socket vedremmo che i pacchetti che arrivano
-dalla porta remota 21100 vanno al primo figlio e quelli che arrivano alla
-porta 21101 al secondo.
+processi\footnote{ad esempio con il comando \cmd{fuser}, o con \cmd{lsof}, o
+  usando l'opzione \texttt{-p}.} a cui fanno riferimento i vari socket
+vedremmo che i pacchetti che arrivano dalla porta remota 21100 vanno al primo
+figlio e quelli che arrivano alla porta 21101 al secondo.
 
 
 \section{Le funzioni di base per la gestione dei socket}
@@ -716,7 +718,7 @@ Si noti che si 
 \const{INADDR\_ANY}, anche se, essendo questo nullo, il riordinamento è
 inutile.  Si tenga presente comunque che tutte le costanti \val{INADDR\_}
 (riportate in tab.~\ref{tab:TCP_ipv4_addr}) sono definite secondo
-l'\textit{endianess}\index{\textit{endianess}} della macchina, ed anche se
+l'\textit{endianess}\itindex{endianess} della macchina, ed anche se
 esse possono essere invarianti rispetto all'ordinamento dei bit, è comunque
 buona norma usare sempre la funzione \func{htonl}.
 
@@ -746,10 +748,10 @@ con una struttura, perch
 costante come operando a destra in una assegnazione.
 
 Per questo motivo nell'header \file{netinet/in.h} è definita una variabile
-\const{in6addr\_any} (dichiarata come \direct{extern}, ed inizializzata dal
+\macro{in6addr\_any} (dichiarata come \direct{extern}, ed inizializzata dal
 sistema al valore \const{IN6ADRR\_ANY\_INIT}) che permette di effettuare una
 assegnazione del tipo: \includecodesnip{listati/serv_addr_sin6_addr.c} in
-maniera analoga si può utilizzare la variabile \const{in6addr\_loopback} per
+maniera analoga si può utilizzare la variabile \macro{in6addr\_loopback} per
 indicare l'indirizzo di \textit{loopback}, che a sua volta viene inizializzata
 staticamente a \const{IN6ADRR\_LOOPBACK\_INIT}.
 
@@ -765,8 +767,8 @@ connessione con un server TCP,\footnote{di nuovo la funzione 
   limiterà ad impostare l'indirizzo dal quale e verso il quale saranno inviati
   e ricevuti i pacchetti, mentre per socket di tipo \const{SOCK\_STREAM} o
   \const{SOCK\_SEQPACKET}, essa attiverà la procedura di avvio (nel caso del
-  TCP il \index{\textit{three~way~handshake}}\textit{three way handshake})
-  della connessione.}  il prototipo della funzione è il seguente:
+  TCP il \itindex{three~way~handshake}\textit{three way handshake}) della
+  connessione.}  il prototipo della funzione è il seguente:
 \begin{prototype}{sys/socket.h}
   {int connect(int sockfd, const struct sockaddr *servaddr, socklen\_t
     addrlen)}
@@ -809,7 +811,7 @@ nell'esempio sez.~\ref{sec:TCP_daytime_client}, usando le funzioni illustrate
 in sez.~\ref{sec:sock_addr_func}.
 
 Nel caso di socket TCP la funzione \func{connect} avvia il
-\index{\textit{three~way~handshake}}\textit{three way handshake}, e ritorna
+\itindex{three~way~handshake}\textit{three way handshake}, e ritorna
 solo quando la connessione è stabilita o si è verificato un errore. Le
 possibili cause di errore sono molteplici (ed i relativi codici riportati
 sopra), quelle che però dipendono dalla situazione della rete e non da errori
@@ -817,7 +819,7 @@ o problemi nella chiamata della funzione sono le seguenti:
 \begin{enumerate}
 \item Il client non riceve risposta al SYN: l'errore restituito è
   \errcode{ETIMEDOUT}. Stevens riporta che BSD invia un primo SYN alla chiamata
-  di \func{connect}, un'altro dopo 6 secondi, un terzo dopo 24 secondi, se
+  di \func{connect}, un altro dopo 6 secondi, un terzo dopo 24 secondi, se
   dopo 75 secondi non ha ricevuto risposta viene ritornato l'errore. Linux
   invece ripete l'emissione del SYN ad intervalli di 30 secondi per un numero
   di volte che può essere stabilito dall'utente sia con una opportuna
@@ -825,10 +827,7 @@ o problemi nella chiamata della funzione sono le seguenti:
   voluto in \file{/proc/sys/net/ipv4/tcp\_syn\_retries}. Il valore predefinito
   per la ripetizione dell'invio è di 5 volte, che comporta un timeout dopo
   circa 180 secondi.
-%
-% Le informazioni su tutte le opzioni impostabili via /proc stanno in
-% Linux/Documentation/networking/ip-sysctl.txt
-%
+
 \item Il client riceve come risposta al SYN un RST significa che non c'è
   nessun programma in ascolto per la connessione sulla porta specificata (il
   che vuol dire probabilmente che o si è sbagliato il numero della porta o che
@@ -908,7 +907,7 @@ infatti vengono mantenute due code:
 \begin{enumerate}
 \item La coda delle connessioni incomplete (\textit{incomplete connection
     queue} che contiene un riferimento per ciascun socket per il quale è
-  arrivato un SYN ma il \index{\textit{three~way~handshake}}\textit{three way
+  arrivato un SYN ma il \itindex{three~way~handshake}\textit{three way
     handshake} non si è ancora concluso.  Questi socket sono tutti nello stato
   \texttt{SYN\_RECV}.
 \item La coda delle connessioni complete (\textit{complete connection queue}
@@ -922,7 +921,7 @@ quando arriva un SYN da un client il server crea una nuova voce nella coda
 delle connessioni incomplete, e poi risponde con il SYN$+$ACK. La voce resterà
 nella coda delle connessioni incomplete fino al ricevimento dell'ACK dal
 client o fino ad un timeout. Nel caso di completamento del
-\index{\textit{three~way~handshake}}\textit{three way handshake} la voce viene
+\itindex{three~way~handshake}\textit{three way handshake} la voce viene
 spostata nella coda delle connessioni complete.  Quando il processo chiama la
 funzione \func{accept} (vedi sez.~\ref{sec:TCP_func_accept}) la prima voce
 nella coda delle connessioni complete è passata al programma, o, se la coda è
@@ -979,7 +978,7 @@ che il compito principale della coda sia quello di gestire il caso in cui il
 server è occupato fra chiamate successive alla \func{accept} (per cui la coda
 più occupata sarebbe quella delle connessioni completate), ma piuttosto quello
 di gestire la presenza di un gran numero di SYN in attesa di concludere il
-\textit{three way handshake}\index{\textit{three~way~handshake}}.
+\textit{three way handshake}\itindex{three~way~handshake}.
 
 Infine va messo in evidenza che, nel caso di socket TCP, quando un SYN arriva
 con tutte le code piene, il pacchetto deve essere ignorato. Questo perché la
@@ -997,10 +996,10 @@ trasparente dal protocollo TCP.
 \label{sec:TCP_func_accept}
 
 La funzione \funcd{accept} è chiamata da un server per gestire la connessione
-una volta che sia stato completato il \textit{three way
-  handshake},\footnote{la funzione è comunque generica ed è utilizzabile su
-  socket di tipo \const{SOCK\_STREAM}, \const{SOCK\_SEQPACKET} e
-  \const{SOCK\_RDM}.} la funzione restituisce un nuovo socket descriptor su
+una volta che sia stato completato il \itindex{three~way~handshake}
+\textit{three way handshake},\footnote{la funzione è comunque generica ed è
+  utilizzabile su socket di tipo \const{SOCK\_STREAM}, \const{SOCK\_SEQPACKET}
+  \const{SOCK\_RDM}.} la funzione restituisce un nuovo socket descriptor su
 cui si potrà operare per effettuare la comunicazione. Se non ci sono
 connessioni completate il processo viene messo in attesa. Il prototipo della
 funzione è il seguente:
@@ -1600,7 +1599,7 @@ Inoltre nel caso sia stato abilitato il \textit{logging} delle connessioni, si
 provvede anche (\texttt{\small 40--43}) a stampare sullo standard output
 l'indirizzo e la porta da cui il client ha effettuato la connessione, usando i
 valori contenuti nelle strutture restituite da \func{accept}, eseguendo le
-opportune conversioni con \func{inet\_ntop} e \func{atohs}.
+opportune conversioni con \func{inet\_ntop} e \func{ntohs}.
 
 Ancora una volta l'esempio è estremamente semplificato, si noti come di nuovo
 non si sia gestita né la terminazione del processo né il suo uso come demone,
@@ -1792,7 +1791,7 @@ processo ad un gruppo senza privilegi,\footnote{si 
   27--30}) l'operazione usando \func{setuid} per cambiare anche
 l'utente.\footnote{si tenga presente che l'ordine in cui si eseguono queste
   due operazioni è importante, infatti solo avendo i privilegi di
-  amministratore si può cambiare il gruppo di un processo ad un'altro di cui
+  amministratore si può cambiare il gruppo di un processo ad un altro di cui
   non si fa parte, per cui chiamare prima \func{setuid} farebbe fallire una
   successiva chiamata a \func{setgid}.  Inoltre si ricordi (si riveda quanto
   esposto in sez.~\ref{sec:proc_perms}) che usando queste due funzioni il
@@ -1911,14 +1910,14 @@ connessioni da qualunque indirizzo e da qualunque porta e su qualunque
 interfaccia locale.
 
 A questo punto si può lanciare il client, esso chiamerà \func{socket} e
-\func{connect}; una volta completato il \textit{three way handshake} la
-connessione è stabilita; la \func{connect} ritornerà nel client\footnote{si
-  noti che è sempre la \func{connect} del client a ritornare per prima, in
-  quanto questo avviene alla ricezione del secondo segmento (l'ACK del server)
-  del \textit{three way handshake}, la \func{accept} del server ritorna solo
-  dopo un altro mezzo RTT quando il terzo segmento (l'ACK del client) viene
-  ricevuto.}  e la \func{accept} nel server, ed usando di nuovo \cmd{netstat}
-otterremmo che:
+\func{connect}; una volta completato il \itindex{three~way~handshake}
+\textit{three way handshake} la connessione è stabilita; la \func{connect}
+ritornerà nel client\footnote{si noti che è sempre la \func{connect} del
+  client a ritornare per prima, in quanto questo avviene alla ricezione del
+  secondo segmento (l'ACK del server) del \textit{three way handshake}, la
+  \func{accept} del server ritorna solo dopo un altro mezzo RTT quando il
+  terzo segmento (l'ACK del client) viene ricevuto.}  e la \func{accept} nel
+server, ed usando di nuovo \cmd{netstat} otterremmo che:
 \begin{verbatim}
 Active Internet connections (servers and established)
 Proto Recv-Q Send-Q Local Address           Foreign Address         State
@@ -2262,10 +2261,10 @@ Bench
 con dei server molto occupati. In tal caso, con una struttura del server
 simile a quella del nostro esempio, in cui la gestione delle singole
 connessioni è demandata a processi figli, può accadere che il \textit{three
-  way handshake}\index{\textit{three~way~handshake}} venga completato e la
-relativa connessione abortita subito dopo, prima che il padre, per via del
-carico della macchina, abbia fatto in tempo ad eseguire la chiamata ad
-\func{accept}. Di nuovo si ha una situazione analoga a quella illustrata in
+  way handshake}\itindex{three~way~handshake} venga completato e la relativa
+connessione abortita subito dopo, prima che il padre, per via del carico della
+macchina, abbia fatto in tempo ad eseguire la chiamata ad \func{accept}. Di
+nuovo si ha una situazione analoga a quella illustrata in
 fig.~\ref{fig:TCP_early_abort}, in cui la connessione viene stabilita, ma
 subito dopo si ha una condizione di errore che la chiude prima che essa sia
 stata accettata dal programma.
@@ -2292,9 +2291,10 @@ attraverso la sequenza vista in sez.~\ref{sec:TCP_conn_term}, per cui la
 \func{accept} ritornerà senza errori, e si avrà semplicemente un end-of-file
 al primo accesso al socket. Nel caso di Linux inoltre, anche qualora si
 modifichi il client per fargli gestire l'invio di un segmento di RST alla
-chiusura dal socket (come suggerito da Stevens in \cite{UNP1}), non si ha
-nessun errore al ritorno di \funcd{accept}, quanto un errore di
-\errcode{ECONNRESET} al primo tentativo di accesso al socket.
+chiusura dal socket (usando l'opzione \const{SO\_LINGER}, vedi
+sez.~\ref{sec:sock_options_main}), non si ha nessun errore al ritorno di
+\func{accept}, quanto un errore di \errcode{ECONNRESET} al primo tentativo di
+accesso al socket.
 
 
 
@@ -2372,8 +2372,8 @@ anarres.echo > gont.34559: R 511689732:511689732(0) win 0
 
 Le prime tre righe vengono prodotte al momento in cui lanciamo il nostro
 client, e corrispondono ai tre pacchetti del
-\index{\textit{three~way~handshake}}\textit{three way handshake}.  L'output
-del comando riporta anche i numeri di sequenza iniziali, mentre la lettera
+\itindex{three~way~handshake}\textit{three way handshake}.  L'output del
+comando riporta anche i numeri di sequenza iniziali, mentre la lettera
 \texttt{S} indica che per quel pacchetto si aveva il SYN flag attivo.  Si noti
 come a partire dal secondo pacchetto sia sempre attivo il campo \texttt{ack},
 seguito dal numero di sequenza per il quale si da il ricevuto; quest'ultimo, a
@@ -2387,17 +2387,17 @@ server risponde dando il ricevuto con un secondo pacchetto, che a sua volta
 porta un SYN, cui il client risponde con un il terzo pacchetto di ricevuto.
 
 Ritorniamo allora alla nostra sessione con il servizio echo: dopo le tre righe
-del \textit{three way handshake}\index{\textit{three~way~handshake}} non
-avremo nulla fin tanto che non scriveremo una prima riga sul client; al
-momento in cui facciamo questo si genera una sequenza di altri quattro
-pacchetti. Il primo, dal client al server, contraddistinto da una lettera
-\texttt{P} che significa che il flag PSH è impostato, contiene la nostra riga
-(che è appunto di 11 caratteri), e ad esso il server risponde immediatamente
-con un pacchetto vuoto di ricevuto. Poi tocca al server riscrivere indietro
-quanto gli è stato inviato, per cui sarà lui a mandare indietro un terzo
-pacchetto con lo stesso contenuto appena ricevuto, e a sua volta riceverà dal
-client un ACK nel quarto pacchetto.  Questo causerà la ricezione dell'eco nel
-client che lo stamperà a video.
+del \textit{three way handshake}\itindex{three~way~handshake} non avremo nulla
+fin tanto che non scriveremo una prima riga sul client; al momento in cui
+facciamo questo si genera una sequenza di altri quattro pacchetti. Il primo,
+dal client al server, contraddistinto da una lettera \texttt{P} che significa
+che il flag PSH è impostato, contiene la nostra riga (che è appunto di 11
+caratteri), e ad esso il server risponde immediatamente con un pacchetto vuoto
+di ricevuto. Poi tocca al server riscrivere indietro quanto gli è stato
+inviato, per cui sarà lui a mandare indietro un terzo pacchetto con lo stesso
+contenuto appena ricevuto, e a sua volta riceverà dal client un ACK nel quarto
+pacchetto.  Questo causerà la ricezione dell'eco nel client che lo stamperà a
+video.
 
 A questo punto noi procediamo ad interrompere l'esecuzione del server con un
 \texttt{C-c} (cioè con l'invio di \const{SIGTERM}): nel momento in cui