simpltcp.tex

   1 \chapter{Un esempio completo di client/server TCP}
   2 \label{cha:simple_TCP_sock}
   3
   4 In questo capitolo riprenderemo le funzioni trattate nel precedente, usandole
   5 per scrivere una prima applicazione client/server che usi i socket TCP per una
   6 comunicazione in entrambe le direzioni.
   7
   8 Inoltre prenderemo in esame, oltre al comportamento in condizioni normali,
   9 anche tutti i possibili scenari particolari (errori, sconnessione della rete,
  10 crash del client o del server durante la connessione) che possono avere luogo
  11 durante l'impiego di una applicazione di rete.
  12
  13
  14 \section{Il servizio \texttt{echo}}
  15 \label{sec:TCPsimp_echo}
  16
  17 L'applicazione scelta come esempio sarà una implementazione elementare, ma
  18 completa, del servizio \texttt{echo}. Il servizio \texttt{echo} è uno dei
  19 servizi standard solitamente provvisti direttamente dal superserver
  20 \cmd{inetd}, ed è definito dall'RFC~862. Come dice il nome il servizio deve
  21 rimandare indietro sulla connessione i dati che gli vengono inviati; l'RFC
  22 descrive le specifiche sia per TCP che UDP, e per il primo stabilisce che una
  23 volta stabilita la connessione ogni dato in ingresso deve essere rimandato in
  24 uscita, fintanto che il chiamante non ha chiude la connessione; il servizio
  25 opera sulla porta 7.
  26
  27 Nel nostro caso l'esempio sarà costituito da un client che legge una linea di
  28 caratteri dallo standard input e la scrive sul server, il server leggerà la
  29 linea dalla connessione e la riscriverà all'indietro; sarà compito del client
  30 leggere la risposta del server e stamparla sullo standard output.
  31
  32 Si è scelto di usare questo servizio, seguendo lo Stevens, perché costituisce
  33 il prototipo ideale di una generica applicazione di rete in cui un server
  34 risponde alle richieste di un client; tutto quello che cambia nel caso si una
  35 applicazione più complessa è la elaborazione dell'input del client da parte
  36 del server nel fornire le risposte in uscita.
  37
  38 Partiremo da una implementazione elementare che dovrà essere rimaneggiata di
  39 volta in volta per poter tenere conto di tutte le evenienze che si possono
  40 manifestare nella vita reale di una applicazione di rete, fino ad arrivare ad
  41 una implementazione completa.
  42
  43 \subsection{La struttura del server}
  44 \label{sec:TCPsimp_server_main}
  45
  46 La prima versione del server, \file{ElemEchoTCPServer.c}, si compone di un
  47 corpo principale, costituito dalla funzione \code{main}.  Questa si incarica
  48 di creare il socket, metterlo in ascolto di connessioni in arrivo e creare un
  49 processo figlio a cui delegare la gestione di ciascuna connessione.  Questa
  50 parte, riportata in \nfig, è analoga a quella vista nel precedente esempio
  51 esaminato in \secref{sec:TCPel_cunc_serv}.
  52
  53 \begin{figure}[!htb]
  54   \footnotesize
  55   \begin{lstlisting}{}
  56 /* Subroutines declaration */
  57 void ServEcho(int sockfd);
  58 /* Program beginning */
  59 int main(int argc, char *argv[])
  60 {
  61     int list_fd, conn_fd;
  62     pid_t pid;
  63     struct sockaddr_in serv_add;
  64      ....
  65     /* create socket */
  66     if ( (list_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0) {
  67         perror("Socket creation error");
  68         exit(-1);
  69     }
  70     /* initialize address */
  71     memset((void *)&serv_add, 0, sizeof(serv_add)); /* clear server address */
  72     serv_add.sin_family = AF_INET;                  /* address type is INET */
  73     serv_add.sin_port = htons(13);                  /* daytime port is 13 */
  74     serv_add.sin_addr.s_addr = htonl(INADDR_ANY);   /* connect from anywhere */
  75     /* bind socket */
  76     if (bind(list_fd, (struct sockaddr *)&serv_add, sizeof(serv_add)) < 0) {
  77         perror("bind error");
  78         exit(-1);
  79     }
  80     /* listen on socket */
  81     if (listen(list_fd, BACKLOG) < 0 ) {
  82         perror("listen error");
  83         exit(-1);
  84     }
  85     /* handle echo to client */
  86     while (1) {
  87         /* accept connection */
  88         if ( (conn_fd = accept(list_fd, NULL, NULL)) < 0) {
  89             perror("accept error");
  90             exit(-1);
  91         }
  92         /* fork to handle connection */
  93         if ( (pid = fork()) < 0 ){
  94             perror("fork error");
  95             exit(-1);
  96         }
  97         if (pid == 0) {      /* child */
  98             close(list_fd);          /* close listening socket */
  99             SockEcho(conn_fd);       /* handle echo */
 100             exit(0);
 101         } else {             /* parent */
 102             close(conn_fd);          /* close connected socket */
 103         }
 104     }
 105     /* normal exit, never reached */
 106     exit(0);
 107 }
 108   \end{lstlisting}
 109   \caption{Codice della funzione \code{main} della prima versione del server
 110     per il servizio \texttt{echo}.}
 111   \label{fig:TCPsimpl_serv_code}
 112 \end{figure}
 113
 114 La struttura di questa prima versione del server è sostanzialmente identica a
 115 quella dell'esempio citato, ed ad esso si applicano le considerazioni fatte in
 116 \secref{sec:TCPel_cunc_daytime}. Le uniche differenze rispetto all'esempio in
 117 \figref{fig:TCPel_serv_code} sono che in questo caso per il socket in
 118 ascolto viene usata la porta 7 e tutta la gestione della comunicazione è
 119 delegata alla funzione \code{ServEcho}.
 120 %  Per ogni connessione viene creato un
 121 % processo figlio, il quale si incarica di lanciare la funzione
 122 % \texttt{SockEcho}.
 123
 124 Il codice della funzione \code{ServEcho} è invece mostrata in \nfig, la
 125 comunicazione viene gestita all'interno del ciclo (linee \texttt{\small
 126   6--8}).  I dati inviati dal client vengono letti dal socket con una semplice
 127 \func{read} (che ritorna solo in presenza di dati in arrivo), la riscrittura
 128 viene invece gestita dalla funzione \func{SockWrite} (descritta a suo tempo
 129 in \figref{fig:sock_SockWrite_code}) che si incarica di tenere conto
 130 automaticamente della possibilità che non tutti i dati di cui è richiesta la
 131 scrittura vengano trasmessi con una singola \func{write}.
 132
 133
 134 \begin{figure}[!htb]
 135   \footnotesize
 136   \begin{lstlisting}{}
 137 void ServEcho(int sockfd) {
 138     char buffer[MAXLINE];
 139     int nread, nwrite;
 140
 141     /* main loop, reading 0 char means client close connection */
 142     while ( (nread = read(sockfd, buffer, MAXLINE)) != 0) {
 143         nwrite = SockWrite(sockfd, buffer, nread);
 144     }
 145     return;
 146 }
 147   \end{lstlisting}
 148   \caption{Codice della prima versione della funzione \code{ServEcho} per la
 149     gestione del servizio \texttt{echo}.}
 150   \label{fig:TCPsimpl_server_elem_sub}
 151 \end{figure}
 152
 153 Quando il client chiude la connessione il ricevimento del FIN fa ritornare la
 154 \func{read} con un numero di byte letti pari a zero, il che causa l'uscita
 155 dal ciclo e il ritorno della funzione, che a sua volta causa la terminazione
 156 del processo figlio.
 157
 158
 159 \subsection{Il client}
 160 \label{sec:TCPsimp_client_main}
 161
 162 Il codice del client è riportato in \nfig, anche esso ricalca la struttura del
 163 precedente client per il servizio \texttt{daytime} (vedi
 164 \secref{sec:net_cli_sample}) ma, come per il server, lo si è diviso in due
 165 parti, inserendo la parte relativa alle operazioni specifiche previste per il
 166 protocollo \texttt{echo} in una funzione a parte.
 167 \begin{figure}[!htb]
 168   \footnotesize
 169   \begin{lstlisting}{}
 170 int main(int argc, char *argv[])
 171 {
 172 /*
 173  * Variables definition
 174  */
 175     int sock_fd, i;
 176     struct sockaddr_in serv_add;
 177     ...
 178     /* create socket */
 179     if ( (sock_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0) {
 180         perror("Socket creation error");
 181         return -1;
 182     }
 183     /* initialize address */
 184     memset((void *) &serv_add, 0, sizeof(serv_add)); /* clear server address */
 185     serv_add.sin_family = AF_INET;                   /* address type is INET */
 186     serv_add.sin_port = htons(7);                    /* echo port is 7 */
 187     /* build address using inet_pton */
 188     if ( (inet_pton(AF_INET, argv[optind], &serv_add.sin_addr)) <= 0) {
 189         perror("Address creation error");
 190         return -1;
 191     }
 192     /* extablish connection */
 193     if (connect(sock_fd, (struct sockaddr *)&serv_add, sizeof(serv_add)) < 0) {
 194         perror("Connection error");
 195         return -1;
 196     }
 197     /* read daytime from server */
 198     ClientEcho(stdin, sock_fd);
 199     /* normal exit */
 200     return 0;
 201 }
 202   \end{lstlisting}
 203   \caption{Codice della prima versione del client \texttt{echo}.}
 204   \label{fig:TCPsimpl_client_elem}
 205 \end{figure}
 206
 207 La funzione \code{main} si occupa della creazione del socket e della
 208 connessione (linee \texttt{\small 10--27}) secondo la stessa modalità spiegata
 209 in \secref{sec:net_cli_sample}, il client si connette sulla porta 7
 210 all'indirizzo specificato dalla linea di comando (a cui si è aggiunta una
 211 elementare gestione delle opzioni non riportata in figura).
 212
 213 Completata la connessione (quando la funzione \func{connect} ritorna) la
 214 funzione \code{ClientEcho}, riportata in \nfig, si preoccupa di gestire la
 215 comunicazione, leggendo una riga alla volta dallo \file{stdin}, scrivendola
 216 sul socket e ristampando su \file{stdout} quanto ricevuto in risposta dal
 217 server.
 218
 219 \begin{figure}[!htb]
 220   \footnotesize
 221   \begin{lstlisting}{}
 222 void ClientEcho(FILE * filein, int socket)
 223 {
 224     char sendbuff[MAXLINE], recvbuff[MAXLINE];
 225     int nread;
 226     while (fgets(sendbuff, MAXLINE, filein) != NULL) {
 227         SockWrite(socket, sendbuff, strlen(sendbuff));
 228         nread = SockRead(socket, recvbuff, strlen(sendbuff));
 229         recvbuff[nread] = 0;
 230         fputs(recvbuff, stdout);
 231     }
 232     return;
 233 }
 234   \end{lstlisting}
 235   \caption{Codice della prima versione della funzione \texttt{ClientEcho} per
 236     la gestione del servizio \texttt{echo}.}
 237   \label{fig:TCPsimpl_client_echo_sub}
 238 \end{figure}
 239
 240 La funzione utilizza due buffer per gestire i dati inviati e letti sul socket
 241 (\texttt{\small 3}).  La comunicazione viene gestita all'interno di un ciclo
 242 (linee \texttt{\small 5--10}), i dati da inviare sulla connessione vengono
 243 presi dallo \file{stdin} usando la funzione \func{fgets} che legge una
 244 linea di testo (terminata da un \texttt{CR} e fino al massimo di
 245 \macro{MAXLINE} caratteri) e la salva sul buffer di invio, la funzione
 246 \func{SockWrite} (\texttt{\small 3}) scrive detti dati sul socket (gestendo
 247 l'invio multiplo qualora una singola \func{write} non basti, come spiegato
 248 in \secref{sec:sock_io_behav}).
 249
 250 I dati che vengono riletti indietro con una \func{SockRead} sul buffer di
 251 ricezione e viene inserita la terminazione della stringa (\texttt{\small
 252   7--8}) e per poter usare la funzione \func{fputs} per scriverli su
 253 \file{stdout}.
 254
 255 Un end of file inviato su \file{stdin} causa il ritorno di \func{fgets}
 256 con un puntatore nullo e l'uscita dal ciclo, al che la subroutine ritorna ed
 257 il client esce.
 258
 259
 260 \section{Il funzionamento del servizio}
 261 \label{sec:TCPsimpl_normal_work}
 262
 263 Benché il codice dell'esempio precedente sia molto ridotto, esso ci permetterà
 264 di considerare in dettaglio tutte le problematiche che si possono incontrare
 265 nello scrivere una applicazione di rete. Infatti attraverso l'esame delle sue
 266 modalità di funzionamento normali, all'avvio e alla terminazione, e di quello
 267 che avviene nelle varie situazioni limite, da una parte potremo approfondire
 268 la comprensione del protocollo TCP/IP e dall'altra ricavare le indicazioni
 269 necessarie per essere in gradi di scrivere applicazioni robuste, in grado di
 270 gestire anche i casi limite.
 271
 272
 273 \subsection{L'avvio e il funzionamento}
 274 \label{sec:TCPsimpl_startup}
 275
 276 Il primo passo è compilare e lanciare il server (da root, per poter usare la
 277 porta 7 che è riservata), alla partenza esso eseguirà l'apertura passiva con
 278 la sequenza delle chiamate a \func{socket}, \func{bind}, \func{listen} e poi
 279 si bloccherà nella \func{accept}. A questo punto si potrà controllarne lo
 280 stato con \cmd{netstat}:
 281 \begin{verbatim}
 282 [piccardi@roke piccardi]$ netstat -at
 283 Active Internet connections (servers and established)
 284 Proto Recv-Q Send-Q Local Address           Foreign Address         State
 285 ...
 286 tcp        0      0 *:echo                  *:*                     LISTEN
 287 ...
 288 \end{verbatim} %$
 289 che ci mostra come il socket sia in ascolto sulla porta richiesta, accettando
 290 connessioni da qualunque indirizzo e da qualunque porta e su qualunque
 291 interfaccia locale.
 292
 293 A questo punto si può lanciare il client, esso chiamerà \func{socket} e
 294 \func{connect}; una volta completato il three way handshake la connessione è
 295 stabilita; la \func{connect} ritornerà nel client\footnote{si noti che è
 296   sempre la \func{connect} del client a ritornare per prima, in quanto
 297   questo avviene alla ricezione del secondo segmento (l'ACK del server) del
 298   three way handshake, la \func{accept} del server ritorna solo dopo
 299   un altro mezzo RTT quando il terzo segmento (l'ACK del client) viene
 300   ricevuto.} e la \func{accept} nel server, ed usando di nuovo
 301 \cmd{netstat} otterremmo che:
 302 \begin{verbatim}
 303 Active Internet connections (servers and established)
 304 Proto Recv-Q Send-Q Local Address           Foreign Address         State
 305 tcp        0      0 *:echo                  *:*                     LISTEN
 306 tcp        0      0 roke:echo               gont:32981              ESTABLISHED
 307 \end{verbatim}
 308 mentre per quanto riguarda l'esecuzione dei programmi avremo che:
 309 \begin{itemize}
 310 \item il client chiama la funzione \code{ClientEcho} che si blocca sulla
 311   \func{fgets} dato che non si è ancora scritto nulla sul terminale.
 312 \item il server eseguirà una \func{fork} facendo chiamare al processo figlio
 313   la funzione \code{ServEcho}, quest'ultima si bloccherà sulla \func{read}
 314   dal socket sul quale ancora non sono presenti dati.
 315 \item il processo padre del server chiamerà di nuovo \func{accept}
 316   bloccandosi fino all'arrivo di un'altra connessione.
 317 \end{itemize}
 318 e se usiamo il comando \cmd{ps} per esaminare lo stato dei processi otterremo
 319 un risultato del tipo:
 320 \begin{verbatim}
 321 [piccardi@roke piccardi]$ ps ax
 322   PID TTY      STAT   TIME COMMAND
 323  ...  ...      ...    ...  ...
 324  2356 pts/0    S      0:00 ./echod
 325  2358 pts/1    S      0:00 ./echo 127.0.0.1
 326  2359 pts/0    S      0:00 ./echod
 327 \end{verbatim} %$
 328 (dove si sono cancellate le righe inutili) da cui si evidenzia la presenza di
 329 tre processi, tutti in stato di \textit{sleep} (S).
 330
 331 Se a questo punto si inizia a scrivere qualcosa sul client niente sarà
 332 trasmesso fin tanto che non si prema il ritorno carrello, allora la
 333 \func{fgets} ritornerà e a questo punto il client scriverà quanto immesso
 334 sul socket, poi rileggerà quanto gli viene inviato all'indietro dal server, e
 335 questo sarà inviato sullo standard output, che nel caso ne provoca
 336 l'immediatamente stampa a video.
 337
 338
 339 \subsection{La conclusione normale}
 340 \label{sec:TCPsimpl_conclusion}
 341
 342 Tutto quello che scriveremo sul client sarà rimandato indietro dal server e
 343 ristampato a video fintanto che non concluderemo l'immissione dei dati; una
 344 sessione tipica sarà allora del tipo:
 345 \begin{verbatim}
 346 [piccardi@roke sources]$ ./echo 127.0.0.1
 347 Questa e` una prova
 348 Questa e` una prova
 349 Ho finito
 350 Ho finito
 351 \end{verbatim} %$
 352 che termineremo inviando un EOF dal terminale (usando la combinazione di tasti
 353 ctrl-D, che non compare a schermo); se eseguiamo un \cmd{netstat} a questo
 354 punto avremo:
 355 \begin{verbatim}
 356 [piccardi@roke piccardi]$ netstat -at
 357 tcp        0      0 *:echo                  *:*                     LISTEN
 358 tcp        0      0 localhost:33032         localhost:echo          TIME_WAIT
 359 \end{verbatim} %$
 360 con il client che entra in \texttt{TIME\_WAIT}.
 361
 362 Esaminiamo allora in dettaglio la sequenza di eventi che porta alla
 363 terminazione normale della connessione, che ci servirà poi da riferimento nei
 364 casi seguenti:
 365
 366 \begin{enumerate}
 367 \item inviando un carattere di EOF da terminale la \func{fgets} ritorna
 368   restituendo un puntatore nullo che causa l'uscita dal ciclo di
 369   while, così la \code{ClientEcho} ritorna.
 370 \item al ritorno di \code{ClientEcho} ritorna anche la funzione \code{main}, e
 371   come parte del processo terminazione tutti i file descriptor vengono chiusi
 372   (si ricordi quanto detto in \secref{sec:proc_term_conclusion}); questo causa
 373   la chiusura del socket di comunicazione; il client allora invierà un FIN al
 374   server a cui questo risponderà con un ACK.  A questo punto il client verrà a
 375   trovarsi nello stato \texttt{FIN\_WAIT\_2} ed il server nello stato
 376   \texttt{CLOSE\_WAIT} (si riveda quanto spiegato in
 377   \secref{sec:TCPel_conn_term}).
 378 \item quando il server riceve il FIN la \func{read} del processo figlio che
 379   gestisce la connessione ritorna restituendo 0 causando così l'uscita dal
 380   ciclo di while e il ritorno di \code{ServEcho}, a questo punto il processo
 381   figlio termina chiamando \func{exit}.
 382 \item all'uscita del figlio tutti i file descriptor vengono chiusi, la
 383   chiusura del socket connesso fa sì che venga effettuata la sequenza finale
 384   di chiusura della connessione, viene emesso un FIN dal server che riceverà
 385   un ACK dal client, a questo punto la connessione è conclusa e il client
 386   resta nello stato \texttt{TIME\_WAIT}.
 387 \item
 388 \end{enumerate}
 389
 390
 391 \subsection{La gestione dei processi figli}
 392 \label{sec:TCPsimpl_child_hand}
 393
 394 Tutto questo riguarda la connessione, c'è però da tenere conto dell'effetto
 395 del procedimento di chiusura del processo figlio nel server (si veda quanto
 396 esaminato in \secref{sec:proc_termination}). In questo caso avremo l'invio del
 397 segnale \macro{SIGCHILD} al padre, ma dato che non si è installato un
 398 manipolatore e che l'azione di default per questo segnale è quella di essere
 399 ignorato, non avendo predisposto la ricezione dello stato di terminazione,
 400 otterremo che il processo figlio entrerà nello stato di zombie, come risulterà
 401 ripetendo il comando \cmd{ps}:
 402 \begin{verbatim}
 403  2356 pts/0    S      0:00 ./echod
 404  2359 pts/0    Z      0:00 [echod <defunct>]
 405 \end{verbatim}
 406
 407 Poiché non è possibile lasciare processi zombie che pur inattivi occupano
 408 spazio nella tabella dei processi e a lungo andare saturerebbero le risorse
 409 del kernel, occorrerà ricevere opportunamente lo stato di terminazione del
 410 processo (si veda \secref{sec:proc_wait}), cosa che faremo utilizzando il
 411 segnale, per questo installeremo un manipolatore usando la funzione
 412 \func{Signal} (trattata in dettaglio in \secref{sec:sig_signal}).
 413