473d0eb4611c6154bffaf49896fa974791c38cd1
[gapil.git] / network.tex
1 \chapter{Introduzione alla programmazione di rete}
2 \label{cha:network}
3
4 In questo capitolo sarà fatta un'introduzione ai contetti generali che servono
5 come prerequisiti per capire la programmazione di rete, partiremo con due
6 semplici esempi per poi passare ad un esame a grandi linee dei protocolli di
7 rete e di come questi sono organizzati e interagiscono.
8
9 In particolare, avendo assunto l'ottica di un'introduzione mirata alla
10 programmazione, ci concentreremo sul protocollo più diffuso, TCP/IP, che è
11 quello che sta alla base di internet, ed in particolare prenderemo in esame in
12 questa introduzione i concetti più importanti da conoscere ai fini della
13 programmazione.
14
15 \section{Il modello client-server}
16 \label{sec:net_cliserv}
17
18 La differenza principale fra un'applicazione di rete e un programma normale è
19 che quest'ultima per definizione concerne la comunicazione fra ``processi''
20 diversi (che in generale non girano neanche sulla stessa macchina). Questo già
21 prefigura un cambiamento completo rispetto all'ottica del ``programma''
22 monolitico all'interno del quale vengono eseguite tutte le istruzioni, e
23 presuppone un sistema operativo ``multitasking'' in grado di eseguire processi
24 diversi.
25
26 Il concetto fondamentale si basa la programmazione di rete sotto Linux (e
27 sotto Unix in generale) è il modello \textit{client-server} in cui un
28 programma di servizio, il \textit{server} riceve un connessione e risponde a
29 un programma di utilizzo, il \textit{client}, provvedendo a quest'ultimo un
30 definito insieme di servizi.
31
32 Esempi di questo modello sono il WEB, ftp, telnet, ssh e praticamente ogni
33 servizio che viene fornito tramite la rete, ma il modello è utilizzato in
34 generale anche per programmi che non fanno necessariamente uso della rete,
35 come il sistema a finestre.
36
37 Normalmente si dividono i server in due categorie principali, e vengono detti
38 \textit{concorrenti} o \textit{iterativi}, sulla base del loro comportamento.
39
40 Un server iterativo risponde alla richiesta inviando i dati e resta occupato
41 (non rispondendo ad ulteriori richieste) fintanto che non ha concluso la
42 richiesta. Una volta completata la richiesta il server diventa di nuovo
43 disponibile.
44
45 Un server concorrente al momento di trattare la richiesta crea un processo
46 figlio incaricato di fornire i servizi richiesti, per poi porsi in attesa di
47 ulteriori richieste. In questo modo più richieste possono essere soddisfatte
48 contemporaneamente; una volta che il processo figlio ha concluso il suo lavoro
49 viene terminato, mentre il server originale resta sempre attivo.
50
51
52 \subsection{Un primo esempio di client}
53 \label{sec:net_cli_sample}
54
55 Per evitare di rendere l'esposizione dei concetti generali sulla rete
56 puramente teorica iniziamo con il mostrare un esempio di un client TCP
57 elementare.  Scopo di questo esempio è fornire un primo approccio alla
58 programmazione di rete, tutto questo sarà esaminato in dettaglio nei capitoli
59 successivo; qui ci limiteremo a introdurre la nomenclatura senza fornire
60 definizioni precise e dettagli di funzionamento che saranno trattati
61 estensivamente più avanti.
62
63 In \nfig\ è riportata la sezione principale del codice del nostro client
64 elementare per il servizio \textit{daytime}, un servizio standard che
65 restituisce l'ora locale della macchina a cui si effettua la richesta.
66
67
68 \begin{figure}[!htbp]
69   \footnotesize
70   \begin{lstlisting}{}
71 #include <sys/types.h>   /* predefined types */
72 #include <unistd.h>      /* include unix standard library */
73 #include <arpa/inet.h>   /* IP addresses conversion utiliites */
74 #include <sys/socket.h>  /* socket library */
75 #include <stdio.h>       /* include standard I/O library */
76
77 int main(int argc, char *argv[])
78 {
79     int sock_fd;
80     int i, nread;
81     struct sockaddr_in serv_add;
82     char buffer[MAXLINE];
83      ...
84     /* create socket */
85     if ( (sock_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0) {
86         perror("Socket creation error");
87         return -1;
88     }
89     /* initialize address */
90     memset((void *) &serv_add, 0, sizeof(serv_add)); /* clear server address */
91     serv_add.sin_family = AF_INET;                   /* address type is INET */
92     serv_add.sin_port = htons(13);                   /* daytime post is 13 */
93     /* build address using inet_pton */
94     if ( (inet_pton(AF_INET, argv[optind], &serv_add.sin_addr)) <= 0) {
95         perror("Address creation error");
96         return -1;
97     }
98     /* extablish connection */
99     if (connect(sock_fd, (struct sockaddr *)&serv_add, sizeof(serv_add)) < 0) {
100         perror("Connection error");
101         return -1;
102     }
103     /* read daytime from server */
104     while ( (nread = read(sock_fd, buffer, MAXLINE)) > 0) {
105         buffer[nread]=0;
106         if (fputs(buffer, stdout) == EOF) {          /* write daytime */
107             perror("fputs error");
108             return -1;
109         }
110     }
111     /* error on read */
112     if (nread < 0) {
113         perror("Read error");
114         return -1;
115     }
116     /* normal exit */
117     return 0;
118 }
119   \end{lstlisting}
120   \caption{Esempio di codice di un client elementare per il servizio daytime.}
121   \label{fig:net_cli_code}
122 \end{figure}
123
124 Il sorgente completo del programma (\texttt{SimpleDaytimeTCPClient.c}, che
125 comprende il trattamento delle opzioni e una funzione per stampare un
126 messaggio di aiuto) è allegato alla guida nella sezione dei codici sorgente e
127 può essere compilato su una qualunque macchina linux.
128
129 Il programma anzitutto include gli header necessari (\texttt{\small 1--5});
130 dopo la dichiarazione delle variabili (\texttt{\small 9--12}) si è omessa
131 tutta la parte relativa al trattamento degli argomenti passati dalla linea di
132 comando (effettuata con le apposite routines illustrate in
133 \ref{cha:parameter_options}).
134
135 Il primo passo (\texttt{\small 14--18}) è creare un \textit{socket} IPv4
136 (\texttt{AF\_INET}), di tipo TCP \texttt{SOCK\_STREAM} (in sostanza un canale
137 di comunicazione attraverso internet, questi termini verranno spiegati con
138 precisione più avanti). La funzione \texttt{socket} ritorna un descrittore,
139 analogo a quello dei file, che viene usato per identificare il socket in tutte
140 le chiamate successive. Nel caso la chiamata fallisca si stampa un errore con
141 la relativa routine e si esce.
142
143 Il passo seguente (\texttt{\small 19--27}) è quello di costruire una apposita
144 struttura \texttt{sockaddr\_in} in cui sarà inserito l'indirizzo del server ed
145 il numero della porta del servizio. Il primo passo è inizializzare tutto a
146 zero, per poi inserire il tipo di protocollo e la porta (usando per
147 quest'ultima la funzione \texttt{htons} per convertire il formato dell'intero
148 usato dal computer a quello usato nella rete), infine si utilizza la funzione
149 \texttt{inet\_pton} per convertire l'indirizzo numerico passato dalla linea di
150 comando.
151
152 Usando la funzione \texttt{connect} sul socket creato in precedenza
153 (\texttt{\small 28--32}) si provvede poi a stabilire la connessione con il
154 server specificato dall'indirizzo immesso nella struttura possata come secondo
155 argomento, il terzo argomento è la dimensione di detta struttura. Dato che
156 esistono diversi tipi di socket, si è dovuto effettuare un cast della
157 struttura inizializzata in precedenza, che è specifica per i socket IPv4.  Un
158 valore di ritorno negativo implica il fallimento della connessione.
159
160 Completata con successo la connessione il passo successivo (\texttt{\small
161   34--40}) è leggere la data dal socket; il server invierà sempre una stringa
162 di 26 caratteri della forma \verb|Wed Apr 4 00:53:00 2001\r\n|, che viene
163 letta dalla funzione \texttt{read} e scritta su \texttt{stdout}.
164
165 Dato il funzionamento di TCP la risposta potrà tornare in un unico pacchetto
166 di 26 byte (come avverrà senz'altro nel caso in questione) ma potrebbe anche
167 arrivare in 26 pacchetti di un byte.  Per questo nel caso generale non si può
168 mai assumere che tutti i dati arrivino con una singola lettura, pertanto
169 quest'ultima deve essere effettuata in un loop in cui si continui a leggere
170 fintanto che la funzione \texttt{read} non ritorni uno zero (che significa che
171 l'altro capo ha chiuso la connessione) o un numero minore di zero (che
172 significa un errore nella connessione).
173
174 Si noti come in questo caso la fine dei dati sia specificata dal server che
175 chiude la connessione; questa è una delle tecniche possibili (è quella usata
176 pure dal protocollo HTTP), ma ce ne possono essere altre, ad esempio FTP marca
177 la conclusione di un blocco di dati con la sequenza ASCII \verb|\r\n|
178 (carriage return e line feed), mentre il DNS mette la lunghezza in testa ad
179 ogni blocco che trasmette. Il punto essenziale è che TCP non provvede nessuna
180 indicazione che permetta di marcare dei blocchi di dati, per cui se questo è
181 necessario deve provvedere il programma stesso.
182
183 \subsection{Un primo esempio di server}
184 \label{sec:net_serv_sample}
185
186 Dopo aver illustrato il client daremo anche un esempio di un server
187 elementare, in grado di rispondere al precedente client. Il listato è
188 nuovamente mostrato in \nfig, il sorgente completo
189 (\texttt{SimpleDaytimeTCPServer.c}) è allegato insieme agli altri file nella
190 directory \texttt{sources}.
191
192 \begin{figure}[!htbp]
193   \footnotesize
194   \begin{lstlisting}{}
195 #include <sys/types.h>   /* predefined types */
196 #include <unistd.h>      /* include unix standard library */
197 #include <arpa/inet.h>   /* IP addresses conversion utiliites */
198 #include <sys/socket.h>  /* socket library */
199 #include <stdio.h>       /* include standard I/O library */
200 #include <time.h>
201 #define MAXLINE 80
202 #define BACKLOG 10
203 int main(int argc, char *argv[])
204 {
205 /* 
206  * Variables definition  
207  */
208     int list_fd, conn_fd;
209     int i;
210     struct sockaddr_in serv_add;
211     char buffer[MAXLINE];
212     time_t timeval;
213
214     ...
215
216     /* create socket */
217     if ( (list_fd = socket(AF_INET, SOCK_STREAM, 0)) < 0) {
218         perror("Socket creation error");
219         exit(-1);
220     }
221     /* initialize address */
222     memset((void *)&serv_add, 0, sizeof(serv_add)); /* clear server address */
223     serv_add.sin_family = AF_INET;                  /* address type is INET */
224     serv_add.sin_port = htons(13);                  /* daytime port is 13 */
225     serv_add.sin_addr.s_addr = htonl(INADDR_ANY);   /* connect from anywhere */
226     /* bind socket */
227     if (bind(list_fd, (struct sockaddr *)&serv_add, sizeof(serv_add)) < 0) {
228         perror("bind error");
229         exit(-1);
230     }
231     /* listen on socket */
232     if (listen(list_fd, BACKLOG) < 0 ) {
233         perror("listen error");
234         exit(-1);
235     }
236     /* write daytime to client */
237     while (1) {
238         if ( (conn_fd = accept(list_fd, (struct sockaddr *) NULL, NULL)) <0 ) {
239             perror("accept error");
240             exit(-1);
241         }
242         timeval = time(NULL);
243         snprintf(buffer, sizeof(buffer), "%.24s\r\n", ctime(&timeval));
244         if ( (write(conn_fd, buffer, strlen(buffer))) < 0 ) {
245             perror("write error");
246             exit(-1);
247         }
248         close(conn_fd);
249     }
250     /* normal exit */
251     exit(0);
252 }
253   \end{lstlisting}
254   \caption{Esempio di codice di un semplice server per il servizio daytime.}
255   \label{fig:net_serv_code}
256 \end{figure}
257
258 Come per il client si includono gli header necessari a cui è aggiunto quello
259 per trattare i tempi, e si definiscono alcune costanti e le variabili
260 necessarie in seguito (\texttt{\small 1--18}), come nel caso precedente si
261 sono omesse le parti relative al trattamento delle opzioni da riga di comando.
262
263 La creazione del socket (\texttt{\small 22--26}) è analoga al caso precedente,
264 come pure l'inizializzazione della struttura \texttt{sockaddr\_in}, anche in
265 questo caso si usa la porta standard del servizio daytime, ma come indirizzo
266 IP si il valore predefinito \texttt{INET\_ANY} che corrisponde ad un indirizzo
267 generico (\texttt{\small 27--31}).
268
269 Si effettua poi (\texttt{\small 32--36}) la chiamata alla funzione
270 \texttt{bind} che permette di associare la precedente struttura al socket, in
271 modo che quest'ultimo possa essere usato per accettare connessioni su una
272 qualunque delle interfacce di rete locali.
273
274 Il passo successivo (\texttt{\small 37--41}) è mettere ``in ascolto'' il
275 socket, questo viene effettuato con la funzione \texttt{listen} che dice al
276 kernel di accettare connessioni per il socket specificato, la funzione indica
277 inoltre, con il secondo parametro, il numero massimo di connessioni che il
278 kernel accetterà di mettere in coda per il suddetto socket.
279
280 Questa ultima chiamata completa la preparazione del socket per l'ascolto (che
281 viene chiamato anche \textit{listening descriptor}) a questo punto il processo
282 è mandato in sleep (\texttt{\small 44--47}) con la successiva chiamata alla
283 funzione \texttt{accept}, fin quando non arriva e viene accettata una
284 connessione da un client.
285
286 Quando questo avviene \texttt{accept} ritorna un secondo descrittore di
287 socket, che viene chiamato \textit{connected descriptor} che è quello che
288 viene usato dalla successiva chiamata alla \texttt{write} per scrivere la
289 risposta al client, una volta che si è opportunamente (\texttt{\small 48--49})
290 costruita la stringa con la data da trasmettere. Completata la trasmissione il
291 nuovo socket viene chiuso (\texttt{\small 54}).
292 Il tutto è inserito in un loop infinito (\texttt{\small 42--55}) in modo da
293 poter ripetere l'invio della data ad una successiva connessione.
294
295 È impostante notare che questo server è estremamente elementare, infatti a
296 parte il fatto di essere dipendente da IPv4, esso è in grado di servire solo
297 un client alla volta, è cioè un \textsl{server iterativo}, inoltre esso è
298 scritto per essere lanciato da linea di comando, se lo si volesse utilizzare
299 come demone di sistema (che è in esecuzione anche quando non c'è nessuna shell
300 attiva e il terminale da cui lo si è lanciato è stato sconnesso),
301 occorrerebbero delle opportune modifiche.
302
303 \section{I protocolli di rete}
304 \label{sec:net_protocols}
305
306 Visto un primo esempio di programmazione, passiamo ora ad una introduzione più
307 dettagliata del funzionamento delle reti e dei relativi protocolli.
308
309 Parlando di reti di computer si parla in genere di un insieme molto vasto ed
310 eterogeneo di mezzi di comunicazione che vanno dal cavo telefonico, alla fibra
311 ottica, alle comunicazioni via satellite; per rendere possibile la
312 comunicazione attraverso un così variegato insieme di mezzi sono stati
313 adottati una serie di protocolli, il più famoso dei quali, quello alla base
314 del funzionamento di internet, è il protocollo TCP/IP.
315
316 \subsection{Il modello ISO/OSI}
317 \label{sec:net_iso_osi}
318
319 Una caratteristica comune dei protocolli di rete è il loro essere strutturati
320 in livelli sovrapposti; in questo modo un livello superiore esegue richieste
321 al livello sottostante e da questo riceve responsi, mentre livelli uguali su
322 macchine diverse conversano tramite lo stesso protocollo. Questo modello di
323 funzionamento è stato stato standardizzato dalla \textit{International
324   Standards Organization} (ISO) che ha preparato fin dal 1984 il Modello di
325 Riferimento \textit{Open Systems Interconnection} (OSI), strutturato in sette
326 livelli, secondo la tabella in \ntab.
327
328 \begin{table}[htb]
329   \centering
330   \begin{tabular}{l c c l} 
331     \textbf{Livello} & \multicolumn{2}{c}{\textbf{Nome}} & \\
332     \hline
333     Livello 7&\textit{Application} &\textsl{Applicazione}& \\ 
334     Livello 6&\textit{Presentation} &\textsl{Presentazione}& \\ 
335     Livello 5&\textit{Session} &\textsl{Sessione}& \\ 
336     Livello 4&\textit{Transport} &\textsl{Trasporto}& \\ 
337     Livello 3&\textit{Network} &\textsl{Rete}&   \\ 
338     Livello 2&\textit{DataLink} &\textsl{Collegamento Dati}& \\
339     Livello 1&\textit{Connection} &\textsl{Connessione Fisica}& \\
340     \hline
341 \end{tabular}
342 \caption{I sette livelli del protocollo ISO/OSI.}
343 \label{tab:net_osilayers}
344 \end{table}
345
346 Il modello ISO/OSI è stato sviluppato corrispondentemente alla definizione
347 della serie di protocolli X.25 per la commutazione di pacchetto. Ma nonostante
348 il lavoro dettagliato di standardizzazione il modello si è rivelato
349 sostanzialmente troppo complesso e poco flessibile rispetto a quello,
350 precedente, su cui si basa TCP/IP che è diventato uno standard de facto;
351 quest'ultimo viene comunemente chiamato modello DoD (\textit{Department of
352   Defense}), dato che fu sviluppato dall'agenzia ARPA per il Dipartimento
353 della Difesa Americano.
354
355
356 \begin{figure}[!htbp]
357   \centering
358   
359   \caption{Struttura a livelli dei protocolli OSi e TCP/IP, con la  
360     relative corrispondeze e la divisione fra kernel e user space.}
361   \label{fig:net_osi_tcpip_comp}
362 \end{figure}
363
364
365
366 \subsection{Il modello DoD (TCP/IP)}
367 \label{sec:net_tcpip_overview}
368
369 Così come ISO/OSI anche TCP/IP è stato strutturato in livelli (riassunti in
370 \ntab); un confronto fra i due è riportato in \curfig\ dove viene evidenziata
371 anche la corrispondenza fra i rispettivi livelli (che comunque è
372 approssimativa) e su come essi vanno ad inserirsi all'interno del sistema
373 operativo rispetto alla divisione fra user space e kernel space spiegata in
374 \ref{sec:intro_unix_struct}.
375
376 \begin{table}[htb]
377   \centering
378   \begin{tabular}{l c c l} 
379     \textbf{Livello} & \multicolumn{2}{c}{\textbf{Nome}} & \textbf{Esempi} \\
380     \hline
381     Livello 1&\textit{Application} &\textsl{Applicazione}& 
382     Telnet, FTP, etc. \\ 
383     Livello 2&\textit{Transport} &\textsl{Trasporto}& TCP, UDP \\ 
384     Livello 3&\textit{Network} &\textsl{Rete}& IP, (ICMP, IGMP)  \\ 
385     Livello 4&\textit{Link} &\textsl{Connessione}& 
386     device driver \& scheda di interfaccia  \\
387     \hline
388 \end{tabular}
389 \caption{I quattro livelli del protocollo TPC/IP.}
390 \label{tab:net_layers}
391 \end{table}
392
393
394 Come si può notare TCP/IP è più semplice del modello ISO/OSI e strutturato in
395 soli quattro livelli. Il suo nome deriva dai due principali protocolli che lo
396 compongono, il TCP \textit{Trasmission Control Protocol} e l'IP
397 \textit{Internet Protocol}. Le funzioni dei vari livelli sono le seguenti:
398
399 \begin{description}
400 \item \textbf{Applicazione} É relativo ai programmi di interfaccia utente, in
401   genere questi vengono realizzati secondo il modello Client-Server (vedi
402   \ref{sec:net_cliserv}.
403 \item \textbf{Trasporto} Fornisce la comunicazione tra le due stazioni
404   terminali su cui girano gli applicativi, regola il flusso delle
405   informazioni, e può fornire un trasporto affidabile, cioè con recupero
406   errori. Il protocollo principale di questo livello è il TCP.
407 \item \textbf{Rete} Si occupa dello smistamento dei singoli pacchetti su una
408   rete complessa e interconnessa, a questo stesso livello operano i protocolli
409   per il reperimento delle informazioni necessarie allo smistamento, per lo
410   scambio di messaggi di controllo e per il monitoraggio della rete. Il
411   protocollo su cui si basa questo livello è IP (sia nella attuale versione,
412   IPv4 che nella nuova IPv6).
413 \item \textbf{Connessione} È responsabile per l'interfacciamento al
414   dispositivo elettronico che effettua la comunicazione fisica, gestendo
415   l'invio e la ricezione dall'hardware dei pacchetti.
416 \end{description}
417
418
419 La comunicazione fra due stazioni avviene pertanto secondo le modalità
420 illustrate in \nfig. 
421
422
423 \begin{figure}[!htbp]
424   \centering
425   
426   \caption{Strutturazione del flusso dei dati nella comunicazione fra due
427     applicazioni attraverso i protocolli della suite TCP/IP.}
428   \label{fig:net_tcpip_data_flux}
429 \end{figure}
430
431 Le singole applicazioni si scambieranno i dati secondo un loro formato
432 specifico, implementando un protocollo di applicazione (esempi possono essere
433 HTTP, POP, telnet, SMTP, etc). 
434
435 Questi dati vengono inviati al livello di trasporto usando un'interfaccia
436 opportuna (i \textit{socket}, che esamineremo in dettaglio in seguito), i
437 quali li spezzerà in pacchetti di dimensione opportuna e li incapsulerà
438 all'interno del suo protocollo di trasporto aggiungendo ad ogni pacchetto le
439 informazioni necessarie alla gestione di quest'ultimo. Questo processo viene
440 svolto dirattamente nel kernel ad esempio dallo stack TCP nel caso il
441 protocollo di trasporto sia questo.
442
443 Una volta composto il pacchetto nel formato adatto al protocollo di trasporto
444 usato questo sarà passato al successivo livello, quello del collegamento che
445 si occupa di inserire le opportune informazioni per poter effettuare
446 l'instradamento nella rete ed il recapito alla destinazione finale. In genere
447 questo è il livello di IP (Internet Protocol), a cui vengono inseriti i numeri
448 IP che identificano i computer su internet.
449
450 L'ultimo passo è il trasferimento del pacchetto al driver della interfaccia di
451 trasmissione che si incarica di incapsularlo nel relativo protocollo di
452 trasmissione fisica usato dall'hardware usato per la comunicazione (ad esempio
453 ethernet per una scheda di rete).
454
455
456 \subsection{Criteri generali del design di TCP/IP}
457 \label{sec:net_tcpip_design}
458
459 La filosofia architetturale di TCP/IP è semplice: costruire una rete che
460 possa sopportare il carico in transito, ma permettere ai singoli nodi di
461 scartare pacchetti se il carico è temporaneamente eccessivo, o se risultano
462 errati o non recapitabili.
463
464 L'incarico di rendere il recapito pacchetti affidabile non spetta allo livello
465 di collegamento, ma ai livelli superiori. Pertanto il protocollo IP è per sua
466 natura inaffidabile, in quanto non è assicurata né una percentuale di
467 successo né un limite sui tempi di consegna dei pacchetti.
468
469 È il livello di trasporto che si deve occupare (qualora necessiti) del
470 controllo del flusso dei dati e del recupero degli errori; questo è realizzato
471 dal protocollo TCP. La sede principale di "intelligenza" della rete è pertanto
472 al livello di trasporto o superiore.
473
474 Infine le singole stazioni collegate alla rete non fungono soltanto da punti
475 terminali di comunicazione, ma possono anche assumere il ruolo di router, per
476 l'interscambio di pacchetti da una rete ad un'altra. Questo rende possibile la
477 flessibilità della rete che è in grado di adattarsi ai mutamenti delle
478 interconnessioni.
479
480 La caratteristica essenziale che rende tutto ciò possibile è la strutturazione
481 a livelli tramite l'incapsulamento. Ogni pacchetto di dati viene incapsulato
482 nel formato del livello successivo, fino al livello della connessione fisica.
483 In questo modo il pacchetto ricevuto ad un livello $n$ dalla stazione di
484 destinazione è esattamente lo stesso spedito dal livello $n$ dalla sorgente.
485 Questo rende facile il progettare il software facendo riferimento unicamente a
486 quanto necessario ad un singolo livello, con la confidenza che questo poi sarà
487 trattato uniformemente da tutti i nodi della rete.
488
489
490 \section{Il protocollo TCP/IP}
491 \label{sec:net_tpcip}
492
493 Come appena mostrato il protocollo TCP/IP è un insieme di protocolli diversi,
494 che operano su 4 livelli diversi. Per gli interessi della programmazione di
495 rete però sono importanti principalmente i due livelli centrali, e soprattutto
496 quello di trasporto. 
497
498 La principale interfaccia di programmazione di rete, quella dei socket, è
499 infatti un'interfaccia nei confronti di quest'ultimo. Questo avviene perché al
500 di sopra del livello di trasporto i programmi hanno a che fare solo con
501 dettagli specifici delle applicazioni, mentre al di sotto vengono curati tutti
502 i dettagli relativi alla comunicazione. È pertanto naturale definire una API
503 su questo confine tanto più che è proprio li (come evidenziato in \pfig) che
504 nei sistemi unix (e non solo) viene inserita la divisione fra kernel space e
505 user space.
506
507 In realtà in un sistema unix è possibile accedere anche agli altri livelli
508 inferiori (e non solo a quello di trasporto) con opportune interfacce (la cosa
509 è indicata in \pfig\ lasciando uno spazio fra UDP e TCP), ma queste vengono
510 usate solo quando si vogliono fare applicazioni di sistema per il controllo
511 della rete a basso livello, un uso quindi molto specialistico, e che non
512 rientra in quanto trattato qui.
513
514 In questa sezione daremo una breve descrizione dei vari protocolli di TCP/IP,
515 concentrandoci per le ragioni esposte sul livello di trasposto. All'interno di
516 questo privilegeremo poi il protocollo TCP, per il ruolo centrale che svolge
517 nella maggior parte delle applicazioni.
518
519 \subsection{Il quadro generale}
520
521 Benché si parli di TCP/IP questa famiglia di protocolli è composta anche da
522 altri membri. In \nfig\ si è riportato uno schema che mostra un panorama sui
523 vari prottocolli della famiglia, e delle loro relazioni reciproche e con
524 alcune dalle principali applicazioni che li usano.
525
526 \begin{figure}[!htbp]
527   \centering
528   
529   \caption{Panoramica sui vari protocolli che compongono la suite TCP/IP.}
530   \label{fig:net_tcpip_overview}
531 \end{figure}
532
533 I vari protocolli mostrati in figura sono i seguenti:
534
535 \begin{list}{}{}
536 \item \textsl{IPv4} \textit{Internet Protocol version 4}. È quello che
537   comunemente si chiama IP. Ha origine negli anni '80 e da allora è la base su
538   cui è cotriuta internet. Usa indirizzi a 32 bit e provvede la trasmissione
539   dei pacchetti TCP, UDP, ICMP e IGMP.
540 \item \textsl{IPv6} \textit{Internet Protocol version 6}. È stato progettato a
541   metà degli anni '90 per rimpiazzare IPv4. Ha indirizzi a 128 bit e effettua
542   lo stesso servizio di trasporto di IPv4 per i pacchetti TCP, UDP e ICPMv6.
543 \item \textsl{TCP} \textit{Trasmission Control Protocol}. È un protocollo
544   orientato alla connessione che provvede un trasporto affidabile e
545   bidirezionale di un flusso di dati. I socket TCP sono esempi di
546   \textit{stream socket}. Il protocollo ha cura di tutti gli aspetti del
547   trasporto, come l'acknoweledgment, i timeout, la ritrasmissione, etc. È 
548   usato dalla maggior parte delle applicazioni. Può essere usato sia con IPv4
549   che con IPv6.
550 \item \textsl{UDP} \textit{User Datagram Protocol}. È un protocollo senza
551   connessione a pacchetti. I socket UDP sono esempi di \textit{datagram
552     socket}. Contrariamente al TCP in protocollo non è affidabile e non c'è
553   garanzia che i pacchetti raggiungano la loro destinazione, né sull'eventuale
554   ordine di arrivo. Può essere usato sia con IPv4 che con IPv6.
555 \item \textsl{ICMP} \textit{Internet Control Message Protocol}. Gestisce gli
556   errori e trasporta l'informazione di controllo fra stazioni remote e
557   instradatori (\textit{host} e \textit{router}). I messaggi sono normalmente
558   generati dal software del kernel che gestisce la comunicazione TCP/IP, anche
559   se ICMP può venire usato direttamente da alcuni programmi come
560   \texttt{ping}. A volte ci si riferisce ad esso come ICPMv4 per distinguerlo
561   da ICMPv6.
562 \item \textsl{ICMP} \textit{Internet Group Management Protocol}. É un
563   protocollo usato per il \textit{multicasting} (vedi
564   \ref{sec:xxx_multicast}), che è opzionale in IPv4.
565 \item \textsl{ARP} \textit{Address Resolution Protocol}. È il protocollo che
566   mappa un indirizzo IP in un indirizzo hardware (come un indirizzo
567   internet). È usato in reti di tipo broadcast come ethernet, token ring o
568   FDDI ma non serve in connessioni punto-punto.
569 \item \textsl{RARP} \textit{Reverse Address Resolution Protocol}. È il
570   protocollo che mappa un indirizzo hardware in un indirizzo IP. Viene usato a
571   volte per durante il boot per assegnare un indirizzo IP ad una macchina.
572 \item \textsl{ICMPv6} \textit{Internet Control Message Protocol, version 6}.
573   Combina per IPv6 le funzionalità di ICMPv4, IGMP e ARP.
574 \item \textsl{NETLINK} \textit{Netlink}.
575   Provvede l'interfaccia di accesso alla comunicazione a basso livello.
576 \end{list}
577
578 Gran parte delle applicazioni comunicano usando TCP o UDP, ed alcune si
579 rifanno ad IP (ed i suoi correlati ICMP e IGMP); benché sia TCP che UDP siano
580 basati su IP e sia possibile intervenire a questo livello con i \textit{raw
581   socket} questa tecnica è molto meno diffusa e a parte applicazioni
582 particolari si preferisce sempre usare i servizi messi a disposizione dai due
583 protocolli precedenti.  Per questo motivo a parte alcuni brevi accenni su IP
584 in questa sezione ci concentreremo sul livello di trasporto.
585
586 \subsection{Internet Protocol (IP)}
587 \label{sec:net_ip}
588
589 Quando si parla di IP ci si riferisce in genere alla versione attualmente in
590 uso che è la versione 4 (e viene pertanto chiamato IPv4). Questa versione
591 venne standardizzata nel 1981 dall'RFC~719.
592
593 Internet Protocol nasce per disaccoppiare le applicazioni della struttura
594 hardware delle reti di trasmissione, e creare una interfaccia di trasmissione
595 dei dati indipendente dal sottostante substrato di rete, che può essere
596 realizzato con le tecnologie più disparate (Ethernet, Token Ring, FDDI, etc.).
597 Il compito di IP è pertanto quello di trasmettere i pacchetti da un computer
598 all'altro della rete; le caratteristiche essenziali con cui questo viene
599 realizzato in IPv4 sono due:
600
601 \begin{itemize}
602 \item \textit{Universal addressing} la comunicazione avviene fra due host
603   identificati univocamente con un indirizzo a 32 bit che può appartenere ad
604   una sola interfaccia di rete.
605 \item \textit{Best effort} viene assicurato il massimo impegno nella
606   trasmissione, ma non c'è nessuna garanzia per i livelli superiori né sulla
607   percentuale di successo né sul tempo di consegna dei pacchetti di dati.
608 \end{itemize}
609
610 Negli anni '90 la crescita vertiginosa del numero di macchine connesse a
611 internet ha iniziato a far emergere i vari limiti di IPv4, per risolverne i
612 problemi si è perciò definita una nuova versione del protocollo, che (saltando
613 un numero) è diventata la versione 6. IPv6 nasce quindi come evoluzione di
614 IPv4, mantendone inalterate le funzioni che si sono dimostrate valide,
615 eliminando quelle inutili e aggiungendone poche altre per mantenere il
616 protocollo il più snello e veloce possibile.
617
618 I cambiamenti apportati sono comunque notevoli e si possono essere riassunti a
619 grandi linee nei seguenti punti:
620 \begin{itemize}
621 \item l'espansione delle capacità di indirizzamento e instradamento, per
622   supportare una gerarchia con più livelli di indirizzamento, un numero di
623   nodi indirizzabili molto maggiore e una autoconfigurazione degli indirizzi
624 \item l'introduzione un nuovo tipo di indirizzamento, l'\textit{anycast} che
625   si aggiunge agli usuali \textit{unycast} e \textit{multicast}
626 \item la semplificazione del formato della testata, eliminando o rendendo
627   opzionali alcuni dei campi di IPv4, per eliminare la necessità di
628   riprocessamento della stessa da parte dei router e contenere l'aumento di
629   dimensione dovuto all'ampiamento degli indirizzi
630 \item un supporto per le opzioni migliorato, per garantire una trasmissione
631   più efficiente del traffico normale, limiti meno stringenti sulle dimensioni
632   delle opzioni, e la flessibilità necessaria per introdurne di nuove in
633   futuro
634 \item il supporto per delle capacità di qualità di servizio (QoS) che
635   permettano di identificare gruppi di dati per i quali si può provvedere un
636   trattamento speciale (in vista dell'uso di internet per applicazioni
637   multimediali e/o ``real-time'')
638 \end{itemize}
639
640 Per maggiori dettagli riguardo al protocollo si può consultare
641 \ref{sec:appA_ip}.
642
643  
644 \subsection{UDP: User Datagram Protocol)}
645 \label{sec:net_udp}
646
647 UDP è un protocollo di trasporto molto semplice, la sua descizione completa è
648 contenuta dell'RFC~768, ma in sostanza esso è una semplice interfaccia a IP dal
649 livello di trasporto. Quando un'applicazione usa UDP essa scrive un pacchetto
650 di dati (il cosiddetto \textit{datagram} che da il nome al protocollo) su un
651 socket, al pacchetto viene aggiunto un header molto semplice (per una
652 descrizione più accurata vedi \ref{sec:appA_udp}), e poi viene passato al
653 livello superiore (IPv4 o IPv6 che sia) che lo spedisce verso la destinazione.
654 Dato che né IPv4 né IPv6 garantiscono l'affidabilità niente assicura che il
655 pacchetto arrivi a destinazione, né che più pacchetti arrivino nello stesso
656 ordine in cui sono stati spediti.
657
658 Pertanto il problema principale che si affronta quando si usa UDP è la
659 mancanza di affidabilità, se si vuole essere sicuri che i pacchetti arrivino a
660 destinazione occorrerà provvedere con l'applicazione all'interno della quale
661 si dovrà inserire tutto quanto necessario a gestire la notifica di
662 ricevimento, la ritrasmissione, il timeout. 
663
664 Si tenga conto poi che in UDP niente garantisce che i pacchetti arrivino nello
665 stesso ordine in cui sono stati trasmessi, e può anche accadere che i
666 pacchetti vengano duplicati nella trasmissione, e non solo perduti. Di tutto
667 questo di nuovo deve tenere conto l'applicazione.
668
669 Un'altro aspetto di UDP è che se un pacchetto raggiunge correttamente la
670 destinazione esso viene passato all'applicazione ricevente in tutta la sua
671 lunghezza, la trasmissione avviene perciò per \textit{record} la cui lunghezza
672 viene anche essa trasmessa all'applicazione all'atto del ricevimento.
673
674 Infine UDP è un protocollo che opera senza connessione
675 (\textit{connectionless}) in quanto non è necessario stabilire nessun tipo di
676 relazione tra origine e destinazione dei pacchetti. Si hanno così situazioni
677 in cui un client può scrivere su uno stesso socket pacchetti destinati a
678 server diversi, o un server ricevere su un socket paccetti provenienti da
679 client diversi.  Il modo più semplice di immaginarsi il funzionamento di UDP è
680 quello della radio, in cui si può ``trasmettere a'' e ``ricevere da'' più
681 stazioni usando la stessa frequenza.
682
683 Nonostante gli evidenti svantaggi comportati dall'inaffidabilità UDP ha il
684 grande pregio della velocità che in certi casi è essenziale; inoltre si presta
685 bene per le applicazioni in cui la connessione non è necessaria e
686 costituirebbe solo un peso di prestazioni mentre una perdita di pacchetti può
687 essere tollerata, ad esempio quelle che usano il multicasting.
688
689 \subsection{TCP: Transport Control Protocol)}
690 \label{sec:net_tcp}
691
692 Il TCP è un protocollo molto complesso, definito nell'RFC~739 e completamente
693 diverso da UDP; alla base del suo design infatti non stanno semplicità e
694 velocità, ma la ricerca della massima affidabilità possibile nella
695 trasmissione dei dati.
696
697 La prima differenza con UDP è che TCP provvede sempre una conessione diretta
698 fra un client e un server, attraverso la quale essi possono comunicare; per
699 questo il paragone più appropriato per questo protocollo è quello del
700 collegamento telefonico, in quanto prima viene stabilita una connessione fra
701 due i due capi della comunicazione su cui poi viene quest'ultima viene
702 effettuata.
703
704 Caratteristica fondamentale di TCP è l'affidabilità; quando i dati vengono
705 inviati attraverso una connessione ne viene richiesto un ``ricevuto''
706 (il cosiddetto \textit{acknowlegment}), se questo non arriva essi verranno
707 ritrasmessi per un determinato numero di tentativi, intervallati da un
708 periodo di tempo crescente, fino a che sarà considerata fallita o caduta la
709 connessione (e generato un errore di \textit{time-out}), dopo un periodo di
710 tempo che dipende dall'implementazione e che può variare far i
711 quattro e i dieci minuti.
712
713 Inoltre per tenere conto delle diverse condizioni in cui può trovarsi la linea
714 di comunicazione TCP comprende anche un algoritmo di calcolo dinamico del
715 tempo di andata e ritorno dei pacchetti (il cosiddetto RTT, 
716 \textit{round-trip time}) fra un client e un server che lo rende in grado di
717 adattarsi alle condizioni della rete per non generare inutili ritrasmissioni o
718 cadere facilmente in timeout.
719
720 Inoltre TCP è in grado di preservare l'ordine dei dati assegnando un numero di
721 sequenza ad ogni byte che trasmette. Ad esempio se un'applicazione scrive 3000
722 bytes su un socket TCP, questi potranno essere spezzati dal protocollo in due
723 segmenti (le unità di dati passate da TCP a IP vengono chiamate
724 \textit{segment}) di 1500 bytes, di cui il primo conterrà il numero di
725 sequenza $1-1500$ e il secondo il numero $1501-3000$. In questo modo anche se
726 i segmenti arrivano a destinazione in un ordine diverso, o se alcuni arrivano
727 più volte a causa di ritrasmissioni dovute alla perdita dei ricevuto,
728 all'arrivo sarà comunque possibile riordinare i dati e scartare i duplicati.
729
730 Il protocollo provvede anche un controllo di flusso (\textit{flow control}),
731 cioè specifica sempre all'altro capo della trasmissione quanti dati può
732 ricevere tramite una \textit{advertised window} (letteralmente finestra
733 annunciata), che indica lo spazio disponibile nel buffer di ricezione,
734 cosicchè nella trasmissione non vengano inviati più dati di quelli che possono
735 essere ricevuti. 
736
737 Questa finestra cambia dinamicamente diminuendo con la ricezione dei dati dal
738 socket ed aumentando con la lettura di quest'ultimo da parte
739 dell'applicazione, se diventa nulla il buffer di ricezione è pieno e non
740 verranno accettati altri dati.  Si noti che UDP non provvede niente di tutto
741 ciò per cui nulla impedisce che vengano trasmessi pacchetti ad un rate che il
742 ricevitore non può sostenere.
743
744 Infine attraverso TCP la trasmissione è sempre bidirezionale (in inglese
745 \textit{full-duplex}), è cioè possibile sia trasmettere che ricevere allo
746 stesso tempo, il che poi comporta che quanto dicevamo a proposito del
747 controllo di flusso e della gestione della sequenzialità dei dati viene
748 effettuato per entrambe le direzioni di comunicazione.
749