network.tex

   1 \chapter{Introduzione alla programmazione di rete}
   2 \label{cha:network}
   3
   4 In questo capitolo sarà fatta un'introduzione ai concetti generali che servono
   5 come prerequisiti per capire la programmazione di rete, non tratteremo quindi
   6 aspetti specifici ma faremo una breve introduzione al modello più comune usato
   7 nella programmazione di rete, per poi passare ad un esame a grandi linee dei
   8 protocolli di rete e di come questi sono organizzati e interagiscono.
   9
  10 In particolare, avendo assunto l'ottica di un'introduzione mirata alla
  11 programmazione, ci concentreremo sul protocollo più diffuso, il TCP/IP, che è
  12 quello che sta alla base di internet, avendo cura di sottolineare i concetti
  13 più importanti da conoscere per la scrittura dei programmi.
  14
  15 \section{Il modello client-server}
  16 \label{sec:net_cliserv}
  17
  18 La differenza principale fra un'applicazione di rete e un programma normale è
  19 che quest'ultima per definizione concerne la comunicazione fra ``processi''
  20 diversi (che in generale non girano neanche sulla stessa macchina). Questo già
  21 prefigura un cambiamento completo rispetto all'ottica del ``programma''
  22 monolitico all'interno del quale vengono eseguite tutte le istruzioni, e
  23 presuppone un sistema operativo ``multitasking'' in grado di eseguire processi
  24 diversi.
  25
  26 Il concetto fondamentale si basa la programmazione di rete sotto Linux (e
  27 sotto Unix in generale) è il modello \textit{client-server} in cui un
  28 programma di servizio, il \textit{server} riceve un connessione e risponde a
  29 un programma di utilizzo, il \textit{client}, provvedendo a quest'ultimo un
  30 definito insieme di servizi.
  31
  32 Esempi di questo modello sono il WEB, ftp, telnet, ssh e praticamente ogni
  33 servizio che viene fornito tramite la rete, ma il modello è utilizzato in
  34 generale anche per programmi che non fanno necessariamente uso della rete,
  35 come il sistema a finestre.
  36
  37 Normalmente si dividono i server in due categorie principali, e vengono detti
  38 \textsl{concorrenti} o \textsl{iterativi}, sulla base del loro comportamento.
  39
  40 Un \textsl{server iterativo} risponde alla richiesta inviando i dati e resta
  41 occupato (non rispondendo ad ulteriori richieste) fintanto che non ha concluso
  42 la richiesta. Una volta completata la richiesta il server diventa di nuovo
  43 disponibile.
  44
  45 Un \textsl{server concorrente} al momento di trattare la richiesta crea un
  46 processo figlio incaricato di fornire i servizi richiesti, per poi porsi in
  47 attesa di ulteriori richieste. In questo modo più richieste possono essere
  48 soddisfatte contemporaneamente; una volta che il processo figlio ha concluso
  49 il suo lavoro viene terminato, mentre il server originale resta sempre attivo.
  50
  51
  52
  53 \section{I protocolli di rete}
  54 \label{sec:net_protocols}
  55
  56 Parlando di reti di computer si parla in genere di un insieme molto vasto ed
  57 eterogeneo di mezzi di comunicazione che vanno dal cavo telefonico, alla fibra
  58 ottica, alle comunicazioni via satellite; per rendere possibile la
  59 comunicazione attraverso un così variegato insieme di mezzi sono stati
  60 adottati una serie di protocolli, il più famoso dei quali, quello alla base
  61 del funzionamento di internet, è il protocollo TCP/IP.
  62
  63 \subsection{Il modello ISO/OSI}
  64 \label{sec:net_iso_osi}
  65
  66 Una caratteristica comune dei protocolli di rete è il loro essere strutturati
  67 in livelli sovrapposti; in questo modo un livello superiore esegue richieste
  68 al livello sottostante e da questo riceve responsi, mentre livelli uguali su
  69 macchine diverse conversano tramite lo stesso protocollo. Questo modello di
  70 funzionamento è stato stato standardizzato dalla \textit{International
  71   Standards Organization} (ISO) che ha preparato fin dal 1984 il Modello di
  72 Riferimento \textit{Open Systems Interconnection} (OSI), strutturato in sette
  73 livelli, secondo quanto riportato in \ntab.
  74
  75 \begin{table}[htb]
  76   \centering
  77   \begin{tabular}{l c c l}
  78     \textbf{Livello} & \multicolumn{2}{c}{\textbf{Nome}} & \\
  79     \hline
  80     Livello 7&\textit{Application} &\textsl{Applicazione}& \\
  81     Livello 6&\textit{Presentation} &\textsl{Presentazione}& \\
  82     Livello 5&\textit{Session} &\textsl{Sessione}& \\
  83     Livello 4&\textit{Transport} &\textsl{Trasporto}& \\
  84     Livello 3&\textit{Network} &\textsl{Rete}&   \\
  85     Livello 2&\textit{DataLink} &\textsl{Collegamento Dati}& \\
  86     Livello 1&\textit{Connection} &\textsl{Connessione Fisica}& \\
  87     \hline
  88 \end{tabular}
  89 \caption{I sette livelli del protocollo ISO/OSI.}
  90 \label{tab:net_osilayers}
  91 \end{table}
  92
  93 Il modello ISO/OSI è stato sviluppato corrispondentemente alla definizione
  94 della serie di protocolli X.25 per la commutazione di pacchetto. Ma nonostante
  95 il lavoro dettagliato di standardizzazione il modello si è rivelato
  96 sostanzialmente troppo complesso e poco flessibile rispetto a quello,
  97 precedente, su cui si basa TCP/IP che è diventato uno standard de facto;
  98 quest'ultimo viene comunemente chiamato modello DoD (\textit{Department of
  99   Defense}), dato che fu sviluppato dall'agenzia ARPA per il Dipartimento
 100 della Difesa Americano.
 101
 102 \begin{figure}[!htbp]
 103   \centering
 104   \includegraphics[width=8cm]{img/iso_tcp_comp.eps}
 105   \caption{Struttura a livelli dei protocolli OSI e TCP/IP, con la
 106     relative corrispondenze e la divisione fra kernel e user space.}
 107   \label{fig:net_osi_tcpip_comp}
 108 \end{figure}
 109
 110
 111 \subsection{Il modello DoD (TCP/IP)}
 112 \label{sec:net_tcpip_overview}
 113
 114 Così come ISO/OSI anche TCP/IP è stato strutturato in livelli (riassunti in
 115 \ntab); un confronto fra i due è riportato in \curfig\ dove viene evidenziata
 116 anche la corrispondenza fra i rispettivi livelli (che comunque è
 117 approssimativa) e su come essi vanno ad inserirsi all'interno del sistema
 118 operativo rispetto alla divisione fra user space e kernel space spiegata in
 119 \secref{sec:intro_unix_struct}.
 120
 121 \begin{table}[htb]
 122   \centering
 123   \begin{tabular}{l c c l}
 124     \textbf{Livello} & \multicolumn{2}{c}{\textbf{Nome}} & \textbf{Esempi} \\
 125     \hline
 126     Livello 1&\textit{Application} &\textsl{Applicazione}&
 127     Telnet, FTP, etc. \\
 128     Livello 2&\textit{Transport} &\textsl{Trasporto}& TCP, UDP \\
 129     Livello 3&\textit{Network} &\textsl{Rete}& IP, (ICMP, IGMP)  \\
 130     Livello 4&\textit{Link} &\textsl{Connessione}&
 131     device driver \& scheda di interfaccia  \\
 132     \hline
 133 \end{tabular}
 134 \caption{I quattro livelli del protocollo TCP/IP.}
 135 \label{tab:net_layers}
 136 \end{table}
 137
 138 Come si può notare TCP/IP è più semplice del modello ISO/OSI e strutturato in
 139 soli quattro livelli. Il suo nome deriva dai due principali protocolli che lo
 140 compongono, il TCP \textit{Trasmission Control Protocol} e l'IP
 141 \textit{Internet Protocol}. Le funzioni dei vari livelli sono le seguenti:
 142
 143 \begin{description}
 144 \item \textbf{Applicazione} É relativo ai programmi di interfaccia utente, in
 145   genere questi vengono realizzati secondo il modello client-server (vedi
 146   \secref{sec:net_cliserv}.
 147 \item \textbf{Trasporto} Fornisce la comunicazione tra le due stazioni
 148   terminali su cui girano gli applicativi, regola il flusso delle
 149   informazioni, e può fornire un trasporto affidabile, cioè con recupero
 150   errori. Il protocollo principale di questo livello è il TCP.
 151 \item \textbf{Rete} Si occupa dello smistamento dei singoli pacchetti su una
 152   rete complessa e interconnessa, a questo stesso livello operano i protocolli
 153   per il reperimento delle informazioni necessarie allo smistamento, per lo
 154   scambio di messaggi di controllo e per il monitoraggio della rete. Il
 155   protocollo su cui si basa questo livello è IP (sia nella attuale versione,
 156   IPv4 che nella nuova IPv6).
 157 \item \textbf{Connessione} È responsabile per l'interfacciamento al
 158   dispositivo elettronico che effettua la comunicazione fisica, gestendo
 159   l'invio e la ricezione dall'hardware dei pacchetti.
 160 \end{description}
 161
 162
 163 La comunicazione fra due stazioni avviene secondo le modalità illustrate in
 164 \nfig, dove si è riportato il flusso dei dati reali e i protocolli usati per
 165 lo scambio di informazione su ciascuno livello.
 166 \begin{figure}[!htb]
 167   \centering
 168   \includegraphics[width=6cm]{img/tcp_data_flux.eps}
 169   \caption{Strutturazione del flusso dei dati nella comunicazione fra due
 170     applicazioni attraverso i protocolli della suite TCP/IP.}
 171   \label{fig:net_tcpip_data_flux}
 172 \end{figure}
 173
 174 La struttura della comuniczione pertanto si può riassumere nei seguenti passi:
 175 \begin{itemize}
 176 \item Le singole applicazioni si scambieranno i dati secondo un loro formato
 177   specifico, implementando un protocollo di applicazione (esempi possono
 178   essere HTTP, POP, telnet, SMTP, etc).
 179 \item Questi dati vengono inviati al livello di trasporto usando
 180   un'interfaccia opportuna (i \textit{socket}, che esamineremo in dettaglio in
 181   seguito). Qui verranno spezzati in pacchetti di dimensione opportuna e
 182   incapsulati nel protocollo di trasporto, aggiungendo ad ogni pacchetto le
 183   informazioni necessarie per la sua gestione. Questo processo viene
 184   svolto direttamente nel kernel ad esempio dallo stack TCP nel caso il
 185   protocollo di trasporto sia questo.
 186 \item Una volta composto il pacchetto nel formato adatto al protocollo di
 187   trasporto usato questo sarà passato al successivo livello, quello del
 188   collegamento che si occupa di inserire le opportune informazioni per poter
 189   effettuare l'instradamento nella rete ed il recapito alla destinazione
 190   finale. In genere questo è il livello di IP (Internet Protocol), a cui
 191   vengono inseriti i numeri IP che identificano i computer su internet.
 192 \item L'ultimo passo è il trasferimento del pacchetto al driver della
 193   interfaccia di trasmissione che si incarica di incapsularlo nel relativo
 194   protocollo di trasmissione fisica usato dall'hardware usato per la
 195   comunicazione (ad esempio ethernet per una scheda di rete).
 196 \end{itemize}
 197
 198
 199 \subsection{Criteri generali del design di TCP/IP}
 200 \label{sec:net_tcpip_design}
 201
 202 La filosofia architetturale di TCP/IP è semplice: costruire una rete che
 203 possa sopportare il carico in transito, ma permettere ai singoli nodi di
 204 scartare pacchetti se il carico è temporaneamente eccessivo, o se risultano
 205 errati o non recapitabili.
 206
 207 L'incarico di rendere il recapito pacchetti affidabile non spetta allo livello
 208 di collegamento, ma ai livelli superiori. Pertanto il protocollo IP è per sua
 209 natura inaffidabile, in quanto non è assicurata né una percentuale di
 210 successo né un limite sui tempi di consegna dei pacchetti.
 211
 212 È il livello di trasporto che si deve occupare (qualora necessiti) del
 213 controllo del flusso dei dati e del recupero degli errori; questo è realizzato
 214 dal protocollo TCP. La sede principale di "intelligenza" della rete è pertanto
 215 al livello di trasporto o superiore.
 216
 217 Infine le singole stazioni collegate alla rete non fungono soltanto da punti
 218 terminali di comunicazione, ma possono anche assumere il ruolo di router, per
 219 l'interscambio di pacchetti da una rete ad un'altra. Questo rende possibile la
 220 flessibilità della rete che è in grado di adattarsi ai mutamenti delle
 221 interconnessioni.
 222
 223 La caratteristica essenziale che rende tutto ciò possibile è la strutturazione
 224 a livelli tramite l'incapsulamento. Ogni pacchetto di dati viene incapsulato
 225 nel formato del livello successivo, fino al livello della connessione fisica.
 226 In questo modo il pacchetto ricevuto ad un livello $n$ dalla stazione di
 227 destinazione è esattamente lo stesso spedito dal livello $n$ dalla sorgente.
 228 Questo rende facile il progettare il software facendo riferimento unicamente a
 229 quanto necessario ad un singolo livello, con la confidenza che questo poi sarà
 230 trattato uniformemente da tutti i nodi della rete.
 231
 232
 233 \section{Il protocollo TCP/IP}
 234 \label{sec:net_tpcip}
 235
 236 Come appena mostrato il protocollo TCP/IP è un insieme di protocolli diversi,
 237 che operano su 4 livelli diversi. Per gli interessi della programmazione di
 238 rete però sono importanti principalmente i due livelli centrali, e soprattutto
 239 quello di trasporto.
 240
 241 La principale interfaccia di programmazione di rete, quella dei socket, è
 242 infatti un'interfaccia nei confronti di quest'ultimo. Questo avviene perché al
 243 di sopra del livello di trasporto i programmi hanno a che fare solo con
 244 dettagli specifici delle applicazioni, mentre al di sotto vengono curati tutti
 245 i dettagli relativi alla comunicazione. È pertanto naturale definire una API
 246 su questo confine tanto più che è proprio li (come evidenziato in \pfig) che
 247 nei sistemi unix (e non solo) viene inserita la divisione fra kernel space e
 248 user space.
 249
 250 In realtà in un sistema unix è possibile accedere anche agli altri livelli
 251 inferiori (e non solo a quello di trasporto) con opportune interfacce (la cosa
 252 è indicata in \pfig\ lasciando uno spazio fra UDP e TCP), ma queste vengono
 253 usate solo quando si vogliono fare applicazioni di sistema per il controllo
 254 della rete a basso livello, un uso quindi molto specialistico, e che non
 255 rientra in quanto trattato qui.
 256
 257 In questa sezione daremo una breve descrizione dei vari protocolli di TCP/IP,
 258 concentrandoci per le ragioni esposte sul livello di trasporto. All'interno di
 259 questo privilegeremo poi il protocollo TCP, per il ruolo centrale che svolge
 260 nella maggior parte delle applicazioni.
 261
 262 \subsection{Il quadro generale}
 263
 264 Benché si parli di TCP/IP questa famiglia di protocolli è composta anche da
 265 altri membri. In \nfig\ si è riportato uno schema che mostra un panorama sui
 266 vari protocolli della famiglia, e delle loro relazioni reciproche e con
 267 alcune dalle principali applicazioni che li usano.
 268
 269 \begin{figure}[!htbp]
 270   \centering
 271   \includegraphics[width=10cm]{img/tcpip_overview.eps}
 272   \caption{Panoramica sui vari protocolli che compongono la suite TCP/IP.}
 273   \label{fig:net_tcpip_overview}
 274 \end{figure}
 275
 276 I vari protocolli mostrati in figura sono i seguenti:
 277
 278 \begin{list}{}{}
 279 \item \textsl{IPv4} \textit{Internet Protocol version 4}. È quello che
 280   comunemente si chiama IP. Ha origine negli anni '80 e da allora è la base su
 281   cui è costruita internet. Usa indirizzi a 32 bit e provvede la trasmissione
 282   dei pacchetti TCP, UDP, ICMP e IGMP.
 283 \item \textsl{IPv6} \textit{Internet Protocol version 6}. È stato progettato a
 284   metà degli anni '90 per rimpiazzare IPv4. Ha indirizzi a 128 bit e effettua
 285   lo stesso servizio di trasporto di IPv4 per i pacchetti TCP, UDP e ICPMv6.
 286 \item \textsl{TCP} \textit{Trasmission Control Protocol}. È un protocollo
 287   orientato alla connessione che provvede un trasporto affidabile e
 288   bidirezionale di un flusso di dati. I socket TCP sono esempi di
 289   \textit{stream socket}. Il protocollo ha cura di tutti gli aspetti del
 290   trasporto, come l'acknoweledgment, i timeout, la ritrasmissione, etc. È
 291   usato dalla maggior parte delle applicazioni. Può essere usato sia con IPv4
 292   che con IPv6.
 293 \item \textsl{UDP} \textit{User Datagram Protocol}. È un protocollo senza
 294   connessione a pacchetti. I socket UDP sono esempi di \textit{datagram
 295     socket}. Contrariamente al TCP in protocollo non è affidabile e non c'è
 296   garanzia che i pacchetti raggiungano la loro destinazione, né sull'eventuale
 297   ordine di arrivo. Può essere usato sia con IPv4 che con IPv6.
 298 \item \textsl{ICMP} \textit{Internet Control Message Protocol}. Gestisce gli
 299   errori e trasporta l'informazione di controllo fra stazioni remote e
 300   instradatori (\textit{host} e \textit{router}). I messaggi sono normalmente
 301   generati dal software del kernel che gestisce la comunicazione TCP/IP, anche
 302   se ICMP può venire usato direttamente da alcuni programmi come
 303   \texttt{ping}. A volte ci si riferisce ad esso come ICPMv4 per distinguerlo
 304   da ICMPv6.
 305 \item \textsl{IGMP} \textit{Internet Group Management Protocol}. É un
 306   protocollo usato per il \textit{multicasting} (vedi
 307   \secref{sec:xxx_multicast}), che è opzionale in IPv4.
 308 \item \textsl{ARP} \textit{Address Resolution Protocol}. È il protocollo che
 309   mappa un indirizzo IP in un indirizzo hardware (come un indirizzo
 310   internet). È usato in reti di tipo broadcast come ethernet, token ring o
 311   FDDI ma non serve in connessioni punto-punto.
 312 \item \textsl{RARP} \textit{Reverse Address Resolution Protocol}. È il
 313   protocollo che mappa un indirizzo hardware in un indirizzo IP. Viene usato a
 314   volte per durante il boot per assegnare un indirizzo IP ad una macchina.
 315 \item \textsl{ICMPv6} \textit{Internet Control Message Protocol, version 6}.
 316   Combina per IPv6 le funzionalità di ICMPv4, IGMP e ARP.
 317 \item \textsl{NETLINK} \textit{Netlink}.
 318   Provvede l'interfaccia di accesso alla comunicazione a basso livello.
 319 \end{list}
 320
 321 Gran parte delle applicazioni comunicano usando TCP o UDP, ed alcune si
 322 rifanno ad IP (ed i suoi correlati ICMP e IGMP); benché sia TCP che UDP siano
 323 basati su IP e sia possibile intervenire a questo livello con i \textit{raw
 324   socket} questa tecnica è molto meno diffusa e a parte applicazioni
 325 particolari si preferisce sempre usare i servizi messi a disposizione dai due
 326 protocolli precedenti.  Per questo motivo a parte alcuni brevi accenni su IP
 327 in questa sezione ci concentreremo sul livello di trasporto.
 328
 329 \subsection{Internet Protocol (IP)}
 330 \label{sec:net_ip}
 331
 332 Quando si parla di IP ci si riferisce in genere alla versione attualmente in
 333 uso che è la versione 4 (e viene pertanto chiamato IPv4). Questa versione
 334 venne standardizzata nel 1981 dall'RFC~719.
 335
 336 Internet Protocol nasce per disaccoppiare le applicazioni della struttura
 337 hardware delle reti di trasmissione, e creare una interfaccia di trasmissione
 338 dei dati indipendente dal sottostante substrato di rete, che può essere
 339 realizzato con le tecnologie più disparate (Ethernet, Token Ring, FDDI, etc.).
 340 Il compito di IP è pertanto quello di trasmettere i pacchetti da un computer
 341 all'altro della rete; le caratteristiche essenziali con cui questo viene
 342 realizzato in IPv4 sono due:
 343
 344 \begin{itemize}
 345 \item \textit{Universal addressing} la comunicazione avviene fra due host
 346   identificati univocamente con un indirizzo a 32 bit che può appartenere ad
 347   una sola interfaccia di rete.
 348 \item \textit{Best effort} viene assicurato il massimo impegno nella
 349   trasmissione, ma non c'è nessuna garanzia per i livelli superiori né sulla
 350   percentuale di successo né sul tempo di consegna dei pacchetti di dati.
 351 \end{itemize}
 352
 353 Negli anni '90 la crescita vertiginosa del numero di macchine connesse a
 354 internet ha iniziato a far emergere i vari limiti di IPv4, per risolverne i
 355 problemi si è perciò definita una nuova versione del protocollo, che (saltando
 356 un numero) è diventata la versione 6. IPv6 nasce quindi come evoluzione di
 357 IPv4, mantendone inalterate le funzioni che si sono dimostrate valide,
 358 eliminando quelle inutili e aggiungendone poche altre per mantenere il
 359 protocollo il più snello e veloce possibile.
 360
 361 I cambiamenti apportati sono comunque notevoli e si possono essere riassunti a
 362 grandi linee nei seguenti punti:
 363 \begin{itemize}
 364 \item l'espansione delle capacità di indirizzamento e instradamento, per
 365   supportare una gerarchia con più livelli di indirizzamento, un numero di
 366   nodi indirizzabili molto maggiore e una autoconfigurazione degli indirizzi
 367 \item l'introduzione un nuovo tipo di indirizzamento, l'\textit{anycast} che
 368   si aggiunge agli usuali \textit{unycast} e \textit{multicast}
 369 \item la semplificazione del formato della testata, eliminando o rendendo
 370   opzionali alcuni dei campi di IPv4, per eliminare la necessità di
 371   riprocessamento della stessa da parte dei router e contenere l'aumento di
 372   dimensione dovuto all'ampliamento degli indirizzi
 373 \item un supporto per le opzioni migliorato, per garantire una trasmissione
 374   più efficiente del traffico normale, limiti meno stringenti sulle dimensioni
 375   delle opzioni, e la flessibilità necessaria per introdurne di nuove in
 376   futuro
 377 \item il supporto per delle capacità di qualità di servizio (QoS) che
 378   permettano di identificare gruppi di dati per i quali si può provvedere un
 379   trattamento speciale (in vista dell'uso di internet per applicazioni
 380   multimediali e/o ``real-time'')
 381 \end{itemize}
 382
 383 Maggiori dettagli riguardo a caratteristiche, notazioni e funzionamento del
 384 protocollo IP sono forniti nell'appendice \capref{cha:ip_protocol}.
 385
 386
 387 \subsection{UDP: User Datagram Protocol)}
 388 \label{sec:net_udp}
 389
 390 UDP è un protocollo di trasporto molto semplice, la sua descrizione completa è
 391 contenuta dell'RFC~768, ma in sostanza esso è una semplice interfaccia a IP
 392 dal livello di trasporto. Quando un'applicazione usa UDP essa scrive un
 393 pacchetto di dati (il cosiddetto \textit{datagram} che da il nome al
 394 protocollo) su un socket, al pacchetto viene aggiunto un header molto semplice
 395 (per una descrizione più accurata vedi \secref{sec:xxx_udp}), e poi viene
 396 passato al livello superiore (IPv4 o IPv6 che sia) che lo spedisce verso la
 397 destinazione.  Dato che né IPv4 né IPv6 garantiscono l'affidabilità niente
 398 assicura che il pacchetto arrivi a destinazione, né che più pacchetti arrivino
 399 nello stesso ordine in cui sono stati spediti.
 400
 401 Pertanto il problema principale che si affronta quando si usa UDP è la
 402 mancanza di affidabilità, se si vuole essere sicuri che i pacchetti arrivino a
 403 destinazione occorrerà provvedere con l'applicazione all'interno della quale
 404 si dovrà inserire tutto quanto necessario a gestire la notifica di
 405 ricevimento, la ritrasmissione, il timeout.
 406
 407 Si tenga conto poi che in UDP niente garantisce che i pacchetti arrivino nello
 408 stesso ordine in cui sono stati trasmessi, e può anche accadere che i
 409 pacchetti vengano duplicati nella trasmissione, e non solo perduti. Di tutto
 410 questo di nuovo deve tenere conto l'applicazione.
 411
 412 Un'altro aspetto di UDP è che se un pacchetto raggiunge correttamente la
 413 destinazione esso viene passato all'applicazione ricevente in tutta la sua
 414 lunghezza, la trasmissione avviene perciò per \textit{record} la cui lunghezza
 415 viene anche essa trasmessa all'applicazione all'atto del ricevimento.
 416
 417 Infine UDP è un protocollo che opera senza connessione
 418 (\textit{connectionless}) in quanto non è necessario stabilire nessun tipo di
 419 relazione tra origine e destinazione dei pacchetti. Si hanno così situazioni
 420 in cui un client può scrivere su uno stesso socket pacchetti destinati a
 421 server diversi, o un server ricevere su un socket pacchetti provenienti da
 422 client diversi.  Il modo più semplice di immaginarsi il funzionamento di UDP è
 423 quello della radio, in cui si può ``trasmettere a'' e ``ricevere da'' più
 424 stazioni usando la stessa frequenza.
 425
 426 Nonostante gli evidenti svantaggi comportati dall'inaffidabilità UDP ha il
 427 grande pregio della velocità che in certi casi è essenziale; inoltre si presta
 428 bene per le applicazioni in cui la connessione non è necessaria e
 429 costituirebbe solo un peso di prestazioni mentre una perdita di pacchetti può
 430 essere tollerata, ad esempio quelle che usano il multicasting.
 431
 432 \subsection{TCP: Transport Control Protocol)}
 433 \label{sec:net_tcp}
 434
 435 Il TCP è un protocollo molto complesso, definito nell'RFC~739 e completamente
 436 diverso da UDP; alla base del suo design infatti non stanno semplicità e
 437 velocità, ma la ricerca della massima affidabilità possibile nella
 438 trasmissione dei dati.
 439
 440 La prima differenza con UDP è che TCP provvede sempre una connessione diretta
 441 fra un client e un server, attraverso la quale essi possono comunicare; per
 442 questo il paragone più appropriato per questo protocollo è quello del
 443 collegamento telefonico, in quanto prima viene stabilita una connessione fra
 444 due i due capi della comunicazione su cui poi viene quest'ultima viene
 445 effettuata.
 446
 447 Caratteristica fondamentale di TCP è l'affidabilità; quando i dati vengono
 448 inviati attraverso una connessione ne viene richiesto un ``ricevuto''
 449 (il cosiddetto \textit{acknowlegment}), se questo non arriva essi verranno
 450 ritrasmessi per un determinato numero di tentativi, intervallati da un
 451 periodo di tempo crescente, fino a che sarà considerata fallita o caduta la
 452 connessione (e generato un errore di \textit{time-out}), dopo un periodo di
 453 tempo che dipende dall'implementazione e che può variare far i
 454 quattro e i dieci minuti.
 455
 456 Inoltre per tenere conto delle diverse condizioni in cui può trovarsi la linea
 457 di comunicazione TCP comprende anche un algoritmo di calcolo dinamico del
 458 tempo di andata e ritorno dei pacchetti (il cosiddetto RTT,
 459 \textit{round-trip time}) fra un client e un server che lo rende in grado di
 460 adattarsi alle condizioni della rete per non generare inutili ritrasmissioni o
 461 cadere facilmente in timeout.
 462
 463 Inoltre TCP è in grado di preservare l'ordine dei dati assegnando un numero di
 464 sequenza ad ogni byte che trasmette. Ad esempio se un'applicazione scrive 3000
 465 bytes su un socket TCP, questi potranno essere spezzati dal protocollo in due
 466 segmenti (le unità di dati passate da TCP a IP vengono chiamate
 467 \textit{segment}) di 1500 bytes, di cui il primo conterrà il numero di
 468 sequenza $1-1500$ e il secondo il numero $1501-3000$. In questo modo anche se
 469 i segmenti arrivano a destinazione in un ordine diverso, o se alcuni arrivano
 470 più volte a causa di ritrasmissioni dovute alla perdita dei ricevuto,
 471 all'arrivo sarà comunque possibile riordinare i dati e scartare i duplicati.
 472
 473 Il protocollo provvede anche un controllo di flusso (\textit{flow control}),
 474 cioè specifica sempre all'altro capo della trasmissione quanti dati può
 475 ricevere tramite una \textit{advertised window} (letteralmente finestra
 476 annunciata), che indica lo spazio disponibile nel buffer di ricezione,
 477 cosicché nella trasmissione non vengano inviati più dati di quelli che possono
 478 essere ricevuti.
 479
 480 Questa finestra cambia dinamicamente diminuendo con la ricezione dei dati dal
 481 socket ed aumentando con la lettura di quest'ultimo da parte
 482 dell'applicazione, se diventa nulla il buffer di ricezione è pieno e non
 483 verranno accettati altri dati.  Si noti che UDP non provvede niente di tutto
 484 ciò per cui nulla impedisce che vengano trasmessi pacchetti ad un rate che il
 485 ricevitore non può sostenere.
 486
 487 Infine attraverso TCP la trasmissione è sempre bidirezionale (in inglese
 488 \textit{full-duplex}), è cioè possibile sia trasmettere che ricevere allo
 489 stesso tempo, il che poi comporta che quanto dicevamo a proposito del
 490 controllo di flusso e della gestione della sequenzialità dei dati viene
 491 effettuato per entrambe le direzioni di comunicazione.
 492
 493 Una descrizione più accurata del protocollo è fornita in appendice
 494 \capref{cha:tcp_protocol}.
 495
 496 \subsection{Limiti e dimensioni riguardanti la trasmissione dei dati}
 497 \label{sec:net_lim_dim}
 498
 499 Un aspetto di cui bisogna tenere conto, e che ritornerà in seguito, è che ci
 500 sono una serie di limiti a cui la trasmissione dei dati attraverso i vari
 501 livelli del protocollo deve sottostare, limiti che è opportuno tenere presente
 502 perché in certi casi si possono avere delle conseguenze sul comportamento
 503 delle applicazioni.
 504
 505 Un elenco di questi limiti è il seguente, insieme ad un breve accenno alle
 506 loro origini ed alle eventuali implicazioni che possono avere:
 507 \begin{itemize}
 508 \item La dimensione massima di un pacchetti IP è di 65535 bytes, compreso
 509   l'header. Questo è dovuto al fatto che la dimensione è indicata da un campo
 510   apposito nell'header di IP che è lungo 16 bit (vedi
 511   \tabref{tab:IP_ipv4head}).
 512 \item La dimensione massima di un pacchetto normale di IPv6 è di 65575 bytes,
 513   il campo apposito nell'header infatti è sempre a 16 bit, ma la dimensione
 514   dell'header è fissa e di 40 byte e non è compresa nel valore indicato dal
 515   suddetto campo. Inoltre IPv6 ha la possibilità di estendere la dimensione di
 516   un pacchetto usando la \textit{jumbo payload option}.
 517 \item Molte reti fisiche hanno un MTU (\textit{maximum tranfer unit}) che
 518   dipende dal protocollo specifico usato al livello di link. Il più comune è
 519   quello dell'ethernet che è pari a 1500 bytes, una serie di valori possibili
 520   sono riportati in \ntab.
 521 \end{itemize}
 522
 523 Quando un pacchetto IP viene inviato su una interfaccia di rete e le sue
 524 dimensioni eccedono la MTU viene eseguita la cosiddetta
 525 \textit{frammentazione}, i pacchetti cioè vengono spezzati (sia da IPv4 che da
 526 IPv6, anche se i pacchetti frammentati sono gestiti con modalità
 527 diverse\footnote{il primo usa un flag nell'header, il secondo una opportuna
 528   opzione, si veda \secref{cha:ip_protocol}}), in blocchi più piccoli che
 529 possono essere trasmessi attraverso l'interfaccia.
 530
 531 \begin{table}[!htb]
 532   \centering
 533   \begin{tabular}[c]{|l|c|}
 534     \hline
 535     \textbf{Rete} & \textbf{MTU} \\
 536     \hline
 537     \hline
 538     Hyperlink & 65535 \\
 539     Token Ring IBM (16 Mbit/sec) & 17914 \\
 540     Token Ring IEEE 802.5 (4 Mbit/sec) & 4464 \\
 541     FDDI & 4532 \\
 542     Ethernet & 1500 \\
 543     X.25 & 576 \\
 544     \hline
 545   \end{tabular}
 546   \caption{Valori della MTU (\textit{maximum tranfer unit}) per una serie di
 547     reti diverse.}
 548   \label{tab:net_mtu_values}
 549 \end{table}
 550
 551 La MTU più piccola fra due stazioni viene in genere chiamata \textit{path
 552   MTU}, che dice qual'è la lunghezza massima oltre la quale un pacchetto
 553 inviato da una stazione ad un'altra verrebbe senz'altro frammentato. Si tenga
 554 conto che non è affatto detto che la \textit{path MTU} sia la stessa in
 555 entrambe le direzioni, perché l'instradamento può essere diverso nei due
 556 sensi, con diverse tipologie di rete coinvolte.
 557
 558 Una delle differenze fra IPv4 e IPv6 é che per IPv6 la frammentazione può
 559 essere eseguita solo alla sorgente, questo vuol dire che i router IPv6 non
 560 frammentano i pacchetti che trasmettono (anche se possono frammentare i
 561 pacchetti che generano loro stessi), mentre i router IPv4 si. In ogni caso una
 562 volta frammentati i pacchetti possono essere riassemblati solo alla
 563 destinazione.
 564
 565 Nell'header di IPv4 è previsto il flag \texttt{DF} che specifica che il
 566 pacchetto non deve essere frammentato; un router che riceva un pacchetto le
 567 cui dimensioni eccedano quelle dell'MTU della rete di destinazione genererà un
 568 messaggio di errore ICMPv4 di tipo \textit{destination unreachable,
 569   fragentation needed but DF bit set}.
 570
 571 Dato che i router IPv6 non possono effettuare la frammentazione la ricezione
 572 di un pacchetto di dimensione eccessiva per la ritrasmissione genererà sempre
 573 un messaggio di errore ICMPv6 di tipo \textit{packet too big}.
 574
 575 Dato che il meccanismo di frammentazione e riassemblaggio comporta
 576 inefficienza normalmente viene utilizzato il procedimento della \textit{path
 577   MTU discover} (vedi RFC~1191 per IPv4 e RFC~1981 per IPv6) che permette di
 578 trovare il \textit{path MTU} fra due stazioni; per la realizzazione del
 579 procedimento si usa il flag DF di IPv4 e il comportamento normale di IPv6
 580 inviando delle opportune serie di pacchetti (per i dettagli vedere l'RFC~1191
 581 per IPv4 e l'RFC~1981 per IPv6) fintanto che non si hanno più errori.
 582
 583 Il TCP usa sempre questo meccanismo, che per le implementazioni di IPv4 è
 584 opzionale, mentre diventa obbligatorio per IPv6.  Per IPv6 infatti, non
 585 potendo i router frammentare i pacchetti, è necessario, per poter comunicare,
 586 conoscere il \textit{path MTU}.
 587
 588
 589 Infine TCP definisce una \textit{maximum segment size} MSS che annuncia
 590 all'altro capo la dimensione massima del segmento di dati.
 591
 592
 593 \subsection{Il passaggio dei dati in TCP}
 594 \label{sec:net_tcp_pass}
 595
 596 \subsection{Il passaggio dei dati in UDP}
 597 \label{sec:net_udp_pass}