network.tex

   1 %% network.tex
   2 %%
   3 %% Copyright (C) 2000-2018 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11
  12 \chapter{Introduzione alla programmazione di rete}
  13 \label{cha:network}
  14
  15 In questo capitolo sarà fatta un'introduzione ai concetti generali che servono
  16 come prerequisiti per capire la programmazione di rete, non tratteremo quindi
  17 aspetti specifici ma faremo una breve introduzione al modello più comune usato
  18 nella programmazione di rete, per poi passare ad un esame a grandi linee dei
  19 protocolli di rete e di come questi sono organizzati e interagiscono.
  20
  21 In particolare, avendo assunto l'ottica di un'introduzione mirata alla
  22 programmazione, ci concentreremo sul gruppo di protocolli più diffuso, il
  23 TCP/IP, che è quello che sta alla base di Internet, avendo cura di
  24 sottolineare i concetti più importanti da conoscere per la scrittura dei
  25 programmi.
  26
  27
  28
  29 \section{Modelli di programmazione}
  30 \label{sec:net_prog_model}
  31
  32
  33 La differenza principale fra un'applicazione di rete e un programma normale è
  34 che quest'ultima per definizione concerne la comunicazione fra processi
  35 diversi, che in generale non girano neanche sulla stessa macchina. Questo già
  36 prefigura un cambiamento completo rispetto all'ottica del programma monolitico
  37 all'interno del quale vengono eseguite tutte le istruzioni, e chiaramente
  38 presuppone un sistema operativo multitasking in grado di eseguire più processi
  39 contemporaneamente.
  40
  41 In questa prima sezione esamineremo brevemente i principali modelli di
  42 programmazione in uso. Ne daremo una descrizione assolutamente generica e
  43 superficiale, che ne illustri le caratteristiche principali, non essendo fra
  44 gli scopi del testo approfondire questi argomenti.
  45
  46 \subsection{Il modello \textit{client-server}}
  47 \label{sec:net_cliserv}
  48
  49 L'architettura fondamentale su cui si basa gran parte della programmazione di
  50 rete sotto Linux (e sotto Unix in generale) è il modello
  51 \textit{client-server} caratterizzato dalla presenza di due categorie di
  52 soggetti, i programmi di servizio, chiamati \textit{server}, che ricevono le
  53 richieste e forniscono le risposte, ed i programmi di utilizzo, detti
  54 \textit{client}.
  55
  56 In generale un server può (di norma deve) essere in grado di rispondere a più
  57 di un client, per cui è possibile che molti programmi possano interagire
  58 contemporaneamente, quello che contraddistingue il modello però è che
  59 l'architettura dell'interazione è sempre nei termini di molti verso uno, il
  60 server, che viene ad assumere un ruolo privilegiato.
  61
  62 Seguono questo modello tutti i servizi fondamentali di Internet, come le
  63 pagine web, la posta elettronica, ftp, telnet, ssh e praticamente ogni
  64 servizio che viene fornito tramite la rete, anche se, come abbiamo visto, il
  65 modello è utilizzato in generale anche per programmi che non fanno
  66 necessariamente uso della rete, come gli esempi che abbiamo usato in
  67 cap.~\ref{cha:IPC} a proposito della comunicazione fra processi nello stesso
  68 sistema.
  69
  70 Normalmente si dividono i server in due categorie principali, e vengono detti
  71 \textsl{concorrenti} o \textsl{iterativi}, sulla base del loro comportamento.
  72 Un \textsl{server iterativo} risponde alla richiesta inviando i dati e resta
  73 occupato e non rispondendo ad ulteriori richieste fintanto che non ha fornito
  74 una risposta alla richiesta. Una volta completata la risposta il server
  75 diventa di nuovo disponibile.
  76
  77 Un \textsl{server concorrente} al momento di trattare la richiesta crea un
  78 processo figlio (o un \textit{thread}) incaricato di fornire i servizi
  79 richiesti, per porsi immediatamente in attesa di ulteriori richieste. In
  80 questo modo, con sistemi multitasking, più richieste possono essere
  81 soddisfatte contemporaneamente. Una volta che il processo figlio ha concluso
  82 il suo lavoro esso di norma viene terminato, mentre il server originale resta
  83 sempre attivo.
  84
  85
  86 \subsection{Il modello \textit{peer-to-peer}}
  87 \label{sec:net_peertopeer}
  88
  89 Come abbiamo visto il tratto saliente dell'architettura \textit{client-server}
  90 è quello della preminenza del server rispetto ai client, le architetture
  91 \textit{peer-to-peer} si basano su un approccio completamente opposto che è
  92 quello di non avere nessun programma che svolga un ruolo preminente.
  93
  94 Questo vuol dire che in generale ciascun programma viene ad agire come un nodo
  95 in una rete potenzialmente paritetica; ciascun programma si trova pertanto a
  96 ricevere ed inviare richieste ed a ricevere ed inviare risposte, e non c'è più
  97 la separazione netta dei compiti che si ritrova nelle architetture
  98 \textit{client-server}.
  99
 100 Le architetture \textit{peer-to-peer} sono salite alla ribalta con
 101 l'esplosione del fenomeno Napster, ma gli stessi protocolli di routing sono un
 102 buon esempio di architetture \textit{peer-to-peer}, in cui ciascun nodo,
 103 tramite il demone che gestisce il routing, richiede ed invia informazioni ad
 104 altri nodi.
 105
 106 In realtà in molti casi di architetture classificate come
 107 \textit{peer-to-peer} non è detto che la struttura sia totalmente paritetica e
 108 ci sono parecchi esempi in cui alcuni servizi vengono centralizzati o
 109 distribuiti gerarchicamente, come avveniva per lo stesso Napster, in cui le
 110 ricerche erano effettuate su un server centrale.
 111
 112
 113
 114 \subsection{Il modello \textit{three-tier}}
 115 \label{sec:net_three_tier}
 116
 117 Benché qui sia trattato a parte, il modello \textit{three-tier} in realtà è
 118 una estensione del modello \textit{client-server}. Con il crescere della
 119 quantità dei servizi forniti in rete (in particolare su Internet) ed al numero
 120 di accessi richiesto. Si è così assistito anche ad una notevole crescita di
 121 complessità, in cui diversi servizi venivano ad essere integrati fra di loro.
 122
 123 In particolare sempre più spesso si assiste ad una integrazione di servizi di
 124 database con servizi di web, in cui le pagine vengono costruite dinamicamente
 125 sulla base dei dati contenuti nel database. In tutti questi casi il problema
 126 fondamentale di una architettura \textit{client-server} è che la richiesta di
 127 un servizio da parte di un gran numero di client si scontra con il collo di
 128 bottiglia dell'accesso diretto ad un unico server, con gravi problemi di
 129 scalabilità.
 130
 131 Rispondere a queste esigenze di scalabilità il modello più semplice (chiamato
 132 talvolta \textit{two-tier}) da adottare è stata quello di distribuire il
 133 carico delle richieste su più server identici, mantenendo quindi
 134 sostanzialmente inalterata l'architettura \textit{client-server} originale.
 135
 136 Nel far questo ci si scontra però con gravi problemi di manutenibilità dei
 137 servizi, in particolare per quanto riguarda la sincronizzazione dei dati, e di
 138 inefficienza dell'uso delle risorse. Il problema è particolarmente grave ad
 139 esempio per i database che non possono essere replicati e sincronizzati
 140 facilmente, e che sono molto onerosi, la loro replicazione è costosa e
 141 complessa.
 142
 143 È a partire da queste problematiche che nasce il modello \textit{three-tier},
 144 che si struttura, come dice il nome, su tre livelli. Il primo livello, quello
 145 dei client che eseguono le richieste e gestiscono l'interfaccia con l'utente,
 146 resta sostanzialmente lo stesso del modello \textit{client-server}, ma la
 147 parte server viene suddivisa in due livelli, introducendo un
 148 \textit{middle-tier}, su cui deve appoggiarsi tutta la logica di analisi delle
 149 richieste dei client per ottimizzare l'accesso al terzo livello, che è quello
 150 che si limita a fornire i dati dinamici che verranno usati dalla logica
 151 implementata nel \textit{middle-tier} per eseguire le operazioni richieste dai
 152 client.
 153
 154 In questo modo si può disaccoppiare la logica dai dati, replicando la prima,
 155 che è molto meno soggetta a cambiamenti ed evoluzione, e non soffre di
 156 problemi di sincronizzazione, e centralizzando opportunamente i secondi. In
 157 questo modo si può distribuire il carico ed accedere in maniera efficiente i
 158 dati.
 159
 160
 161 \subsection{Il modello \textit{broadcast}}
 162 \label{sec:net_broadcast}
 163
 164 Uno specifico modello relativo alla programmazione di rete è poi quello in cui
 165 è possibile, invece della classica comunicazione uno ad uno comunque usata in
 166 tutti i modelli precedenti (anche nel \texttt{peer to peer} la comunicazione è
 167 comunque fra singoli ``\textit{peer}''), una comunicazione da uno a molti.
 168
 169 \itindbeg{broadcast}
 170
 171 Questo modello nasce dal fatto che molte tecnologie di rete (ed in particolare
 172 la Ethernet, che è probabilmente la più diffusa) hanno il supporto per
 173 effettuare una comunicazione in cui un nodo qualunque della rete più inviare
 174 informazioni in contemporanea a tutti gli altri. In questo caso si parla di
 175 \textit{broadcast}, utilizzando la nomenclatura usata per le trasmissioni
 176 radio, anche se in realtà questo tipo di comunicazione è eseguibile da un nodo
 177 qualunque per cui tutti quanti possono ricoprire sia il ruolo di trasmettitore
 178 che quello di ricevitore.
 179
 180 \itindbeg{multicast}
 181
 182 In genere si parla di \textit{broadcast} quando la trasmissione uno a molti è
 183 possibile fra qualunque nodo di una rete e gli altri, ed è supportata
 184 direttamente dalla tecnologia di collegamento utilizzata. L'utilizzo di questa
 185 forma di comunicazione da uno a molti però può risultare molto utile anche
 186 quando questo tipo di supporto non è disponibile (come ad esempio su Internet,
 187 dove non si possono contattare tutti i nodi presenti).
 188
 189 \itindend{broadcast}
 190
 191 In tal caso alcuni protocolli di rete (e quelli usati per Internet sono fra
 192 questi) supportano una variante del\textit{broadcast}, detta
 193 \textit{multicast}, in cui resta possibile fare una comunicazione uno a molti,
 194 in cui una applicazione invia i pacchetti a molte altre, in genere passando
 195 attraverso un opportuno supporto degli apparati ed una qualche forma di
 196 registrazione che consente la distribuzione della cominicazione ai nodi
 197 interessati.
 198
 199 \itindend{multicast}
 200
 201 Ovviamente i programmi che devono realizzare un tipo di comunicazione di
 202 questo tipo (come ad esempio potrebbero essere quelli che effettuano uno
 203 \textit{streaming} di informazioni) devono rispondere a delle problematiche
 204 del tutto diverse da quelle classiche illustrate nei modelli precedenti, e
 205 costituiscono pertanto un'altra classe completamente a parte.
 206
 207
 208 \section{I protocolli di rete}
 209 \label{sec:net_protocols}
 210
 211 Parlando di reti di computer si parla in genere di un insieme molto vasto ed
 212 eterogeneo di mezzi di comunicazione che vanno dal cavo telefonico, alla fibra
 213 ottica, alle comunicazioni via satellite o via radio; per rendere possibile la
 214 comunicazione attraverso un così variegato insieme di mezzi sono stati
 215 adottati molti protocolli, il più famoso dei quali, quello alla base del
 216 funzionamento di Internet, è il gruppo di protocolli comunemente chiamato
 217 TCP/IP.
 218
 219 \subsection{Il modello ISO/OSI}
 220 \label{sec:net_iso_osi}
 221
 222 Una caratteristica comune dei protocolli di rete è il loro essere strutturati
 223 in livelli sovrapposti; in questo modo ogni protocollo di un certo livello
 224 realizza le sue funzionalità basandosi su un protocollo del livello
 225 sottostante.  Questo modello di funzionamento è stato standardizzato dalla
 226 \textit{International Standards Organization} (ISO) che ha preparato fin dal
 227 1984 il Modello di Riferimento \textit{Open Systems Interconnection} (OSI),
 228 strutturato in sette livelli, secondo quanto riportato in
 229 tab.~\ref{tab:net_osilayers}.
 230
 231 \begin{table}[htb]
 232   \centering
 233   \begin{tabular}{|l|c|c|}
 234     \hline
 235     \textbf{Livello} & \multicolumn{2}{|c|}{\textbf{Nome}} \\
 236     \hline
 237     \hline
 238     Livello 7&\textit{Application}  &\textsl{Applicazione}\\
 239     Livello 6&\textit{Presentation} &\textsl{Presentazione} \\
 240     Livello 5&\textit{Session}      &\textsl{Sessione} \\
 241     Livello 4&\textit{Transport}    &\textsl{Trasporto} \\
 242     Livello 3&\textit{Network}      &\textsl{Rete}\\
 243     Livello 2&\textit{DataLink}     &\textsl{Collegamento Dati} \\
 244     Livello 1&\textit{Physical}   &\textsl{Connessione Fisica} \\
 245     \hline
 246 \end{tabular}
 247 \caption{I sette livelli del protocollo ISO/OSI.}
 248 \label{tab:net_osilayers}
 249 \end{table}
 250
 251 Il modello ISO/OSI è stato sviluppato in corrispondenza alla definizione della
 252 serie di protocolli X.25 per la commutazione di pacchetto; come si vede è un
 253 modello abbastanza complesso\footnote{infatti per memorizzarne i vari livelli
 254   è stata creata la frase \textit{All people seem to need data processing}, in
 255   cui ciascuna parola corrisponde all'iniziale di uno dei livelli.}, tanto che
 256 usualmente si tende a suddividerlo in due parti, secondo lo schema mostrato in
 257 fig.~\ref{fig:net_osi_tcpip_comp}, con un \textit{upper layer} che riguarda
 258 solo le applicazioni, che viene realizzato in \textit{user space}, ed un
 259 \textit{lower layer} in cui si mescolano la gestione fatta dal kernel e le
 260 funzionalità fornite dall'hardware.
 261
 262 Il modello ISO/OSI mira ad effettuare una classificazione completamente
 263 generale di ogni tipo di protocollo di rete; nel frattempo però era stato
 264 sviluppato anche un altro modello, relativo al protocollo TCP/IP, che è quello
 265 su cui è basata Internet, che è diventato uno standard de facto.  Questo
 266 modello viene talvolta chiamato anche modello \textit{DoD} (sigla che sta per
 267 \textit{Department of Defense}), dato che fu sviluppato dall'agenzia ARPA per
 268 il Dipartimento della Difesa Americano.
 269
 270 \begin{figure}[!htb]
 271   \centering
 272   \includegraphics[width=12cm]{img/iso_tcp_comp}
 273   \caption{Struttura a livelli dei protocolli OSI e TCP/IP, con la relative
 274     corrispondenze e la divisione fra \textit{kernel space} e \textit{user
 275       space}.}
 276   \label{fig:net_osi_tcpip_comp}
 277 \end{figure}
 278
 279 La scelta fra quale dei due modelli utilizzare dipende per lo più dai gusti
 280 personali. Come caratteristiche generali il modello ISO/OSI è più teorico e
 281 generico, basato separazioni funzionali, mentre il modello TCP/IP è più vicino
 282 alla separazione concreta dei vari strati del sistema operativo; useremo
 283 pertanto quest'ultimo, anche per la sua maggiore semplicità. Questa semplicità
 284 ha un costo quando si fa riferimento agli strati più bassi, che sono in
 285 effetti descritti meglio dal modello ISO/OSI, in quanto gran parte dei
 286 protocolli di trasmissione hardware sono appunto strutturati sui due livelli
 287 di \textit{Data Link} e \textit{Connection}.
 288
 289
 290 \subsection{Il modello TCP/IP (o DoD)}
 291 \label{sec:net_tcpip_overview}
 292
 293 Così come ISO/OSI anche il modello del TCP/IP è stato strutturato in livelli
 294 (riassunti in tab.~\ref{tab:net_layers}); un confronto fra i due è riportato
 295 in fig.~\ref{fig:net_osi_tcpip_comp} dove viene evidenziata anche la
 296 corrispondenza fra i rispettivi livelli (che comunque è approssimativa) e su
 297 come essi vanno ad inserirsi all'interno del sistema rispetto alla divisione
 298 fra \textit{user space} e \textit{kernel space} spiegata in
 299 sez.~\ref{sec:intro_unix_struct}.\footnote{in realtà è sempre possibile
 300   accedere dallo \textit{user space}, attraverso una opportuna interfaccia
 301   (come vedremo in sez.~\ref{sec:sock_sa_packet}), ai livelli inferiori del
 302   protocollo.}
 303
 304 \begin{table}[htb]
 305   \centering
 306   \begin{tabular}{|l|c|c|l|}
 307     \hline
 308     \textbf{Livello} & \multicolumn{2}{|c|}{\textbf{Nome}} & \textbf{Esempi} \\
 309     \hline
 310     \hline
 311     Livello 4 & \textit{Application} & \textsl{Applicazione}&
 312                                        Telnet, FTP, ecc. \\
 313     Livello 3 & \textit{Transport}   & \textsl{Trasporto} & TCP, UDP\\
 314     Livello 2 & \textit{Network}     & \textsl{Rete}      & IP, (ICMP, IGMP)\\
 315     Livello 1 & \textit{Link}        & \textsl{Collegamento}&
 316                                        Device driver \& scheda di interfaccia\\
 317     \hline
 318 \end{tabular}
 319 \caption{I quattro livelli del protocollo TCP/IP.}
 320 \label{tab:net_layers}
 321 \end{table}
 322
 323 Come si può notare come il modello TCP/IP è più semplice del modello ISO/OSI
 324 ed è strutturato in soli quattro livelli. Il suo nome deriva dai due
 325 principali protocolli che lo compongono, il TCP (\textit{Trasmission Control
 326   Protocol}) che copre il livello 3 e l'IP (\textit{Internet Protocol}) che
 327 copre il livello 2. Le funzioni dei vari livelli sono le seguenti:
 328
 329 \begin{basedescript}{\desclabelwidth{2.5cm}\desclabelstyle{\nextlinelabel}}
 330 \item[\textbf{Applicazione}] É relativo ai programmi di interfaccia con la
 331   rete, in genere questi vengono realizzati secondo il modello client-server
 332   (vedi sez.~\ref{sec:net_cliserv}), realizzando una comunicazione secondo un
 333   protocollo che è specifico di ciascuna applicazione.
 334 \item[\textbf{Trasporto}] Fornisce la comunicazione tra le due stazioni
 335   terminali su cui girano gli applicativi, regola il flusso delle
 336   informazioni, può fornire un trasporto affidabile, cioè con recupero degli
 337   errori o inaffidabile. I protocolli principali di questo livello sono il TCP
 338   e l'UDP.
 339 \item[\textbf{Rete}] Si occupa dello smistamento dei singoli pacchetti su una
 340   rete complessa e interconnessa, a questo stesso livello operano i protocolli
 341   per il reperimento delle informazioni necessarie allo smistamento, per lo
 342   scambio di messaggi di controllo e per il monitoraggio della rete. Il
 343   protocollo su cui si basa questo livello è IP (sia nella attuale versione,
 344   IPv4, che nella nuova versione, IPv6).
 345 \item[\textbf{Collegamento}] È responsabile per l'interfacciamento al
 346   dispositivo elettronico che effettua la comunicazione fisica, gestendo
 347   l'invio e la ricezione dei pacchetti da e verso l'hardware.
 348 \end{basedescript}
 349
 350 La comunicazione fra due stazioni remote avviene secondo le modalità
 351 illustrate in fig.~\ref{fig:net_tcpip_data_flux}, dove si è riportato il flusso
 352 dei dati reali e i protocolli usati per lo scambio di informazione su ciascun
 353 livello. Si è genericamente indicato \textit{ethernet} per il livello 1, anche
 354 se in realtà i protocolli di trasmissione usati possono essere molti altri.
 355
 356 \begin{figure}[!htb]
 357   \centering \includegraphics[width=13cm]{img/tcp_data_flux}
 358   \caption{Strutturazione del flusso dei dati nella comunicazione fra due
 359     applicazioni attraverso i protocolli della suite TCP/IP.}
 360   \label{fig:net_tcpip_data_flux}
 361 \end{figure}
 362
 363 Per chiarire meglio la struttura della comunicazione attraverso i vari
 364 protocolli mostrata in fig.~\ref{fig:net_tcpip_data_flux}, conviene prendere in
 365 esame i singoli passaggi fatti per passare da un livello al sottostante,
 366 la procedura si può riassumere nei seguenti passi:
 367 \begin{itemize}
 368 \item Le singole applicazioni comunicano scambiandosi i dati ciascuna secondo
 369   un suo specifico formato. Per applicazioni generiche, come la posta o le
 370   pagine web, viene di solito definito ed implementato quello che viene
 371   chiamato un protocollo di applicazione (esempi possono essere HTTP, POP,
 372   SMTP, ecc.), ciascuno dei quali è descritto in un opportuno standard, di
 373   solito attraverso un RFC (l'acronimo RFC sta per
 374   \itindex{Request~For~Comment~(RFC)} \textit{Request For Comment} ed è la
 375   procedura attraverso la quale vengono proposti gli standard per Internet).
 376 \item I dati delle applicazioni vengono inviati al livello di trasporto usando
 377   un'interfaccia opportuna (i \textit{socket}, che esamineremo in dettaglio in
 378   cap.~\ref{cha:socket_intro}). Qui verranno spezzati in pacchetti di
 379   dimensione opportuna e inseriti nel protocollo di trasporto, aggiungendo ad
 380   ogni pacchetto le informazioni necessarie per la sua gestione. Questo
 381   processo viene svolto direttamente nel kernel, ad esempio dallo stack TCP,
 382   nel caso il protocollo di trasporto usato sia questo.
 383 \item Una volta composto il pacchetto nel formato adatto al protocollo di
 384   trasporto usato questo sarà passato al successivo livello, quello di rete,
 385   che si occupa di inserire le opportune informazioni per poter effettuare
 386   l'instradamento nella rete ed il recapito alla destinazione finale. In
 387   genere questo è il livello di IP (Internet Protocol), a cui vengono inseriti
 388   i numeri IP che identificano i computer su Internet.
 389 \item L'ultimo passo è il trasferimento del pacchetto al driver della
 390   interfaccia di trasmissione, che si incarica di incapsularlo nel relativo
 391   protocollo di trasmissione. Questo può avvenire sia in maniera diretta, come
 392   nel caso di ethernet, in cui i pacchetti vengono inviati sulla linea
 393   attraverso le schede di rete, che in maniera indiretta con protocolli come
 394   PPP o SLIP, che vengono usati come interfaccia per far passare i dati su
 395   altri dispositivi di comunicazione (come la seriale o la parallela).
 396 \end{itemize}
 397
 398
 399 \subsection{Criteri generali dell'architettura del TCP/IP}
 400 \label{sec:net_tcpip_design}
 401
 402 La filosofia architetturale del TCP/IP è semplice: costruire una rete che
 403 possa sopportare il carico in transito, ma permettere ai singoli nodi di
 404 scartare pacchetti se il carico è temporaneamente eccessivo, o se risultano
 405 errati o non recapitabili.
 406
 407 L'incarico di rendere il recapito pacchetti affidabile non spetta al livello
 408 di rete, ma ai livelli superiori. Pertanto il protocollo IP è per sua natura
 409 inaffidabile, in quanto non è assicurata né una percentuale di successo né un
 410 limite sui tempi di consegna dei pacchetti.
 411
 412 È il livello di trasporto che si deve occupare (qualora necessiti) del
 413 controllo del flusso dei dati e del recupero degli errori; questo è realizzato
 414 dal protocollo TCP. La sede principale di "\textit{intelligenza}" della rete è
 415 pertanto al livello di trasporto o ai livelli superiori.
 416
 417 Infine le singole stazioni collegate alla rete non fungono soltanto da punti
 418 terminali di comunicazione, ma possono anche assumere il ruolo di
 419 \textit{router} (\textsl{instradatori}), per l'interscambio di pacchetti da
 420 una rete ad un'altra. Questo rende possibile la flessibilità della rete che è
 421 in grado di adattarsi ai mutamenti delle interconnessioni.
 422
 423 La caratteristica essenziale che rende tutto ciò possibile è la strutturazione
 424 a livelli tramite l'incapsulamento. Ogni pacchetto di dati viene incapsulato
 425 nel formato del livello successivo, fino al livello del collegamento fisico.
 426 In questo modo il pacchetto ricevuto ad un livello \textit{n} dalla stazione
 427 di destinazione è esattamente lo stesso spedito dal livello \textit{n} dalla
 428 sorgente.  Questo rende facile il progettare il software facendo riferimento
 429 unicamente a quanto necessario ad un singolo livello, con la confidenza che
 430 questo poi sarà trattato uniformemente da tutti i nodi della rete.
 431
 432
 433 \section{La struttura del TCP/IP}
 434 \label{sec:net_tpcip}
 435
 436 Come accennato in sez.~\ref{sec:net_protocols} il TCP/IP è un insieme di
 437 protocolli diversi, che operano su 4 livelli diversi. Per gli interessi della
 438 programmazione di rete però sono importanti principalmente i due livelli
 439 centrali, e soprattutto quello di trasporto.
 440
 441 La principale interfaccia usata nella programmazione di rete, quella dei
 442 socket (vedi sez.~\ref{cha:socket_intro}), è infatti un'interfaccia nei
 443 confronti di quest'ultimo.  Questo avviene perché al di sopra del livello di
 444 trasporto i programmi hanno a che fare solo con dettagli specifici delle
 445 applicazioni, mentre al di sotto vengono curati tutti i dettagli relativi alla
 446 comunicazione. È pertanto naturale definire una interfaccia di programmazione
 447 su questo confine, tanto più che è proprio lì (come evidenziato in
 448 fig.~\ref{fig:net_osi_tcpip_comp}) che nei sistemi Unix (e non solo) viene
 449 inserita la divisione fra \textit{kernel space} e \textit{user space}.
 450
 451 In realtà in un sistema Unix è possibile accedere anche agli altri livelli (e
 452 non solo a quello di trasporto) con opportune interfacce di programmazione
 453 (vedi sez.~\ref{sec:sock_sa_packet}), ma queste vengono usate solo quando si
 454 debbano fare applicazioni di sistema per il controllo della rete a basso
 455 livello, di uso quindi molto specialistico.
 456
 457 In questa sezione daremo una descrizione sommaria dei vari protocolli del
 458 TCP/IP, concentrandoci, per le ragioni appena esposte, sul livello di
 459 trasporto.  All'interno di quest'ultimo privilegeremo poi il protocollo TCP,
 460 per il ruolo centrale che svolge nella maggior parte delle applicazioni.
 461
 462
 463 \subsection{Il quadro generale}
 464 \label{sec:net_tcpip_general}
 465
 466 Benché si parli di TCP/IP questa famiglia di protocolli è composta anche da
 467 molti membri. In fig.~\ref{fig:net_tcpip_overview} si è riportato uno schema
 468 che mostra un panorama sui principali protocolli della famiglia, e delle loro
 469 relazioni reciproche e con alcune dalle principali applicazioni che li usano.
 470
 471 \begin{figure}[!htb]
 472   \centering
 473   \includegraphics[width=13cm]{img/tcpip_overview}
 474   \caption{Panoramica sui vari protocolli che compongono la suite TCP/IP.}
 475   \label{fig:net_tcpip_overview}
 476 \end{figure}
 477
 478 I vari protocolli riportati in fig.~\ref{fig:net_tcpip_overview} sono i
 479 seguenti:
 480 \begin{basedescript}{\desclabelwidth{1.7cm}\desclabelstyle{\nextlinelabel}}
 481 \item[\textsl{IPv4}] \textit{Internet Protocol version 4}. È quello che
 482   comunemente si chiama IP. Ha origine negli anni '80 e da allora è la base su
 483   cui è costruita Internet. Usa indirizzi a 32 bit, e mantiene tutte le
 484   informazioni di instradamento e controllo per la trasmissione dei pacchetti
 485   sulla rete; tutti gli altri protocolli della suite (eccetto ARP e RARP, e
 486   quelli specifici di IPv6) vengono trasmessi attraverso di esso.
 487 \item[\textsl{IPv6}] \textit{Internet Protocol version 6}. È stato progettato
 488   a metà degli anni '90 per rimpiazzare IPv4. Ha uno spazio di indirizzi
 489   ampliato 128 bit che consente più gerarchie di indirizzi,
 490   l'auto-configurazione, ed un nuovo tipo di indirizzi, gli \textit{anycast},
 491   che consentono di inviare un pacchetto ad una stazione su un certo gruppo.
 492   Effettua lo stesso servizio di trasmissione dei pacchetti di IPv4 di cui
 493   vuole essere un sostituto.
 494 \item[\textsl{TCP}] \textit{Trasmission Control Protocol}. È un protocollo
 495   orientato alla connessione che provvede un trasporto affidabile per un
 496   flusso di dati bidirezionale fra due stazioni remote. Il protocollo ha cura
 497   di tutti gli aspetti del trasporto, come l'\textit{acknoweledgment} (il
 498   ricevuto), i timeout, la ritrasmissione, ecc. È usato dalla maggior parte
 499   delle applicazioni.
 500 \item[\textsl{UDP}] \textit{User Datagram Protocol}. È un protocollo senza
 501   connessione, per l'invio di dati a pacchetti. Contrariamente al TCP il
 502   protocollo non è affidabile e non c'è garanzia che i pacchetti raggiungano
 503   la loro destinazione, si perdano, vengano duplicati, o abbiano un
 504   particolare ordine di arrivo.
 505 \item[\textsl{ICMP}] \textit{Internet Control Message Protocol}. È il
 506   protocollo usato a livello 2 per gestire gli errori e trasportare le
 507   informazioni di controllo fra stazioni remote e instradatori (cioè fra
 508   \textit{host} e \textit{router}). I messaggi sono normalmente generati dal
 509   software del kernel che gestisce la comunicazione TCP/IP, anche se ICMP può
 510   venire usato direttamente da alcuni programmi come \cmd{ping}. A volte ci
 511   si riferisce ad esso come ICPMv4 per distinguerlo da ICMPv6.
 512 \item[\textsl{IGMP}] \textit{Internet Group Management Protocol}. É un
 513   protocollo di livello 2 usato per il \textit{multicast} (vedi
 514   sez.~\ref{sec:xxx_multicast}).  Permette alle stazioni remote di notificare
 515   ai router che supportano questa comunicazione a quale gruppo esse
 516   appartengono.  Come ICMP viene implementato direttamente sopra IP.
 517 \item[\textsl{ARP}] \textit{Address Resolution Protocol}. È il protocollo che
 518   mappa un indirizzo IP in un indirizzo hardware sulla rete locale. È usato in
 519   reti di tipo \textit{broadcast} come Ethernet, Token Ring o FDDI che hanno
 520   associato un indirizzo fisico (il \textit{MAC address}) alla interfaccia, ma
 521   non serve in connessioni punto-punto.
 522 \item[\textsl{RARP}] \textit{Reverse Address Resolution Protocol}. È il
 523   protocollo che esegue l'operazione inversa rispetto ad ARP (da cui il nome)
 524   mappando un indirizzo hardware in un indirizzo IP. Viene usato a volte per
 525   durante l'avvio per assegnare un indirizzo IP ad una macchina.
 526 \item[\textsl{ICMPv6}] \textit{Internet Control Message Protocol, version 6}.
 527   Combina per IPv6 le funzionalità di ICMPv4, IGMP e ARP.
 528 \item[\textsl{EGP}] \textit{Exterior Gateway Protocol}. È un protocollo di
 529   routing usato per comunicare lo stato fra gateway vicini a livello di
 530   \textsl{sistemi autonomi} (vengono chiamati \textit{autonomous
 531       systems} i raggruppamenti al livello più alto della rete), con
 532   meccanismi che permettono di identificare i vicini, controllarne la
 533   raggiungibilità e scambiare informazioni sullo stato della rete. Viene
 534   implementato direttamente sopra IP.
 535 \item[\textsl{OSPF}] \textit{Open Shortest Path First}. È in protocollo di
 536   routing per router su reti interne, che permette a questi ultimi di
 537   scambiarsi informazioni sullo stato delle connessioni e dei legami che
 538   ciascuno ha con gli altri. Viene implementato direttamente sopra IP.
 539 \item[\textsl{GRE}] \textit{Generic Routing Encapsulation}. È un protocollo
 540   generico di incapsulamento che permette di incapsulare un qualunque altro
 541   protocollo all'interno di IP.
 542 \item[\textsl{AH}] \textit{Authentication Header}. Provvede l'autenticazione
 543   dell'integrità e dell'origine di un pacchetto. È una opzione nativa in IPv6
 544   e viene implementato come protocollo a sé su IPv4. Fa parte della suite di
 545   IPSEC che provvede la trasmissione cifrata ed autenticata a livello IP.
 546 \item[\textsl{ESP}] \textit{Encapsulating Security Payload}. Provvede la
 547   cifratura insieme all'autenticazione dell'integrità e dell'origine di un
 548   pacchetto. Come per AH è opzione nativa in IPv6 e viene implementato come
 549   protocollo a sé su IPv4.
 550 \item[\textsl{PPP}] \textit{Point-to-Point Protocol}. È un protocollo a
 551   livello 1 progettato per lo scambio di pacchetti su connessioni punto punto.
 552   Viene usato per configurare i collegamenti, definire i protocolli di rete
 553   usati ed incapsulare i pacchetti di dati. È un protocollo complesso con
 554   varie componenti.
 555 \item[\textsl{SLIP}] \textit{Serial Line over IP}. È un protocollo di livello
 556   1 che permette di trasmettere un pacchetto IP attraverso una linea seriale.
 557 \end{basedescript}
 558
 559 Gran parte delle applicazioni comunicano usando TCP o UDP, solo alcune, e per
 560 scopi particolari si rifanno direttamente ad IP (ed i suoi correlati ICMP e
 561 IGMP); benché sia TCP che UDP siano basati su IP e sia possibile intervenire a
 562 questo livello con i \textit{raw socket} questa tecnica è molto meno diffusa e
 563 a parte applicazioni particolari si preferisce sempre usare i servizi messi a
 564 disposizione dai due protocolli precedenti.  Per questo, motivo a parte alcuni
 565 brevi accenni su IP in questa sezione, ci concentreremo sul livello di
 566 trasporto.
 567
 568 \subsection{Internet Protocol (IP)}
 569 \label{sec:net_ip}
 570
 571 Quando si parla di IP ci si riferisce in genere alla versione attualmente in
 572 uso che è la versione 4 (e viene pertanto chiamato IPv4). Questa versione
 573 venne standardizzata nel 1981
 574 dall'\href{http://www.ietf.org/rfc/rfc0719.txt}{RFC~719}.
 575
 576 Internet Protocol nasce per disaccoppiare le applicazioni della struttura
 577 hardware delle reti di trasmissione, e creare una interfaccia di trasmissione
 578 dei dati indipendente dal sottostante substrato di rete, che può essere
 579 realizzato con le tecnologie più disparate (Ethernet, Token Ring, FDDI, ecc.).
 580 Il compito di IP è pertanto quello di trasmettere i pacchetti da un computer
 581 all'altro della rete; le caratteristiche essenziali con cui questo viene
 582 realizzato in IPv4 sono due:
 583
 584 \begin{itemize}
 585 \item \textit{Universal addressing} la comunicazione avviene fra due stazioni
 586   remote identificate univocamente con un indirizzo a 32 bit che può
 587   appartenere ad una sola interfaccia di rete.
 588 \item \textit{Best effort} viene assicurato il massimo impegno nella
 589   trasmissione, ma non c'è nessuna garanzia per i livelli superiori né sulla
 590   percentuale di successo né sul tempo di consegna dei pacchetti di dati.
 591 \end{itemize}
 592
 593 Negli anni '90 la crescita vertiginosa del numero di macchine connesse a
 594 Internet ha iniziato a far emergere i vari limiti di IPv4, per risolverne i
 595 problemi si è perciò definita una nuova versione del protocollo, che (saltando
 596 un numero) è diventata la versione 6. IPv6 nasce quindi come evoluzione di
 597 IPv4, mantenendone inalterate le funzioni che si sono dimostrate valide,
 598 eliminando quelle inutili e aggiungendone poche altre per mantenere il
 599 protocollo il più snello e veloce possibile.
 600
 601 I cambiamenti apportati sono comunque notevoli e si possono essere riassunti a
 602 grandi linee nei seguenti punti:
 603 \begin{itemize}
 604 \item l'espansione delle capacità di indirizzamento e instradamento, per
 605   supportare una gerarchia con più livelli di indirizzamento, un numero di
 606   nodi indirizzabili molto maggiore e una auto-configurazione degli indirizzi.
 607 \item l'introduzione un nuovo tipo di indirizzamento, l'\textit{anycast} che
 608   si aggiunge agli usuali \textit{unicast} e \textit{multicast}.
 609 \item la semplificazione del formato dell'intestazione (\textit{header}) dei
 610   pacchetti, eliminando o rendendo opzionali alcuni dei campi di IPv4, per
 611   eliminare la necessità di rielaborazione della stessa da parte dei router e
 612   contenere l'aumento di dimensione dovuto all'ampliamento degli indirizzi.
 613 \item un supporto per le opzioni migliorato, per garantire una trasmissione
 614   più efficiente del traffico normale, limiti meno stringenti sulle dimensioni
 615   delle opzioni, e la flessibilità necessaria per introdurne di nuove in
 616   futuro.
 617 \item il supporto per delle capacità di \textsl{qualità di servizio} (QoS) che
 618   permettano di identificare gruppi di dati per i quali si può provvedere un
 619   trattamento speciale (in vista dell'uso di Internet per applicazioni
 620   multimediali e/o ``real-time'').
 621 \end{itemize}
 622
 623 Maggiori dettagli riguardo a caratteristiche, notazioni e funzionamento del
 624 protocollo IP sono forniti nell'appendice sez.~\ref{sec:ip_protocol}.
 625
 626
 627 \subsection{User Datagram Protocol (UDP)}
 628 \label{sec:net_udp}
 629
 630 Il protocollo UDP è un protocollo di trasporto molto semplice; la sua
 631 descrizione completa è contenuta
 632 dell'\href{http://www.ietf.org/rfc/rfc0768.txt}{RFC~768}, ma in sostanza esso
 633 è una semplice interfaccia al protocollo IP dal livello di trasporto. Quando
 634 un'applicazione usa UDP essa scrive un pacchetto di dati (il cosiddetto
 635 \textit{datagram} che da il nome al protocollo) su un socket, al pacchetto
 636 viene aggiunto un header molto semplice (per una descrizione più accurata vedi
 637 sez.~\ref{sec:udp_protocol}), e poi viene passato al livello superiore (IPv4 o
 638 IPv6 che sia) che lo spedisce verso la destinazione.  Dato che né IPv4 né IPv6
 639 garantiscono l'affidabilità niente assicura che il pacchetto arrivi a
 640 destinazione, né che più pacchetti arrivino nello stesso ordine in cui sono
 641 stati spediti.
 642
 643 Pertanto il problema principale che si affronta quando si usa UDP è la
 644 mancanza di affidabilità, se si vuole essere sicuri che i pacchetti arrivino a
 645 destinazione occorrerà provvedere con l'applicazione, all'interno della quale
 646 si dovrà inserire tutto quanto necessario a gestire la notifica di
 647 ricevimento, la ritrasmissione, il timeout.
 648
 649 Si tenga conto poi che in UDP niente garantisce che i pacchetti arrivino nello
 650 stesso ordine in cui sono stati trasmessi, e può anche accadere che i
 651 pacchetti vengano duplicati nella trasmissione, e non solo perduti. Di tutto
 652 questo di nuovo deve tenere conto l'applicazione.
 653
 654 Un altro aspetto di UDP è che se un pacchetto raggiunge correttamente la
 655 destinazione esso viene passato all'applicazione ricevente in tutta la sua
 656 lunghezza, la trasmissione avviene perciò per \textit{record} la cui lunghezza
 657 viene anche essa trasmessa all'applicazione all'atto del ricevimento.
 658
 659 Infine UDP è un protocollo che opera senza connessione
 660 (\textit{connectionless}) in quanto non è necessario stabilire nessun tipo di
 661 relazione tra origine e destinazione dei pacchetti. Si hanno così situazioni
 662 in cui un client può scrivere su uno stesso socket pacchetti destinati a
 663 server diversi, o un server ricevere su un socket pacchetti provenienti da
 664 client diversi.  Il modo più semplice di immaginarsi il funzionamento di UDP è
 665 quello della radio, in cui si può \textsl{trasmettere} e \textsl{ricevere} da
 666 più stazioni usando la stessa frequenza.
 667
 668 Nonostante gli evidenti svantaggi comportati dall'inaffidabilità UDP ha il
 669 grande pregio della velocità, che in certi casi è essenziale; inoltre si
 670 presta bene per le applicazioni in cui la connessione non è necessaria, e
 671 costituirebbe solo un peso in termini di prestazioni, mentre una perdita di
 672 pacchetti può essere tollerata: ad esempio le applicazioni di streaming e
 673 quelle che usano il \textit{multicast}.
 674
 675 \subsection{Transport Control Protocol (TCP)}
 676 \label{sec:net_tcp}
 677
 678 Il TCP è un protocollo molto complesso, definito
 679 nell'\href{http://www.ietf.org/rfc/rfc0739.txt}{RFC~739} e completamente
 680 diverso da UDP; alla base della sua progettazione infatti non stanno
 681 semplicità e velocità, ma la ricerca della massima affidabilità possibile
 682 nella trasmissione dei dati.
 683
 684 La prima differenza con UDP è che TCP provvede sempre una connessione diretta
 685 fra un client e un server, attraverso la quale essi possono comunicare; per
 686 questo il paragone più appropriato per questo protocollo è quello del
 687 collegamento telefonico, in quanto prima viene stabilita una connessione fra
 688 due i due capi della comunicazione su cui poi effettuare quest'ultima.
 689
 690 Caratteristica fondamentale di TCP è l'affidabilità; quando i dati vengono
 691 inviati attraverso una connessione ne viene richiesto un ``\textsl{ricevuto}''
 692 (il cosiddetto \textit{acknowlegment}), se questo non arriva essi verranno
 693 ritrasmessi per un determinato numero di tentativi, intervallati da un periodo
 694 di tempo crescente, fino a che sarà considerata fallita o caduta la
 695 connessione (e sarà generato un errore di \textit{timeout}); il periodo di
 696 tempo dipende dall'implementazione e può variare far i quattro e i dieci
 697 minuti.
 698
 699 Inoltre, per tenere conto delle diverse condizioni in cui può trovarsi la
 700 linea di comunicazione, TCP comprende anche un algoritmo di calcolo dinamico
 701 del tempo di andata e ritorno dei pacchetti fra un client e un server (il
 702 cosiddetto RTT, \textit{Round Trip Time}), che lo rende in grado di adattarsi
 703 alle condizioni della rete per non generare inutili ritrasmissioni o cadere
 704 facilmente in timeout.
 705
 706 Inoltre TCP è in grado di preservare l'ordine dei dati assegnando un numero di
 707 sequenza ad ogni byte che trasmette. Ad esempio se un'applicazione scrive 3000
 708 byte su un socket TCP, questi potranno essere spezzati dal protocollo in due
 709 segmenti (le unità di dati passate da TCP a IP vengono chiamate
 710 \textit{segment}) di 1500 byte, di cui il primo conterrà il numero di sequenza
 711 $1-1500$ e il secondo il numero $1501-3000$. In questo modo anche se i
 712 segmenti arrivano a destinazione in un ordine diverso, o se alcuni arrivano
 713 più volte a causa di ritrasmissioni dovute alla perdita degli
 714 \textit{acknowlegment}, all'arrivo sarà comunque possibile riordinare i dati e
 715 scartare i duplicati.
 716
 717 \itindbeg{advertised~window}
 718
 719 Il protocollo provvede anche un controllo di flusso (\textit{flow control}),
 720 cioè specifica sempre all'altro capo della trasmissione quanti dati può
 721 ricevere tramite una \textit{advertised window} (letteralmente
 722 ``\textsl{finestra annunciata}''), che indica lo spazio disponibile nel buffer
 723 di ricezione, cosicché nella trasmissione non vengano inviati più dati di
 724 quelli che possono essere ricevuti.
 725
 726 Questa finestra cambia dinamicamente diminuendo con la ricezione dei dati dal
 727 socket ed aumentando con la lettura di quest'ultimo da parte
 728 dell'applicazione, se diventa nulla il buffer di ricezione è pieno e non
 729 verranno accettati altri dati.  Si noti che UDP non provvede niente di tutto
 730 ciò per cui nulla impedisce che vengano trasmessi pacchetti ad un ritmo che il
 731 ricevente non può sostenere.
 732
 733 \itindend{advertised~window}
 734
 735 Infine attraverso TCP la trasmissione è sempre bidirezionale (in inglese si
 736 dice che è \textit{full-duplex}). È cioè possibile sia trasmettere che
 737 ricevere allo stesso tempo, il che comporta che quanto dicevamo a proposito
 738 del controllo di flusso e della gestione della sequenzialità dei dati viene
 739 effettuato per entrambe le direzioni di comunicazione.
 740
 741 % TODO mettere riferimento alla appendice su TCP quando ci sarà
 742 %% Una descrizione più accurata del protocollo è fornita in appendice
 743 %% sez.~\ref{sec:tcp_protocol}.
 744
 745 \subsection{Limiti e dimensioni riguardanti la trasmissione dei dati}
 746 \label{sec:net_lim_dim}
 747
 748 Un aspetto di cui bisogna tenere conto nella programmazione di rete, e che
 749 ritornerà in seguito, quando tratteremo gli aspetti più avanzati, è che ci sono
 750 una serie di limiti a cui la trasmissione dei dati attraverso i vari livelli
 751 del protocollo deve sottostare; limiti che è opportuno tenere presente perché
 752 in certi casi si possono avere delle conseguenze sul comportamento delle
 753 applicazioni.
 754
 755 Un elenco di questi limiti, insieme ad un breve accenno alle loro origini ed
 756 alle eventuali implicazioni che possono avere, è il seguente:
 757 \begin{itemize}
 758 \item La dimensione massima di un pacchetto IP è di 65535 byte, compresa
 759   l'intestazione. Questo è dovuto al fatto che la dimensione è indicata da un
 760   campo apposito nell'header di IP che è lungo 16 bit (vedi
 761   fig.~\ref{fig:IP_ipv4_head}).
 762 \item La dimensione massima di un pacchetto normale di IPv6 è di 65575 byte;
 763   il campo apposito nell'header infatti è sempre a 16 bit, ma la dimensione
 764   dell'header è fissa e di 40 byte e non è compresa nel valore indicato dal
 765   suddetto campo. Inoltre IPv6 ha la possibilità di estendere la dimensione di
 766   un pacchetto usando la \textit{jumbo payload option}.
 767 \itindbeg{Maximum~Transfer~Unit~(MTU)}
 768 \item Molte reti fisiche hanno una MTU (\textit{Maximum Transfer Unit}) che
 769   dipende dal protocollo specifico usato al livello di connessione fisica. Il
 770   più comune è quello di ethernet che è pari a 1500 byte, una serie di altri
 771   valori possibili sono riportati in tab.~\ref{tab:net_mtu_values}.
 772 \end{itemize}
 773
 774 Quando un pacchetto IP viene inviato su una interfaccia di rete e le sue
 775 dimensioni eccedono la MTU viene eseguita la cosiddetta
 776 \textit{frammentazione}, i pacchetti cioè vengono suddivisi in blocchi più
 777 piccoli che possono essere trasmessi attraverso l'interfaccia.\footnote{questo
 778   accade sia per IPv4 che per IPv6, anche se i pacchetti frammentati sono
 779   gestiti con modalità diverse, IPv4 usa un flag nell'header, IPv6 una
 780   opportuna opzione, si veda sez.~\ref{sec:ipv6_protocol}.}
 781
 782 \begin{table}[!htb]
 783   \centering
 784   \begin{tabular}[c]{|l|c|}
 785     \hline
 786     \textbf{Rete} & \textbf{MTU} \\
 787     \hline
 788     \hline
 789     Hyperlink & 65535 \\
 790     Token Ring IBM (16 Mbit/sec) & 17914 \\
 791     Token Ring IEEE 802.5 (4 Mbit/sec) & 4464 \\
 792     FDDI & 4532 \\
 793     Ethernet & 1500 \\
 794     X.25 & 576 \\
 795     \hline
 796   \end{tabular}
 797   \caption{Valori della MTU (\textit{Maximum Transfer Unit}) per una serie di
 798     diverse tecnologie di rete.}
 799   \label{tab:net_mtu_values}
 800 \end{table}
 801
 802 %TODO aggiornare la tabella con dati più recenti
 803
 804 \itindbeg{Path~MTU}
 805
 806 La MTU più piccola fra due stazioni viene in genere chiamata \textit{path
 807   MTU}, che dice qual è la lunghezza massima oltre la quale un pacchetto
 808 inviato da una stazione ad un'altra verrebbe senz'altro frammentato. Si tenga
 809 conto che non è affatto detto che la \textit{path MTU} sia la stessa in
 810 entrambe le direzioni, perché l'instradamento può essere diverso nei due
 811 sensi, con diverse tipologie di rete coinvolte.
 812
 813 Una delle differenze fra IPv4 e IPv6 é che per IPv6 la frammentazione può
 814 essere eseguita solo alla sorgente, questo vuol dire che i router IPv6 non
 815 frammentano i pacchetti che ritrasmettono (anche se possono frammentare i
 816 pacchetti che generano loro stessi), al contrario di quanto fanno i router
 817 IPv4. In ogni caso una volta frammentati i pacchetti possono essere
 818 riassemblati solo alla destinazione.
 819
 820 Nell'header di IPv4 è previsto il flag \texttt{DF} che specifica che il
 821 pacchetto non deve essere frammentato; un router che riceva un pacchetto le
 822 cui dimensioni eccedano quelle dell'MTU della rete di destinazione genererà un
 823 messaggio di errore ICMPv4 di tipo \textit{destination unreachable,
 824   fragmentation needed but DF bit set}.  Dato che i router IPv6 non possono
 825 effettuare la frammentazione la ricezione di un pacchetto di dimensione
 826 eccessiva per la ritrasmissione genererà sempre un messaggio di errore ICMPv6
 827 di tipo \textit{packet too big}.
 828
 829 Dato che il meccanismo di frammentazione e riassemblaggio dei pacchetti
 830 comporta inefficienza, normalmente viene utilizzato un procedimento, detto
 831 \textit{path MTU discovery} che permette di determinare il \textit{path MTU}
 832 fra due stazioni; per la realizzazione del procedimento si usa il flag
 833 \texttt{DF} di IPv4 e il comportamento normale di IPv6 inviando delle
 834 opportune serie di pacchetti (per i dettagli vedere
 835 l'\href{http://www.ietf.org/rfc/rfc1191.txt}{RFC~1191} per IPv4 e
 836 l'\href{http://www.ietf.org/rfc/rfc1981.txt}{RFC~1981} per IPv6) fintanto che
 837 non si hanno più errori.
 838
 839 Il TCP usa sempre questo meccanismo, che per le implementazioni di IPv4 è
 840 opzionale, mentre diventa obbligatorio per IPv6.  Per IPv6 infatti, non
 841 potendo i router frammentare i pacchetti, è necessario, per poter comunicare,
 842 conoscere da subito il \textit{path MTU}.
 843
 844 \itindend{Path~MTU}
 845
 846 Infine il TCP definisce una \textit{Maximum Segment Size} o MSS (vedi
 847 sez.~\ref{sec:tcp_protocol}) che annuncia all'altro capo della connessione la
 848 dimensione massima del segmento di dati che può essere ricevuto, così da
 849 evitare la frammentazione. Di norma viene impostato alla dimensione della MTU
 850 dell'interfaccia meno la lunghezza delle intestazioni di IP e TCP, in Linux il
 851 default, mantenuto nella costante \constd{TCP\_MSS} è 512.
 852
 853 \itindend{Maximum~Transfer~Unit~(MTU)}
 854
 855
 856 %%% Local Variables:
 857 %%% mode: latex
 858 %%% TeX-master: "gapil"
 859 %%% End:
 860
 861 % LocalWords:  TCP multitasking client ftp telnet ssh cap thread peer to three
 862 % LocalWords:  Napster routing tier two middle International Standards Systems
 863 % LocalWords:  Organization Interconnection tab Application Presentation All of
 864 % LocalWords:  Session Transport DataLink Physical people seem need processing
 865 % LocalWords:  fig upper layer lower kernel DoD Department Defense Connection
 866 % LocalWords:  sez UDP ICMP IGMP device Trasmission Control Protocol l'IP l'UDP
 867 % LocalWords:  IPv ethernet SMTP RFC Request For Comment socket stack PPP ARP
 868 % LocalWords:  router instradatori version RARP anycast Di
 869 % LocalWords:  l'acknoweledgment Datagram Message host ping ICPMv ICMPv Group
 870 % LocalWords:  multicast Address Resolution broadcast Token FDDI MAC address DF
 871 % LocalWords:  Reverse EGP Exterior Gateway gateway autonomous systems OSPF GRE
 872 % LocalWords:  Shortest Path First Generic Encapsulation Authentication Header
 873 % LocalWords:  IPSEC ESP Encapsulating Security Payload Point Line over raw QoS
 874 % LocalWords:  dall' Universal addressing Best effort unicast header dell' RTT
 875 % LocalWords:  datagram connectionless streaming nell' acknowlegment trip flow
 876 % LocalWords:  segment control advertised window nell'header dell'header option
 877 % LocalWords:  payload MTU Transfer Unit Hyperlink IBM Mbit sec IEEE path but
 878 % LocalWords:  dell'MTU destination unreachable fragmentation needed packet too
 879 % LocalWords:  big discovery MSS Size