socket.tex

   1 %% socket.tex
   2 %%
   3 %% Copyright (C) 2000-2006 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11 \chapter{Introduzione ai socket}
  12 \label{cha:socket_intro}
  13
  14 In questo capitolo inizieremo a spiegare le caratteristiche salienti della
  15 principale interfaccia per la programmazione di rete, quella dei
  16 \textit{socket}, che, pur essendo nata in ambiente Unix, è usata ormai da
  17 tutti i sistemi operativi.
  18
  19 Dopo una breve panoramica sulle caratteristiche di questa interfaccia vedremo
  20 come creare un socket e come collegarlo allo specifico protocollo di rete che
  21 si utilizzerà per la comunicazione. Per evitare un'introduzione puramente
  22 teorica concluderemo il capitolo con un primo esempio di applicazione.
  23
  24 \section{Una panoramica}
  25 \label{sec:sock_overview}
  26
  27 Iniziamo con una descrizione essenziale di cosa sono i \textit{socket} e di
  28 quali sono i concetti fondamentali da tenere presente quando si ha a che fare
  29 con essi.
  30
  31 \index{socket!definizione|(}
  32
  33 \subsection{I \textit{socket}}
  34 \label{sec:sock_socket_def}
  35
  36 I \textit{socket}\footnote{una traduzione letterale potrebbe essere
  37   \textsl{presa}, ma essendo universalmente noti come \textit{socket}
  38   utilizzeremo sempre la parola inglese.} sono uno dei principali meccanismi
  39 di comunicazione utilizzato in ambito Unix, e li abbiamo brevemente incontrati
  40 in sez.~\ref{sec:ipc_socketpair}, fra i vari meccanismi di intercomunicazione
  41 fra processi. Un socket costituisce in sostanza un canale di comunicazione fra
  42 due processi su cui si possono leggere e scrivere dati analogo a quello di una
  43 pipe (vedi sez.~\ref{sec:ipc_pipes}) ma, a differenza di questa e degli altri
  44 meccanismi esaminati nel capitolo cap.~\ref{cha:IPC}, i socket non sono
  45 limitati alla comunicazione fra processi che girano sulla stessa macchina, ma
  46 possono realizzare la comunicazione anche attraverso la rete.
  47
  48 Quella dei socket costituisce infatti la principale interfaccia usata nella
  49 programmazione di rete.  La loro origine risale al 1983, quando furono
  50 introdotti in BSD 4.2; l'interfaccia è rimasta sostanzialmente la stessa, con
  51 piccole modifiche, negli anni successivi. Benché siano state sviluppate
  52 interfacce alternative, originate dai sistemi SVr4 come la XTI (\textit{X/Open
  53   Transport Interface}) nessuna ha mai raggiunto la diffusione e la popolarità
  54 di quella dei socket (né tantomeno la stessa usabilità e flessibilità).
  55
  56 La flessibilità e la genericità dell'interfaccia inoltre consente di
  57 utilizzare i socket con i più disparati meccanismi di comunicazione, e non
  58 solo con l'insieme dei protocolli TCP/IP, anche se questa sarà comunque quella
  59 di cui tratteremo in maniera più estesa.
  60
  61
  62 \subsection{Concetti base}
  63 \label{sec:sock_gen}
  64
  65 Per capire il funzionamento dei socket occorre avere presente il funzionamento
  66 dei protocolli di rete (vedi cap.~\ref{cha:network}), ma l'interfaccia è del
  67 tutto generale e benché le problematiche (e quindi le modalità di risolvere i
  68 problemi) siano diverse a seconda del tipo di protocollo di comunicazione
  69 usato, le funzioni da usare restano le stesse.
  70
  71 Per questo motivo una semplice descrizione dell'interfaccia è assolutamente
  72 inutile, in quanto il comportamento di quest'ultima e le problematiche da
  73 affrontare cambiano radicalmente a seconda dello \textsl{stile} di
  74 comunicazione usato.  La scelta di questo stile va infatti ad incidere sulla
  75 semantica che verrà utilizzata a livello utente per gestire la comunicazione
  76 (su come inviare e ricevere i dati) e sul comportamento effettivo delle
  77 funzioni utilizzate.
  78
  79 La scelta di uno stile dipende sia dai meccanismi disponibili, sia dal tipo di
  80 comunicazione che si vuole effettuare. Ad esempio alcuni stili di
  81 comunicazione considerano i dati come una sequenza continua di byte, in quello
  82 che viene chiamato un \textsl{flusso} (in inglese \textit{stream}), mentre
  83 altri invece li raggruppano in \textsl{pacchetti} (in inglese
  84 \textit{datagram}) che vengono inviati in blocchi separati.
  85
  86 Un altro esempio di stile concerne la possibilità che la comunicazione possa o
  87 meno perdere dati, possa o meno non rispettare l'ordine in cui essi non sono
  88 inviati, o inviare dei pacchetti più volte (come nel caso di TCP e UDP).
  89
  90 Un terzo esempio di stile di comunicazione concerne le modalità in cui essa
  91 avviene, in certi casi essa può essere condotta con una connessione diretta
  92 con un solo corrispondente, come per una telefonata; altri casi possono
  93 prevedere una comunicazione come per lettera, in cui si scrive l'indirizzo su
  94 ogni pacchetto, altri ancora una comunicazione \itindex{broadcast}
  95 \textit{broadcast} come per la radio, in cui i pacchetti vengono emessi su
  96 appositi ``\textsl{canali}'' dove chiunque si collega possa riceverli.
  97
  98 É chiaro che ciascuno di questi stili comporta una modalità diversa di gestire
  99 la comunicazione, ad esempio se è inaffidabile occorrerà essere in grado di
 100 gestire la perdita o il rimescolamento dei dati, se è a pacchetti questi
 101 dovranno essere opportunamente trattati, ecc.
 102
 103
 104 \section{La creazione di un socket}
 105 \label{sec:sock_creation}
 106
 107 Come accennato l'interfaccia dei socket è estremamente flessibile e permette
 108 di interagire con protocolli di comunicazione anche molto diversi fra di loro;
 109 in questa sezione vedremo come è possibile creare un socket e come specificare
 110 il tipo di comunicazione che esso deve utilizzare.
 111
 112 \subsection{La funzione \func{socket}}
 113 \label{sec:sock_socket}
 114
 115 La creazione di un socket avviene attraverso l'uso della funzione
 116 \funcd{socket}; essa restituisce un \textit{file descriptor}\footnote{del
 117   tutto analogo a quelli che si ottengono per i file di dati e le pipe,
 118   descritti in sez.~\ref{sec:file_fd}.} che serve come riferimento al socket;
 119 il suo prototipo è:
 120 \begin{prototype}{sys/socket.h}{int socket(int domain, int type, int protocol)}
 121
 122   Apre un socket.
 123
 124   \bodydesc{La funzione restituisce un intero positivo in caso di successo, e
 125     -1 in caso di fallimento, nel qual caso la variabile \var{errno} assumerà
 126   i valori:
 127   \begin{errlist}
 128   \item[\errcode{EPROTONOSUPPORT}] Il tipo di socket o il protocollo scelto non
 129     sono supportati nel dominio.
 130   \item[\errcode{ENFILE}] Il kernel non ha memoria sufficiente a creare una
 131     nuova struttura per il socket.
 132   \item[\errcode{EMFILE}] Si è ecceduta la tabella dei file.
 133   \item[\errcode{EACCES}] Non si hanno privilegi per creare un socket nel
 134     dominio o con il protocollo specificato.
 135   \item[\errcode{EINVAL}] Protocollo sconosciuto o dominio non disponibile.
 136   \item[\errcode{ENOBUFS}] Non c'è sufficiente memoria per creare il socket
 137     (può essere anche \errval{ENOMEM}).
 138   \end{errlist}
 139   inoltre, a seconda del protocollo usato, potranno essere generati altri
 140   errori, che sono riportati nelle relative pagine di manuale.}
 141 \end{prototype}
 142
 143 La funzione ha tre argomenti, \param{domain} specifica il dominio del socket
 144 (definisce cioè, come vedremo in sez.~\ref{sec:sock_domain}, la famiglia di
 145 protocolli usata), \param{type} specifica il tipo di socket (definisce cioè,
 146 come vedremo in sez.~\ref{sec:sock_type}, lo stile di comunicazione) e
 147 \param{protocol} il protocollo; in genere quest'ultimo è indicato
 148 implicitamente dal tipo di socket, per cui di norma questo valore viene messo
 149 a zero (con l'eccezione dei \textit{raw socket}).
 150
 151 Si noti che la creazione del socket si limita ad allocare le opportune
 152 strutture nel kernel (sostanzialmente una voce nella \textit{file table}) e
 153 non comporta nulla riguardo all'indicazione degli indirizzi remoti o locali
 154 attraverso i quali si vuole effettuare la comunicazione.
 155
 156 \subsection{Il dominio dei socket}
 157 \label{sec:sock_domain}
 158
 159 Dati i tanti e diversi protocolli di comunicazione disponibili, esistono vari
 160 tipi di socket, che vengono classificati raggruppandoli in quelli che si
 161 chiamano \textsl{domini}.  La scelta di un dominio equivale in sostanza alla
 162 scelta di una famiglia di protocolli, e viene effettuata attraverso
 163 l'argomento \param{domain} della funzione \func{socket}. Ciascun dominio ha un
 164 suo nome simbolico che convenzionalmente è indicato da una costante che inizia
 165 per \texttt{PF\_}, sigla che sta per \textit{protocol family}, altro nome con
 166 cui si indicano i domini.
 167
 168 A ciascun tipo di dominio corrisponde un analogo nome simbolico, anch'esso
 169 associato ad una costante, che inizia invece per \texttt{AF\_} (da
 170 \textit{address family}) che identifica il formato degli indirizzi usati in
 171 quel dominio. Le pagine di manuale di Linux si riferiscono a questi indirizzi
 172 anche come \textit{name space},\footnote{nome che invece il manuale delle
 173   \acr{glibc} riserva a quello che noi abbiamo chiamato domini.} dato che
 174 identificano il formato degli indirizzi usati in quel dominio per identificare
 175 i capi della comunicazione.
 176
 177 \begin{table}[htb]
 178   \footnotesize
 179   \centering
 180   \begin{tabular}[c]{|l|l|l|l|}
 181        \hline
 182        \textbf{Nome}&\textbf{Valore}&\textbf{Utilizzo}&\textbf{Man page} \\
 183        \hline
 184        \hline
 185        \const{PF\_UNSPEC}   & 0& Non specificato               &            \\
 186        \const{PF\_LOCAL}    & 1& Local communication           & unix(7)    \\
 187        \const{PF\_UNIX}, \const{PF\_FILE}&1&Sinonimi di \const{PF\_LOCAL}& \\
 188        \const{PF\_INET}     & 2& IPv4 Internet protocols       & ip(7)      \\
 189        \const{PF\_AX25}     & 3& Amateur radio AX.25 protocol  &            \\
 190        \const{PF\_IPX}      & 4& IPX - Novell protocols        &            \\
 191        \const{PF\_APPLETALK}& 5& Appletalk                     & ddp(7)     \\
 192        \const{PF\_NETROM}   & 6& Amateur radio NetROM          &            \\
 193        \const{PF\_BRIDGE}   & 7& Multiprotocol bridge          &            \\
 194        \const{PF\_ATMPVC}   & 8& Access to raw ATM PVCs        &            \\
 195        \const{PF\_X25}      & 9& ITU-T X.25 / ISO-8208 protocol& x25(7)     \\
 196        \const{PF\_INET6}    &10& IPv6 Internet protocols       & ipv6(7)    \\
 197        \const{PF\_ROSE}     &11& Amateur Radio X.25 PLP        &            \\
 198        \const{PF\_DECnet}   &12& Reserved for DECnet project   &            \\
 199        \const{PF\_NETBEUI}  &13& Reserved for 802.2LLC project &            \\
 200        \const{PF\_SECURITY} &14& Security callback pseudo AF   &            \\
 201        \const{PF\_KEY}      &15& PF\_KEY key management API    &            \\
 202        \const{PF\_NETLINK}  &16& Kernel user interface device  & netlink(7) \\
 203        \const{PF\_ROUTE}    &16& Sinonimo di \const{PF\_NETLINK} emula BSD.&\\
 204        \const{PF\_PACKET}   &17& Low level packet interface    & packet(7)  \\
 205        \const{PF\_ASH}      &18& Ash                           &    \\
 206        \const{PF\_ECONET}   &19& Acorn Econet                  &    \\
 207        \const{PF\_ATMSVC}   &20& ATM SVCs                      &    \\
 208        \const{PF\_SNA}      &22& Linux SNA Project             &    \\
 209        \const{PF\_IRDA}     &23& IRDA socket                   &    \\
 210        \const{PF\_PPPOX}    &24& PPPoX socket                  &    \\
 211        \const{PF\_WANPIPE}  &25& Wanpipe API socket            &    \\
 212        \const{PF\_LLC}      &26& Linux LLC                     &    \\
 213        \const{PF\_BLUETOOTH}&31& Bluetooth socket              &    \\
 214        \hline
 215   \end{tabular}
 216   \caption{Famiglie di protocolli definiti in Linux.}
 217   \label{tab:net_pf_names}
 218 \end{table}
 219
 220 L'idea alla base della distinzione fra questi due insiemi di costanti era che
 221 una famiglia di protocolli potesse supportare vari tipi di indirizzi, per cui
 222 il prefisso \texttt{PF\_} si sarebbe dovuto usare nella creazione dei socket e
 223 il prefisso \texttt{AF\_} in quello delle strutture degli indirizzi; questo è
 224 quanto specificato anche dallo standard POSIX.1g, ma non esistono a tuttora
 225 famiglie di protocolli che supportino diverse strutture di indirizzi, per cui
 226 nella pratica questi due nomi sono equivalenti e corrispondono agli stessi
 227 valori numerici.\footnote{in Linux, come si può verificare andando a guardare
 228   il contenuto di \file{bits/socket.h}, le costanti sono esattamente le stesse
 229   e ciascuna \texttt{AF\_} è definita alla corrispondente \texttt{PF\_} e con
 230   lo stesso nome.}
 231
 232 I domini (e i relativi nomi simbolici), così come i nomi delle famiglie di
 233 indirizzi, sono definiti dall'header \texttt{socket.h}. Un elenco delle
 234 famiglie di protocolli disponibili in Linux è riportato in
 235 tab.~\ref{tab:net_pf_names}.\footnote{l'elenco indica tutti i protocolli
 236   definiti; fra questi però saranno utilizzabili solo quelli per i quali si è
 237   compilato il supporto nel kernel (o si sono caricati gli opportuni moduli),
 238   viene definita anche una costante \const{PF\_MAX} che indica il valore
 239   massimo associabile ad un dominio (nel caso il suo valore 32).}
 240
 241 Si tenga presente che non tutte le famiglie di protocolli sono utilizzabili
 242 dall'utente generico, ad esempio in generale tutti i socket di tipo
 243 \const{SOCK\_RAW} possono essere creati solo da processi che hanno i privilegi
 244 di amministratore (cioè con user-ID effettivo uguale a zero) o dotati della
 245 \itindex{capabilities}\textit{capability} \const{CAP\_NET\_RAW}.
 246
 247
 248 \subsection{Il tipo di socket}
 249 \label{sec:sock_type}
 250
 251 La scelta di un dominio non comporta però la scelta dello stile di
 252 comunicazione, questo infatti viene a dipendere dal protocollo che si andrà ad
 253 utilizzare fra quelli disponibili nella famiglia scelta. L'interfaccia dei
 254 socket permette di scegliere lo stile di comunicazione indicando il tipo di
 255 socket con l'argomento \param{type} di \func{socket}. Linux mette a
 256 disposizione vari tipi di socket (che corrispondono a quelli che il manuale
 257 della \acr{glibc} \cite{glibc} chiama \textit{styles}) identificati dalle
 258 seguenti costanti:\footnote{le pagine di manuale POSIX riportano solo i primi
 259   tre tipi, Linux supporta anche gli altri, come si può verificare nel file
 260   \texttt{include/linux/net.h} dei sorgenti del kernel.}
 261
 262 \begin{basedescript}{\desclabelwidth{2.9cm}\desclabelstyle{\nextlinelabel}}
 263 \item[\const{SOCK\_STREAM}] Provvede un canale di trasmissione dati
 264   bidirezionale, sequenziale e affidabile. Opera su una connessione con un
 265   altro socket. I dati vengono ricevuti e trasmessi come un flusso continuo di
 266   byte (da cui il nome \textit{stream}) e possono essere letti in blocchi di
 267   dimensioni qualunque. Può supportare la trasmissione dei cosiddetti dati
 268   urgenti (o \itindex{out-of-band} \textit{out-of-band}, vedi
 269   sez.~\ref{sec:TCP_urgent_data}).
 270 \item[\const{SOCK\_DGRAM}] Viene usato per trasmettere pacchetti di dati
 271   (\textit{datagram}) di lunghezza massima prefissata, indirizzati
 272   singolarmente. Non esiste una connessione e la trasmissione è effettuata in
 273   maniera non affidabile.
 274 \item[\const{SOCK\_SEQPACKET}] Provvede un canale di trasmissione di dati
 275   bidirezionale, sequenziale e affidabile. Opera su una connessione con un
 276   altro socket. I dati possono vengono trasmessi per pacchetti di dimensione
 277   massima fissata, e devono essere letti integralmente da ciascuna chiamata a
 278   \func{read}.
 279 \item[\const{SOCK\_RAW}] Provvede l'accesso a basso livello ai protocolli di
 280   rete e alle varie interfacce. I normali programmi di comunicazione non
 281   devono usarlo, è riservato all'uso di sistema.
 282 \item[\const{SOCK\_RDM}] Provvede un canale di trasmissione di dati
 283   affidabile, ma in cui non è garantito l'ordine di arrivo dei pacchetti.
 284 \item[\const{SOCK\_PACKET}] Obsoleto, non deve essere più usato.\footnote{e
 285     pertanto non ne parleremo ulteriormente.}
 286 \end{basedescript}
 287
 288 Si tenga presente che non tutte le combinazioni fra una famiglia di protocolli
 289 e un tipo di socket sono valide, in quanto non è detto che in una famiglia
 290 esista un protocollo per ciascuno dei diversi stili di comunicazione appena
 291 elencati.
 292
 293 \begin{table}[htb]
 294   \footnotesize
 295   \centering
 296   \begin{tabular}{|l|c|c|c|c|c|}
 297     \hline
 298     \multicolumn{1}{|c|}{\textbf{Famiglia}}&
 299     \multicolumn{5}{|c|}{\textbf{Tipo}}\\
 300     \hline
 301     \hline
 302     &\const{SOCK\_STREAM} &\const{SOCK\_DGRAM}     &\const{SOCK\_RAW}&
 303       \const{SOCK\_RDM}&\const{SOCK\_SEQPACKET} \\
 304      \hline
 305     \const{PF\_LOCAL}     &  si & si  &      &     &     \\
 306      \hline
 307 %    \const{PF\_UNIX}&\multicolumn{5}{|l|}{sinonimo di \const{PF\_LOCAL}.}\\
 308 %     \hline
 309     \const{PF\_INET}      & TCP & UDP & IPv4 &     &     \\
 310      \hline
 311     \const{PF\_INET6}     & TCP & UDP & IPv6 &     &     \\
 312      \hline
 313     \const{PF\_IPX}       &     &     &      &     &     \\
 314      \hline
 315     \const{PF\_NETLINK}   &     &  si &  si  &     &     \\
 316      \hline
 317     \const{PF\_X25}       &     &     &      &     &  si \\
 318      \hline
 319     \const{PF\_AX25}      &     &     &      &     &     \\
 320      \hline
 321     \const{PF\_ATMPVC}    &     &     &      &     &     \\
 322      \hline
 323     \const{PF\_APPLETALK} &     & si  &  si  &     &     \\
 324      \hline
 325     \const{PF\_PACKET}    &     & si  & si   &     &     \\
 326      \hline
 327   \end{tabular}
 328   \caption{Combinazioni valide di dominio e tipo di protocollo per la
 329     funzione \func{socket}.}
 330   \label{tab:sock_sock_valid_combinations}
 331 \end{table}
 332
 333 In tab.~\ref{tab:sock_sock_valid_combinations} sono mostrate le combinazioni
 334 valide possibili per le principali famiglie di protocolli. Per ogni
 335 combinazione valida si è indicato il tipo di protocollo, o la parola
 336 \textsl{si} qualora non il protocollo non abbia un nome definito, mentre si
 337 sono lasciate vuote le caselle per le combinazioni non supportate.
 338
 339
 340 \section{Le strutture degli indirizzi dei socket}
 341 \label{sec:sock_sockaddr}
 342
 343 Come si è visto nella creazione di un socket non si specifica nulla oltre al
 344 tipo di famiglia di protocolli che si vuole utilizzare, in particolare nessun
 345 indirizzo che identifichi i due capi della comunicazione. La funzione infatti
 346 si limita ad allocare nel kernel quanto necessario per poter poi realizzare la
 347 comunicazione.
 348
 349 Gli indirizzi infatti vengono specificati attraverso apposite strutture che
 350 vengono utilizzate dalle altre funzioni della interfaccia dei socket, quando
 351 la comunicazione viene effettivamente realizzata.  Ogni famiglia di protocolli
 352 ha ovviamente una sua forma di indirizzamento e in corrispondenza a questa una
 353 sua peculiare struttura degli indirizzi. I nomi di tutte queste strutture
 354 iniziano per \var{sockaddr\_}; quelli propri di ciascuna famiglia vengono
 355 identificati dal suffisso finale, aggiunto al nome precedente.
 356
 357
 358 \subsection{La struttura generica}
 359 \label{sec:sock_sa_gen}
 360
 361 Le strutture degli indirizzi vengono sempre passate alle varie funzioni
 362 attraverso puntatori (cioè \textit{by reference}), ma le funzioni devono poter
 363 maneggiare puntatori a strutture relative a tutti gli indirizzi possibili
 364 nelle varie famiglie di protocolli; questo pone il problema di come passare
 365 questi puntatori, il C moderno risolve questo problema coi i puntatori
 366 generici (i \ctyp{void *}), ma l'interfaccia dei socket è antecedente alla
 367 definizione dello standard ANSI C, e per questo nel 1982 fu scelto di definire
 368 una struttura generica per gli indirizzi dei socket, \struct{sockaddr}, che si
 369 è riportata in fig.~\ref{fig:sock_sa_gen_struct}.
 370
 371 \begin{figure}[!htb]
 372   \footnotesize \centering
 373   \begin{minipage}[c]{15cm}
 374     \includestruct{listati/sockaddr.h}
 375   \end{minipage}
 376   \caption{La struttura generica degli indirizzi dei socket
 377     \structd{sockaddr}.}
 378   \label{fig:sock_sa_gen_struct}
 379 \end{figure}
 380
 381 Tutte le funzioni dei socket che usano gli indirizzi sono definite usando nel
 382 prototipo un puntatore a questa struttura; per questo motivo quando si
 383 invocano dette funzioni passando l'indirizzo di un protocollo specifico
 384 occorrerà eseguire una conversione del relativo puntatore.
 385
 386 I tipi di dati che compongono la struttura sono stabiliti dallo standard
 387 POSIX.1g e li abbiamo riassunti in tab.~\ref{tab:sock_data_types} con i
 388 rispettivi file di include in cui sono definiti; la struttura è invece
 389 definita nell'include file \file{sys/socket.h}.
 390
 391 \begin{table}[!htb]
 392   \centering
 393   \footnotesize
 394   \begin{tabular}{|l|l|l|}
 395     \hline
 396     \multicolumn{1}{|c|}{\textbf{Tipo}}&
 397     \multicolumn{1}{|c|}{\textbf{Descrizione}}&
 398     \multicolumn{1}{|c|}{\textbf{Header}} \\
 399     \hline
 400     \hline
 401     \type{int8\_t}   & intero a 8 bit con segno   & \file{sys/types.h}\\
 402     \type{uint8\_t}  & intero a 8 bit senza segno & \file{sys/types.h}\\
 403     \type{int16\_t}  & intero a 16 bit con segno  & \file{sys/types.h}\\
 404     \type{uint16\_t} & intero a 16 bit senza segno& \file{sys/types.h}\\
 405     \type{int32\_t}  & intero a 32 bit con segno  & \file{sys/types.h}\\
 406     \type{uint32\_t} & intero a 32 bit senza segno& \file{sys/types.h}\\
 407     \hline
 408     \type{sa\_family\_t} & famiglia degli indirizzi& \file{sys/socket.h}\\
 409     \type{socklen\_t} & lunghezza (\type{uint32\_t}) dell'indirizzo di
 410     un socket& \file{sys/socket.h}\\
 411     \hline
 412     \type{in\_addr\_t} & indirizzo IPv4 (\type{uint32\_t}) &
 413     \file{netinet/in.h}\\
 414     \type{in\_port\_t} & porta TCP o UDP (\type{uint16\_t})&
 415     \file{netinet/in.h}\\
 416     \hline
 417   \end{tabular}
 418   \caption{Tipi di dati usati nelle strutture degli indirizzi, secondo quanto
 419     stabilito dallo standard POSIX.1g.}
 420   \label{tab:sock_data_types}
 421 \end{table}
 422
 423 In alcuni sistemi la struttura è leggermente diversa e prevede un primo membro
 424 aggiuntivo \code{uint8\_t sin\_len} (come riportato da R. Stevens in
 425 \cite{UNP1}). Questo campo non verrebbe usato direttamente dal programmatore e
 426 non è richiesto dallo standard POSIX.1g, in Linux pertanto non esiste. Il
 427 campo \type{sa\_family\_t} era storicamente un \ctyp{unsigned short}.
 428
 429 Dal punto di vista del programmatore l'unico uso di questa struttura è quello
 430 di fare da riferimento per il casting, per il kernel le cose sono un po'
 431 diverse, in quanto esso usa il puntatore per recuperare il campo
 432 \var{sa\_family}, comune a tutte le famiglie, con cui determinare il tipo di
 433 indirizzo; per questo motivo, anche se l'uso di un puntatore \ctyp{void *}
 434 sarebbe più immediato per l'utente (che non dovrebbe più eseguire il casting),
 435 è stato mantenuto l'uso di questa struttura.
 436
 437
 438 \subsection{La struttura degli indirizzi IPv4}
 439 \label{sec:sock_sa_ipv4}
 440
 441 I socket di tipo \const{PF\_INET} vengono usati per la comunicazione
 442 attraverso internet; la struttura per gli indirizzi per un socket internet (se
 443 si usa IPv4) è definita come \struct{sockaddr\_in} nell'header file
 444 \file{netinet/in.h} ed ha la forma mostrata in
 445 fig.~\ref{fig:sock_sa_ipv4_struct}, conforme allo standard POSIX.1g.
 446
 447 \begin{figure}[!htb]
 448   \footnotesize\centering
 449   \begin{minipage}[c]{15cm}
 450     \includestruct{listati/sockaddr_in.h}
 451   \end{minipage}
 452   \caption{La struttura \structd{sockaddr\_in} degli indirizzi dei socket
 453     internet (IPv4) e la struttura \structd{in\_addr} degli indirizzi IPv4.}
 454   \label{fig:sock_sa_ipv4_struct}
 455 \end{figure}
 456
 457 L'indirizzo di un socket internet (secondo IPv4) comprende l'indirizzo
 458 internet di un'interfaccia più un \textsl{numero di porta} (affronteremo in
 459 dettaglio il significato di questi numeri in sez.~\ref{sec:TCP_port_num}).  Il
 460 protocollo IP non prevede numeri di porta, che sono utilizzati solo dai
 461 protocolli di livello superiore come TCP e UDP. Questa struttura però viene
 462 usata anche per i socket RAW che accedono direttamente al livello di IP, nel
 463 qual caso il numero della porta viene impostato al numero di protocollo.
 464
 465 Il membro \var{sin\_family} deve essere sempre impostato a \const{AF\_INET},
 466 altrimenti si avrà un errore di \errcode{EINVAL}; il membro \var{sin\_port}
 467 specifica il \textsl{numero di porta}. I numeri di porta sotto il 1024 sono
 468 chiamati \textsl{riservati} in quanto utilizzati da servizi standard e
 469 soltanto processi con i privilegi di amministratore (con user-ID effettivo
 470 uguale a zero) o con la \itindex{capabilities}\textit{capability}
 471 \const{CAP\_NET\_BIND\_SERVICE} possono usare la funzione \func{bind} (che
 472 vedremo in sez.~\ref{sec:TCP_func_bind}) su queste porte.
 473
 474 Il membro \var{sin\_addr} contiene un indirizzo internet, e viene acceduto sia
 475 come struttura (un resto di una implementazione precedente in cui questa era
 476 una \direct{union} usata per accedere alle diverse classi di indirizzi) che
 477 direttamente come intero. In \file{netinet/in.h} vengono definite anche alcune
 478 costanti che identificano alcuni indirizzi speciali, riportati in
 479 tab.~\ref{tab:TCP_ipv4_addr}, che rincontreremo più avanti.
 480
 481 Infine occorre sottolineare che sia gli indirizzi che i numeri di porta devono
 482 essere specificati in quello che viene chiamato \textit{network order}, cioè
 483 con i bit ordinati in formato \textit{big endian}, questo comporta la
 484 necessità di usare apposite funzioni di conversione per mantenere la
 485 portabilità del codice (vedi sez.~\ref{sec:sock_addr_func} per i dettagli del
 486 problema e le relative soluzioni).
 487
 488
 489 \subsection{La struttura degli indirizzi IPv6}
 490 \label{sec:sock_sa_ipv6}
 491
 492 Essendo IPv6 un'estensione di IPv4, i socket di tipo \const{PF\_INET6} sono
 493 sostanzialmente identici ai precedenti; la parte in cui si trovano
 494 praticamente tutte le differenze fra i due socket è quella della struttura
 495 degli indirizzi; la sua definizione, presa da \file{netinet/in.h}, è riportata
 496 in fig.~\ref{fig:sock_sa_ipv6_struct}.
 497
 498 \begin{figure}[!htb]
 499   \footnotesize \centering
 500   \begin{minipage}[c]{15cm}
 501     \includestruct{listati/sockaddr_in6.h}
 502   \end{minipage}
 503   \caption{La struttura \structd{sockaddr\_in6} degli indirizzi dei socket
 504     IPv6 e la struttura \structd{in6\_addr} degli indirizzi IPv6.}
 505   \label{fig:sock_sa_ipv6_struct}
 506 \end{figure}
 507
 508 Il campo \var{sin6\_family} deve essere sempre impostato ad \const{AF\_INET6},
 509 il campo \var{sin6\_port} è analogo a quello di IPv4 e segue le stesse regole;
 510 il campo \var{sin6\_flowinfo} è a sua volta diviso in tre parti di cui i 24
 511 bit inferiori indicano l'etichetta di flusso, i successivi 4 bit la priorità e
 512 gli ultimi 4 sono riservati. Questi valori fanno riferimento ad alcuni campi
 513 specifici dell'header dei pacchetti IPv6 (vedi sez.~\ref{sec:IP_ipv6head}) ed
 514 il loro uso è sperimentale.
 515
 516 Il campo \var{sin6\_addr} contiene l'indirizzo a 128 bit usato da IPv6,
 517 espresso da un vettore di 16 byte. Infine il campo \var{sin6\_scope\_id} è un
 518 campo introdotto in Linux con il kernel 2.4, per gestire alcune operazioni
 519 riguardanti il \itindex{multicast} \textit{multicasting}.  Si noti infine che
 520 \struct{sockaddr\_in6} ha una dimensione maggiore della struttura
 521 \struct{sockaddr} generica di fig.~\ref{fig:sock_sa_gen_struct}, quindi
 522 occorre stare attenti a non avere fatto assunzioni riguardo alla possibilità
 523 di contenere i dati nelle dimensioni di quest'ultima.
 524
 525
 526 \subsection{La struttura degli indirizzi locali}
 527 \label{sec:sock_sa_local}
 528
 529 I socket di tipo \const{PF\_UNIX} o \const{PF\_LOCAL} vengono usati per una
 530 comunicazione fra processi che stanno sulla stessa macchina (per questo
 531 vengono chiamati \textit{local domain} o anche \textit{Unix domain}); essi
 532 hanno la caratteristica ulteriore di poter essere creati anche in maniera
 533 anonima attraverso la funzione \func{socketpair} (che abbiamo trattato in
 534 sez.~\ref{sec:ipc_socketpair}).  Quando però si vuole fare riferimento
 535 esplicito ad uno di questi socket si deve usare una struttura degli indirizzi
 536 di tipo \struct{sockaddr\_un}, la cui definizione si è riportata in
 537 fig.~\ref{fig:sock_sa_local_struct}.
 538
 539 \begin{figure}[!htb]
 540   \footnotesize \centering
 541   \begin{minipage}[c]{15cm}
 542     \includestruct{listati/sockaddr_un.h}
 543   \end{minipage}
 544   \caption{La struttura \structd{sockaddr\_un} degli indirizzi dei socket
 545     locali (detti anche \textit{unix domain}) definita in \file{sys/un.h}.}
 546   \label{fig:sock_sa_local_struct}
 547 \end{figure}
 548
 549 In questo caso il campo \var{sun\_family} deve essere \const{AF\_UNIX}, mentre
 550 il campo \var{sun\_path} deve specificare un indirizzo. Questo ha due forme;
 551 può essere un file (di tipo socket) nel filesystem o una stringa univoca
 552 (mantenuta in uno spazio di nomi astratto). Nel primo caso l'indirizzo viene
 553 specificato come una stringa (terminata da uno zero) corrispondente al
 554 \itindex{pathname}\textit{pathname} del file; nel secondo invece
 555 \var{sun\_path} inizia con uno zero e vengono usati come nome i restanti byte
 556 come stringa, senza terminazione.
 557
 558
 559 \subsection{La struttura degli indirizzi AppleTalk}
 560 \label{sec:sock_sa_appletalk}
 561
 562 I socket di tipo \const{PF\_APPLETALK} sono usati dalla libreria
 563 \file{netatalk} per implementare la comunicazione secondo il protocollo
 564 AppleTalk, uno dei primi protocolli di rete usato nel mondo dei personal
 565 computer, usato dalla Apple per connettere fra loro computer e stampanti. Il
 566 kernel supporta solo due strati del protocollo, DDP e AARP, e di norma è
 567 opportuno usare le funzioni della libreria \texttt{netatalk}, tratteremo qui
 568 questo argomento principalmente per mostrare l'uso di un protocollo
 569 alternativo.
 570
 571 I socket AppleTalk permettono di usare il protocollo DDP, che è un protocollo
 572 a pacchetto, di tipo \const{SOCK\_DGRAM}; l'argomento \param{protocol} di
 573 \func{socket} deve essere nullo. È altresì possibile usare i socket raw
 574 specificando un tipo \const{SOCK\_RAW}, nel qual caso l'unico valore valido
 575 per \param{protocol} è \const{ATPROTO\_DDP}.
 576
 577 Gli indirizzi AppleTalk devono essere specificati tramite una struttura
 578 \struct{sockaddr\_atalk}, la cui definizione è riportata in
 579 fig.~\ref{fig:sock_sa_atalk_struct}; la struttura viene dichiarata includendo
 580 il file \file{netatalk/at.h}.
 581
 582 \begin{figure}[!htb]
 583   \footnotesize \centering
 584   \begin{minipage}[c]{15cm}
 585     \includestruct{listati/sockaddr_atalk.h}
 586   \end{minipage}
 587   \caption{La struttura \structd{sockaddr\_atalk} degli indirizzi dei socket
 588     AppleTalk, e la struttura \structd{at\_addr} degli indirizzi AppleTalk.}
 589   \label{fig:sock_sa_atalk_struct}
 590 \end{figure}
 591
 592 Il campo \var{sat\_family} deve essere sempre \const{AF\_APPLETALK}, mentre il
 593 campo \var{sat\_port} specifica la porta che identifica i vari servizi. Valori
 594 inferiori a 129 sono usati per le \textsl{porte riservate}, e possono essere
 595 usati solo da processi con i privilegi di amministratore o con la
 596 \itindex{capabilities} \textit{capability} \const{CAP\_NET\_BIND\_SERVICE}.
 597 L'indirizzo remoto è specificato nella struttura \var{sat\_addr}, e deve
 598 essere in \textit{network order} (vedi sez.~\ref{sec:sock_endianess}); esso è
 599 composto da un parte di rete data dal campo \var{s\_net}, che può assumere il
 600 valore \const{AT\_ANYNET}, che indica una rete generica e vale anche per
 601 indicare la rete su cui si è, il singolo nodo è indicato da \var{s\_node}, e
 602 può prendere il valore generico \const{AT\_ANYNODE} che indica anche il nodo
 603 corrente, ed il valore \const{ATADDR\_BCAST} che indica tutti i nodi della
 604 rete.
 605
 606
 607 \subsection{La struttura degli indirizzi dei \textit{packet socket}}
 608 \label{sec:sock_sa_packet}
 609
 610 I \textit{packet socket}, identificati dal dominio \const{PF\_PACKET}, sono
 611 un'interfaccia specifica di Linux per inviare e ricevere pacchetti
 612 direttamente su un'interfaccia di rete, senza passare per le funzioni di
 613 gestione dei protocolli di livello superiore. In questo modo è possibile
 614 implementare dei protocolli in user space, agendo direttamente sul livello
 615 fisico. In genere comunque si preferisce usare la libreria
 616 \file{pcap},\footnote{la libreria è mantenuta insieme al comando
 617   \cmd{tcpdump}, informazioni e documentazione si possono trovare sul sito del
 618   progetto \href{http://www.tcpdump.org/}{\texttt{http://www.tcpdump.org/}}.}
 619 che assicura la portabilità su altre piattaforme, anche se con funzionalità
 620 ridotte.
 621
 622 Questi socket possono essere di tipo \const{SOCK\_RAW} o \const{SOCK\_DGRAM}.
 623 Con socket di tipo \const{SOCK\_RAW} si può operare sul livello di
 624 collegamento, ed i pacchetti vengono passati direttamente dal socket al driver
 625 del dispositivo e viceversa.  In questo modo, in fase di trasmissione, il
 626 contenuto completo dei pacchetti, comprese le varie intestazioni, deve essere
 627 fornito dall'utente. In fase di ricezione invece tutto il contenuto del
 628 pacchetto viene passato inalterato sul socket, anche se il kernel analizza
 629 comunque il pacchetto, riempiendo gli opportuni campi della struttura
 630 \struct{sockaddr\_ll} ad esso associata.
 631
 632 Si usano invece socket di tipo \const{SOCK\_DGRAM} quando si vuole operare a
 633 livello di rete. In questo caso in fase di ricezione l'intestazione del
 634 protocollo di collegamento viene rimossa prima di passare il resto del
 635 pacchetto all'utente, mentre in fase di trasmissione viene creata una
 636 opportuna intestazione per il protocollo a livello di collegamento
 637 utilizzato, usando le informazioni necessarie che devono essere specificate
 638 sempre con una struttura \struct{sockaddr\_ll}.
 639
 640 Nella creazione di un \textit{packet socket} il valore dell'argomento
 641 \param{protocol} di \func{socket} serve a specificare, in \textit{network
 642   order}, il numero identificativo del protocollo di collegamento si vuole
 643 utilizzare. I valori possibili sono definiti secondo lo standard IEEE 802.3, e
 644 quelli disponibili in Linux sono accessibili attraverso opportune costanti
 645 simboliche definite nel file \file{linux/if\_ether.h}. Se si usa il valore
 646 speciale \const{ETH\_P\_ALL} passeranno sul \textit{packet socket} tutti i
 647 pacchetti, qualunque sia il loro protocollo di collegamento. Ovviamente l'uso
 648 di questi socket è una operazione privilegiata e può essere effettuati solo da
 649 un processo con i privilegi di amministratore (user-ID effettivo nullo) o con
 650 la \itindex{capabilities}\textit{capability} \const{CAP\_NET\_RAW}.
 651
 652 Una volta aperto un \textit{packet socket}, tutti i pacchetti del protocollo
 653 specificato passeranno attraverso di esso, qualunque sia l'interfaccia da cui
 654 provengono; se si vuole limitare il passaggio ad una interfaccia specifica
 655 occorre usare la funzione \func{bind} per agganciare il socket a quest'ultima.
 656
 657 \begin{figure}[!htb]
 658   \footnotesize \centering
 659   \begin{minipage}[c]{15cm}
 660     \includestruct{listati/sockaddr_ll.h}
 661   \end{minipage}
 662   \caption{La struttura \structd{sockaddr\_ll} degli indirizzi dei
 663     \textit{packet socket}.}
 664   \label{fig:sock_sa_packet_struct}
 665 \end{figure}
 666
 667 Nel caso dei \textit{packet socket} la struttura degli indirizzi è di tipo
 668 \struct{sockaddr\_ll}, e la sua definizione è riportata in
 669 fig.~\ref{fig:sock_sa_packet_struct}; essa però viene ad assumere un ruolo
 670 leggermente diverso rispetto a quanto visto finora per gli altri tipi di
 671 socket.  Infatti se il socket è di tipo \const{SOCK\_RAW} si deve comunque
 672 scrivere tutto direttamente nel pacchetto, quindi la struttura non serve più a
 673 specificare gli indirizzi. Essa mantiene questo ruolo solo per i socket di
 674 tipo \const{SOCK\_DGRAM}, per i quali permette di specificare i dati necessari
 675 al protocollo di collegamento, mentre viene sempre utilizzata in lettura (per
 676 entrambi i tipi di socket), per la ricezione dei i dati relativi a ciascun
 677 pacchetto.
 678
 679 Al solito il campo \var{sll\_family} deve essere sempre impostato al valore
 680 \const{AF\_PACKET}. Il campo \var{sll\_protocol} indica il protocollo scelto,
 681 e deve essere indicato in \textit{network order}, facendo uso delle costanti
 682 simboliche definite in \file{linux/if\_ether.h}. Il campo \var{sll\_ifindex} è
 683 l'indice dell'interfaccia, che, in caso di presenza di più interfacce dello
 684 stesso tipo (se ad esempio si hanno più schede ethernet), permette di
 685 selezionare quella con cui si vuole operare (un valore nullo indica qualunque
 686 interfaccia).  Questi sono i due soli campi che devono essere specificati
 687 quando si vuole selezionare una interfaccia specifica, usando questa struttura
 688 con la funzione \func{bind}.
 689
 690 I campi \var{sll\_halen} e \var{sll\_addr} indicano rispettivamente
 691 l'indirizzo associato all'interfaccia sul protocollo di collegamento e la
 692 relativa lunghezza; ovviamente questi valori cambiano a seconda del tipo di
 693 collegamento che si usa, ad esempio, nel caso di ethernet, questi saranno il
 694 MAC address della scheda e la relativa lunghezza. Essi vengono usati, insieme
 695 ai campi \var{sll\_family} e \var{sll\_ifindex} quando si inviano dei
 696 pacchetti, in questo caso tutti gli altri campi devono essere nulli.
 697
 698 Il campo \var{sll\_hatype} indica il tipo ARP, come definito in
 699 \file{linux/if\_arp.h}, mentre il campo \var{sll\_pkttype} indica il tipo di
 700 pacchetto; entrambi vengono impostati alla ricezione di un pacchetto ed han
 701 senso solo in questo caso. In particolare \var{sll\_pkttype} può assumere i
 702 seguenti valori: \const{PACKET\_HOST} per un pacchetto indirizzato alla
 703 macchina ricevente, \const{PACKET\_BROADCAST} per un pacchetto di
 704 \itindex{broadcast} \textit{broadcast}, \const{PACKET\_MULTICAST} per un
 705 pacchetto inviato ad un indirizzo fisico di \itindex{multicast}
 706 \textit{multicast}, \const{PACKET\_OTHERHOST} per un pacchetto inviato ad
 707 un'altra stazione (e ricevuto su un'interfaccia in \index{modo~promiscuo} modo
 708 promiscuo), \const{PACKET\_OUTGOING} per un pacchetto originato dalla propria
 709 macchina che torna indietro sul socket.
 710
 711
 712 Si tenga presente infine che in fase di ricezione, anche se si richiede il
 713 troncamento del pacchetto, le funzioni \func{recv}, \func{recvfrom} e
 714 \func{recvmsg} (vedi sez.~\ref{sec:net_sendmsg}) restituiranno comunque la
 715 lunghezza effettiva del pacchetto così come arrivato sulla linea.
 716
 717 %% \subsection{La struttura degli indirizzi DECnet}
 718 %% \label{sec:sock_sa_decnet}
 719
 720 %% I socket di tipo \const{PF\_DECnet} usano il protocollo DECnet, usato dai VAX
 721 %% Digital sotto VMS quando ancora il TCP/IP non era diventato lo standard di
 722 %% fatto. Il protocollo è un protocollo chiuso, ed il suo uso attuale è limitato
 723 %% alla comunicazione con macchine che stanno comunque scomparendo. Lo si riporta
 724 %% solo come esempio
 725
 726
 727
 728 % \subsection{Il passaggio delle strutture}
 729 % \label{sec:sock_addr_pass}
 730
 731 % Come detto nelle funzioni della API dei socket le strutture degli indirizzi
 732 % vengono sempre passate per riferimento usando un puntatore; anche la lunghezza
 733 % della struttura è passata come argomento, ma in questo caso la modalità del
 734 % passaggio dipende dalla direzione del medesimo, dal processo al kernel o
 735 % viceversa.
 736
 737 % In particolare le tre funzioni \func{bind}, \func{connect} e
 738 % \func{sendto} passano la struttura al kernel, in questo caso è passata
 739 % \textsl{per valore} anche la dimensione della medesima
 740
 741
 742 % Le funzioni \func{accept}, \func{recvfrom}, \func{getsockname} e
 743 % \func{getpeername} invece ricevono i valori del kernel
 744
 745
 746
 747 \section{Le funzioni di conversione degli indirizzi}
 748 \label{sec:sock_addr_func}
 749
 750 In questa sezione tratteremo delle varie funzioni usate per manipolare gli
 751 indirizzi, limitandoci però agli indirizzi internet.  Come accennato gli
 752 indirizzi e i numeri di porta usati nella rete devono essere forniti in
 753 formato opportuno (il \textit{network order}). Per capire cosa significa tutto
 754 ciò occorre introdurre un concetto generale che tornerà utile anche in
 755 seguito.
 756
 757
 758 \subsection{La \textit{endianess}}
 759 \label{sec:sock_endianess}
 760
 761 \itindbeg{endianess}
 762 La rappresentazione di un numero binario in un computer può essere fatta in
 763 due modi, chiamati rispettivamente \textit{big endian} e \textit{little
 764   endian} a seconda di come i singoli bit vengono aggregati per formare le
 765 variabili intere (ed in genere in diretta corrispondenza a come sono poi in
 766 realtà cablati sui bus interni del computer).
 767
 768 \begin{figure}[htb]
 769   \centering
 770   \includegraphics[height=3cm]{img/endianess}
 771   \caption{Schema della disposizione dei dati in memoria a seconda della
 772     \textit{endianess}.}
 773   \label{fig:sock_endianess}
 774 \end{figure}
 775
 776 Per capire meglio il problema si consideri un intero a 32 bit scritto in una
 777 locazione di memoria posta ad un certo indirizzo. Come illustrato in
 778 fig.~\ref{fig:sock_endianess} i singoli bit possono essere disposti un memoria
 779 in due modi: a partire dal più significativo o a partire dal meno
 780 significativo.  Così nel primo caso si troverà il byte che contiene i bit più
 781 significativi all'indirizzo menzionato e il byte con i bit meno significativi
 782 nell'indirizzo successivo; questo ordinamento è detto \textit{big endian},
 783 dato che si trova per prima la parte più grande. Il caso opposto, in cui si
 784 parte dal bit meno significativo è detto per lo stesso motivo \textit{little
 785   endian}.
 786
 787 Si può allora verificare quale tipo di \textit{endianess} usa il proprio
 788 computer con un programma elementare che si limita ad assegnare un valore ad
 789 una variabile per poi ristamparne il contenuto leggendolo un byte alla volta.
 790 Il codice di detto programma, \file{endtest.c}, è nei sorgenti allegati,
 791 allora se lo eseguiamo su un PC otterremo:
 792 \begin{verbatim}
 793 [piccardi@gont sources]$ ./endtest
 794 Using value ABCDEF01
 795 val[0]= 1
 796 val[1]=EF
 797 val[2]=CD
 798 val[3]=AB
 799 \end{verbatim}%$
 800 mentre su di un Mac avremo:
 801 \begin{verbatim}
 802 piccardi@anarres:~/gapil/sources$ ./endtest
 803 Using value ABCDEF01
 804 val[0]=AB
 805 val[1]=CD
 806 val[2]=EF
 807 val[3]= 1
 808 \end{verbatim}%$
 809
 810
 811 La \textit{endianess} di un computer dipende essenzialmente dalla architettura
 812 hardware usata; Intel e Digital usano il \textit{little endian}, Motorola,
 813 IBM, Sun (sostanzialmente tutti gli altri) usano il \textit{big endian}. Il
 814 formato dei dati contenuti nelle intestazioni dei protocolli di rete è
 815 anch'esso \textit{big endian}; altri esempi di uso di questi due diversi
 816 formati sono quello del bus PCI, che è \textit{little endian}, o quello del
 817 bus VME che è \textit{big endian}.
 818
 819 Esistono poi anche dei processori che possono scegliere il tipo di formato
 820 all'avvio e alcuni che, come il PowerPC o l'Intel i860, possono pure passare
 821 da un tipo di ordinamento all'altro con una specifica istruzione. In ogni caso
 822 in Linux l'ordinamento è definito dall'architettura e dopo l'avvio del sistema
 823 resta sempre lo stesso, anche quando il processore permetterebbe di eseguire
 824 questi cambiamenti.
 825
 826 \begin{figure}[htb]
 827   \footnotesize \centering
 828   \begin{minipage}[c]{15cm}
 829     \includecodesample{listati/endian.c}
 830   \end{minipage}
 831   \normalsize
 832   \caption{La funzione \func{endian}, usata per controllare il tipo di
 833     architettura della macchina.}
 834   \label{fig:sock_endian_code}
 835 \end{figure}
 836
 837 Per controllare quale tipo di ordinamento si ha sul proprio computer si è
 838 scritta una piccola funzione di controllo, il cui codice è riportato
 839 fig.~\ref{fig:sock_endian_code}, che restituisce un valore nullo (falso) se
 840 l'architettura è \textit{big endian} ed uno non nullo (vero) se l'architettura
 841 è \textit{little endian}.
 842
 843 Come si vede la funzione è molto semplice, e si limita, una volta assegnato
 844 (\texttt{\small 9}) un valore di test pari a \texttt{0xABCD} ad una variabile
 845 di tipo \ctyp{short} (cioè a 16 bit), a ricostruirne una copia byte a byte.
 846 Per questo prima (\texttt{\small 10}) si definisce il puntatore \var{ptr} per
 847 accedere al contenuto della prima variabile, ed infine calcola (\texttt{\small
 848   11}) il valore della seconda assumendo che il primo byte sia quello meno
 849 significativo (cioè, per quanto visto in fig.~\ref{fig:sock_endianess}, che sia
 850 \textit{little endian}). Infine la funzione restituisce (\texttt{\small 12})
 851 il valore del confronto delle due variabili.
 852 \itindend{endianess}
 853
 854
 855
 856 \subsection{Le funzioni per il riordinamento}
 857 \label{sec:sock_func_ord}
 858
 859 Il problema connesso all'endianess\itindex{endianess} è che quando si passano
 860 dei dati da un tipo di architettura all'altra i dati vengono interpretati in
 861 maniera diversa, e ad esempio nel caso dell'intero a 16 bit ci si ritroverà
 862 con i due byte in cui è suddiviso scambiati di posto.  Per questo motivo si
 863 usano delle funzioni di conversione che servono a tener conto automaticamente
 864 della possibile differenza fra l'ordinamento usato sul computer e quello che
 865 viene usato nelle trasmissione sulla rete; queste funzioni sono \funcd{htonl},
 866 \funcd{htons}, \funcd{ntohl} e \funcd{ntohs} ed i rispettivi prototipi sono:
 867 \begin{functions}
 868   \headdecl{netinet/in.h}
 869   \funcdecl{unsigned long int htonl(unsigned long int hostlong)}
 870   Converte l'intero a 32 bit \param{hostlong} dal formato della macchina a
 871   quello della rete.
 872
 873   \funcdecl{unsigned short int htons(unsigned short int hostshort)}
 874   Converte l'intero a 16 bit \param{hostshort} dal formato della macchina a
 875   quello della rete.
 876
 877   \funcdecl{unsigned long int ntohl(unsigned long int netlong)}
 878   Converte l'intero a 32 bit \param{netlong} dal formato della rete a quello
 879   della macchina.
 880
 881   \funcdecl{unsigned sort int ntohs(unsigned short int netshort)}
 882   Converte l'intero a 16 bit \param{netshort} dal formato della rete a quello
 883   della macchina.
 884
 885   \bodydesc{Tutte le funzioni restituiscono il valore convertito, e non
 886     prevedono errori.}
 887 \end{functions}
 888
 889 I nomi sono assegnati usando la lettera \texttt{n} come mnemonico per indicare
 890 l'ordinamento usato sulla rete (da \textit{network order}) e la lettera
 891 \texttt{h} come mnemonico per l'ordinamento usato sulla macchina locale (da
 892 \textit{host order}), mentre le lettere \texttt{s} e \texttt{l} stanno ad
 893 indicare i tipi di dato (\ctyp{long} o \ctyp{short}, riportati anche dai
 894 prototipi).
 895
 896 Usando queste funzioni si ha la conversione automatica: nel caso in cui la
 897 macchina che si sta usando abbia una architettura \textit{big endian} queste
 898 funzioni sono definite come macro che non fanno nulla. Per questo motivo vanno
 899 sempre utilizzate, anche quando potrebbero non essere necessarie, in modo da
 900 assicurare la portabilità del codice su tutte le architetture.
 901
 902
 903 \subsection{Le funzioni \func{inet\_aton}, \func{inet\_addr} e
 904   \func{inet\_ntoa}}
 905 \label{sec:sock_func_ipv4}
 906
 907 Un secondo insieme di funzioni di manipolazione serve per passare dal formato
 908 binario usato nelle strutture degli indirizzi alla rappresentazione simbolica
 909 dei numeri IP che si usa normalmente.
 910
 911 Le prime tre funzioni di manipolazione riguardano la conversione degli
 912 indirizzi IPv4 da una stringa in cui il numero di IP è espresso secondo la
 913 cosiddetta notazione \textit{dotted-decimal}, (cioè nella forma
 914 \texttt{192.168.0.1}) al formato binario (direttamente in \textit{network
 915   order}) e viceversa; in questo caso si usa la lettera \texttt{a} come
 916 mnemonico per indicare la stringa. Dette funzioni sono \funcd{inet\_addr},
 917 \funcd{inet\_aton} e \funcd{inet\_ntoa}, ed i rispettivi prototipi sono:
 918 \begin{functions}
 919   \headdecl{arpa/inet.h}
 920
 921   \funcdecl{in\_addr\_t inet\_addr(const char *strptr)} Converte la stringa
 922   dell'indirizzo \textit{dotted decimal} in nel numero IP in network order.
 923
 924   \funcdecl{int inet\_aton(const char *src, struct in\_addr *dest)} Converte
 925   la stringa dell'indirizzo \textit{dotted decimal} in un indirizzo IP.
 926
 927   \funcdecl{char *inet\_ntoa(struct in\_addr addrptr)}
 928   Converte un indirizzo IP in una stringa \textit{dotted decimal}.
 929
 930   \bodydesc{Tutte queste le funzioni non generano codice di errore.}
 931 \end{functions}
 932
 933 La prima funzione, \func{inet\_addr}, restituisce l'indirizzo a 32 bit in
 934 network order (del tipo \type{in\_addr\_t}) a partire dalla stringa passata
 935 nell'argomento \param{strptr}. In caso di errore (quando la stringa non esprime
 936 un indirizzo valido) restituisce invece il valore \const{INADDR\_NONE} che
 937 tipicamente sono trentadue bit a uno.  Questo però comporta che la stringa
 938 \texttt{255.255.255.255}, che pure è un indirizzo valido, non può essere usata
 939 con questa funzione; per questo motivo essa è generalmente deprecata in favore
 940 di \func{inet\_aton}.
 941
 942 La funzione \func{inet\_aton} converte la stringa puntata da \param{src}
 943 nell'indirizzo binario che viene memorizzato nell'opportuna struttura
 944 \struct{in\_addr} (si veda fig.~\ref{fig:sock_sa_ipv4_struct}) situata
 945 all'indirizzo dato dall'argomento \param{dest} (è espressa in questa forma in
 946 modo da poterla usare direttamente con il puntatore usato per passare la
 947 struttura degli indirizzi). La funzione restituisce 0 in caso di successo e 1
 948 in caso di fallimento.  Se usata con \param{dest} inizializzato a \val{NULL}
 949 effettua la validazione dell'indirizzo.
 950
 951 L'ultima funzione, \func{inet\_ntoa}, converte il valore a 32 bit
 952 dell'indirizzo (espresso in \textit{network order}) restituendo il puntatore
 953 alla stringa che contiene l'espressione in formato dotted decimal. Si deve
 954 tenere presente che la stringa risiede in memoria statica, per cui questa
 955 funzione non è rientrante.
 956
 957
 958 \subsection{Le funzioni \func{inet\_pton} e \func{inet\_ntop}}
 959 \label{sec:sock_conv_func_gen}
 960
 961 Le tre funzioni precedenti sono limitate solo ad indirizzi IPv4, per questo
 962 motivo è preferibile usare le due nuove funzioni \func{inet\_pton} e
 963 \func{inet\_ntop} che possono convertire anche gli indirizzi IPv6. Anche in
 964 questo caso le lettere \texttt{n} e \texttt{p} sono degli mnemonici per
 965 ricordare il tipo di conversione effettuata e stanno per \textit{presentation}
 966 e \textit{numeric}.
 967
 968 Entrambe le funzioni accettano l'argomento \param{af} che indica il tipo di
 969 indirizzo, e che può essere soltanto \const{AF\_INET} o \const{AF\_INET6}. La
 970 prima funzione, \funcd{inet\_pton}, serve a convertire una stringa in un
 971 indirizzo; il suo prototipo è:
 972 \begin{prototype}{sys/socket.h}
 973 {int inet\_pton(int af, const char *src, void *addr\_ptr)}
 974
 975   Converte l'indirizzo espresso tramite una stringa nel valore numerico.
 976
 977   \bodydesc{La funzione restituisce un valore negativo se \param{af} specifica
 978     una famiglia di indirizzi non valida, con \var{errno} che assume il valore
 979     \errcode{EAFNOSUPPORT}, un valore nullo se \param{src} non rappresenta un
 980     indirizzo valido, ed un valore positivo in caso di successo.}
 981 \end{prototype}
 982
 983 La funzione converte la stringa indicata tramite \param{src} nel valore
 984 numerico dell'indirizzo IP del tipo specificato da \param{af} che viene
 985 memorizzato all'indirizzo puntato da \param{addr\_ptr}, la funzione
 986 restituisce un valore positivo in caso di successo, nullo se la stringa non
 987 rappresenta un indirizzo valido, e negativo se \param{af} specifica una
 988 famiglia di indirizzi non valida.
 989
 990 La seconda funzione di conversione è \funcd{inet\_ntop} che converte un
 991 indirizzo in una stringa; il suo prototipo è:
 992 \begin{prototype}{sys/socket.h}
 993   {char *inet\_ntop(int af, const void *addr\_ptr, char *dest, size\_t len)}
 994   Converte l'indirizzo dalla relativa struttura in una stringa simbolica.
 995
 996   \bodydesc{La funzione restituisce un puntatore non nullo alla stringa
 997     convertita in caso di successo e \val{NULL} in caso di fallimento, nel
 998     qual caso \var{errno} assume i valori:
 999     \begin{errlist}
1000     \item[\errcode{ENOSPC}] le dimensioni della stringa con la conversione
1001       dell'indirizzo eccedono la lunghezza specificata da \param{len}.
1002     \item[\errcode{ENOAFSUPPORT}] la famiglia di indirizzi \param{af} non è
1003       una valida.
1004   \end{errlist}}
1005 \end{prototype}
1006
1007 La funzione converte la struttura dell'indirizzo puntata da \param{addr\_ptr}
1008 in una stringa che viene copiata nel buffer puntato dall'indirizzo
1009 \param{dest}; questo deve essere preallocato dall'utente e la lunghezza deve
1010 essere almeno \const{INET\_ADDRSTRLEN} in caso di indirizzi IPv4 e
1011 \const{INET6\_ADDRSTRLEN} per indirizzi IPv6; la lunghezza del buffer deve
1012 comunque venire specificata attraverso il parametro \param{len}.
1013
1014 Gli indirizzi vengono convertiti da/alle rispettive strutture di indirizzo
1015 (una struttura \struct{in\_addr} per IPv4, e una struttura \struct{in6\_addr}
1016 per IPv6), che devono essere precedentemente allocate e passate attraverso il
1017 puntatore \param{addr\_ptr}; l'argomento \param{dest} di \func{inet\_ntop} non
1018 può essere nullo e deve essere allocato precedentemente.
1019
1020 Il formato usato per gli indirizzi in formato di presentazione è la notazione
1021 \textit{dotted decimal} per IPv4 e quello descritto in
1022 sez.~\ref{sec:IP_ipv6_notation} per IPv6.
1023
1024 \index{socket!definizione|)}
1025
1026
1027
1028 %%% Local Variables:
1029 %%% mode: latex
1030 %%% TeX-master: "gapil"
1031 %%% End:
1032
1033 % LocalWords:  socket sez cap BSD SVr XTI Transport Interface TCP stream UDP PF
1034 % LocalWords:  datagram broadcast descriptor sys int domain type protocol errno
1035 % LocalWords:  EPROTONOSUPPORT ENFILE kernel EMFILE EACCES EINVAL ENOBUFS raw
1036 % LocalWords:  ENOMEM table family AF address name glibc UNSPEC LOCAL Local IPv
1037 % LocalWords:  communication INET protocols ip AX Amateur IPX Novell APPLETALK
1038 % LocalWords:  Appletalk ddp NETROM NetROM Multiprotocol ATMPVC Access to ATM
1039 % LocalWords:  PVCs ITU ipv PLP DECnet Reserved for project NETBEUI LLC KEY key
1040 % LocalWords:  SECURITY Security callback NETLINK interface device netlink Low
1041 % LocalWords:  PACKET level packet ASH Ash ECONET Acorn Econet ATMSVC SVCs SNA
1042 % LocalWords:  IRDA PPPOX PPPoX WANPIPE Wanpipe BLUETOOTH Bluetooth POSIX bits
1043 % LocalWords:  dall'header tab SOCK capabilities capability styles DGRAM read
1044 % LocalWords:  SEQPACKET RDM sockaddr reference void fig Header uint socklen at
1045 % LocalWords:  addr netinet port len Stevens unsigned short casting nell'header
1046 % LocalWords:  BIND SERVICE bind union order big endian flowinfo dell'header ll
1047 % LocalWords:  multicast multicasting local socketpair sun path filesystem AARP
1048 % LocalWords:  pathname AppleTalk netatalk personal Apple ATPROTO atalk sat if
1049 % LocalWords:  ANYNET node ANYNODE ATADDR BCAST pcap IEEE linux ether ETH ALL
1050 % LocalWords:  sll ifindex ethernet halen MAC hatype ARP arp pkttype HOST recv
1051 % LocalWords:  OTHERHOST OUTGOING recvfrom recvmsg endianess little endtest Mac
1052 % LocalWords:  Intel Digital Motorola IBM VME PowerPC l'Intel xABCD ptr htonl
1053 % LocalWords:  all'endianess htons ntohl ntohs long hostlong hostshort netlong
1054 % LocalWords:  sort netshort host inet aton ntoa dotted decimal const char src
1055 % LocalWords:  strptr struct dest addrptr INADDR NULL pton ntop presentation af
1056 % LocalWords:  numeric EAFNOSUPPORT size ENOSPC ENOAFSUPPORT ADDRSTRLEN ROUTE
1057 % LocalWords:  of tcpdump