+\section{Le funzioni di conversione degli indirizzi}
+\label{sec:sock_addr_func}
+
+In questa sezione tratteremo delle varie funzioni usate per manipolare gli
+indirizzi, limitandoci però agli indirizzi internet.
+
+Come accennato gli indirizzi e i numeri di porta usati nella rete devono
+essere forniti in formato opportuno (il \textit{network order}). Per capire
+cosa significa tutto ciò occorre introdurre un concetto generale che tornerà
+utile anche in seguito.
+
+
+\subsection{La \textit{endianess}}
+\label{sec:sock_endianess}
+
+La rappresentazione di un numero binario in un computer può essere fatta in
+due modi, chiamati rispettivamente \textit{big endian} e \textit{little
+ endian} a seconda di come i singoli bit vengono aggregati per formare le
+variabili intere (in diretta corrispondenza a come sono poi in realtà cablati
+sui bus interni del computer).
+
+Per capire meglio il problema si consideri un intero a 16 bit scritto in una
+locazione di memoria posta ad un certo indirizzo. I singoli bit possono essere
+disposti un memoria in due modi, a partire dal più significativo o a partire
+dal meno significativo. Così nel primo caso si troverà il byte che contiene i
+bit più significativi all'indirizzo menzionato e il byte con i bit meno
+significativi nell'indirizzo successivo; questo ordinamento è detto
+\textit{little endian} dato che il dato finale è la parte ``piccola'' del
+numero. Il caso opposto, in cui si parte dal bit meno significativo è detto
+per lo stesso motivo \textit{big endian}.
+
+La \textit{endianess} di un computer dipende essenzialmente dalla architettura
+hardware usata; Intel e Digital usano il little endian, Motorola, IBM, Sun
+(sostanzialmente tutti gli altri) usano il big endian. Il formato della rete è
+anch'esso big endian, quello del bus PCI è little endian, quello del bus VME è
+big endian.
+
+Esistono poi anche dei processori che possono scegliere il tipo di formato
+all'avvio e alcuni, come il PowerPC o l'Intel i860, possono pure passare da un
+tipo di ordinamento all'altro con una specifica istruzione; in ogni caso in
+Linux l'ordinamento è definito dall'architettura e anche se questi cambiamenti
+sono possibili anche dopo che il sistema è avviato, non vengono mai eseguiti.
+
+\subsection{Le funzioni per il riordinamento}
+\label{sec:sock_func_ord}
+
+Il problema connesso all'endianess è che quando si passano dei dati da un tipo
+di architettura all'altra i dati vengono interpretati in maniera diversa, e ad
+esempio nel caso dell'intero a 16 bit ci si ritroverà con i due bytes in cui è
+suddiviso scambiati di posto, e ne sarà quindi invertito l'ordine di lettura
+per cui, per riavere il valore originale dovranno essere rovesciati.
+
+Per questo motivo si usano le seguenti funzioni di conversione che servono a
+tener conto automaticamente della possibile differenza fra l'ordinamento usato
+sul computer e quello che viene usato nelle trasmissione sulla rete; queste
+funzioni sono:
+\begin{prototype}{netinet/in.h}
+{unsigned long int htonl(unsigned long int hostlong)}
+ Converte l'intero a 32 bit \texttt{hostlong} dal formato della macchina a
+ quello della rete.
+\end{prototype}
+\begin{prototype}{netinet/in.h}
+{unsigned short int htons(unsigned short int hostshort)}
+ Converte l'intero a 16 bit \texttt{hostshort} dal formato della macchina a
+ quello della rete.
+\end{prototype}
+\begin{prototype}{netinet/in.h}
+{unsigned long int ntonl(unsigned long int netlong)}
+ Converte l'intero a 32 bit \texttt{netlong} dal formato della rete a quello
+ della macchina.
+\end{prototype}
+\begin{prototype}{netinet/in.h}
+{unsigned sort int ntons(unsigned short int netshort)}
+ Converte l'intero a 16 bit \texttt{netshort} dal formato della rete a quello
+ della macchina.
+\end{prototype}
+I nomi sono assegnati usando la lettera $n$ come mnemonico per indicare
+l'ordinamento usato sulla rete (da \textit{network order}) e la lettera $h$
+come mnemonico per l'ordinamento usato sulla macchina locale (da \textit{host
+ order}), mentre le lettere $s$ e $l$ stanno ad indicare i tipi di dato
+(\texttt{long} o \texttt{short}, riportati anche dai prototipi).
+
+Usando queste funzioni si ha la conversione automatica (nel caso pure la
+macchina sia in big endian queste funzioni sono definite come macro che non
+fanno nulla); esse vanno sempre utilizzate per assicurare la portabilità del
+codice su tutte le architetture.
+
+
+\subsection{Le funzioni \texttt{inet\_aton}, \texttt{inet\_addr} e
+ \texttt{inet\_ntoa}}
+\label{sec:sock_func_ipv4}
+
+Un secondo insieme di funzioni di manipolazione serve per passare dal formato
+binario usato nelle strutture degli indirizzi alla rappresentazione dei numeri
+IP che si usa normalmente.
+
+Le prime tre funzioni di manipolazione riguardano la conversione degli
+indirizzi IPv4 da una stringa in cui il numero di IP è espresso secondo la
+cosiddetta notazione \textit{dotted-decimal}, (cioè nella forma
+\texttt{192.160.0.1}) al formato binario (direttamente in \textit{network
+ order}) e viceversa; in questo caso si usa la lettera $a$ come mnemonico per
+indicare la stringa. Dette funzioni sono:
+\begin{prototype}{arpa/inet.h}
+ {int inet\_aton(const char *src, struct in\_addr *dest)} Converte la stringa
+ puntata da \texttt{src} nell'indirizzo binario da memorizzare all'indirizzo
+ puntato da \texttt{dest}, restituendo 0 in caso di successo e 1 in caso di
+ fallimento (è espressa in questa forma in modo da poterla usare direttamente
+ con il puntatore usato per passare la struttura degli indirizzi). Se usata
+ con \texttt{dest} inizializzato a \texttt{NULL} effettua la validazione
+ dell'indirizzo.
+\end{prototype}
+\begin{prototype}{arpa/inet.h}{in\_addr\_t inet\_addr(const char *strptr)}
+ Restituisce l'indirizzo a 32 bit in network order a partire dalla stringa
+ passata come parametro, in caso di errore restituisce il valore
+ \texttt{INADDR\_NONE} che tipicamente sono trentadue bit a uno; questo
+ comporta che la stringa \texttt{255.255.255.255}, che pure è un indirizzo
+ valido, non può essere usata con questa funzione; per questo motivo essa è
+ generalmente deprecata in favore della precedente.
+\end{prototype}
+\begin{prototype}{arpa/inet.h}{char *inet\_ntoa(struct in\_addr addrptr)}
+ Converte il valore a 32 bit dell'indirizzo (espresso in network order)
+ restituendo il puntatore alla stringa che contiene l'espressione in formato
+ dotted decimal. Si deve tenere presente che la stringa risiede in memoria
+ statica, per cui questa funzione non è rientrante.
+\end{prototype}
+
+
+\subsection{Le funzioni \texttt{inet\_pton} e \texttt{inet\_ntop}}
+\label{sec:sock_conv_func_gen}
+
+Le tre funzioni precedenti sono limitate solo ad indirizzi IPv4, per questo
+motivo è preferibile usare le due nuove funzioni \texttt{inet\_pton} e
+\texttt{inet\_ntop} che possono convertire anche gli indirizzi IPv6 (secondo
+lo schema in \nfig). Anche in questo caso le lettere $n$ e $p$ sono degli
+mnemonici per ricordare il tipo di conversione effettuata e stanno per
+\textit{presentation} e \textit{numeric}.
+
+\begin{figure}[htb]
+ \centering
+
+ \caption{Schema della rappresentazioni utilizzate dalle funzioni di
+ conversione \texttt{inet\_pton} e \texttt{inet\_ntop} }
+ \label{fig:sock_inet_conv_func}
+
+\end{figure}
+
+Entrambe le funzioni accettano l'argomento \texttt{family} che indica il tipo
+di indirizzo e può essere \texttt{AF\_INET} o \texttt{AF\_INET6}. Se la
+famiglia indicata non è valida entrambe le funzioni ritornano un valore
+negativo e settano la variabile \texttt{errno} al valore
+\texttt{EAFNOSUPPORT}. I prototipi delle suddette funzioni sono i seguenti:
+\begin{prototype}{sys/socket.h}
+{int inet\_pton(int family, const char *src, void *dest)}
+ Converte la stringa puntata da \texttt{src} nell'indirizzo binario da
+ memorizzare all'indirizzo puntato da \texttt{dest}, restituendo 0 in caso di
+ successo e 1 in caso di fallimento.
+\end{prototype}
+
+\begin{prototype}{sys/socket.h}
+{char *inet\_ntop(int family, const void *src, char *dest, size\_t len)}
+ Converte la struttura dell'indirizzo puntata da \texttt{src} in una stringa
+ che viene copiata nel buffer puntato dall'indirizzo \texttt{dest}; questo
+ deve essere preallocato dall'utente e la lunghezza deve essere almeno
+ \texttt{INET\_ADDRSTRLEN} in caso di indirizzi IPv4 e
+ \texttt{INET6\_ADDRSTRLEN} per indirizzi IPv6; la lunghezza del buffer deve
+ comunque venire specificata attraverso il parametro \texttt{len}.
+
+ La funzione restituisce un puntatore non nullo a \texttt{dest} in caso di
+ successo e un puntatore nullo in caso di fallimento, in quest'ultimo caso
+ viene settata la variabile \texttt{errno} con il valore \texttt{ENOSPC} in
+ caso le dimensioni dell'indirizzo eccedano la lunghezza specificata da
+ \texttt{len}.
+\end{prototype}
+
+
+\section{Il comportamento delle funzioni di I/O}
+\label{sec:sock_io_behav}
+
+Una cosa di cui non sempre si è consapevoli quando si ha a che fare con i
+socket è che le funzioni di input/output non sempre hanno lo stesso
+comportamento che avrebbero con i normali files (in particolare questo accade
+per i socket di tipo stream).
+
+Infatti con i socket può accadere che funzioni come \texttt{read} o
+\texttt{write} possano restituire in input o scrivere in output un numero di
+bytes minore di quello richiesto. Questo è un comportamento normale e non un
+errore, e succede perché si eccede in lettura o scrittura il limite di buffer
+del kernel.
+
+In questo caso tutto quello che il programma chiamante deve fare è di ripetere
+la lettura (o scrittura) per la quantità di bytes rimanenti (lo stesso può
+avvenire scrivendo più di 4096 bytes in una pipe, dato che quello è il limite
+di solito adottato per il buffer di trasmissione del kernel).
+
+\begin{figure}[htb]
+ \centering
+ \footnotesize
+ \begin{lstlisting}{}
+#include <unistd.h>