X-Git-Url: https://gapil.gnulinux.it/gitweb/?a=blobdiff_plain;f=socket.tex;h=fafe08ebd1610b00eb7e5120b7aea0ad2fbf2d03;hb=5854d47465c992d90b2dd0ebc18417f9a9bef377;hp=cff6a7f79f7c99159a6341df3d521d9e83bbbd01;hpb=aaec9dd38969d06af79c52bad2a54d6190e18f6e;p=gapil.git diff --git a/socket.tex b/socket.tex index cff6a7f..fafe08e 100644 --- a/socket.tex +++ b/socket.tex @@ -434,7 +434,6 @@ Si noti che questa struttura quindi occorre stare attenti a non avere fatto assunzioni riguardo alla possibilità di contenere i dati nelle dimensioni di quest'ultima. - \subsection{La struttura degli indirizzi locali} \label{sec:sock_sa_local} @@ -478,18 +477,186 @@ della struttura passaggio dipende dalla direzione del medesimo, dal processo al kernel o viceversa. -In particolare le tre funzioni \texttt{bind}, \texttt{connect} e -\texttt{sendto} passano la struttura al kernel, in questo caso è passata -\textsl{per valore} anche la dimensione della medesima +% In particolare le tre funzioni \texttt{bind}, \texttt{connect} e +% \texttt{sendto} passano la struttura al kernel, in questo caso è passata +% \textsl{per valore} anche la dimensione della medesima -Le funzioni \texttt{accept}, \texttt{recvfrom}, \texttt{getsockname} e -\texttt{getpeername} +% Le funzioni \texttt{accept}, \texttt{recvfrom}, \texttt{getsockname} e +% \texttt{getpeername} invece ricevono i valori del kernel \section{Le funzioni di conversione degli indirizzi} \label{sec:sock_addr_func} +Come accennato gli indirizzi internet e i numeri di porta usati nella rete +devono essere forniti in formato big endian. In genere la rappresentazione di +un numbero binario in un computer può essere fatta in due modi, chiamati +rispettivamente \textit{big endian} e \textit{little endian} a seconda di come +i singoli bit vengono aggregati per formare le variabili intere (in diretta +corrispondenza a come sono poi in realtà cablati sui bus interni del +computer). + +Per capire meglio il problema si consideri un intero a 16 bit scritto in una +locazione di memoria posta ad un certo indirizzo. I singoli bit possono essere +disposti un memoria in due modi, a partire dal più significativo o a partire +dal meno significativo. Così nel primo caso si troverà il byte che contiene i +bit più significativi all'indirizzo menzionato e il byte con i bit meno +significativi nell'indirizzo successivo; questo ordinamento è detto little +endian dato che il dato finale è la parte ``piccola'' del numero. Il caso +opposto, in cui si parte dal bit meno significativo è detto per lo stesso +motivo big endian. + +La \textit{endianess} di un computer dipende essenzialmente dalla architettura +hardware usata; intel e digital usano il little endian, motorola, ibm, sun +(sostanzialmente tutti gli altri) usano il big endian. Il formato della rete è +anch'esso big endian. Esistono poi anche dei processori che possono scegliere +il tipo di formato all'avvio e alcuni, come il PowerPC o l'intel i860, possono +pure passare da un tipo all'altro con una specifica istruzione; in ogni caso +in linux l'ordinamanento è definito dall'archiettura e anche se questi +cambiamenti sono possibili anche dopo che il sistema è avviato, non vengono +mai eseguiti. + +Il problema connesso all'endianess è che quando si passano dei dati da un tipo +di architettura all'altra; in questo caso infatti nel passaggio i dati vengono +interpretati in maniera diversa, e nel caso dell'esempio dell'intero a 16 bit +ci si ritroverà con i due bytes componenti scambiati di posto, mentre in +generale ne sarà invertito l'ordine di lettura e andranno perciò rovesciati. + +Per questo motivo si usano le seguenti funzioni di conversione (i cui +prototipi sono definiti in \texttt{netinet/in.h}) che servono a tener conto +automaticamente della possibile differenza fra l'ordinamento usato sul +computer e quello che viene usato nelle trasmissione sulla rete: +\begin{itemize} +\item \texttt{unsigned long int htonl(unsigned long int hostlong)} + + Converte l'intero a 32 bit \texttt{hostlong} dal formato della macchina a + quello della rete. + +\item \texttt{unsigned sort int htons(unsigned short int hostshort)} + + Converte l'intero a 16 bit \texttt{hostshort} dal formato della macchina a + quello della rete. + +\item \texttt{unsigned long int ntonl(unsigned long int netlong)} + + Converte l'intero a 32 bit \texttt{netlong} dal formato della rete a quello + della macchina. + +\item \texttt{unsigned sort int ntons(unsigned short int netshort)} + + Converte l'intero a 16 bit \texttt{netshort} dal formato della rete a quello + della macchina. +\end{itemize} +I nomi sono assegnati usando la lettera $n$ come mnemonico per indicare +l'ordinamento usato sulla rete (da \textit{network order}) e la lettera $h$ +come mnemonico per l'ordinamento usato sulla macchina locale (da \textit{host + order}), mentre le lettere $s$ e $l$ stanno ad indicare i tipi di dato +(\texttt{long} o \texttt{short}, riportati anche dai prototipi). + +Usando queste funzioni si ha la conversione automatica (nel caso pure la +macchina sia in big endian queste funzioni sono definite come macro che non +fanno nulla); esse vanno sempre utilizzate per assicurare la portabilità del +codice su tutte le architetture. + + +Un secondo insieme di funzioni di manipolazione (i cui prototipi sono definiti +in \texttt{arpa/inet.h}) serve per passare dal formato binario usato nelle +strutture degli indirizzi alla rappresentazione dei numeri IP che si usa +normalente. + +Le prime tre funzioni di manipolazione riguardano la conversione degli +indirizzi IPv4 da una stringa in cui il numero di IP è espresso secondo la +cosiddetta notazione \textit{dotted-decimal}, (cioè nella forma +\texttt{192.160.0.1}) al formato binario (direttamente in \textit{network + order}) e viceversa; in questo caso si usa la lettera $a$ come mnemonico per +indicare la stringa. Dette funzioni sono: +\begin{itemize} +\item \texttt{int inet\_aton(const char *strptr, struct in\_addr *addrptr)} + + Converte la stringa puntata da \texttt{strptr} nell'indirizzo binario da + memorizzare all'indirizzo puntato da \texttt{addrptr}, restituendo 0 in caso + di successo e 1 in caso di fallimento (è espressa in questa forma in modo da + poterla usare direttamente con il puntatore usato per passare la struttura + degli indirizzi). Se usata con \texttt{addrptr} inizializzato a + \texttt{NULL} effettua la validazione dell'indirizzo. + +\item \texttt{in\_addr\_t inet\_addr(const char *strptr)} + + Restituisce l'indirizzo a 32 bit in network order a partire dalla stringa + passata come parametro, in caso di errore restituisce il valore + \texttt{INADDR\_NONE} che tipicamente sono trentadue bit a uno; questo + comporta che la stringa \texttt{255.255.255.255}, che pure è un indirizzo + valido, non può essere usata con questa funzione; per questo motivo essa è + generalmente deprecata in favore della precedente. + +\item \texttt{char *inet\_ntop(struct in\_addr addrptr)} + + Converte il valore a 32 bit dell'indirizzo (espresso in network order) + restituendo il puntatore alla stringa che contiene l'espressione in formato + dotted decimal. Si deve tenere presente che la stringa risiede in memoria + statica, per cui questa funzione non è rientrante. +\end{itemize} + +Le tre funzioni precedenti sono però limitate solo ad IPv4, per questo motivo +è preferibile usare le due nuove funzioni \texttt{inet\_pton} e +\texttt{inet\_ntop} che possono convertire anche gli indirizzi IPv6 (secondo +lo schema in \nfig). Anche in questo caso le lettere $n$ e $p$ sono gli +mnemonici per ricordare il tipo di conversione effettuata e stanno per +\textit{presentation} e \textit{numeric}. + +\begin{figure}[htb] + \centering + + \caption{Schema della rappresentazioni utilizzate dalle funzioni di + conversione \texttt{inet\_pton} e \texttt{inet\_ntop} } + \label{fig:sock_inet_conv_func} + +\end{figure} + +Entrambe le funzioni accettano l'argomento \texttt{family} che indica il tipo +di indirizzo e può essere \texttt{AF\_INET} o \texttt{AF\_INET6}. Se la +famiglia indicata non è valida entrambe le funzioni ritornano un valore +negativo e settano la variabile \texttt{errno} al valore +\texttt{EAFNOSUPPORT}. I prototipi delle suddette funzioni sono i seguenti: +\begin{itemize} +\item \texttt{int inet\_pton(int family, const char *src, void *dest)} + + Converte la stringa puntata da \texttt{src} nell'indirizzo binario da + memorizzare all'indirizzo puntato da \texttt{dest}, restituendo 0 in caso di + successo e 1 in caso di fallimento. + +\item \texttt{char *inet\_ntop(int family, const void *src, char *dest, + size\_t len)} + + Converte la struttura dell'indirizzo puntata da \texttt{src} in una stringa + che viene copiata nel buffer puntato dall'indirizzo \texttt{dest}; questo + deve essere preallocato dall'utente e la lunghezza deve essere almeno + \texttt{INET\_ADDRSTRLEN} in caso di indirizzi IPv4 e + \texttt{INET6\_ADDRSTRLEN} per indirizzi IPv6; la lunghezza del buffer deve + comunque venire specificata attraverso il parametro \texttt{len}. + + La funzione restitisce un puntatore non nullo a \texttt{dest} in caso di + successo e un puntatore nullo in caso di fallimento, in quest'ultimo caso + viene settata la variabile \texttt{errno} con il valore \texttt{ENOSPC} in + caso le dimensioni dell'indirizzo eccedano la lunghezza specificata da + \texttt{len}. + +\end{itemize} + + +\section{Il comportamento delle funzioni di I/O} +\label{sec:sock_io_behav} + +Una cosa di cui non sempre si è consapevoli quando si ha a che fare con i +socket è che le funzioni di I/O non sempre hanno lo stesso comportamento che +avrebbero con i normali files (in particolare questo è vero nel caso si stream +socket). Infatti con i socket funzioni come \texttt{read} o \texttt{write} +possono restituire in input o scrivere in output un numero di bytes minore di +quello richiesto, e questo è un comportamento normale e non un errore. Ciò +avviene perché il kernel può + + @@ -503,7 +670,6 @@ client e un server TCP, riprendendo quanto visto in \ref{sec:net_cli_sample} e \ref{sec:net_cli_server}. - \subsection{Creazione e terminazione della connessione TCP} Per capire il funzionamento delle funzioni della interfaccia dei socket che