X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=socket.tex;h=b2f9033e0ce70ad2a4c72e7a9d838fed72578772;hp=69a6a3bb34c542ec782c2f8824052ab78fa61993;hb=ff76d56c6a2c280cbe4f153173488871d7b12336;hpb=c6459d309753df19925aa2c95028d077b7f6ffd6 diff --git a/socket.tex b/socket.tex index 69a6a3b..b2f9033 100644 --- a/socket.tex +++ b/socket.tex @@ -1,6 +1,6 @@ %% socket.tex %% -%% Copyright (C) 2000-2005 Simone Piccardi. Permission is granted to +%% Copyright (C) 2000-2007 Simone Piccardi. Permission is granted to %% copy, distribute and/or modify this document under the terms of the GNU Free %% Documentation License, Version 1.1 or any later version published by the %% Free Software Foundation; with the Invariant Sections being "Un preambolo", @@ -8,6 +8,7 @@ %% license is included in the section entitled "GNU Free Documentation %% License". %% + \chapter{Introduzione ai socket} \label{cha:socket_intro} @@ -27,8 +28,8 @@ teorica concluderemo il capitolo con un primo esempio di applicazione. Iniziamo con una descrizione essenziale di cosa sono i \textit{socket} e di quali sono i concetti fondamentali da tenere presente quando si ha a che fare con essi. -\index{socket|(} +\index{socket!definizione|(} \subsection{I \textit{socket}} \label{sec:sock_socket_def} @@ -37,7 +38,7 @@ I \textit{socket}\footnote{una traduzione letterale potrebbe essere \textsl{presa}, ma essendo universalmente noti come \textit{socket} utilizzeremo sempre la parola inglese.} sono uno dei principali meccanismi di comunicazione utilizzato in ambito Unix, e li abbiamo brevemente incontrati -in sez.~\ref{sec:ipc_socketpair}, fra i vari meccanismi di intercominazione +in sez.~\ref{sec:ipc_socketpair}, fra i vari meccanismi di intercomunicazione fra processi. Un socket costituisce in sostanza un canale di comunicazione fra due processi su cui si possono leggere e scrivere dati analogo a quello di una pipe (vedi sez.~\ref{sec:ipc_pipes}) ma, a differenza di questa e degli altri @@ -83,7 +84,7 @@ che viene chiamato un \textsl{flusso} (in inglese \textit{stream}), mentre altri invece li raggruppano in \textsl{pacchetti} (in inglese \textit{datagram}) che vengono inviati in blocchi separati. -Un'altro esempio di stile concerne la possibilità che la comunicazione possa o +Un altro esempio di stile concerne la possibilità che la comunicazione possa o meno perdere dati, possa o meno non rispettare l'ordine in cui essi non sono inviati, o inviare dei pacchetti più volte (come nel caso di TCP e UDP). @@ -101,7 +102,7 @@ gestire la perdita o il rimescolamento dei dati, se dovranno essere opportunamente trattati, ecc. -\section{La creazione di un \textit{socket}} +\section{La creazione di un socket} \label{sec:sock_creation} Come accennato l'interfaccia dei socket è estremamente flessibile e permette @@ -149,11 +150,12 @@ implicitamente dal tipo di socket, per cui di norma questo valore viene messo a zero (con l'eccezione dei \textit{raw socket}). Si noti che la creazione del socket si limita ad allocare le opportune -strutture nel kernel (sostanzialmente una voce nella \textit{file table}) e -non comporta nulla riguardo all'indicazione degli indirizzi remoti o locali -attraverso i quali si vuole effettuare la comunicazione. +strutture nel kernel (sostanzialmente una voce nella \itindex{file~table} +\textit{file table}) e non comporta nulla riguardo all'indicazione degli +indirizzi remoti o locali attraverso i quali si vuole effettuare la +comunicazione. -\subsection{Il dominio, o \textit{protocol family}} +\subsection{Il dominio dei socket} \label{sec:sock_domain} Dati i tanti e diversi protocolli di comunicazione disponibili, esistono vari @@ -161,9 +163,9 @@ tipi di socket, che vengono classificati raggruppandoli in quelli che si chiamano \textsl{domini}. La scelta di un dominio equivale in sostanza alla scelta di una famiglia di protocolli, e viene effettuata attraverso l'argomento \param{domain} della funzione \func{socket}. Ciascun dominio ha un -suo nome simbolico che convenzionalmente inizia con una costante che inizia -per \texttt{PF\_}, iniziali di \textit{protocol family}, un altro nome con cui -si indicano i domini. +suo nome simbolico che convenzionalmente è indicato da una costante che inizia +per \texttt{PF\_}, sigla che sta per \textit{protocol family}, altro nome con +cui si indicano i domini. A ciascun tipo di dominio corrisponde un analogo nome simbolico, anch'esso associato ad una costante, che inizia invece per \texttt{AF\_} (da @@ -184,7 +186,7 @@ i capi della comunicazione. \hline \const{PF\_UNSPEC} & 0& Non specificato & \\ \const{PF\_LOCAL} & 1& Local communication & unix(7) \\ - \const{PF\_UNIX}, \const{PF\_FILE}&1& & \\ + \const{PF\_UNIX}, \const{PF\_FILE}&1&Sinonimi di \const{PF\_LOCAL}& \\ \const{PF\_INET} & 2& IPv4 Internet protocols & ip(7) \\ \const{PF\_AX25} & 3& Amateur radio AX.25 protocol & \\ \const{PF\_IPX} & 4& IPX - Novell protocols & \\ @@ -200,18 +202,20 @@ i capi della comunicazione. \const{PF\_SECURITY} &14& Security callback pseudo AF & \\ \const{PF\_KEY} &15& PF\_KEY key management API & \\ \const{PF\_NETLINK} &16& Kernel user interface device & netlink(7) \\ + \const{PF\_ROUTE} &16& Sinonimo di \const{PF\_NETLINK} emula BSD.&\\ \const{PF\_PACKET} &17& Low level packet interface & packet(7) \\ \const{PF\_ASH} &18& Ash & \\ \const{PF\_ECONET} &19& Acorn Econet & \\ \const{PF\_ATMSVC} &20& ATM SVCs & \\ \const{PF\_SNA} &22& Linux SNA Project & \\ - \const{PF\_IRDA} &23& IRDA sockets & \\ - \const{PF\_PPPOX} &24& PPPoX sockets & \\ - \const{PF\_WANPIPE} &25& Wanpipe API sockets & \\ - \const{PF\_BLUETOOTH}&31& Bluetooth sockets & \\ + \const{PF\_IRDA} &23& IRDA socket & \\ + \const{PF\_PPPOX} &24& PPPoX socket & \\ + \const{PF\_WANPIPE} &25& Wanpipe API socket & \\ + \const{PF\_LLC} &26& Linux LLC & \\ + \const{PF\_BLUETOOTH}&31& Bluetooth socket & \\ \hline \end{tabular} - \caption{Famiglie di protocolli definiti in Linux.} + \caption{Famiglie di protocolli definiti in Linux.} \label{tab:net_pf_names} \end{table} @@ -240,10 +244,10 @@ Si tenga presente che non tutte le famiglie di protocolli sono utilizzabili dall'utente generico, ad esempio in generale tutti i socket di tipo \const{SOCK\_RAW} possono essere creati solo da processi che hanno i privilegi di amministratore (cioè con user-ID effettivo uguale a zero) o dotati della -\itindex{capabilities}\textit{capability} \const{CAP\_NET\_RAW}. +\itindex{capabilities} \textit{capability} \const{CAP\_NET\_RAW}. -\subsection{Il tipo, o stile} +\subsection{Il tipo di socket} \label{sec:sock_type} La scelta di un dominio non comporta però la scelta dello stile di @@ -253,13 +257,18 @@ socket permette di scegliere lo stile di comunicazione indicando il tipo di socket con l'argomento \param{type} di \func{socket}. Linux mette a disposizione vari tipi di socket (che corrispondono a quelli che il manuale della \acr{glibc} \cite{glibc} chiama \textit{styles}) identificati dalle -seguenti costanti: +seguenti costanti:\footnote{le pagine di manuale POSIX riportano solo i primi + tre tipi, Linux supporta anche gli altri, come si può verificare nel file + \texttt{include/linux/net.h} dei sorgenti del kernel.} \begin{basedescript}{\desclabelwidth{2.9cm}\desclabelstyle{\nextlinelabel}} \item[\const{SOCK\_STREAM}] Provvede un canale di trasmissione dati bidirezionale, sequenziale e affidabile. Opera su una connessione con un altro socket. I dati vengono ricevuti e trasmessi come un flusso continuo di - byte (da cui il nome \textit{stream}). + byte (da cui il nome \textit{stream}) e possono essere letti in blocchi di + dimensioni qualunque. Può supportare la trasmissione dei cosiddetti dati + urgenti (o \itindex{out-of-band} \textit{out-of-band}, vedi + sez.~\ref{sec:TCP_urgent_data}). \item[\const{SOCK\_DGRAM}] Viene usato per trasmettere pacchetti di dati (\textit{datagram}) di lunghezza massima prefissata, indirizzati singolarmente. Non esiste una connessione e la trasmissione è effettuata in @@ -267,14 +276,15 @@ seguenti costanti: \item[\const{SOCK\_SEQPACKET}] Provvede un canale di trasmissione di dati bidirezionale, sequenziale e affidabile. Opera su una connessione con un altro socket. I dati possono vengono trasmessi per pacchetti di dimensione - massima fissata, ed devono essere letti integralmente da ciascuna - chiamata a \func{read}. + massima fissata, e devono essere letti integralmente da ciascuna chiamata a + \func{read}. \item[\const{SOCK\_RAW}] Provvede l'accesso a basso livello ai protocolli di rete e alle varie interfacce. I normali programmi di comunicazione non devono usarlo, è riservato all'uso di sistema. \item[\const{SOCK\_RDM}] Provvede un canale di trasmissione di dati affidabile, ma in cui non è garantito l'ordine di arrivo dei pacchetti. -\item[\const{SOCK\_PACKET}] Obsoleto, non deve essere usato. +\item[\const{SOCK\_PACKET}] Obsoleto, non deve essere più usato.\footnote{e + pertanto non ne parleremo ulteriormente.} \end{basedescript} Si tenga presente che non tutte le combinazioni fra una famiglia di protocolli @@ -292,10 +302,12 @@ elencati. \hline \hline &\const{SOCK\_STREAM} &\const{SOCK\_DGRAM} &\const{SOCK\_RAW}& - \const{SOCK\_PACKET}&\const{SOCK\_SEQPACKET} \\ + \const{SOCK\_RDM}&\const{SOCK\_SEQPACKET} \\ \hline - \const{PF\_UNIX} & si & si & & & \\ + \const{PF\_LOCAL} & si & si & & & \\ \hline +% \const{PF\_UNIX}&\multicolumn{5}{|l|}{sinonimo di \const{PF\_LOCAL}.}\\ +% \hline \const{PF\_INET} & TCP & UDP & IPv4 & & \\ \hline \const{PF\_INET6} & TCP & UDP & IPv6 & & \\ @@ -457,7 +469,7 @@ altrimenti si avr specifica il \textsl{numero di porta}. I numeri di porta sotto il 1024 sono chiamati \textsl{riservati} in quanto utilizzati da servizi standard e soltanto processi con i privilegi di amministratore (con user-ID effettivo -uguale a zero) o con la \itindex{capabilities}\textit{capability} +uguale a zero) o con la \itindex{capabilities} \textit{capability} \const{CAP\_NET\_BIND\_SERVICE} possono usare la funzione \func{bind} (che vedremo in sez.~\ref{sec:TCP_func_bind}) su queste porte. @@ -466,7 +478,7 @@ come struttura (un resto di una implementazione precedente in cui questa era una \direct{union} usata per accedere alle diverse classi di indirizzi) che direttamente come intero. In \file{netinet/in.h} vengono definite anche alcune costanti che identificano alcuni indirizzi speciali, riportati in -tab.~\ref{tab:TCP_ipv4_addr}, che reincontreremo più avanti. +tab.~\ref{tab:TCP_ipv4_addr}, che rincontreremo più avanti. Infine occorre sottolineare che sia gli indirizzi che i numeri di porta devono essere specificati in quello che viene chiamato \textit{network order}, cioè @@ -541,7 +553,7 @@ il campo \var{sun\_path} deve specificare un indirizzo. Questo ha due forme; può essere un file (di tipo socket) nel filesystem o una stringa univoca (mantenuta in uno spazio di nomi astratto). Nel primo caso l'indirizzo viene specificato come una stringa (terminata da uno zero) corrispondente al -\itindex{pathname}\textit{pathname} del file; nel secondo invece +\itindex{pathname} \textit{pathname} del file; nel secondo invece \var{sun\_path} inizia con uno zero e vengono usati come nome i restanti byte come stringa, senza terminazione. @@ -583,7 +595,7 @@ Il campo \var{sat\_family} deve essere sempre \const{AF\_APPLETALK}, mentre il campo \var{sat\_port} specifica la porta che identifica i vari servizi. Valori inferiori a 129 sono usati per le \textsl{porte riservate}, e possono essere usati solo da processi con i privilegi di amministratore o con la -\itindex{capabilities}\textit{capability} \const{CAP\_NET\_BIND\_SERVICE}. +\itindex{capabilities} \textit{capability} \const{CAP\_NET\_BIND\_SERVICE}. L'indirizzo remoto è specificato nella struttura \var{sat\_addr}, e deve essere in \textit{network order} (vedi sez.~\ref{sec:sock_endianess}); esso è composto da un parte di rete data dal campo \var{s\_net}, che può assumere il @@ -602,8 +614,11 @@ un'interfaccia specifica di Linux per inviare e ricevere pacchetti direttamente su un'interfaccia di rete, senza passare per le funzioni di gestione dei protocolli di livello superiore. In questo modo è possibile implementare dei protocolli in user space, agendo direttamente sul livello -fisico. In genere comunque si preferisce usare la libreria \file{pcap}, che -assicura la portabilità su altre piattaforme, anche se con funzionalità +fisico. In genere comunque si preferisce usare la libreria +\file{pcap},\footnote{la libreria è mantenuta insieme al comando + \cmd{tcpdump}, informazioni e documentazione si possono trovare sul sito del + progetto \href{http://www.tcpdump.org/}{\texttt{http://www.tcpdump.org/}}.} +che assicura la portabilità su altre piattaforme, anche se con funzionalità ridotte. Questi socket possono essere di tipo \const{SOCK\_RAW} o \const{SOCK\_DGRAM}. @@ -634,7 +649,7 @@ speciale \const{ETH\_P\_ALL} passeranno sul \textit{packet socket} tutti i pacchetti, qualunque sia il loro protocollo di collegamento. Ovviamente l'uso di questi socket è una operazione privilegiata e può essere effettuati solo da un processo con i privilegi di amministratore (user-ID effettivo nullo) o con -la \itindex{capabilities}\textit{capability} \const{CAP\_NET\_RAW}. +la \itindex{capabilities} \textit{capability} \const{CAP\_NET\_RAW}. Una volta aperto un \textit{packet socket}, tutti i pacchetti del protocollo specificato passeranno attraverso di esso, qualunque sia l'interfaccia da cui @@ -691,9 +706,9 @@ macchina ricevente, \const{PACKET\_BROADCAST} per un pacchetto di \itindex{broadcast} \textit{broadcast}, \const{PACKET\_MULTICAST} per un pacchetto inviato ad un indirizzo fisico di \itindex{multicast} \textit{multicast}, \const{PACKET\_OTHERHOST} per un pacchetto inviato ad -un'altra stazione (e ricevuto su un'interfaccia in modo promiscuo), -\const{PACKET\_OUTGOING} per un pacchetto originato dalla propria macchina che -torna indietro sul socket. +un'altra stazione (e ricevuto su un'interfaccia in \index{modo~promiscuo} modo +promiscuo), \const{PACKET\_OUTGOING} per un pacchetto originato dalla propria +macchina che torna indietro sul socket. Si tenga presente infine che in fase di ricezione, anche se si richiede il @@ -835,7 +850,7 @@ accedere al contenuto della prima variabile, ed infine calcola (\texttt{\small 11}) il valore della seconda assumendo che il primo byte sia quello meno significativo (cioè, per quanto visto in fig.~\ref{fig:sock_endianess}, che sia \textit{little endian}). Infine la funzione restituisce (\texttt{\small 12}) -il valore del confonto delle due variabili. +il valore del confronto delle due variabili. \itindend{endianess} @@ -843,7 +858,7 @@ il valore del confonto delle due variabili. \subsection{Le funzioni per il riordinamento} \label{sec:sock_func_ord} -Il problema connesso all'endianess\itindex{endianess} è che quando si passano +Il problema connesso \itindex{endianess} all'endianess è che quando si passano dei dati da un tipo di architettura all'altra i dati vengono interpretati in maniera diversa, e ad esempio nel caso dell'intero a 16 bit ci si ritroverà con i due byte in cui è suddiviso scambiati di posto. Per questo motivo si @@ -1008,7 +1023,7 @@ Il formato usato per gli indirizzi in formato di presentazione \textit{dotted decimal} per IPv4 e quello descritto in sez.~\ref{sec:IP_ipv6_notation} per IPv6. -\index{socket|)} +\index{socket!definizione|)} @@ -1016,3 +1031,29 @@ sez.~\ref{sec:IP_ipv6_notation} per IPv6. %%% mode: latex %%% TeX-master: "gapil" %%% End: + +% LocalWords: socket sez cap BSD SVr XTI Transport Interface TCP stream UDP PF +% LocalWords: datagram broadcast descriptor sys int domain type protocol errno +% LocalWords: EPROTONOSUPPORT ENFILE kernel EMFILE EACCES EINVAL ENOBUFS raw +% LocalWords: ENOMEM table family AF address name glibc UNSPEC LOCAL Local IPv +% LocalWords: communication INET protocols ip AX Amateur IPX Novell APPLETALK +% LocalWords: Appletalk ddp NETROM NetROM Multiprotocol ATMPVC Access to ATM +% LocalWords: PVCs ITU ipv PLP DECnet Reserved for project NETBEUI LLC KEY key +% LocalWords: SECURITY Security callback NETLINK interface device netlink Low +% LocalWords: PACKET level packet ASH Ash ECONET Acorn Econet ATMSVC SVCs SNA +% LocalWords: IRDA PPPOX PPPoX WANPIPE Wanpipe BLUETOOTH Bluetooth POSIX bits +% LocalWords: dall'header tab SOCK capabilities capability styles DGRAM read +% LocalWords: SEQPACKET RDM sockaddr reference void fig Header uint socklen at +% LocalWords: addr netinet port len Stevens unsigned short casting nell'header +% LocalWords: BIND SERVICE bind union order big endian flowinfo dell'header ll +% LocalWords: multicast multicasting local socketpair sun path filesystem AARP +% LocalWords: pathname AppleTalk netatalk personal Apple ATPROTO atalk sat if +% LocalWords: ANYNET node ANYNODE ATADDR BCAST pcap IEEE linux ether ETH ALL +% LocalWords: sll ifindex ethernet halen MAC hatype ARP arp pkttype HOST recv +% LocalWords: OTHERHOST OUTGOING recvfrom recvmsg endianess little endtest Mac +% LocalWords: Intel Digital Motorola IBM VME PowerPC l'Intel xABCD ptr htonl +% LocalWords: all'endianess htons ntohl ntohs long hostlong hostshort netlong +% LocalWords: sort netshort host inet aton ntoa dotted decimal const char src +% LocalWords: strptr struct dest addrptr INADDR NULL pton ntop presentation af +% LocalWords: numeric EAFNOSUPPORT size ENOSPC ENOAFSUPPORT ADDRSTRLEN ROUTE +% LocalWords: of tcpdump