Correzioni
[gapil.git] / intro.tex
index 13a5f4a7eff9bbecf2af8456b202c862f3e886cd..d2833478591e6539840f760e020d0ee240da36ae 100644 (file)
--- a/intro.tex
+++ b/intro.tex
@@ -2,51 +2,51 @@
 \label{cha:intro_unix}
 
 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
-cui è basato un sistema di tipo unix come GNU/Linux, per fornire una base di
-comprensione mirata a sottolineare le peculiarità che saranno poi importanti
-per quello che riguarda la programmazione. 
+cui è basato un sistema di tipo unix come GNU/Linux, in questo modo potremo
+fornire una base di comprensione mirata a sottolineare le peculiarità del
+sistema che sono più rilevanti per quello che riguarda la programmazione.
 
 Dopo un introduzione sulle caratteristiche principali di un sistema di tipo
 unix passeremo ad illustrare alcuni dei concetti basi dell'architettura di
-Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
-introdurremo alcunoi degli standard princincipali a cui si fa riferimento.
+GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
+introdurremo alcuni degli standard principali a cui viene fatto riferimento.
 
 
-\section{Una panoramica sulla struttura}
+\section{Una panoramica}
 \label{sec:intro_unix_struct}
 
-In questa prima sezione faremo una panoramica sulla struttura di un sistema
-\textit{unix-like} come Linux.  Chi avesse già una conoscenza di questa
-materia può tranquillamente saltare questa sezione.
+In questa prima sezione faremo una breve panoramica sull'architettura del
+sistema.  Chi avesse già una conoscenza di questa materia può tranquillamente
+saltare questa sezione.
 
-Il concetto base di un sistema unix-like é quello di un nucleo del sistema (il
+Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
 cosiddetto \textit{kernel}) a cui si demanda la gestione delle risorse
 essenziali (la CPU, la memoria, le periferiche) mentre tutto il resto, quindi
 anche la parte che prevede l'interazione con l'utente, deve venire realizzato
 tramite programmi eseguiti dal kernel e che accedano alle risorse hardware
 tramite delle richieste a quest'ultimo.
 
-Fin dall'inizio unix si presenta come un sistema operativo
+Fin dall'inizio uno unix si presenta come un sistema operativo
 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
 programmi, e multiutente, in cui é possibile che più utenti siano connessi ad
 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
 a rotazione).
 
-% Questa e' una distinzione essenziale da capire,
+% Questa e` una distinzione essenziale da capire,
 %specie nei confronti dei sistemi operativi successivi, nati per i personal
 %computer (e quindi per un uso personale), sui quali l'hardware (allora
 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
 
-Gli unix più recenti, come Linux, sono stati realizzati usando alcune
+Gli unix più recenti, come Linux, sono realizzati sfruttando alcune
 caratteristiche dei processori moderni come la gestione hardware della memoria
 e la modalità protetta. In sostanza con i processori moderni si può
 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
 zone di memoria fisica.  Quello che succede é che il kernel é il solo
 programma ad essere eseguito in modalità privilegiata, con il completo accesso
 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
-(e non possono accedere direttamente alle zone di memoria riservate
-o alle porte di input/output).
+(e non possono accedere direttamente alle zone di memoria riservate o alle
+porte di input/output).
 
 Una parte del kernel, lo \textit{scheduler}, si occupa di stabilire, ad
 intervalli fissi e sulla base di un opportuno calcolo delle priorità, quale
@@ -57,19 +57,19 @@ soltanto attraverso delle opportune chiamate al sistema che restituiranno il
 controllo al kernel.
 
 La memoria viene sempre gestita del kernel attraverso il meccanismo della
-memoria virtuale, che consente di assegnare a ciascun processo uno spazio di
-indirizzi ``virtuale'' (vedi \secref{sec:proc_memory}) che il kernel stesso,
-con l'ausilio della unità di gestione della memoria, si incaricherà di
-rimappare automaticamente sulla memoria disponibile, salvando quando
-necessario su disco (nella cosiddetta \textit{swap}) le pagine di memoria in
+\textsl{memoria virtuale}, che consente di assegnare a ciascun processo uno
+spazio di indirizzi ``virtuale'' (vedi \secref{sec:proc_memory}) che il kernel
+stesso, con l'ausilio della unità di gestione della memoria, si incaricherà di
+rimappare automaticamente sulla memoria disponibile, salvando su disco quando
+necessario (nella cosiddetta area di \textit{swap}) le pagine di memoria in
 eccedenza.
 
 Le periferiche infine vengono viste in genere attraverso un'interfaccia
 astratta che permette di trattarle come fossero file, secondo il concetto per
-cui \textit{everything is a file}, vedi \capref{cha:files_intro}, (questo non
-è vero per le interfacce di rete, che hanno un'interfaccia diversa, ma resta
-valido il concetto generale che tutto il lavoro di accesso e gestione a basso
-livello è effettuato dal kernel).
+cui \textit{everything is a file}, su cui torneremo in dettaglio in
+\capref{cha:files_intro}, (questo non è vero per le interfacce di rete, che
+hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
+il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
 
 
 \section{User space e kernel space}
@@ -81,7 +81,7 @@ contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
 \textit{kernel space} che é l'ambiente in cui viene eseguito il kernel. Ogni
 programma vede se stesso come se avesse la piena disponibilità della CPU e
 della memoria ed è, salvo i meccanismi di comunicazione previsti
-dall'architettura completamente ignaro del fatto che altri programmi possono
+dall'architettura, completamente ignaro del fatto che altri programmi possono
 essere messi in esecuzione dal kernel.
 
 Per questa separazione non è possibile ad un singolo programma disturbare
@@ -91,7 +91,7 @@ processi non hanno di questi limiti, o che vengono per vari motivi eseguiti al
 livello del kernel.
 
 Pertanto deve essere chiaro a chi programma in unix che l'accesso diretto
-all'hardware non può avvenire se non all'interno del kernel, al di fuori dal
+all'hardware non può avvenire se non all'interno del kernel; al di fuori dal
 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
 fornisce allo user space. 
 
@@ -101,25 +101,25 @@ fornisce allo user space.
 
 Per capire meglio la distinzione fra kernel space e user space si può prendere
 in esame la procedura di avvio di un sistema unix; all'avvio il BIOS (o in
-generale il software di avvio posto nelle EPROM) eseguirà il \textit{boot}
-incaricandosi di caricare il kernel in memoria e di farne partire
-l'esecuzione; quest'ultimo, dopo aver inizializzato le periferiche farà
-partire il primo processo, \textit{init} che è quello che si incaricherà di
-far partire tutti i processi successivi, come quello che si occupa di
-dialogare con la tastiera e lo schermo della console, mettendo a disposizione
-dell'utente che si vuole collegare un terminale e la stessa \textit{shell} da
-cui inviare i comandi.
+generale il software di avvio posto nelle EPROM) eseguirà la procedura di
+avvio del sistema (il cosiddetto \textit{boot}) incaricandosi di caricare il
+kernel in memoria e di farne partire l'esecuzione; quest'ultimo, dopo aver
+inizializzato le periferiche farà partire il primo processo, \cmd{init} che è
+quello che a sua volta farà partire tutti i processi successivi,fra i quali
+c'è pure quello che si occupa di dialogare con la tastiera e lo schermo della
+console, e quello che mette a disposizione dell'utente che si vuole collegare
+un terminale e la stessa \textit{shell} da cui inviare i comandi.
 
 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
-programma di scrittura o di disegno, in user space.
+qualunque programma di scrittura o di disegno, in user space.
 
 Questo significa ad esempio che il sistema di per sé non dispone di primitive
 per tutta una serie di operazioni (come la copia di un file) che altri sistemi
-(come Windows) hanno invece al loro interno. Per questo può capitare che
-alcune operazioni, come quella in esempio, siano implementate come normali
-programmi.
+(come Windows) hanno invece al loro interno. Pertanto buona parte delle
+operazioni di normale amministrazione di un sistema, come quella in esempio,
+sono implementate come normali programmi.
 
 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
 %realizzare un sistema di permessi e controlli che evitano che i programmi
@@ -137,18 +137,18 @@ si aspetta da un sistema operativo.
 
 Come accennato le interfacce con cui i programmi possono accedere all'hardware
 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
-  call}), si tratta di un insieme di routine che un programma può chiamare per
-le quali viene generata una interruzione e il controllo è passato dal
-programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie di
-operazioni interne come la gestione del multitaskin e il l'allocazione della
-memoria) eseguirà la funzione richiesta in kernel space restituendo i
+  call}), si tratta di un insieme di funzioni, che un programma può chiamare,
+per le quali viene generata una interruzione processo e il controllo è passato
+dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
+di operazioni interne come la gestione del multitasking e il l'allocazione
+della memoria) eseguirà la funzione richiesta in kernel space restituendo i
 risultati al chiamante.
 
 Ogni versione unix ha storicamente sempre avuto un certo numero di queste
 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale della
-  programmazione di unix} (quella che si accede con il comando \texttt{man 2})
-e linux non fa eccezione. Queste sono poi state codificate da vari standard,
-che esamineremo brevemente in \secref{sec:intro_standard}.
+  programmazione di unix} (quella che si accede con il comando \cmd{man 2
+  nome}) e GNU/Linux non fa eccezione. Queste sono poi state codificate da vari
+standard, che esamineremo brevemente in \secref{sec:intro_standard}.
 
 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
@@ -161,19 +161,20 @@ il linguaggio C implementano direttamente operazioni comuni come la
 allocazione dinamica della memoria, l'input/output bufferizzato o la
 manipolazione delle stringhe presenti in qualunque programma.
 
-Per questo in Linux è in effetti GNU/Linux, in quanto una parte essenziale del
-sistema (senza la quale niente può funzionare) è la realizzazione fatta dalla
-Free Software Foundation della suddetta libreria (la GNU Standard C Library,
-in breve \textit{glibc}), in cui sono state implementate tutte le funzioni
-essenziali definite negli standard POSIX e ANSI C, e che viene utilizzata da
-qualunque programma.
+Anche per questo in Linux è in effetti GNU/Linux, in quanto una parte
+essenziale del sistema (senza la quale niente può funzionare) è la
+realizzazione fatta dalla Free Software Foundation della suddetta libreria (la
+GNU Standard C Library, in breve \textit{glibc}), in cui sono state
+implementate tutte le funzioni essenziali definite negli standard POSIX e ANSI
+C, che vengono utilizzate da qualunque programma.
 
 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
-Manuale di Programmazione di Unix, e sono costruite sulla base delle chiamate
-al sistema del kernel; è importante avere presente questa distinzione,
-fondamentale dal punto di vista dell'implementazione, anche se poi nella
-relizzazione di normali programmi non si hanno differenze pratiche fra l'uso
-di una funzione di libreria e quello di una chiamata al sistema.
+Manuale di Programmazione di Unix (cioè accessibili con il comando \cmd{man 2
+  nome}), e sono costruite sulla base delle chiamate al sistema del kernel; è
+importante avere presente questa distinzione, fondamentale dal punto di vista
+dell'implementazione, anche se poi nella realizzazione di normali programmi
+non si hanno differenze pratiche fra l'uso di una funzione di libreria e
+quello di una chiamata al sistema.
 
 
 \subsection{Un sistema multiutente}
@@ -194,7 +195,10 @@ Ad ogni utente 
 richiesto all'ingresso nel sistema dalla procedura di \textit{login}. Questa
 procedura si incarica di verificare la identità dell'utente (in genere
 attraverso la richiesta di una parola d'ordine, anche se sono possibili
-meccanismi diversi).
+meccanismi diversi\footnote{Ad esempio usando la libreria PAM
+  (\textit{Pluggable Autentication Methods}) è possibile astrarre
+  completamente i meccanismi di autenticazione e sostituire ad esempio l'uso
+  delle password con meccanismi di identificazione biometrica}.
 
 Eseguita la procedura di riconoscimento in genere il sistema manda in
 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
@@ -211,7 +215,7 @@ L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
 un nome in espresso in caratteri è inserita nei due files \file{/etc/passwd}
 e \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto
 in breve \acr{uid} e il \textit{group identifier}, detto in breve \acr{gid}
-che sono quelli che identificano l'utente di fronte al sistema.
+che sono quelli che poi vengono usati dal kernel per riconoscere l'utente.
  
 In questo modo il sistema è in grado di tenere traccia per ogni processo
 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
@@ -220,10 +224,12 @@ sicurezza interna in quanto anche l'accesso ai file (vedi
 \secref{sec:file_access_control}) è regolato da questo meccanismo di
 identificazione.
 
-Un utente speciale del sistema è \textit{root}, il cui \acr{uid} è zero. Esso
-identifica l'amministratore del sistema, che deve essere in grado di fare
-qualunque operazione; pertanto per l'utente \textit{root} i meccanismi di
-controllo descritti in precedenza sono disattivati.
+Infine in ogni unix è presente un utente speciale privilegiato, di norma
+chiamato \textit{root}, il cui \acr{uid} è zero. Esso identifica
+l'amministratore del sistema, che deve essere in grado di fare qualunque
+operazione; per l'utente \textit{root} infatti i meccanismi di controllo
+descritti in precedenza sono disattivati\footnote{i controlli infatti vengono
+  sempre eseguiti da un codice del tipo \texttt{if (uid) \{ ... \}}}.
 
 
 \section{Gli standard di unix e GNU/Linux}
@@ -236,114 +242,70 @@ tipi di dati.
 \subsection{Prototipi e puntatori}
 \label{sec:intro_function}
 
-\subsection{La misura del tempo in unix}
-\label{sec:intro_unix_time}
-
-Storicamente i sistemi unix-like hanno sempre mantenuto due distinti valori
-per i tempi all'interno del sistema, chiamati rispettivamente \textit{calendar
-  time} e \textit{process time}, secondo le definizioni:
-\begin{itemize}
-\item \textit{calendar time}: è il numero di secondi dalla mezzanotte del
-  primo gennaio 1970, in tempo universale coordinato (o UTC, data che viene
-  usualmente indicata con 00:00:00 Jan, 1 1970 (UTC) e chiamata \textit{the
-    Epoch}). Viene chiamato anche GMT (Greenwich Mean Time) dato che l'UTC
-  corrisponde all'ora locale di Greenwich.  E' il tempo su cui viene mantenuto
-  l'orologio del calcolatore, e viene usato ad esempio per indicare le date di
-  modifica dei file o quelle di avvio dei processi. Per memorizzare questo
-  tempo è stato riservato il tipo primitivo \func{time\_t}.
-\item \textit{process time}: talvolta anche detto tempo di CPU. Viene misurato
-  in \textit{clock tick}, corripondenti al numero di interruzioni effettuate
-  dal timer di sistema, e che per Linux sono ogni centesimo di secondo
-  (eccetto per la piattaforma alpha). Il dato primitivo usato per questo tempo
-  è \func{clock\_t}, inoltre la costante \macro{HZ} restituisce la frequenza
-  di operazione del timer, e corrisponde dunque al numero di tick al secondo
-  (Posix definisce allo stesso modo la costante \macro{CLK\_TCK}); questo
-  valore può comunque essere ottenuto con \func{sysconf} (vedi
-  \secref{sec:intro_limits}).
-\end{itemize}
-
-In genere si usa il \textit{calendar time} per tenere le date dei file e le
-informazioni analoghe che riguardano i tempi di ``orologio'' (usati ad esempio
-per i demoni che compiono lavori amministrativi ad ore definite, come
-\cmd{cron}). Di solito questo vene convertito automaticamente dal valore in
-UTC al tempo locale, utilizzando le opportune informazioni di localizzazione
-(specificate in \file{/etc/timezone}). E da tenere presente che questo tempo è
-mantenuto dal sistema e non corrisponde all'orologio hardware del calcolatore.
-
-Il \textit{process time} di solito si esprime in secondi e viene usato appunto
-per tenere conto dei tempi di esecuzione dei processi. Per ciascun processo il
-kernel tiene tre di questi tempi: 
-\begin{itemize}
-\item \textit{clock time}
-\item \textit{user time}
-\item \textit{system time}
-\end{itemize}
-il primo è il tempo ``reale'' (viene anche chiamato \textit{wall clock time})
-dall'avvio del processo, e misura il tempo trascorso fino alla sua
-conclusione; chiaramente un tale tempo dipede anche dal carico del sistema e
-da quanti altri processi stavano girando nello stesso periodo. Il secondo
-tempo è quello che la CPU ha speso nell'esecuzione delle istruzioni del
-processo in user space. Il terzo è il tempo impiegato dal kernel per eseguire
-delle system call per conto del processo medesimo (tipo quello usato per
-eseguire una \func{write} su un file). In genere la somma di user e system
-time viene chiamato \textit{CPU time}. 
 
 \subsection{Lo standard ANSI C}
 \label{sec:intro_ansiC}
 
-\subsection{Lo standard POSIX}
-\label{sec:intro_posix}
+Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
+  Standard Institute}, come standard del linguaggio C ed è stato
+successivamente adottatto dalla \textit{International Standard Organisation}
+come standard internazionale con la sigla ISO/IEC 9899:1990.
 
-\subsection{Valori e limiti del sistema}
-\label{sec:intro_limits}
+Scopo dello standard è quello di garantire la portabilità dei programmi C fra
+sistemi operativi diversi, ma oltre alla sintassi e alla semantica del
+linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
+anche una libreria di funzioni standard che devono poter essere implementate
+su qualunque sistema operativo.
 
+Linux, come molti unix moderni, provvede la compatibilità con questo standard,
+fornendo le funzioni di libreria da esso previste; queste sono dichiarate in
+quindici header files, uno per ciascuna delle quindici aree in cui è stata
+suddivisa la libreria. In \ntab\ si sono riportati questi header, insieme a
+quelli definiti negli altri standard descritti nelle sezioni successive.
 
-\subsection{Tipi di dati primitivi}
-\label{sec:intro_data_types}
+\subsection{Lo standard POSIX}
+\label{sec:intro_posix}
+
+In realtà POSIX è una famiglia di standard diversi, il nome, suggerito da
+Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
+X finale denuncia la sua stretta relazione con i sistemi unix. Esso nasce dal
+lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
+che ne ha prodotto un primo una prima versione, nota come IEEE 1003.1-1988,
+mirante a standardizzare l'interfaccia con il sistema operativo.
 
-\section{La gestione degli errori}
-\label{sec:intro_errors}
+Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
+libreria, e in seguito sono stati prodotti anche altri standard per la shell e
+le utilities di sistema (1003.2), per le estensioni realtime e per i thread
+(1003.1d e 1003.1c) e molti altri. 
 
-La gestione degli errori è in genere una materia complessa. Inoltre il modello
-utilizzato dai sistema unix-like è basato sull'architettura a processi, e
-presenta una serie di problemi nel caso lo si debba usare con i thread.
-Esamineremo in questa sezione le sue caratteristiche principali.
+Benchè lo standard POSIX sia basato sui sistemi unix esso definisce comunque
+una interfaccia e non fa riferimento ad una specifica implementazione (per cui
+esiste ad esempio anche una implementazione di questo standard pure sotto
+Windows NT). Lo standard si è evoluto nel tempo ed una nuova versione (quella
+che viene normalmente denominata POSIX.1) è stata rilasciata come standard
+internazionale con la sigla ISO/IEC 9945-1:1990.
 
 
+\subsection{Lo standard X/Open -- XPG3}
+\label{sec:intro_xopen}
 
-\subsection{La variabile \func{errno}}
-\label{sec:intro_errno}
+Il consorzio X/Open nasce come consorzio di venditori di sistemi unix, che nel
+1989 produsse una voluminosa guida chiamata \textit{X/Open Portability Guide,
+  Issue 3} al cui interno definiva una ulteriore standardizzazione
+dell'interfaccia ad un sistema unix.
 
-Quasi tutte le funzioni delle librerie del C sono in grado di individuare e
-riportare condizioni di errore, ed è una buona norma di programmazione
-controllare sempre che le funzioni chiamate si siano concluse correttamente.
+Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
+basato sullo standard POSIX.1, ma prevede una serie di funzionalità
+aggiuntive.
 
-In genere le funzioni di libreria usano un valore speciale per indicare che
-c'è stato un errore. Di solito questo valore è -1 o un puntatore nullo o la
-costante \macro{EOF} (a seconda della funzione); ma questo valore segnala solo
-che c'è stato un errore, non il tipo di errore. 
+Il consorzio 
 
-Per riportare il tipo di errore il sistema usa la variabile globale
-\var{errno}\footnote{L'uso di una variabile globale può comportare alcuni
-  problemi (ad esempio nel caso dei thread) ma lo standard ISO C consente
-  anche di definire \var{errno} come un \textit{modifiable lvalue}, quindi si
-  può anche usare una macro, e questo è infatti il modo usato da Linux per
-  renderla locale ai singoli thread
-}, definita nell'header \file{errno.h}, la variabile è in genere
-definita come \var{volatile} dato che può essere cambiata in modo asincrono da
-un segnale (per una descrizione dei segnali si veda \secref{cha:signals}), ma
-dato che un manipolatore di segnale scritto bene salva e ripristina il valore
-della varibile, di questo non è necessario preoccuparsi nella programmazione
-normale.
 
-I valori che può assumere \var{errno} sono riportati in \capref{cha:errors},
-nell'header \file{errno.h} sono anche definiti i nomi simbolici per le
-costanti numeriche che identificano i vari errori. In seguito faremo sempre
-rifermento a tali valori, quando descriveremo i possibili errori restituiti
-dalle funzioni.
+\subsection{Valori e limiti del sistema}
+\label{sec:intro_limits}
 
-\subsection{Le funzioni \func{strerror} e \func{perror}}
-\label{sec:intro_strerror}
 
+\subsection{Tipi di dati primitivi}
+\label{sec:intro_data_types}