Aggiunte note sugli errori
[gapil.git] / intro.tex
index 4c871ac0e67b32ce7853f3d6f56df6d0e1365c0c..cdc19e16842236569f6023dd7d61281dcc903a98 100644 (file)
--- a/intro.tex
+++ b/intro.tex
@@ -201,46 +201,216 @@ esecuzione un programma di interfaccia (che pu
 terminale o una interfaccia grafica) che mette a disposizione dell'utente un
 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
 
-Ogni utente appartiene anche ad almeno un gruppo (\textit{group}), ma può
-essere associato a più gruppi, questo permette di gestire i permessi di
+Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
+\textit{default group}), ma può essere associato ad altri gruppi (i
+\textit{supplementary group}), questo permette di gestire i permessi di
 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
 
-% L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
-% un nome in espresso in caratteri \`e inserita nei due files
-% \texttt{/etc/passwd} e \texttt{/etc/groups}). Questi numeri sono
-% l'\textit{user identifier}, detto in breve \textit{uid} e il \textit{group
-%  identifier}, detto in breve \textit{gid} che sono quelli che identificano
-% l'utente di fronte al sistema.
-
+L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
+un nome in espresso in caratteri è inserita nei due files \file{/etc/passwd}
+e \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto
+in breve \acr{uid} e il \textit{group identifier}, detto in breve \acr{gid}
+che sono quelli che identificano l'utente di fronte al sistema.
 In questo modo il sistema è in grado di tenere traccia per ogni processo
 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
 esso. Inoltre con questo sistema viene anche garantita una forma base di
 sicurezza interna in quanto anche l'accesso ai file (vedi
-\secref{sec:fileintr_access_ctrl}) è regolato da questo meccanismo di
+\secref{sec:file_access_control}) è regolato da questo meccanismo di
 identificazione.
 
-Un utente speciale del sistema è \textit{root}, il cui uid è zero. Esso
+Un utente speciale del sistema è \textit{root}, il cui \acr{uid} è zero. Esso
 identifica l'amministratore del sistema, che deve essere in grado di fare
-qualunque operazione; pertanto per l'utente root i meccanismi di controllo
-descritti in precedenza sono disattivati.
+qualunque operazione; pertanto per l'utente \textit{root} i meccanismi di
+controllo descritti in precedenza sono disattivati.
 
 
-\section{Gli standard di unix e Linux}
+\section{Gli standard di unix e GNU/Linux}
 \label{sec:intro_standard}
 
-
+In questa sezione prenderemo in esame alcune caratteristiche generali del
+sistema e gli standard adottati per le funzioni, i prototipi, gli errori, i
+tipi di dati.
+
+\subsection{Prototipi e puntatori}
+\label{sec:intro_function}
+
+\subsection{La misura del tempo in unix}
+\label{sec:intro_unix_time}
+
+Storicamente i sistemi unix-like hanno sempre mantenuto due distinti valori
+per i tempi all'interno del sistema, chiamati rispettivamente \textit{calendar
+  time} e \textit{process time}, secondo le definizioni:
+\begin{itemize}
+\item \textit{calendar time}: è il numero di secondi dalla mezzanotte del
+  primo gennaio 1970, in tempo universale coordinato (o UTC, data che viene
+  usualmente indicata con 00:00:00 Jan, 1 1970 (UTC) e chiamata \textit{the
+    Epoch}). Viene chiamato anche GMT (Greenwich Mean Time) dato che l'UTC
+  corrisponde all'ora locale di Greenwich.  E' il tempo su cui viene mantenuto
+  l'orologio del calcolatore, e viene usato ad esempio per indicare le date di
+  modifica dei file o quelle di avvio dei processi. Per memorizzare questo
+  tempo è stato riservato il tipo primitivo \func{time\_t}.
+\item \textit{process time}: talvolta anche detto tempo di CPU. Viene misurato
+  in \textit{clock tick}, corripondenti al numero di interruzioni effettuate
+  dal timer di sistema, e che per Linux sono ogni centesimo di secondo
+  (eccetto per la piattaforma alpha). Il dato primitivo usato per questo tempo
+  è \func{clock\_t}, inoltre la costante \macro{HZ} restituisce la frequenza
+  di operazione del timer, e corrisponde dunque al numero di tick al secondo
+  (Posix definisce allo stesso modo la costante \macro{CLK\_TCK}); questo
+  valore può comunque essere ottenuto con \func{sysconf} (vedi
+  \secref{sec:intro_limits}).
+\end{itemize}
+
+In genere si usa il \textit{calendar time} per tenere le date dei file e le
+informazioni analoghe che riguardano i tempi di ``orologio'' (usati ad esempio
+per i demoni che compiono lavori amministrativi ad ore definite, come
+\cmd{cron}). Di solito questo vene convertito automaticamente dal valore in
+UTC al tempo locale, utilizzando le opportune informazioni di localizzazione
+(specificate in \file{/etc/timezone}). E da tenere presente che questo tempo è
+mantenuto dal sistema e non corrisponde all'orologio hardware del calcolatore.
+
+Il \textit{process time} di solito si esprime in secondi e viene usato appunto
+per tenere conto dei tempi di esecuzione dei processi. Per ciascun processo il
+kernel tiene tre di questi tempi: 
+\begin{itemize}
+\item \textit{clock time}
+\item \textit{user time}
+\item \textit{system time}
+\end{itemize}
+il primo è il tempo ``reale'' (viene anche chiamato \textit{wall clock time})
+dall'avvio del processo, e misura il tempo trascorso fino alla sua
+conclusione; chiaramente un tale tempo dipede anche dal carico del sistema e
+da quanti altri processi stavano girando nello stesso periodo. Il secondo
+tempo è quello che la CPU ha speso nell'esecuzione delle istruzioni del
+processo in user space. Il terzo è il tempo impiegato dal kernel per eseguire
+delle system call per conto del processo medesimo (tipo quello usato per
+eseguire una \func{write} su un file). In genere la somma di user e system
+time viene chiamato \textit{CPU time}. 
 
 \subsection{Lo standard ANSI C}
 \label{sec:intro_ansiC}
 
-
-
 \subsection{Lo standard POSIX}
-\label{sec:intro_ansiC}
-
-
-
-
-
-
+\label{sec:intro_posix}
+
+\subsection{Valori e limiti del sistema}
+\label{sec:intro_limits}
+
+
+\subsection{Tipi di dati primitivi}
+\label{sec:intro_data_types}
+
+
+
+
+\section{La gestione degli errori}
+\label{sec:intro_errors}
+
+La gestione degli errori è in genere una materia complessa. Inoltre il modello
+utilizzato dai sistema unix-like è basato sull'architettura a processi, e
+presenta una serie di problemi nel caso lo si debba usare con i thread.
+Esamineremo in questa sezione le sue caratteristiche principali.
+
+
+\subsection{La variabile \func{errno}}
+\label{sec:intro_errno}
+
+Quasi tutte le funzioni delle librerie del C sono in grado di individuare e
+riportare condizioni di errore, ed è una buona norma di programmazione
+controllare sempre che le funzioni chiamate si siano concluse correttamente.
+
+In genere le funzioni di libreria usano un valore speciale per indicare che
+c'è stato un errore. Di solito questo valore è -1 o un puntatore nullo o la
+costante \macro{EOF} (a seconda della funzione); ma questo valore segnala solo
+che c'è stato un errore, non il tipo di errore. 
+
+Per riportare il tipo di errore il sistema usa la variabile globale
+\var{errno}\footnote{L'uso di una variabile globale può comportare alcuni
+  problemi (ad esempio nel caso dei thread) ma lo standard ISO C consente
+  anche di definire \var{errno} come un \textit{modifiable lvalue}, quindi si
+  può anche usare una macro, e questo è infatti il modo usato da Linux per
+  renderla locale ai singoli thread }, definita nell'header \file{errno.h}, la
+variabile è in genere definita come \var{volatile} dato che può essere
+cambiata in modo asincrono da un segnale (per una descrizione dei segnali si
+veda \secref{cha:signals}), ma dato che un manipolatore di segnale scritto
+bene salva e ripristina il valore della variabile, di questo non è necessario
+preoccuparsi nella programmazione normale.
+
+I valori che può assumere \var{errno} sono riportati in \capref{cha:errors},
+nell'header \file{errno.h} sono anche definiti i nomi simbolici per le
+costanti numeriche che identificano i vari errori; essi iniziano tutti per
+\macro{E} e si possono considerare come nomi riservati. In seguito faremo
+sempre rifermento a tali valori, quando descriveremo i possibili errori
+restituiti dalle funzioni. Il programma di esempio \cmd{errcode} stampa il
+codice relativo ad un valore numerico con l'opzione \cmd{-l}.
+
+Il valore di \var{errno} viene sempre settato a zero all'avvio di un
+programma, gran parte delle funzioni di libreria settano \var{errno} ad un
+valore diverso da zero in caso di errore. Si tenga presente che le funzioni
+non cambiano il valore di \var{errno} quando hanno successo, pertanto un
+valore non nullo non è sintomo di errore (potrebbe essere il risultato di un
+errore precedente) e non si può usare \var{errno} per determinare
+\textsl{quando} una chiamata a funzione è fallita.  Pertanto la procedura da
+seguire è quella di controllare \var{errno} immediatamente dopo il fallimento
+della chiamata.
+
+
+\subsection{Le funzioni \func{strerror} e \func{perror}}
+\label{sec:intro_strerror}
+
+Benché gli errori siano identificati univocamente dal valore numerico di
+\var{errno} le librerie provvedono alcune funzioni e variabili utili per
+riportare in opportuni messaggi le condizioni di errore verificatesi.  La
+prima funzione che si può usare per ricavare i messaggi di errore è
+\func{strerror}, il cui prototipo è:
+\begin{prototype}{string.h}{char * strerror(int errnum)} 
+  La funzione ritorna una stringa (statica) che descrive l'errore il cui
+  codice è passato come parametro.
+\end{prototype}
+
+In generale \func{strerror} viene usata passando \var{errno} come parametro;
+nel caso si specifichi un codice sbagliato verrà restituita un messaggio di
+errore sconosciuto.
+
+Il problema con \func{strerror} è che la funzione utilizza una stringa statica
+che non deve essere modificata dal programma e che è utilizzabile solo fino ad
+una chiamata successiva a \func{strerror}; nel caso si usino i thread è
+provvista\footnote{questa funzione è una estensione GNU, non fa parte dello
+  standard POSIX} una versione apposita:
+\begin{prototype}{string.h}
+{char * strerror_r(int errnum, char * buff, size\_t size)} 
+  La funzione è analoga a \func{strerror} ma ritorna il messaggio in un buffer
+  specificato da \var{buff} di lunghezza massima (compreso il terminatore)
+  \var{size}.
+\end{prototype}
+che utilizza un buffer che il singolo thread deve allocare, per evitare i
+problemi connessi alla condivisione del buffer statico. Infine, per completare
+la caratterizzazione dell'errore, si può usare anche la variabile globale
+\var{program_invocation_short_name} che riporta il nome del programma
+attualmente in esecuzione.
+
+
+Una seconda funzione usata per riportare i codici di errore è \func{perror} il
+cui prototipo è:
+\begin{prototype}{stdio.h}{void perror (const char *message)} 
+  La funzione stampa il messaggio di errore relativo al valore corrente di
+  \var{errno} sullo standard error; preceduto dalla stringa \var{message}.
+\end{prototype}
+i messaggi di errore sono gli stessi di \func{strerror}, riportati in
+\capref{cha:errors},
+
+
+Il codice del programma \cmd{errcode} è riportato in \nfig, le sezioni che
+illustrano l'utilizzo delle due funzioni suddette s
+
+\begin{figure}[!htb]
+  \footnotesize
+  \begin{lstlisting}{}
+
+
+
+  \end{lstlisting}
+  \caption{Codice per la stampa del messaggio di errore standard.}
+  \label{fig:proc_fork_code}
+\end{figure}