-\chapter{La gestione del sistema, delle risorse, e degli errori}
+fo \chapter{La gestione del sistema, delle risorse, e degli errori}
\label{cha:system}
In questo capitolo tratteremo varie interfacce che attengono agli aspetti più
-generali del sistema, come quelle per la gestione di parametri e
-configurazione, quelle per la lettura dei limiti e delle caratteristiche dello
-stesso, quelle per il controllo dell'uso delle risorse da parte dei processi,
-quelle per la gestione dei tempi e degli errori.
+generali del sistema, come quelle per la gestione dei parametri e della
+configurazione dello stesso, quelle per la lettura dei limiti e delle
+caratteristiche, quelle per il controllo dell'uso delle risorse dei processi,
+quelle per la gestione ed il controllo dei filesystem, degli utenti, dei tempi
+e degli errori.
\label{sec:sys_characteristics}
In questa sezione tratteremo le varie modalità con cui un programma può
-ottenere informazioni riguardo alle capacità del sistema. Ogni sistema infatti
-è contraddistinto da un gran numero di limiti e costanti che lo
-caratterizzano, e che possono dipendere da fattori molteplici, come
+ottenere informazioni riguardo alle capacità del sistema. Ogni sistema
+unix-like infatti è contraddistinto da un gran numero di limiti e costanti che
+lo caratterizzano, e che possono dipendere da fattori molteplici, come
l'architettura hardware, l'implementazione del kernel e delle librerie, le
opzioni di configurazione.
La definizione di queste caratteristiche ed il tentativo di provvedere dei
meccanismi generali che i programmi potessero usare per ricavarle è uno degli
-aspetti più complessi e controversi coi cui i vari standard si sono dovuti
-confrontare, spesso con risultati spesso tutt'altro che chiari. Proveremo
-comunque a dare una descrizione dei principali metodi previsti dai vari
-standard per ricavare sia le caratteristiche specifiche del sistema, che
-quelle dei file.
+aspetti più complessi e controversi con cui le diverse standardizzazioni si
+sono dovute confrontare, spesso con risultati spesso tutt'altro che chiari.
+Proveremo comunque a dare una descrizione dei principali metodi previsti dai
+vari standard per ricavare sia le caratteristiche specifiche del sistema, che
+quelle della gestione dei file.
\subsection{Limiti e parametri di sistema}
\secref{sec:sys_sysconf}).
Lo standard ANSI C definisce dei limiti che sono tutti fissi, pertanto questo
-saranno sempre disponibili al momento della compilazione; un elenco, ripreso
+saranno sempre disponibili al momento della compilazione. Un elenco, ripreso
da \file{limits.h}, è riportato in \tabref{tab:sys_ansic_macro}. Come si può
vedere per la maggior parte questi limiti attengono alle dimensioni dei dati
interi, che sono in genere fissati dall'architettura hardware (le analoghe
\label{sec:sys_sysconf}
Come accennato in \secref{sec:sys_limits} quando uno dei limiti o delle
-caratteristiche del sistema può variare, è necessario ottenerne il valore
-attraverso la funzione \func{sysconf}, per non dover essere costretti a
+caratteristiche del sistema può variare, per non dover essere costretti a
ricompilare un programma tutte le volte che si cambiano le opzioni con cui è
-compilato il kernel, o alcuni dei parametri modificabili a run time. Il
+compilato il kernel, o alcuni dei parametri modificabili a run time, è
+necessario ottenerne il valore attraverso la funzione \func{sysconf}. Il
prototipo di questa funzione è:
\begin{prototype}{unistd.h}{long sysconf(int name)}
Restituisce il valore del parametro di sistema \param{name}.
}
\end{lstlisting}
%\normalsize
-ma in realtà in Linux queste macro sono comunque definite e indicando un
-limite generico, per cui è sempre meglio usare i valori restituiti da
-quest'ultima.
+ma in realtà in Linux queste macro sono comunque definite, indicando però un
+limite generico. Per questo motivo è sempre meglio usare i valori restituiti
+da \func{sysconf}.
\subsection{I limiti dei file}
\label{tab:sys_file_macro}
\end{table}
-Come per i limiti di sistema POSIX.1 detta una serie di valori minimi per
-queste caratteristiche, che ogni sistema che vuole essere conforme deve
-rispettare; le relative macro sono riportate in \tabref{tab:sys_posix1_file},
-e per esse vale lo stesso discorso fatto per le analoghe di
-\tabref{tab:sys_posix1_general}.
+Come per i limiti di sistema, lo standard POSIX.1 detta una serie di valori
+minimi anche per queste caratteristiche, che ogni sistema che vuole essere
+conforme deve rispettare; le relative macro sono riportate in
+\tabref{tab:sys_posix1_file}, e per esse vale lo stesso discorso fatto per le
+analoghe di \tabref{tab:sys_posix1_general}.
\begin{table}[htb]
\centering
\label{sec:sys_pathconf}
In generale i limiti per i file sono molto più soggetti ad essere variabili
-rispetto ai precedenti limiti generali del sistema; ad esempio parametri come
-la lunghezza del nome del file o il numero di link possono variare da
-filesystem a filesystem; per questo motivo questi limiti devono essere sempre
-controllati con la funzione \func{pathconf}, il cui prototipo è:
+rispetto ai limiti generali del sistema; ad esempio parametri come la
+lunghezza del nome del file o il numero di link possono variare da filesystem
+a filesystem; per questo motivo questi limiti devono essere sempre controllati
+con la funzione \func{pathconf}, il cui prototipo è:
\begin{prototype}{unistd.h}{long pathconf(char *path, int name)}
Restituisce il valore del parametro \param{name} per il file \param{path}.
E si noti come la funzione in questo caso richieda un parametro che specifichi
a quale file si fa riferimento, dato che il valore del limite cercato può
variare a seconda del filesystem. Una seconda versione della funzione,
-\func{fpathconf}, opera su un file descriptor invece che su un pathname, il
+\func{fpathconf}, opera su un file descriptor invece che su un pathname. Il
suo prototipo è:
\begin{prototype}{unistd.h}{long fpathconf(int fd, int name)}
Restituisce il valore del parametro \param{name} per il file \param{fd}.
\label{sec:sys_uname}
Un'altra funzione che si può utilizzare per raccogliere informazioni sia
-riguardo al sistema che al computer su cui esso sta girando è \func{uname}, il
+riguardo al sistema che al computer su cui esso sta girando è \func{uname}; il
suo prototipo è:
\begin{prototype}{sys/utsname.h}{int uname(struct utsname *info)}
Restituisce informazioni sul sistema nella struttura \param{info}.
\macro{\_UTSNAME\_LENGTH} per i campi standard e
\macro{\_UTSNAME\_DOMAIN\_LENGTH} per quello specifico per il nome di dominio;
altri sistemi usano nomi diversi come \macro{SYS\_NMLN} o \macro{\_SYS\_NMLN}
-or \macro{UTSLEN} che possono avere valori diversi; nel caso di Linux
+or \macro{UTSLEN} che possono avere valori diversi. Nel caso di Linux
\func{uname} corrisponde in realtà a 3 system call diverse, le prime due usano
-delle lunghezze delle stringhe di 9 e 65 byte; la terza 65, restituisce anche
-l'ultimo campo con una lunghezza di 257 byte.
+rispettivamente delle lunghezze delle stringhe di 9 e 65 byte; la terza usa
+anch'essa 65 byte, ma restituisce anche l'ultimo campo, \var{domainname}, con
+una lunghezza di 257 byte.
\section{Opzioni e configurazione del sistema}
maniera gerarchica all'interno un albero; per accedere ad uno di essi occorre
specificare un cammino attraverso i vari nodi dell'albero, in maniera analoga
a come avviene per la risoluzione di un pathname (da cui l'uso alternativo del
-filesystem \file{/proc} che vedremo dopo).
+filesystem \file{/proc}, che vedremo dopo).
Ciascun nodo dell'albero è identificato da un valore intero, ed il cammino che
arriva ad identificare un parametro specifico è passato alla funzione
scrittura.
Il tipo di filesystem è specificato da \param{filesystemtype}, che deve essere
-una delle stringhe riportate in \file{/proc/filesystems}, che contiene
+una delle stringhe riportate nel file \file{/proc/filesystems}, che contiene
l'elenco dei filesystem supportati dal kernel; nel caso si sia indicato uno
dei filesystem virtuali, il contenuto di \param{source} viene ignorato.
directory radice del filesystem montato.
Dal kernel 2.4.x inoltre è divenuto possibile sia spostare atomicamente un
-\textit{mount point} da una directory ad un'altra, che montare in diversi
-\textit{mount point} lo stesso filesystem, che montare più filesystem sullo
+\textit{mount point} da una directory ad un'altra, sia montare in diversi
+\textit{mount point} lo stesso filesystem, sia montare più filesystem sullo
stesso \textit{mount point} (nel qual caso vale quanto appena detto, e solo il
contenuto dell'ultimo filesystem montato sarà visibile).
Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due
-pfile standard \file{/etc/fstab} e \file{/etc/mtab}, che convenzionalmente sono
-usati in quasi tutti i sistemi unix per mantenere rispettivamente le
+file standard \file{/etc/fstab} e \file{/etc/mtab}, che convenzionalmente sono
+usati in quasi tutti i sistemi unix-like per mantenere rispettivamente le
informazioni riguardo ai filesystem da montare e a quelli correntemente
montati. Le funzioni servono a leggere il contenuto di questi file in
opportune strutture \var{struct fstab} e \var{struct mntent}, e, per
\subsection{La gestione di utenti e gruppi}
\label{sec:sys_user_group}
-L'ultimo argomento di questa sezione è quello che riguarda le funzioni
-utilizzate per gestire utenti e gruppi all'interno del sistema.
Tradizionalmente l'informazione per la gestione di utenti e gruppi veniva
-tenuta tutta nei due file di testo \file{/etc/passwd} ed \file{/etc/group};
-oggi la maggior parte delle distribuzioni di Linux usa la libreria PAM (sigla
-che sta \textit{Pluggable Authentication Method}) che permette di separare
-completamente i meccanismi di gestione degli utenti (autenticazione,
-riconoscimento, ecc.) dalle modalità in cui i relativi dati vengono mantenuti.
+tenuta tutta nei due file di testo \file{/etc/passwd} ed \file{/etc/group}, e
+tutte le funzioni facevano riferimento ad essi. Oggi la maggior parte delle
+distribuzioni di Linux usa la libreria PAM (sigla che sta \textit{Pluggable
+ Authentication Method}) che permette di separare completamente i meccanismi
+di gestione degli utenti (autenticazione, riconoscimento, ecc.) dalle modalità
+in cui i relativi dati vengono mantenuti, per cui pur restando in gran parte
+le stesse\footnote{in genere quello che viene cambiato è l'informazione usata
+ per l'autenticazione, che non è più necessariamente una password criptata da
+ verificare, ma può assumere le forme più diverse, come impronte digitali,
+ chiavi elettroniche, ecc.}, le informazioni non sono più necessariamente
+mantenute in quei file.
In questo paragrafo ci limiteremo comunque alle funzioni classiche per la
lettura delle informazioni relative a utenti e gruppi previste dallo standard
\end{figure}
La struttura usata da entrambe le funzioni è allocata staticamente, per questo
-motivo viene sovrascritta ad ogni nuova invocazione, così come le stringhe a
-cui essa fa riferimento. Ovviamente queste funzioni non sono rientranti, ne
-esistono quindi anche due versioni alternative (denotate dalla solita
-estensione \code{\_r}), i cui prototipi sono:
+motivo viene sovrascritta ad ogni nuova invocazione, lo stesso dicasi per la
+memoria dove sono scritte le stringhe a cui i puntatori in essa contenuti
+fanno riferimento. Ovviamente questo implica che dette funzioni non posono
+essere rientranti, per cui ne esistono anche due versioni alternative
+(denotate dalla solita estensione \code{\_r}), i cui prototipi sono:
\begin{functions}
\headdecl{pwd.h}
della struttura \var{passwd} saranno restituiti all'indirizzo \param{password}
mentre la memoria allocata all'indirizzo \param{buffer}, per un massimo di
\param{buflen} byte, sarà utilizzata per contenere le stringhe puntate dai
-campi di \param{password}; infine all'indirizzo puntato da \param{result}
+campi di \param{password}. Infine all'indirizzo puntato da \param{result}
viene restituito il puntatore ai dati ottenuti, cioè \param{buffer} nel caso
l'utente esista, o \macro{NULL} altrimenti. Qualora i dati non possano essere
-contenuti in \param{buflen} byte la funzione fallirà restituendo
-\macro{ERANGE} (e \param{result} sarà comunque settato a \macro{NULL}).
+contenuti nei byte specificati da \param{buflen}, la funzione fallirà
+restituendo \macro{ERANGE} (e \param{result} sarà comunque settato a
+\macro{NULL}).
Del tutto analoghe alle precedenti sono le funzioni \func{getgrnam} e
\func{getgrgid} (e le relative analoghe rientranti con la stessa estensione
\end{table}
Dato che ormai la gran parte delle distribuzioni di Linux utilizzano PAM, che
-come minimo usa almeno le \textit{shadow password}, quindi con delle modifiche
-rispetto al formato classico di \file{/etc/passwd}, le funzioni che danno la
-capacità scrivere delle voci nel database (\func{putpwent} e \func{putgrent})
-non permettono di specificarle in maniera completa. Per questo motivo l'uso di
-queste funzioni è deprecato in favore dell'uso di PAM, per cui ci limitiamo a
-elencarle in \tabref{tab:sys_passwd_func}, rimandando chi fosse interessato
-alle man page e al manuale delle \acr{glibc} per i dettagli del funzionamento.
+come minimo usa almeno le \textit{shadow password} (quindi con delle modifiche
+rispetto al formato classico di \file{/etc/passwd}), le funzioni che danno la
+capacità scrivere delle voci nel database (cioè \func{putpwent} e
+\func{putgrent}) non permettono di effettuarne una specificazione in maniera
+completa. Per questo motivo l'uso di queste funzioni è deprecato in favore
+dell'uso di PAM, ci limiteremo pertanto ad elencarle in
+\tabref{tab:sys_passwd_func}, rimandando chi fosse interessato alle rispettive
+man page e al manuale delle \acr{glibc} per i dettagli del loro funzionamento.
\subsection{Il database di accounting}
\label{sec:sys_accounting}
-Un altro insieme di funzioni utili è quello che permette di accedere ai dati
-del database di \textit{accounting} degli utenti, che mantiene la traccia di
-chi si è collegato al sistema e di che è correntemente collegato, insieme alle
-informazioni, per ciascun terminale, di chi ci è collegato, da che ora,
-dell'\acr{uid} della shell di login, ed una serie di altre informazioni
-relativa al sistema come il run-level, l'orario dell'ultimo riavvio, ed altre.
-
-Le informazioni vengono mantenute nei due file \file{/var/run/utmp} e
+L'ultimo insieme di funzioni relative alla gestione del sistema che
+esamineremo è quello che permette di accedere ai dati del database di
+\textit{accounting}. In esso vengono mantenute una serie di informazioni
+storiche relative sia agli utenti che si sono collegati al sistema, (tanto per
+quelli correntemente collegati, che per la registrazione degli accessi
+precedenti), sia relative all'intero sistema, come il momento di lancio di
+processi da parte di \cmd{init}, il cambiamento dell'orologio di sistema, il
+cambiamento di runlevel o il riavvio della macchina.
+
+I dati vengono usualmente\footnote{questa è la locazione specificata dal
+ \textit{Linux Filesystem Hierarchy Standard}, adottato dalla gran parte
+ delle distribuzioni.} memorizzati nei due file \file{/var/run/utmp} e
\file{/var/log/wtmp}. Quando un utente si collega viene aggiunta una voce a
-\file{/var/run/utmp}; la voce vi resta fino al logout, quando viene cancellata
-e spostata in \file{/var/log/wtmp}.
+\file{/var/run/utmp} in cui viene memorizzato il nome di login, il terminale
+da cui ci si collega, l'\acr{uid} della shell di login, l'orario della
+connessione ed altre informazioni. La voce resta nel file fino al logout,
+quando viene cancellata e spostata in \file{/var/log/wtmp}.
In questo modo il primo file viene utilizzato per registrare sta utilizzando
-il sistema al momento corrente, mentre il secondo mantiene la storia delle
-attività degli utenti. A quest'ultimo vengono anche aggiunte delle voci
-speciali per tenere conto dei cambiamenti di runlevel, del riavvio della
-macchina, e di altri eventi di sistema.
+il sistema al momento corrente, mentre il secondo mantiene la registrazione
+delle attività degli utenti. A quest'ultimo vengono anche aggiunte delle voci
+speciali per tenere conto dei cambiamenti del sistema, come la modifica del
+runlevel, il riavvio della macchina, ecc. Tutte queste informazioni sono
+descritte in dettaglio nel manuale delle \acr{glibc}.
Questi file non devono mai essere letti direttamente, ma le informazioni che
contengono possono essere ricavate attraverso le opportune funzioni di
-libreria. Queste sono analoghe alle precedenti per il database delle password,
-solo che la struttura del database è molto più complessa, dato che contiene
-vari tipi di informazione.
-
-Le prime tre funzioni, \func{utmpname}, \func{setutent} e \func{endutent},
-servono a aprire e chiudere il database, e a specificare il file su cui esso è
-mantenuto (in caso questo non venga specificato viene usato il valore standard
-\macro{\_PATH\_UTMP} che è definito in \file{paths.h}. Il loro prototipi sono:
+libreria. Queste sono analoghe alle precedenti (vedi
+\tabref{tab:sys_passwd_func}) usate per accedere al database degli utenti,
+solo che in questo caso la struttura del database di accounting è molto più
+complessa, dato che contiene diversi tipi di informazione.
+
+Le prime tre funzioni, \func{setutent}, \func{endutent} e \func{utmpname}
+servono rispettivamente a aprire e a chiudere il file che contiene il
+database, e a specificare su quale file esso viene mantenuto. I loro prototipi
+sono:
\begin{functions}
\headdecl{utmp.h}
\bodydesc{Le funzioni non ritornano codici di errore.}
\end{functions}
+In caso questo non venga specificato nessun file viene usato il valore
+standard \macro{\_PATH\_UTMP} (che è definito in \file{paths.h}); in genere
+\func{utmpname} prevede due possibili valori:
+\begin{basedescript}{\desclabelwidth{2.0cm}}
+\item[\macro{\_PATH\_UTMP}] Specifica il database di accounting per gli utenti
+ correntemente collegati.
+\item[\macro{\_PATH\_WTMP}] Specifica il database di accounting per l'archivio
+ storico degli utenti collegati.
+\end{basedescript}
+corrispondenti ai file \file{/var/run/utmp} e \file{/var/log/wtmp} visti in
+precedenza.
+
Una volta aperto il file si può eseguire una scansione leggendo o scrivendo
una voce con le funzioni \func{getutent}, \func{getutid}, \func{getutline} e
\func{pututline}, i cui prototipi sono:
\begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{}
struct utmp
{
- short int ut_type; /* Type of login. */
- pid_t ut_pid; /* Process ID of login process. */
- char ut_line[UT_LINESIZE]; /* Devicename. */
- char ut_id[4]; /* Inittab ID. */
- char ut_user[UT_NAMESIZE]; /* Username. */
- char ut_host[UT_HOSTSIZE]; /* Hostname for remote login. */
- struct exit_status ut_exit; /* Exit status of a process marked
- as DEAD_PROCESS. */
- long int ut_session; /* Session ID, used for windowing. */
- struct timeval ut_tv; /* Time entry was made. */
- int32_t ut_addr_v6[4]; /* Internet address of remote host. */
- char __unused[20]; /* Reserved for future use. */
+ short int ut_type; /* Type of login. */
+ pid_t ut_pid; /* Process ID of login process. */
+ char ut_line[UT_LINESIZE]; /* Devicename. */
+ char ut_id[4]; /* Inittab ID. */
+ char ut_user[UT_NAMESIZE]; /* Username. */
+ char ut_host[UT_HOSTSIZE]; /* Hostname for remote login. */
+ struct exit_status ut_exit; /* Exit status of a process marked
+ as DEAD_PROCESS. */
+ long int ut_session; /* Session ID, used for windowing. */
+ struct timeval ut_tv; /* Time entry was made. */
+ int32_t ut_addr_v6[4]; /* Internet address of remote host. */
+ char __unused[20]; /* Reserved for future use. */
};
\end{lstlisting}
\end{minipage}
\label{tab:sys_ut_type}
\end{table}
-Infine \func{getutline} esegue la ricerca sulle voci che hanno \var{ut\_type}
-uguale a \macro{LOGIN\_PROCESS} o \macro{USER\_PROCESS}, restituendo la prima
-che corrisponde al valore di \var{ut\_line}. Lo stesso criterio di ricerca è
-usato da \func{pututline} per trovare uno spazio dove inserire la voce
-specificata, qualora non sia trovata la voce viene aggiunta in coda al
-database.
+La funzione \func{getutline} esegue la ricerca sulle voci che hanno
+\var{ut\_type} uguale a \macro{LOGIN\_PROCESS} o \macro{USER\_PROCESS},
+restituendo la prima che corrisponde al valore di \var{ut\_line}, che
+specifica il device\footnote{espresso senza il \file{/dev/} iniziale.} di
+terminale che interessa. Lo stesso criterio di ricerca è usato da
+\func{pututline} per trovare uno spazio dove inserire la voce specificata,
+qualora non sia trovata la voce viene aggiunta in coda al database.
+
+In generale occorre però tenere conto che queste funzioni non sono
+completamente standardizzate, e che in sistemi diversi possono esserci
+differenze; ad esempio \func{pututline} restituisce \code{void} in vari
+sistemi (compreso Linux, fino alle \acr{libc5}). Qui seguiremo la sintassi
+fornita dalle \acr{glibc}, ma gli standard POSIX 1003.1-2001 e XPG4.2 hanno
+introdotto delle nuove strutture (e relativi file) di tipo \code{utmpx}, che
+sono un sovrainsieme di \code{utmp}.
+
+Le \acr{glibc} utilizzano già una versione estesa di \code{utmp}, che rende
+inutili queste nuove strutture; pertanto esse e le relative funzioni di
+gestione (\func{getutxent}, \func{getutxid}, \func{getutxline},
+\func{pututxline}, \func{setutxent} e \func{endutxent}) sono ridefinite come
+sinonimi delle funzioni appena viste.
+
+Come visto in \secref{sec:sys_user_group}, l'uso di strutture allocate
+staticamente rende le funzioni di lettura non rientranti; per questo motivo le
+\acr{glibc} forniscono anche delle versioni rientranti: \func{getutent\_r},
+\func{getutid\_r}, \func{getutline\_r}, che invece di restituire un puntatore
+restituiscono un intero e prendono due argomenti aggiuntivi. Le funzioni si
+comportano esattamente come le analoge non rientranti, solo che restituiscono
+il risultato all'indirizzo specificato dal primo argomento aggiuntivo (di tipo
+\code{struct utmp *buffer}) mentre il secondo (di tipo \code{struct utmp
+ **result)} viene usato per restituire il puntatore allo stesso buffer.
+
+Infine le \acr{glibc} forniscono come estensione per la scrittura delle voci
+in \file{wmtp} altre due funzioni, \func{updwtmp} e \func{logwtmp}, i cui
+prototipi sono:
+\begin{functions}
+ \headdecl{utmp.h}
+
+ \funcdecl{void updwtmp(const char *wtmp\_file, const struct utmp *ut)}
+ Aggiunge la voce \param{ut} nel database di accounting \file{wmtp}.
+
+ \funcdecl{void logwtmp(const char *line, const char *name, const char
+ *host)} Aggiunge nel database di accounting una voce con i valori
+ specificati.
+
+ \bodydesc{Le funzioni ritornano il puntatore ad una struttura \var{utmp} in
+ caso di successo e \macro{NULL} in caso di errore.}
+\end{functions}
+
+La prima funzione permette l'aggiunta di una voce a \file{wmtp} specificando
+direttamente una struttura \type{utmp}, mentre la seconda utilizza gli
+argomenti \param{line}, \param{name} e \param{host} per costruire la voce che
+poi aggiunge chiamando \func{updwtmp}.
\section{Limitazione ed uso delle risorse}
\label{sec:sys_res_limits}
-In questa sezione esamineremo le funzioni che permettono di esaminare e
-controllare come le varie risorse del sistema (CPU, memoria, ecc.) vengono
-utilizzate dai singoli processi, e le modalità con cui è possibile imporre dei
-limiti sul loro utilizzo.
+Dopo aver esaminato le funzioni che permettono di controllare le varie
+caratteristiche, capacità e limiti del sistema a livello globale, in questa
+sezione tratteremo le varie funzioni che vengono usate per quantificare le
+risorse (CPU, memoria, ecc.) utilizzate da ogni singolo processo e quelle che
+permettono di imporre a ciascuno di essi vincoli e limiti di utilizzo.
\subsection{L'uso delle risorse}
\label{sec:sys_resource_use}
+Come abbiamo accennato in \secref{sec:proc_wait4} le informazioni riguardo
+l'utilizzo delle risorse da parte di un processo è mantenuto in una struttura
+di tipo \code{struct }\type{rusage}, la cui definizione (che si trova in
+\file{sys/resource.h}) è riportata in \figref{fig:sys_rusage_struct}.
+\begin{figure}[!htb]
+ \footnotesize
+ \centering
+ \begin{minipage}[c]{15cm}
+ \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{}
+struct rusage {
+ struct timeval ru_utime; /* user time used */
+ struct timeval ru_stime; /* system time used */
+ long ru_maxrss; /* maximum resident set size */
+ long ru_ixrss; /* integral shared memory size */
+ long ru_idrss; /* integral unshared data size */
+ long ru_isrss; /* integral unshared stack size */
+ long ru_minflt; /* page reclaims */
+ long ru_majflt; /* page faults */
+ long ru_nswap; /* swaps */
+ long ru_inblock; /* block input operations */
+ long ru_oublock; /* block output operations */
+ long ru_msgsnd; /* messages sent */
+ long ru_msgrcv; /* messages received */
+ long ru_nsignals; ; /* signals received */
+ long ru_nvcsw; /* voluntary context switches */
+ long ru_nivcsw; /* involuntary context switches */
+};
+ \end{lstlisting}
+ \end{minipage}
+ \normalsize
+ \caption{La struttura \var{rusage} per la lettura delle informazioni dei
+ delle risorse usate da un processo.}
+ \label{fig:sys_rusage_struct}
+\end{figure}
-\subsection{Limiti sulle risorse}
-\label{sec:sys_resource_limit}
+La struttura è ripresa da BSD 4.3, ma attualmente (con i kernel della serie
+2.4.x) i soli campi che sono mantenuti sono: \var{ru\_utime}, \var{ru\_stime},
+\var{ru\_minflt}, \var{ru\_majflt}, e \var{ru\_nswap}. I primi due indicano
+rispettivamente il tempo impiegato dal processo nell'eseguire le istruzioni in
+user space, e quello impiegato dal kernel nelle system call eseguite per conto
+del processo.
+
+Gli altri tre campi servono a quantificare l'uso della memoria virtuale e
+corrispondono rispettivamente al numero di \textit{page fault}\index{page
+ fault} (vedi \secref{sec:proc_mem_gen}) avvenuti senza richiedere I/O (i
+cosiddetti \textit{minor page fault}), a quelli che invece han richiesto I/O
+(detti invece \textit{major page fault}) ed al numero di volte che il processo
+è stato completamente tolto dalla memoria per essere inserito nello swap.
+
+In genere includere esplicitamente \file{<sys/time.h>} non è più necessario,
+ma aumenta la portabilità, e serve comunque quando, come nella maggior parte
+dei casi, si debba accedere ai campi di \var{rusage} relativi ai tempi di
+utilizzo del processore, che sono definiti come \code{struct }\type{timeval}.
+
+
+Questa è la stessa struttura utilizzata da \func{wait4} per ricavare la
+quantità di risorse impiegato dal processo di cui si è letto lo stato di
+terminazione, ma essa può anche essere letta direttamente utilizzando la
+funzione \func{getrusage}, il cui prototipo è:
+\begin{functions}
+ \headdecl{sys/time.h}
+ \headdecl{sys/resource.h}
+ \headdecl{unistd.h}
+
+ \funcdecl{int getrusage(int who, struct rusage *usage)}
+ Legge la quantità di risorse usate da un processo.
-\subsection{Le risorse di memoria}
-\label{sec:sys_memory_res}
+ \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore,
+ nel qual caso \var{errno} può essere \macro{EINVAL} o \macro{EFAULT}.}
+\end{functions}
+L'argomento \param{who} permette di specificare il processo di cui si vuole
+leggere l'uso delle risorse; esso può assumere solo i due valori
+\macro{RUSAGE\_SELF} per indicare il processo corrente e
+\macro{RUSAGE\_CHILDREN} per indicare l'insieme dei processi figli di cui si è
+ricevuto lo stato di terminazione.
-\subsection{Le risorse di processore}
-\label{sec:sys_cpu_load}
+\subsection{Limiti sulle risorse}
+\label{sec:sys_resource_limit}
+Come accennato nell'introduzione oltre a leggere l'uso delle risorse da parte
+di un processo si possono anche imporre dei limiti sulle sue capacità. Ogni
+processo ha in generale due limiti associati ad ogni risorsa; questi sono
+detti il \textsl{limite corrente} (o \textit{current limit}) che esprime il
+valore che attualmente il processo non può superare, ed il \textsl{limite
+ massimo} (o \textit{maximum limit}) che esprime il valore massimo che può
+assumere il \textsl{limite corrente}.
+
+In generale il primo viene chiamato un limite \textsl{soffice} (o \textit{soft
+ limit}) dato che il suo valore può essere aumentato, mentre il secondo è
+detto \textsl{duro} (o \textit{hard limit}), in quanto un processo normale non
+può modificarne il valore. Il valore di questi limiti è mantenuto in una
+struttura \var{rlimit}, la cui definizione è riportata in
+\figref{fig:sys_rlimit_struct}, ed i cui campi corrispondono appunto a limite
+corrente e massimo.
\begin{figure}[!htb]
\footnotesize
\centering
\begin{minipage}[c]{15cm}
\begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{}
-struct rusage {
- struct timeval ru_utime; /* user time used */
- struct timeval ru_stime; /* system time used */
- long ru_maxrss; /* maximum resident set size */
- long ru_ixrss; /* integral shared memory size */
- long ru_idrss; /* integral unshared data size */
- long ru_isrss; /* integral unshared stack size */
- long ru_minflt; /* page reclaims */
- long ru_majflt; /* page faults */
- long ru_nswap; /* swaps */
- long ru_inblock; /* block input operations */
- long ru_oublock; /* block output operations */
- long ru_msgsnd; /* messages sent */
- long ru_msgrcv; /* messages received */
- long ru_nsignals; ; /* signals received */
- long ru_nvcsw; /* voluntary context switches */
- long ru_nivcsw; /* involuntary context switches */
-};
+ struct rlimit {
+ rlim_t rlim_cur;
+ rlim_t rlim_max;
+ };
\end{lstlisting}
\end{minipage}
\normalsize
- \caption{La struttura \var{rusage} per la lettura delle informazioni dei
+ \caption{La struttura \var{rlimit} per impostare i limiti di utilizzo
delle risorse usate da un processo.}
- \label{fig:sys_rusage_struct}
+ \label{fig:sys_rlimit_struct}
\end{figure}
+In genere il superamento di un limite comporta o l'emissione di un segnale o
+il fallimento della system call che lo ha provocato; per far leggere o settare
+i limiti di utilizzo delle risorse da parte di un processo le \acr{glibc}
+prevedono due funzioni, \func{getrlimit} e \func{setrlimit}, i cui prototipi
+sono:
+\begin{functions}
+ \headdecl{sys/time.h}
+ \headdecl{sys/resource.h}
+ \headdecl{unistd.h}
+
+ \funcdecl{int getrlimit(int resource, struct rlimit *rlim)}
+ Legge il limite corrente per la risorsa \param{resource}.
+
+ \funcdecl{int setrlimit(int resource, const struct rlimit *rlim)}
+
+ Setta il limite per la risorsa \param{resource}.
+
+ \bodydesc{Le funzioni ritornano 0 in caso di successo e -1 in caso di
+ errore, nel qual caso \var{errno} viene settata ai valori:
+ \begin{errlist}
+ \item[\macro{INVAL}] I valori per \param{resource} non sono validi.
+ \item[\macro{EPERM}] Un processo senza i privilegi di amministratore ha
+ cercato di innalzare i propri limiti.
+ \end{errlist}
+ ed \macro{EFAULT}.}
+\end{functions}
+Entrambe le funzioni permettono di specificare su quale risorsa si vuole
+operare attraverso \param{resource}, i cui possibili valori sono elencati in
+\secref{tab:sys_rlimit_values}, e utilizzano una struttura \var{rlimit} per
+specificarne i valori.
-\var{tms\_utime}, \var{tms\_stime}, \var{tms\_cutime}, \var{tms\_uetime}
+\begin{table}[htb]
+ \footnotesize
+ \centering
+ \begin{tabular}[c]{|l|p{12cm}|}
+ \hline
+ \textbf{Valore} & \textbf{Significato}\\
+ \hline
+ \hline
+ \macro{RLIMIT\_CPU} & Il massimo tempo di CPU che il processo può
+ usare. Il superamento del limite comporta
+ l'emissione di un segnale di \macro{SIGXCPU}.\\
+ \macro{RLIMIT\_FSIZE} & La massima dimensione di un file che un processo
+ può usare. Se il processo cerca di scrivere
+ oltre questa dimensione riceverà un segnale di
+ \macro{SIGXFSZ}.\\
+ \macro{RLIMIT\_DATA} & La massima dimensione della memoria dati di un
+ processo. Il tentatico di allocare più memoria
+ causa il fallimento della funzione di
+ allocazione. \\
+ \macro{RLIMIT\_STACK} & La massima dimensione dello stack del
+ processo. Se il processo esegue operazioni che
+ estendano lo stack oltre questa dimensione
+ riceverà un segnale di \macro{SIGSEGV}.\\
+ \macro{RLIMIT\_CORE} & La massima dimensione di un file di \textit{core
+ dump} creato da un processo. Nel caso le
+ dimensioni dovessero essere maggiori il file non
+ verrebbe generato.\footnotemark\\
+ \macro{RLIMIT\_RSS} & L'ammontare massimo di memoria fisica dato al
+ processo. Il limite è solo una indicazione per
+ il kernel, qualora ci fosse un surplus di
+ memoria questa verrebbe assegnata.\\
+ \macro{RLIMIT\_NPROC} & Il numero massimo di processi che possono essere
+ creati sullo stesso user id. Se il limite viene
+ raggiunto \func{fork} fallirà con un
+ \macro{EAGAIN}.\\
+ \macro{RLIMIT\_NOFILE} & Il numero massimo di file che il processo può
+ aprire. L'apertura di un ulteriore file fallirà
+ con un errore \macro{EMFILE}.\\
+ \macro{RLIMIT\_MEMLOCK}& L'ammontare massimo di memoria che può essere
+ bloccata (vedi \secref{sec:proc_mem_lock}).\\
+ \macro{RLIMIT\_AS} & La dimensione massima di tutta la memoria che il
+ processo può ottenere. Se il processo tenta di
+ allocarne di più funzioni come \func{brk},
+ \func{malloc} o \func{mmap} falliranno. \\
+ \hline
+ \end{tabular}
+ \caption{Valori possibili dell'argomento \param{resource} delle funzioni
+ \func{getrlimit} e \func{setrlimit}.}
+ \label{tab:sys_rlimit_values}
+\end{table}
+
+\footnotetext{Settare questo limite a zero è la maniera più semplice per
+ evitare la creazione di \file{core} file.}
+
+È inoltre definita la costante \macro{RLIM\_INFINITY} che permette di
+sbloccare l'uso di una risorsa, ma solo un processo con i privilegi di
+amministratore può innalzare un limite al di sopra del valore corrente del
+limite massimo. Si tenga conto infine che tutti i limiti vengono ereditati dal
+processo padre attraverso una \func{fork} (vedi \secref{sec:proc_fork}) e
+mantenuti attraverso una \func{exec} (vedi \secref{sec:proc_exec}).
+
+
+\subsection{Le risorse di memoria e processore}
+\label{sec:sys_memory_res}
+
+La gestione della memoria è già stata affrontata in dettaglio in
+\secref{sec:proc_memory}; abbiamo visto allora che il kernel provvede il
+meccanismo della memoria virtuale attraverso la divisione della memoria fisica
+in pagine.
+
+In genere questo è del tutto trasparente al singolo processo, ma in certi
+casi, come per l'I/O mappato in memoria (vedi \ref{sec:file_memory_map}) che
+usa lo stesso meccanismo per accedere ai file, è necessario conoscere le
+dimensioni delle pagine usate dal kernel. Lo stesso vale quando si vuole
+gestire in maniera ottimale l'interazione della memoria allocata con il
+meccanismo della paginazione.
+
+Di solito la dimensione delle pagine di memoria è fissata dall'architettura
+hardware, per cui in genere la dimensione delle pagine di memoria era una
+costante definita in fase di compilazione, ma oggi alcune architetture (ad
+esempio su Sun Sparc) permettono di variare questa dimensione, e non volendo
+dover fornire binari diversi per ogni possibile modello, è necessario poter
+utilizzare una funzione.
+
+In genere questa dimensione può essere ottenuta attraverso una chiamata a
+\func{sysconf} come \func{sysconf(\_SC\_PAGESIZE)}, ma in BSD 4.2 è stata
+introdotta una apposita funzione, \func{getpagesize}, che restituisce la
+dimensione delle pagine di memoria; il suo prototipo è:
+\begin{prototype}{unistd.h}{int getpagesize(void)}
+ Legge le dimensioni delle pagine di memoria.
+
+ \bodydesc{La funzione ritorna la dimensione di una pagina in byte, e non
+ sono previsti errori.}
+\end{prototype}
+
+La funzione è prevista in SVr4, 4.4BSD e SUSv2, anche se questo ultimo
+standard la etichetta come obsoleta, mentre lo standard POSIX 1003.1-2001 la
+ha eliminata. In Linux è implementata come una system call nelle architetture
+in cui essa è necessaria, ed in genere restituisce il valore del simbolo
+\macro{PAGE\_SIZE} del kernel, anche se le versioni delle librerie del C
+precedenti le \acr{glibc} 2.1 implementavano questa funzione restituendo
+sempre un valore statico.
+
+Le \acr{glibc} forniscono, come specifica estensione GNU, altre due funzioni,
+\func{get\_phys\_pages} e \func{get\_avphys\_pages} che permettono di ottenere
+informazioni riguardo la memoria; i loro prototipi sono:
+\begin{functions}
+ \headdecl{sys/sysinfo.h}
+
+ \funcdecl{long int get\_phys\_pages(void)}
+
+ Legge il numero totale di pagine di memoria disponibili per il sistema.
+
+ \funcdecl{long int get\_avphys\_pages(void)}
+
+ Legge il numero di pagine di memoria disponibili nel sistema.
+
+ \bodydesc{Le funzioni restituiscono il numero di pagine, }
+\end{functions}
+
+Queste funzioni sono equivalenti all'uso della funzione \func{sysconf}
+rispettivamente con i parametri \macro{\_SC\_PHYS\_PAGES} e
+\macro{\_SC\_AVPHYS\_PAGES}. La prima restituisce il numero totale di pagine
+corrispondenti alla RAM della macchina; la seconda invece la memoria
+effettivamente disponibile per i processi.
+
+Le \acr{glibc} supportano inoltre, come estenzioni GNU, due funzioni che
+restituiscono il numero di processori della macchina (e quello dei processori
+attivi); anche queste sono informazioni comunque ottenibili attraverso
+\func{sysconf} utilizzando rispettivamente i parametri
+\macro{\_SC\_NPROCESSORS\_CONF} e \macro{\_SC\_NPROCESSORS\_ONLN}.
+
+Infine le \acr{glibc} riprendono da BSD la funzione \func{getloadavg} che
+permette di ottenere il carico di processore della macchina, in questo modo è
+possibile prendere decisioni su quando far partire eventuali nuovi processi.
+Il suo prototipo è:
+\begin{prototype}{stdlib.h}{int getloadavg(double loadavg[], int nelem)}
+ Legge il carico medio della macchina.
+
+ \bodydesc{La funzione ritorna il numero di elementi scritti o -1 in caso di
+ errore.}
+\end{prototype}
+
+La funzione restituisce in ciascun elemento di \param{loadavg} il numero medio
+di processi attivi sulla coda dello scheduler, calcolato su un diverso
+intervalli di tempo. Il numero di intervalli che si vogliono leggere è
+specificato da \param{nelem}, dato che nel caso di Linux il carico viene
+valutato solo su tre intervalli (corrispondenti a 1, 5 e 15 minuti), questo è
+anche il massimo valore che può essere assegnato a questo argomento.
\section{La gestione dei tempi del sistema}
\label{sec:sys_time}
-In questa sezione tratteremo le varie funzioni per la gestione delle
-date e del tempo in un sistema unix-like, e quelle per convertire i vari
-tempi nelle differenti rappresentazioni che vengono utilizzate.
+In questa sezione tratteremo le varie funzioni attinenti alla gestione del
+tempo in un sistema unix-like, a partire da quelle della gestione di data e
+ora, a quelle per convertire i vari tempi nelle differenti rappresentazioni
+che vengono utilizzate, a quelle per misurare i veri tempi di sistema
+associati ai processi.
\subsection{La misura del tempo in Unix}
dati per la misure dei tempi all'interno del sistema: essi sono
rispettivamente chiamati \textit{calendar time} e \textit{process time},
secondo le definizioni:
-\begin{itemize}
-\item \textit{calendar time}: è il numero di secondi dalla mezzanotte del
+\begin{description}
+\item[\textit{calendar time}]: è il numero di secondi dalla mezzanotte del
primo gennaio 1970, in tempo universale coordinato (o UTC), data che viene
usualmente indicata con 00:00:00 Jan, 1 1970 (UTC) e chiamata \textit{the
Epoch}. Questo tempo viene anche chiamato anche GMT (Greenwich Mean Time)
viene mantenuto l'orologio del calcolatore, e viene usato ad esempio per
indicare le date di modifica dei file o quelle di avvio dei processi. Per
memorizzare questo tempo è stato riservato il tipo primitivo \type{time\_t}.
-\item \textit{process time}: detto anche tempo di processore. Viene misurato
+\item[\textit{process time}]: detto anche tempo di processore. Viene misurato
in \textit{clock tick}, corrispondenti al numero di interruzioni effettuate
dal timer di sistema, e che per Linux avvengono ogni centesimo di
secondo.\footnote{eccetto per la piattaforma alpha dove avvengono ogni
standard POSIX definisce allo stesso modo la costante \macro{CLK\_TCK});
questo valore può comunque essere ottenuto con \func{sysconf} (vedi
\secref{sec:sys_limits}).
-\end{itemize}
+\end{description}
In genere si usa il \textit{calendar time} per esprimere le date dei file e le
informazioni analoghe che riguardano i cosiddetti \textsl{tempi di orologio},
+\subsection{I tempi di processore}
+\label{sec:sys_cpu_times}
+
+
+\var{tms\_utime}, \var{tms\_stime}, \var{tms\_cutime}, \var{tms\_uetime}
+
+
+
\section{La gestione degli errori}
\label{sec:sys_errors}