X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=system.tex;h=84dad32d73be5035e83741fbb7dc9fd75fca43e2;hp=01930a0c182364ce5e07db72c671b1ace60f7668;hb=fa15a3f1ecd64efd8440e46d398fd9976abc3d25;hpb=2c682ba44f85eb183ddf75760b38bf048f89de53 diff --git a/system.tex b/system.tex index 01930a0..84dad32 100644 --- a/system.tex +++ b/system.tex @@ -1,7 +1,18 @@ -fo \chapter{La gestione del sistema, delle risorse, e degli errori} +%% system.tex +%% +%% Copyright (C) 2000-2019 Simone Piccardi. Permission is granted to +%% copy, distribute and/or modify this document under the terms of the GNU Free +%% Documentation License, Version 1.1 or any later version published by the +%% Free Software Foundation; with the Invariant Sections being "Un preambolo", +%% with no Front-Cover Texts, and with no Back-Cover Texts. A copy of the +%% license is included in the section entitled "GNU Free Documentation +%% License". +%% + +\chapter{La gestione del sistema, del tempo e degli errori} \label{cha:system} -In questo capitolo tratteremo varie interfacce che attengono agli aspetti più +In questo capitolo tratteremo varie interfacce che attengono agli aspetti più generali del sistema, come quelle per la gestione dei parametri e della configurazione dello stesso, quelle per la lettura dei limiti e delle caratteristiche, quelle per il controllo dell'uso delle risorse dei processi, @@ -9,1073 +20,879 @@ quelle per la gestione ed il controllo dei filesystem, degli utenti, dei tempi e degli errori. - -\section{La lettura delle caratteristiche del sistema} +\section{La gestione di caratteristiche e parametri del sistema} \label{sec:sys_characteristics} -In questa sezione tratteremo le varie modalità con cui un programma può -ottenere informazioni riguardo alle capacità del sistema. Ogni sistema -unix-like infatti è contraddistinto da un gran numero di limiti e costanti che -lo caratterizzano, e che possono dipendere da fattori molteplici, come -l'architettura hardware, l'implementazione del kernel e delle librerie, le -opzioni di configurazione. - -La definizione di queste caratteristiche ed il tentativo di provvedere dei -meccanismi generali che i programmi potessero usare per ricavarle è uno degli -aspetti più complessi e controversi con cui le diverse standardizzazioni si -sono dovute confrontare, spesso con risultati spesso tutt'altro che chiari. -Proveremo comunque a dare una descrizione dei principali metodi previsti dai -vari standard per ricavare sia le caratteristiche specifiche del sistema, che -quelle della gestione dei file. - - -\subsection{Limiti e parametri di sistema} +In questa sezione tratteremo le varie modalità con cui un programma può +ottenere informazioni riguardo alle capacità del sistema, e, per quelle per +cui è possibile, sul come modificarle. Ogni sistema unix-like infatti è +contraddistinto da un gran numero di limiti e costanti che lo caratterizzano, +e che possono dipendere da fattori molteplici, come l'architettura hardware, +l'implementazione del kernel e delle librerie, le opzioni di +configurazione. Il kernel inoltre mette a disposizione l'accesso ad alcuni +parametri che possono modificarne il comportamento. + +La definizione di queste caratteristiche ed il tentativo di fornire dei +meccanismi generali che i programmi possono usare per ricavarle è uno degli +aspetti più complessi e controversi con cui le diverse standardizzazioni si +sono dovute confrontare, con risultati spesso tutt'altro che chiari. Daremo +comunque una descrizione dei principali metodi previsti dai vari standard per +ricavare sia le caratteristiche specifiche del sistema che quelle della +gestione dei file, e prenderemo in esame le modalità con cui è possibile +intervenire sui parametri del kernel. + +\subsection{Limiti e caratteristiche del sistema} \label{sec:sys_limits} -Quando si devono determinare le le caratteristiche generali del sistema ci si -trova di fronte a diverse possibilità; alcune di queste infatti possono +Quando si devono determinare le caratteristiche generali del sistema ci si +trova di fronte a diverse possibilità; alcune di queste infatti possono dipendere dall'architettura dell'hardware (come le dimensioni dei tipi -interi), o dal sistema operativo (come la presenza o meno dei \textit{saved - id}), altre invece possono dipendere dalle opzioni con cui si è costruito -il sistema (ad esempio da come si è compilato il kernel), o dalla -configurazione del medesimo; per questo motivo in generale sono necessari due -tipi diversi di funzionalità: +interi), o dal sistema operativo (come la presenza o meno del gruppo degli +identificatori \textit{saved}), altre invece possono dipendere dalle opzioni +con cui si è costruito il sistema (ad esempio da come si è compilato il +kernel), o dalla configurazione del medesimo; per questo motivo in generale +sono necessari due tipi diversi di funzionalità: \begin{itemize*} -\item la possibilità di determinare limiti ed opzioni al momento della +\item la possibilità di determinare limiti ed opzioni al momento della compilazione. -\item la possibilità di determinare limiti ed opzioni durante l'esecuzione. +\item la possibilità di determinare limiti ed opzioni durante l'esecuzione. \end{itemize*} -La prima funzionalità si può ottenere includendo gli opportuni header file che -contengono le costanti necessarie definite come macro di preprocessore, per la -seconda invece sono ovviamente necessarie delle funzioni. La situazione è -complicata dal fatto che ci sono molti casi in cui alcuni di questi limiti -sono fissi in un'implementazione mentre possono variare in un altra. Tutto -questo crea una ambiguità che non è sempre possibile risolvere in maniera -chiara; in generale quello che succede è che quando i limiti del sistema sono -fissi essi vengono definiti come macro di preprocessore nel file -\file{limits.h}, se invece possono variare, il loro valore sarà ottenibile -tramite la funzione \func{sysconf} (che esamineremo in -\secref{sec:sys_sysconf}). - -Lo standard ANSI C definisce dei limiti che sono tutti fissi, pertanto questo -saranno sempre disponibili al momento della compilazione. Un elenco, ripreso -da \file{limits.h}, è riportato in \tabref{tab:sys_ansic_macro}. Come si può -vedere per la maggior parte questi limiti attengono alle dimensioni dei dati -interi, che sono in genere fissati dall'architettura hardware (le analoghe -informazioni per i dati in virgola mobile sono definite a parte, ed -accessibili includendo \file{float.h}). Lo standard prevede anche un'altra -costante, \macro{FOPEN\_MAX}, che può non essere fissa e che pertanto non è -definita in \file{limits.h}; essa deve essere definita in \file{stdio.h} ed -avere un valore minimo di 8. +La prima funzionalità si può ottenere includendo gli opportuni file di +intestazione che contengono le costanti necessarie definite come macro di +preprocessore, per la seconda invece sono ovviamente necessarie delle +funzioni. La situazione è complicata dal fatto che ci sono molti casi in cui +alcuni di questi limiti sono fissi in un'implementazione mentre possono +variare in un altra: tutto questo crea una ambiguità che non è sempre +possibile risolvere in maniera chiara. In generale quello che succede è che +quando i limiti del sistema sono fissi essi vengono definiti come macro di +preprocessore nel file \headfile{limits.h}, se invece possono variare, il loro +valore sarà ottenibile tramite la funzione \func{sysconf} (che esamineremo a +breve). \begin{table}[htb] \centering \footnotesize \begin{tabular}[c]{|l|r|l|} \hline - \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ + \textbf{Costante}&\textbf{Valore}&\textbf{Significato}\\ \hline \hline - \macro{MB\_LEN\_MAX}& 16 & massima dimensione di un - carattere esteso\\ - \macro{CHAR\_BIT} & 8 & bit di \ctyp{char}\\ - \macro{UCHAR\_MAX}& 255 & massimo di \ctyp{unsigned char}\\ - \macro{SCHAR\_MIN}& -128 & minimo di \ctyp{signed char}\\ - \macro{SCHAR\_MAX}& 127 & massimo di \ctyp{signed char}\\ - \macro{CHAR\_MIN} &\footnotemark& minimo di \ctyp{char}\\ - \macro{CHAR\_MAX} &\footnotemark& massimo di \ctyp{char}\\ - \macro{SHRT\_MIN} & -32768 & minimo di \ctyp{short}\\ - \macro{SHRT\_MAX} & 32767 & massimo di \ctyp{short}\\ - \macro{USHRT\_MAX}& 65535 & massimo di \ctyp{unsigned short}\\ - \macro{INT\_MAX} & 2147483647 & minimo di \ctyp{int}\\ - \macro{INT\_MIN} &-2147483648 & minimo di \ctyp{int}\\ - \macro{UINT\_MAX} & 4294967295 & massimo di \ctyp{unsigned int}\\ - \macro{LONG\_MAX} & 2147483647 & massimo di \ctyp{long}\\ - \macro{LONG\_MIN} &-2147483648 & minimo di \ctyp{long}\\ - \macro{ULONG\_MAX}& 4294967295 & massimo di \ctyp{unsigned long}\\ + \constd{MB\_LEN\_MAX}& 16 & Massima dimensione di un + carattere esteso.\\ + \constd{CHAR\_BIT} & 8 & Numero di bit di \ctyp{char}.\\ + \constd{UCHAR\_MAX}& 255 & Massimo di \ctyp{unsigned char}.\\ + \constd{SCHAR\_MIN}& -128 & Minimo di \ctyp{signed char}.\\ + \constd{SCHAR\_MAX}& 127 & Massimo di \ctyp{signed char}.\\ + \constd{CHAR\_MIN} & 0 o -128 & Minimo di \ctyp{char}.\footnotemark\\ + \constd{CHAR\_MAX} & 127 o 255 & Massimo di \ctyp{char}.\footnotemark\\ + \constd{SHRT\_MIN} & -32768 & Minimo di \ctyp{short}.\\ + \constd{SHRT\_MAX} & 32767 & Massimo di \ctyp{short}.\\ + \constd{USHRT\_MAX}& 65535 & Massimo di \ctyp{unsigned short}.\\ + \constd{INT\_MAX} & 2147483647 & Minimo di \ctyp{int}.\\ + \constd{INT\_MIN} &-2147483648 & Minimo di \ctyp{int}.\\ + \constd{UINT\_MAX} & 4294967295 & Massimo di \ctyp{unsigned int}.\\ + \constd{LONG\_MAX} & 2147483647 & Massimo di \ctyp{long}.\\ + \constd{LONG\_MIN} &-2147483648 & Minimo di \ctyp{long}.\\ + \constd{ULONG\_MAX}& 4294967295 & Massimo di \ctyp{unsigned long}.\\ \hline \end{tabular} - \caption{Costanti definite in \file{limits.h} in conformità allo standard + \caption{Costanti definite in \headfile{limits.h} in conformità allo standard ANSI C.} \label{tab:sys_ansic_macro} \end{table} -\footnotetext[1]{il valore può essere 0 o \macro{SCHAR\_MIN} a seconda che il +\footnotetext[1]{il valore può essere 0 o \const{SCHAR\_MIN} a seconda che il sistema usi caratteri con segno o meno.} -\footnotetext[2]{il valore può essere \macro{UCHAR\_MAX} o \macro{SCHAR\_MAX} +\footnotetext[2]{il valore può essere \const{UCHAR\_MAX} o \const{SCHAR\_MAX} a seconda che il sistema usi caratteri con segno o meno.} -A questi valori lo standard ISO C90 ne aggiunge altri tre, relativi al tipo -\ctyp{long long} introdotto con il nuovo standard, i relativi valori sono in -\tabref{tab:sys_isoc90_macro}. +Lo standard ANSI C definisce dei limiti che sono tutti fissi, pertanto questo +saranno sempre disponibili al momento della compilazione. Un elenco, ripreso +da \headfile{limits.h}, è riportato in tab.~\ref{tab:sys_ansic_macro}. Come si +può vedere per la maggior parte questi limiti attengono alle dimensioni dei +dati interi, che sono in genere fissati dall'architettura hardware, le +analoghe informazioni per i dati in virgola mobile sono definite a parte, ed +accessibili includendo \headfiled{float.h}. \begin{table}[htb] \centering \footnotesize \begin{tabular}[c]{|l|r|l|} \hline - \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ + \textbf{Costante}&\textbf{Valore}&\textbf{Significato}\\ \hline \hline - \macro{LLONG\_MAX}& 9223372036854775807& massimo di \ctyp{long long}\\ - \macro{LLONG\_MIN}&-9223372036854775808& minimo di \ctyp{long long}\\ - \macro{ULLONG\_MAX}&18446744073709551615& - massimo di \ctyp{unsigned long long}\\ + \constd{LLONG\_MAX} & 9223372036854775807& Massimo di \ctyp{long long}.\\ + \constd{LLONG\_MIN} &-9223372036854775808& Minimo di \ctyp{long long}.\\ + \constd{ULLONG\_MAX}&18446744073709551615& Massimo di \ctyp{unsigned long + long}.\\ \hline \end{tabular} - \caption{Macro definite in \file{limits.h} in conformità allo standard + \caption{Macro definite in \headfile{limits.h} in conformità allo standard ISO C90.} \label{tab:sys_isoc90_macro} \end{table} +Lo standard prevede anche un'altra costante, \constd{FOPEN\_MAX}, che può non +essere fissa e che pertanto non è definita in \headfile{limits.h}, essa deve +essere definita in \headfile{stdio.h} ed avere un valore minimo di 8. A questi +valori lo standard ISO C90 ne aggiunge altri tre, relativi al tipo \ctyp{long + long} introdotto con il nuovo standard, i relativi valori sono in +tab.~\ref{tab:sys_isoc90_macro}. + Ovviamente le dimensioni dei vari tipi di dati sono solo una piccola parte delle caratteristiche del sistema; mancano completamente tutte quelle che dipendono dalla implementazione dello stesso. Queste, per i sistemi unix-like, sono state definite in gran parte dallo standard POSIX.1, che tratta anche i limiti relativi alle caratteristiche dei file che vedremo in -\secref{sec:sys_file_limits}. - -Purtroppo la sezione dello standard che tratta questi argomenti è una delle -meno chiare\footnote{tanto che Stevens, in \cite{APUE}, la porta come esempio - di ``standardese''.}. Lo standard prevede che ci siano 13 macro che -descrivono le caratteristiche del sistema (7 per le caratteristiche generiche, -riportate in \tabref{tab:sys_generic_macro}, e 6 per le caratteristiche dei -file, riportate in \tabref{tab:sys_file_macro}). +sez.~\ref{sec:sys_file_limits}. \begin{table}[htb] \centering \footnotesize - \begin{tabular}[c]{|l|r|p{8cm}|} - \hline - \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ + \begin{tabular}[c]{|l|r|p{9cm}|} \hline + \textbf{Costante}&\textbf{Valore}&\textbf{Significato}\\ \hline - \macro{ARG\_MAX} &131072& dimensione massima degli argomenti - passati ad una funzione della famiglia - \func{exec}.\\ - \macro{CHILD\_MAX} & 999& numero massimo di processi contemporanei - che un utente può eseguire.\\ - \macro{OPEN\_MAX} & 256& numero massimo di file che un processo - può mantenere aperti in contemporanea.\\ - \macro{STREAM\_MAX}& 8& massimo numero di stream aperti per - processo in contemporanea.\\ - \macro{TZNAME\_MAX}& 6& dimensione massima del nome di una - \texttt{timezone} (vedi ).\\ - \macro{NGROUPS\_MAX}& 32& numero di gruppi supplementari per - processo (vedi \secref{sec:proc_access_id}).\\ - \macro{SSIZE\_MAX}&32767& valore massimo del tipo \type{ssize\_t}.\\ \hline + \constd{ARG\_MAX} &131072& Dimensione massima degli argomenti + passati ad una funzione della famiglia + \func{exec}.\\ + \constd{CHILD\_MAX} & 999& Numero massimo di processi contemporanei + che un utente può eseguire.\\ + \constd{OPEN\_MAX} & 256& Numero massimo di file che un processo + può mantenere aperti in contemporanea.\\ + \constd{STREAM\_MAX}& 8& Massimo numero di stream aperti per + processo in contemporanea.\\ + \constd{TZNAME\_MAX}& 6& Dimensione massima del nome di una + \textit{timezone} (vedi + sez.~\ref{sec:sys_time_base})).\\ + \constd{NGROUPS\_MAX}& 32& Numero di gruppi supplementari per + processo (vedi sez.~\ref{sec:proc_access_id}).\\ + \constd{SSIZE\_MAX}&32767& Valore massimo del tipo \type{ssize\_t}.\\ \hline \end{tabular} \caption{Costanti per i limiti del sistema.} \label{tab:sys_generic_macro} \end{table} -Lo standard dice che queste macro devono essere definite in \file{limits.h} -quando i valori a cui fanno riferimento sono fissi, e altrimenti devono essere -lasciate indefinite, ed i loro valori dei limiti devono essere accessibili -solo attraverso \func{sysconf}. In realtà queste vengono sempre definite ad -un valore generico. Si tenga presente poi che alcuni di questi limiti possono -assumere valori molto elevati (come \macro{CHILD\_MAX}), e non è pertanto il -caso di utilizzarli per allocare staticamente della memoria. - -A complicare la faccenda si aggiunge il fatto che POSIX.1 prevede una serie di -altre costanti (il cui nome inizia sempre con \code{\_POSIX\_}) che -definiscono i valori minimi le stesse caratteristiche devono avere, perché una -implementazione possa dichiararsi conforme allo standard; detti valori sono -riportati in \tabref{tab:sys_posix1_general}. +Purtroppo la sezione dello standard che tratta questi argomenti è una delle +meno chiare, tanto che Stevens, in \cite{APUE}, la porta come esempio di +``\textsl{standardese}''. Lo standard prevede che ci siano 13 macro che +descrivono le caratteristiche del sistema: 7 per le caratteristiche generiche, +riportate in tab.~\ref{tab:sys_generic_macro}, e 6 per le caratteristiche dei +file, riportate in tab.~\ref{tab:sys_file_macro}. \begin{table}[htb] \centering \footnotesize - \begin{tabular}[c]{|l|r|p{8cm}|} + \begin{tabular}[c]{|l|r|p{9cm}|} \hline - \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ + \textbf{Costante}&\textbf{Valore}&\textbf{Significato}\\ \hline \hline - \macro{\_POSIX\_ARG\_MAX} & 4096& dimensione massima degli argomenti + \macrod{\_POSIX\_ARG\_MAX} & 4096& Dimensione massima degli argomenti passati ad una funzione della famiglia \func{exec}.\\ - \macro{\_POSIX\_CHILD\_MAX} & 6& numero massimo di processi - contemporanei che un utente può + \macrod{\_POSIX\_CHILD\_MAX} & 6& Numero massimo di processi + contemporanei che un utente può eseguire.\\ - \macro{\_POSIX\_OPEN\_MAX} & 16& numero massimo di file che un processo - può mantenere aperti in + \macrod{\_POSIX\_OPEN\_MAX} & 16& Numero massimo di file che un processo + può mantenere aperti in contemporanea.\\ - \macro{\_POSIX\_STREAM\_MAX} & 8& massimo numero di stream aperti per + \macrod{\_POSIX\_STREAM\_MAX}& 8& Massimo numero di stream aperti per processo in contemporanea.\\ - \macro{\_POSIX\_TZNAME\_MAX} & & dimensione massima del nome di una - \texttt{timezone} (vedi ).\\ - \macro{\_POSIX\_NGROUPS\_MAX}& 0& numero di gruppi supplementari per + \macrod{\_POSIX\_TZNAME\_MAX}& 6& Dimensione massima del nome di una + \textit{timezone} + (vedi sez.~\ref{sec:sys_date}). \\ + \macrod{\_POSIX\_RTSIG\_MAX} & 8& Numero massimo di segnali + \textit{real-time} (vedi + sez.~\ref{sec:sig_real_time}).\\ + \macrod{\_POSIX\_NGROUPS\_MAX}& 0& Numero di gruppi supplementari per processo (vedi - \secref{sec:proc_access_id}).\\ - \macro{\_POSIX\_SSIZE\_MAX} &32767& valore massimo del tipo + sez.~\ref{sec:proc_access_id}).\\ + \macrod{\_POSIX\_SSIZE\_MAX} &32767& Valore massimo del tipo \type{ssize\_t}.\\ - \macro{\_POSIX\_AIO\_LISTIO\_MAX}&2& \\ - \macro{\_POSIX\_AIO\_MAX} & 1& \\ - \hline + % \macrod{\_POSIX\_AIO\_LISTIO\_MAX}&2& \\ + % \macrod{\_POSIX\_AIO\_MAX} & 1& \\ \hline \end{tabular} - \caption{Macro dei valori minimi delle caratteristiche generali del sistema - per la conformità allo standard POSIX.1.} + \caption{Macro dei valori minimi di alcune caratteristiche generali del + sistema per la conformità allo standard POSIX.1.} \label{tab:sys_posix1_general} \end{table} -In genere questi valori non servono a molto, la loro unica utilità è quella di -indicare un limite superiore che assicura la portabilità senza necessità di +Lo standard dice che queste macro devono essere definite in +\headfile{limits.h} quando i valori a cui fanno riferimento sono fissi, e +altrimenti devono essere lasciate indefinite, ed i loro valori dei limiti +devono essere accessibili solo attraverso \func{sysconf}. In realtà queste +vengono sempre definite ad un valore generico. Si tenga presente poi che +alcuni di questi limiti possono assumere valori molto elevati (come +\const{CHILD\_MAX}), e non è pertanto il caso di utilizzarli per allocare +staticamente della memoria. + +A complicare la faccenda si aggiunge il fatto che POSIX.1 prevede una serie di +altre costanti (il cui nome inizia sempre con \code{\_POSIX\_}) che +definiscono i valori minimi le stesse caratteristiche devono avere, perché una +implementazione possa dichiararsi conforme allo standard, alcuni dei questi +valori sono riportati in tab.~\ref{tab:sys_posix1_general}. + +In genere questi valori non servono a molto, la loro unica utilità è quella di +indicare un limite superiore che assicura la portabilità senza necessità di ulteriori controlli. Tuttavia molti di essi sono ampiamente superati in tutti -i sistemi POSIX in uso oggigiorno. Per questo è sempre meglio utilizzare i +i sistemi POSIX in uso oggigiorno. Per questo è sempre meglio utilizzare i valori ottenuti da \func{sysconf}. \begin{table}[htb] \centering \footnotesize - \begin{tabular}[c]{|l|p{8cm}|} + \begin{tabular}[c]{|l|p{9cm}|} \hline \textbf{Macro}&\textbf{Significato}\\ \hline \hline - \macro{\_POSIX\_JOB\_CONTROL}& il sistema supporta il - \textit{job control} (vedi - \secref{sec:sess_xxx}).\\ - \macro{\_POSIX\_SAVED\_IDS} & il sistema supporta i \textit{saved id} - (vedi \secref{sec:proc_access_id}). - per il controllo di accesso dei processi\\ - \macro{\_POSIX\_VERSION} & fornisce la versione dello standard POSIX.1 - supportata nel formato YYYYMML (ad esempio - 199009L).\\ + \macrod{\_POSIX\_JOB\_CONTROL}& Il sistema supporta il + \textit{job control} (vedi + sez.~\ref{sec:sess_job_control}).\\ + \macrod{\_POSIX\_SAVED\_IDS} & Il sistema supporta gli identificatori del + gruppo \textit{saved} (vedi + sez.~\ref{sec:proc_access_id}) + per il controllo di accesso dei processi.\\ + \macrod{\_POSIX\_VERSION} & Fornisce la versione dello standard POSIX.1 + supportata nel formato YYYYMML (ad esempio + 199009L).\\ \hline \end{tabular} - \caption{Alcune macro definite in \file{limits.h} in conformità allo standard - POSIX.1.} + \caption{Alcune macro definite in \headfile{limits.h} in conformità allo + standard POSIX.1.} \label{tab:sys_posix1_other} \end{table} -Oltre ai precedenti valori (e a quelli relativi ai file elencati in -\tabref{tab:sys_posix1_file}), che devono essere obbligatoriamente definiti, -lo standard POSIX.1 ne prevede parecchi altri. La lista completa si trova -dall'header file \file{bits/posix1\_lim.h} (da non usare mai direttamente, è -incluso automaticamente all'interno di \file{limits.h}). Di questi vale la -pena menzionare alcune macro di uso comune, (riportate in -\tabref{tab:sys_posix1_other}), che non indicano un valore specifico, ma -denotano la presenza di alcune funzionalità nel sistema (come il supporto del -\textit{job control} o dei \textit{saved id}). +Oltre ai precedenti valori e a quelli relativi ai file elencati in +tab.~\ref{tab:sys_posix1_file}, che devono essere obbligatoriamente definiti, +lo standard POSIX.1 ne prevede molti altri. La lista completa si trova +dall'header file \file{bits/posix1\_lim.h}, da non usare mai direttamente (è +incluso automaticamente all'interno di \headfile{limits.h}). Di questi vale la +pena menzionarne alcune macro di uso comune, riportate in +tab.~\ref{tab:sys_posix1_other}, che non indicano un valore specifico, ma +denotano la presenza di alcune funzionalità nel sistema, come il supporto del +\textit{job control} o degli identificatori del gruppo \textit{saved}. Oltre allo standard POSIX.1, anche lo standard POSIX.2 definisce una serie di altre costanti. Siccome queste sono principalmente attinenti a limiti relativi -alle applicazioni di sistema presenti (come quelli su alcuni parametri delle -espressioni regolari o del comando \cmd{bc}), non li tratteremo -esplicitamente, se ne trova una menzione completa nell'header file -\file{bits/posix2\_lim.h}, e alcuni di loro sono descritti nella man page di -\func{sysconf} e nel manuale delle \acr{glibc}. - - -\subsection{La funzione \func{sysconf}} -\label{sec:sys_sysconf} - -Come accennato in \secref{sec:sys_limits} quando uno dei limiti o delle -caratteristiche del sistema può variare, per non dover essere costretti a -ricompilare un programma tutte le volte che si cambiano le opzioni con cui è -compilato il kernel, o alcuni dei parametri modificabili a run time, è -necessario ottenerne il valore attraverso la funzione \func{sysconf}. Il -prototipo di questa funzione è: -\begin{prototype}{unistd.h}{long sysconf(int name)} - Restituisce il valore del parametro di sistema \param{name}. - - \bodydesc{La funzione restituisce indietro il valore del parametro - richiesto, o 1 se si tratta di un'opzione disponibile, 0 se l'opzione non - è disponibile e -1 in caso di errore (ma \var{errno} non viene settata).} -\end{prototype} +alle applicazioni di sistema presenti, come quelli su alcuni parametri delle +espressioni regolari o del comando \cmd{bc}, non li tratteremo esplicitamente, +se ne trova una menzione completa nell'header file \file{bits/posix2\_lim.h}, +e alcuni di loro sono descritti nella pagina di manuale di \func{sysconf} e +nel manuale della \acr{glibc}. + +Quando uno dei limiti o delle caratteristiche del sistema può variare, per non +dover essere costretti a ricompilare un programma tutte le volte che si +cambiano le opzioni con cui è compilato il kernel, o alcuni dei parametri +modificabili al momento dell'esecuzione, è necessario ottenerne il valore +attraverso la funzione \funcd{sysconf}, cui prototipo è: + +\begin{funcproto}{ +\fhead{unistd.h} +\fdecl{long sysconf(int name)} +\fdesc{Restituisce il valore di un parametro di sistema.} +} + +{La funzione ritorna in caso di successo il valore del parametro richiesto, o + 1 se si tratta di un'opzione disponibile, 0 se l'opzione non è disponibile e + $-1$ per un errore, nel qual caso però \var{errno} non viene impostata.} +\end{funcproto} La funzione prende come argomento un intero che specifica quale dei limiti si -vuole conoscere; uno specchietto contenente i principali valori disponibili in -Linux è riportato in \tabref{tab:sys_sysconf_par}; l'elenco completo è -contenuto in \file{bits/confname.h}, ed una lista più esaustiva, con le -relative spiegazioni, si può trovare nel manuale delle \acr{glibc}. +vuole conoscere. Uno specchietto contenente i principali valori disponibili in +Linux è riportato in tab.~\ref{tab:sys_sysconf_par}, l'elenco completo è +contenuto in \file{bits/confname.h}, ed una lista più esaustiva, con le +relative spiegazioni, si può trovare nel manuale della \acr{glibc}. \begin{table}[htb] \centering \footnotesize - \begin{tabular}[c]{|l|l|p{9cm}|} + \begin{tabular}[c]{|l|l|p{8cm}|} \hline \textbf{Parametro}&\textbf{Macro sostituita} &\textbf{Significato}\\ \hline \hline - \texttt{\_SC\_ARG\_MAX} &\macro{ARG\_MAX}& - La dimensione massima degli argomenti passati ad una funzione - della famiglia \func{exec}.\\ - \texttt{\_SC\_CHILD\_MAX}&\macro{\_CHILD\_MAX}& - Il numero massimo di processi contemporanei che un utente può - eseguire.\\ - \texttt{\_SC\_OPEN\_MAX}&\macro{\_OPEN\_MAX}& - Il numero massimo di file che un processo può mantenere aperti in - contemporanea.\\ - \texttt{\_SC\_STREAM\_MAX}& \macro{STREAM\_MAX}& - Il massimo numero di stream che un processo può mantenere aperti in - contemporanea. Questo limite previsto anche dallo standard ANSI C, che - specifica la macro {FOPEN\_MAX}.\\ - \texttt{\_SC\_TZNAME\_MAX}&\macro{TZNAME\_MAX}& - La dimensione massima di un nome di una \texttt{timezone} (vedi ).\\ - \texttt{\_SC\_NGROUPS\_MAX}&\macro{NGROUP\_MAX}& - Massimo numero di gruppi supplementari che può avere un processo (vedi - \secref{sec:proc_access_id}).\\ - \texttt{\_SC\_SSIZE\_MAX}&\macro{SSIZE\_MAX}& - valore massimo del tipo di dato \type{ssize\_t}.\\ - \texttt{\_SC\_CLK\_TCK}& \macro{CLK\_TCK} & - Il numero di \textit{clock tick} al secondo, cioè l'unità di misura del - \textit{process time} (vedi \secref{sec:sys_unix_time}).\\ + \texttt{\_SC\_ARG\_MAX} & \const{ARG\_MAX}& + La dimensione massima degli argomenti passati + ad una funzione della famiglia \func{exec}.\\ + \texttt{\_SC\_CHILD\_MAX} & \const{CHILD\_MAX}& + Il numero massimo di processi contemporanei + che un utente può eseguire.\\ + \texttt{\_SC\_OPEN\_MAX} & \const{OPEN\_MAX}& + Il numero massimo di file che un processo può + mantenere aperti in contemporanea.\\ + \texttt{\_SC\_STREAM\_MAX}& \const{STREAM\_MAX}& + Il massimo numero di stream che un processo + può mantenere aperti in contemporanea. Questo + limite è previsto anche dallo standard ANSI C, + che specifica la macro \const{FOPEN\_MAX}.\\ + \texttt{\_SC\_TZNAME\_MAX}& \const{TZNAME\_MAX}& + La dimensione massima di un nome di una + \texttt{timezone} (vedi + sez.~\ref{sec:sys_date}).\\ + \texttt{\_SC\_NGROUPS\_MAX}&\const{NGROUP\_MAX}& + Massimo numero di gruppi supplementari che + può avere un processo (vedi + sez.~\ref{sec:proc_access_id}).\\ + \texttt{\_SC\_SSIZE\_MAX} & \const{SSIZE\_MAX}& + Valore massimo del tipo di dato + \type{ssize\_t}.\\ + \texttt{\_SC\_CLK\_TCK} & \const{CLK\_TCK} & + Il numero di \textit{clock tick} al secondo, + cioè l'unità di misura del + \textit{process time} (vedi + sez.~\ref{sec:sys_unix_time}).\\ \texttt{\_SC\_JOB\_CONTROL}&\macro{\_POSIX\_JOB\_CONTROL}& - Indica se è supportato il \textit{job control} (vedi - \secref{sec:sess_xxx}) in stile POSIX.\\ - \texttt{\_SC\_SAVED\_IDS}&\macro{\_POSIX\_SAVED\_IDS}& - Indica se il sistema supporta i \textit{saved id} (vedi - \secref{sec:proc_access_id}).\\ - \texttt{\_SC\_VERSION}& \macro{\_POSIX\_VERSION} & - Indica il mese e l'anno di approvazione della revisione dello standard - POSIX.1 a cui il sistema fa riferimento, nel formato YYYYMML, la - revisione più recente è 199009L, che indica il Settembre 1990.\\ + Indica se è supportato il \textit{job + control} (vedi + sez.~\ref{sec:sess_job_control}) in stile + POSIX.\\ + \texttt{\_SC\_SAVED\_IDS} & \macro{\_POSIX\_SAVED\_IDS}& + Indica se il sistema supporta i + \textit{saved id} (vedi + sez.~\ref{sec:proc_access_id}).\\ + \texttt{\_SC\_VERSION} & \macro{\_POSIX\_VERSION} & + Indica il mese e l'anno di approvazione + della revisione dello standard POSIX.1 a cui + il sistema fa riferimento, nel formato + YYYYMML, la revisione più recente è 199009L, + che indica il Settembre 1990.\\ \hline \end{tabular} \caption{Parametri del sistema leggibili dalla funzione \func{sysconf}.} \label{tab:sys_sysconf_par} \end{table} -In generale ogni limite o caratteristica del sistema per cui è definita una -macro, sia dagli standard ANSI C e ISO C90, che da POSIX.1 e POSIX.2, può -essere ottenuto attraverso una chiamata a \func{sysconf}. Il valore si otterrà -specificando come valore del parametro \param{name} il nome ottenuto -aggiungendo \code{\_SC\_} ai nomi delle macro definite dai primi due, o -sostituendolo a \code{\_POSIX\_} per le macro definite dagli gli altri due. - -In generale si dovrebbe fare uso di \func{sysconf} solo quando la relativa -macro non è definita, quindi con un codice analogo al seguente: -%\footnotesize -\begin{lstlisting}[labelstep=0,frame=,indent=1cm]{} -get_child_max(void) -{ -#ifdef CHILD_MAX - return CHILD_MAX; -#else - int val = sysconf(_SC_CHILD_MAX); - if (val < 0) { - perror("fatal error"); - exit(-1); - } - return val; -} -\end{lstlisting} -%\normalsize -ma in realtà in Linux queste macro sono comunque definite, indicando però un -limite generico. Per questo motivo è sempre meglio usare i valori restituiti -da \func{sysconf}. - - -\subsection{I limiti dei file} +In generale ogni limite o caratteristica del sistema per cui è definita una +macro, sia da ANSI C e ISO C90 che da POSIX.1 e POSIX.2, può essere ottenuto +attraverso una chiamata a \func{sysconf}. Il nome della costante da utilizzare +come valore dell'argomento \param{name} si otterrà aggiungendo \code{\_SC\_} +ai nomi delle costanti definite dai primi due standard (quelle di +tab.~\ref{tab:sys_generic_macro}), o sostituendolo a \code{\_POSIX\_} per le +costanti definite dagli altri due standard (quelle di +tab.~\ref{tab:sys_posix1_general}). + +In linea teorica si dovrebbe fare uso di \func{sysconf} solo quando la +relativa costante di sistema non è definita, quindi con un codice analogo al +seguente: +\includecodesnip{listati/get_child_max.c} +ma in realtà con Linux queste costanti sono comunque definite, indicando però +un limite generico che non è detto sia corretto; per questo motivo è sempre +meglio usare i valori restituiti da \func{sysconf}. + + +\subsection{Limiti e caratteristiche dei file} \label{sec:sys_file_limits} Come per le caratteristiche generali del sistema anche per i file esistono una serie di limiti (come la lunghezza del nome del file o il numero massimo di -link) che dipendono sia dall'implementazione che dal filesystem in uso; anche +link) che dipendono sia dall'implementazione che dal filesystem in uso. Anche in questo caso lo standard prevede alcune macro che ne specificano il valore, -riportate in \tabref{tab:sys_file_macro}. +riportate in tab.~\ref{tab:sys_file_macro}. \begin{table}[htb] \centering \footnotesize - \begin{tabular}[c]{|l|r|p{8cm}|} + \begin{tabular}[c]{|l|r|l|} \hline - \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ + \textbf{Costante}&\textbf{Valore}&\textbf{Significato}\\ \hline \hline - \macro{NAME\_MAX}& 14 & lunghezza in byte di un nome di file. \\ - \macro{PATH\_MAX}& 256 & lunghezza in byte di pathname.\\ - \macro{PIPE\_BUF}& 512 & byte scrivibili atomicamente in una pipe\\ - \macro{LINK\_MAX} &8 & numero massimo di link a un file\\ - \macro{MAX\_CANON}&255 & spazio disponibile nella coda di input - canonica del terminale\\ - \macro{MAX\_INPUT}&255 & spazio disponibile nella coda di input - del terminale\\ + \constd{LINK\_MAX} &8 & Numero massimo di link a un file.\\ + \constd{NAME\_MAX}& 14 & Lunghezza in byte di un nome di file. \\ + \constd{PATH\_MAX}& 256 & Lunghezza in byte di un \textit{pathname}.\\ + \constd{PIPE\_BUF}&4096 & Byte scrivibili atomicamente in una \textit{pipe} + (vedi sez.~\ref{sec:ipc_pipes}).\\ + \constd{MAX\_CANON}&255 & Dimensione di una riga di terminale in modo + canonico (vedi sez.~\ref{sec:term_io_design}).\\ + \constd{MAX\_INPUT}&255 & Spazio disponibile nella coda di input + del terminale (vedi + sez.~\ref{sec:term_io_design}).\\ \hline \end{tabular} - \caption{Macro per i limiti sulle caratteristiche dei file.} + \caption{Costanti per i limiti sulle caratteristiche dei file.} \label{tab:sys_file_macro} \end{table} Come per i limiti di sistema, lo standard POSIX.1 detta una serie di valori minimi anche per queste caratteristiche, che ogni sistema che vuole essere -conforme deve rispettare; le relative macro sono riportate in -\tabref{tab:sys_posix1_file}, e per esse vale lo stesso discorso fatto per le -analoghe di \tabref{tab:sys_posix1_general}. +conforme deve rispettare. Le relative macro sono riportate in +tab.~\ref{tab:sys_posix1_file} e per esse vale lo stesso discorso fatto per le +analoghe di tab.~\ref{tab:sys_posix1_general}. \begin{table}[htb] \centering \footnotesize - \begin{tabular}[c]{|l|r|p{8cm}|} + \begin{tabular}[c]{|l|r|l|} \hline \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ \hline \hline - \textbf{Macro}&\textbf{Valore}&\textbf{Significato}\\ - \macro{\_POSIX\_LINK\_MAX} &8 & numero massimo di link a un file\\ - \macro{\_POSIX\_MAX\_CANON}&255 & spazio disponibile nella coda di input - canonica del terminale\\ - \macro{\_POSIX\_MAX\_INPUT}&255 & spazio disponibile nella coda di input - del terminale\\ - \macro{\_POSIX\_NAME\_MAX}& 14 & lunghezza in byte di un nome di file. \\ - \macro{\_POSIX\_PATH\_MAX}& 256 & lunghezza in byte di pathname.\\ - \macro{\_POSIX\_PIPE\_BUF}& 512 & byte scrivibili atomicamente in una - pipe\\ -% \macro{\_POSIX\_MQ\_OPEN\_MAX}& 8& \\ -% \macro{\_POSIX\_MQ\_PRIO\_MAX}& 32& \\ -% \macro{\_POSIX\_FD\_SETSIZE}& 16 & \\ -% \macro{\_POSIX\_DELAYTIMER\_MAX}& 32 & \\ + \macrod{\_POSIX\_LINK\_MAX} &8 & Numero massimo di link a un file.\\ + \macrod{\_POSIX\_NAME\_MAX}& 14 & Lunghezza in byte di un nome di file.\\ + \macrod{\_POSIX\_PATH\_MAX}& 256 & Lunghezza in byte di un + \textit{pathname}.\\ + \macrod{\_POSIX\_PIPE\_BUF}& 512 & Byte scrivibili atomicamente in una + \textit{pipe}.\\ + \macrod{\_POSIX\_MAX\_CANON}&255 & Dimensione di una riga di + terminale in modo canonico.\\ + \macrod{\_POSIX\_MAX\_INPUT}&255 & Spazio disponibile nella coda di input + del terminale.\\ +% \macrod{\_POSIX\_MQ\_OPEN\_MAX}& 8& \\ +% \macrod{\_POSIX\_MQ\_PRIO\_MAX}& 32& \\ +% \macrod{\_POSIX\_FD\_SETSIZE}& 16 & \\ +% \macrod{\_POSIX\_DELAYTIMER\_MAX}& 32 & \\ \hline \end{tabular} - \caption{Macro dei valori minimi delle caratteristiche dei file per la - conformità allo standard POSIX.1.} + \caption{Costanti dei valori minimi delle caratteristiche dei file per la + conformità allo standard POSIX.1.} \label{tab:sys_posix1_file} \end{table} -Tutti questi limiti sono definiti in \file{limits.h}; come nel caso precedente -il loro uso è di scarsa utilità in quanto ampiamente superati in tutte le -implementazioni moderne. - +Tutti questi limiti sono definiti in \headfile{limits.h}; come nel caso +precedente il loro uso è di scarsa utilità in quanto ampiamente superati in +tutte le implementazioni moderne. In generale i limiti per i file sono molto +più soggetti ad essere variabili rispetto ai limiti generali del sistema; ad +esempio parametri come la lunghezza del nome del file o il numero di link +possono variare da filesystem a filesystem. + +Per questo motivo quando si ha a che fare con limiti relativi ai file questi +devono essere sempre controllati con la funzione \funcd{pathconf}, il cui +prototipo è: + +\begin{funcproto}{ +\fhead{unistd.h} +\fdecl{long pathconf(char *path, int name)} +\fdesc{Restituisce il valore di un parametro dei file.} +} -\subsection{La funzione \func{pathconf}} -\label{sec:sys_pathconf} +{La funzione ritorna il valore del parametro richiesto in caso di successo e + $-1$ per un errore, nel qual caso \var{errno} viene impostata ad uno degli + errori possibili relativi all'accesso a \param{path}.} +\end{funcproto} + +La funzione richiede che si specifichi il limite che si vuole controllare con +l'argomento \param{name}, per il quale si deve usare la relativa costante +identificativa, il cui nome si ottiene da quelle descritte in +tab.~\ref{tab:sys_file_macro} e tab.~\ref{tab:sys_posix1_file} con la stessa +convenzione già vista con \func{sysconf}, ma un questo caso con l'uso del +suffisso ``\texttt{\_PC\_}''. + +In questo caso la funzione richiede anche un secondo argomento \param{path} +che specifichi a quale file si fa riferimento, dato che il valore del limite +cercato può variare a seconda del filesystem su cui si trova il file. Una +seconda versione della funzione, \funcd{fpathconf}, opera su un file +descriptor invece che su un \textit{pathname}, il suo prototipo è: + +\begin{funcproto}{ +\fhead{unistd.h} +\fdecl{long fpathconf(int fd, int name)} +\fdesc{Restituisce il valore di un parametro dei file.} +} -In generale i limiti per i file sono molto più soggetti ad essere variabili -rispetto ai limiti generali del sistema; ad esempio parametri come la -lunghezza del nome del file o il numero di link possono variare da filesystem -a filesystem; per questo motivo questi limiti devono essere sempre controllati -con la funzione \func{pathconf}, il cui prototipo è: -\begin{prototype}{unistd.h}{long pathconf(char *path, int name)} - Restituisce il valore del parametro \param{name} per il file \param{path}. - - \bodydesc{La funzione restituisce indietro il valore del parametro - richiesto, o -1 in caso di errore (ed \var{errno} viene settata ad uno - degli errori possibili relativi all'accesso a \param{path}).} -\end{prototype} - -E si noti come la funzione in questo caso richieda un parametro che specifichi -a quale file si fa riferimento, dato che il valore del limite cercato può -variare a seconda del filesystem. Una seconda versione della funzione, -\func{fpathconf}, opera su un file descriptor invece che su un pathname. Il -suo prototipo è: -\begin{prototype}{unistd.h}{long fpathconf(int fd, int name)} - Restituisce il valore del parametro \param{name} per il file \param{fd}. - - \bodydesc{È identica a \func{pathconf} solo che utilizza un file descriptor - invece di un pathname; pertanto gli errori restituiti cambiano di - conseguenza.} -\end{prototype} -\noindent ed il suo comportamento è identico a quello di \func{pathconf}. +{È identica a \func{pathconf} solo che utilizza un file descriptor invece di + un \textit{pathname}; pertanto gli errori restituiti in \var{errno} cambiano + di conseguenza.} +\end{funcproto} +\noindent ed il suo comportamento è identico a quello di \func{pathconf} a +parte quello di richiedere l'indicazione di un file descriptor +nell'argomento \param{fd}. -\subsection{La funzione \func{uname}} -\label{sec:sys_uname} -Un'altra funzione che si può utilizzare per raccogliere informazioni sia -riguardo al sistema che al computer su cui esso sta girando è \func{uname}; il -suo prototipo è: -\begin{prototype}{sys/utsname.h}{int uname(struct utsname *info)} - Restituisce informazioni sul sistema nella struttura \param{info}. - - \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di - fallimento, nel qual caso \var{errno} viene settata a \macro{EFAULT}.} -\end{prototype} - -La funzione, che viene usata dal comando \cmd{uname}, restituisce le -informazioni richieste nella struttura \param{info}; anche questa struttura è -definita in \file{sys/utsname.h}, secondo quanto mostrato in -\secref{fig:sys_utsname}, e le informazioni memorizzate nei suoi membri -indicano rispettivamente: -\begin{itemize*} -\item il nome del sistema operativo; -\item il nome della release del kernel; -\item il nome della versione del kernel; -\item il tipo di macchina in uso; -\item il nome della stazione; -\item il nome del domino. -\end{itemize*} -l'ultima informazione è stata aggiunta di recente e non è prevista dallo -standard POSIX, essa è accessibile, come mostrato in \figref{fig:sig_stack_t}, -solo definendo \macro{\_GNU\_SOURCE}. - -\begin{figure}[!htb] - \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct utsname { - char sysname[]; - char nodename[]; - char release[]; - char version[]; - char machine[]; -#ifdef _GNU_SOURCE - char domainname[]; -#endif -}; - \end{lstlisting} - \end{minipage} - \normalsize - \caption{La struttura \var{utsname}.} - \label{fig:sys_utsname} -\end{figure} - -In generale si tenga presente che le dimensioni delle stringe di una -\var{utsname} non è specificata, e che esse sono sempre terminate con -\macro{NULL}; il manuale delle \acr{glibc} indica due diverse dimensioni, -\macro{\_UTSNAME\_LENGTH} per i campi standard e -\macro{\_UTSNAME\_DOMAIN\_LENGTH} per quello specifico per il nome di dominio; -altri sistemi usano nomi diversi come \macro{SYS\_NMLN} o \macro{\_SYS\_NMLN} -or \macro{UTSLEN} che possono avere valori diversi. Nel caso di Linux -\func{uname} corrisponde in realtà a 3 system call diverse, le prime due usano -rispettivamente delle lunghezze delle stringhe di 9 e 65 byte; la terza usa -anch'essa 65 byte, ma restituisce anche l'ultimo campo, \var{domainname}, con -una lunghezza di 257 byte. - - -\section{Opzioni e configurazione del sistema} -\label{sec:sys_config} - -Come abbiamo accennato nella sezione precedente, non tutti i limiti che -caratterizzano il sistema sono fissi, o perlomeno non lo sono in tutte le -implementazioni. Finora abbiamo visto come si può fare per leggerli, ci manca -di esaminare il meccanismo che permette, quando questi possono variare durante -l'esecuzione del sistema, di modificarli. - -Inoltre, al di la di quelli che possono essere limiti caratteristici previsti -da uno standard, ogni sistema può avere una sua serie di altri parametri di -configurazione, che, non essendo mai fissi e variando da sistema a sistema, -non sono stati inclusi nella standardizzazione della sezione precedente. Per -questi occorre, oltre al meccanismo di settaggio, pure un meccanismo di -lettura. - -Affronteremo questi argomenti in questa sezione, insieme alle funzioni che si -usano per il controllo di altre caratteristiche generali del sistema, come -quelle per la gestione dei filesystem e di utenti e gruppi. - - -\subsection{La funzione \func{sysctl} ed il filesystem \file{/proc}} +\subsection{I parametri del kernel ed il filesystem \texttt{/proc}} \label{sec:sys_sysctl} -La funzione che permette la lettura ed il settaggio dei parametri del sistema -è \func{sysctl}; è una funzione derivata da BSD4.4, ma l'implementazione è -specifica di Linux; il suo prototipo è: -\begin{functions} -\headdecl{unistd.h} -\headdecl{linux/unistd.h} -\headdecl{linux/sysctl.h} -\funcdecl{int sysctl(int *name, int nlen, void *oldval, size\_t *oldlenp, void - *newval, size\_t newlen)} - -Legge o scrive uno dei parametri di sistema. - -\bodydesc{La funzione restituisce 0 in caso di successo e -1 in caso di - errore, nel qual caso \var{errno} viene settato ai valori: - \begin{errlist} - \item[\macro{EPERM}] il processo non ha il permesso di accedere ad uno dei - componenti nel cammino specificato per il parametro, o non ha il permesso - di accesso al parametro nella modalità scelta. - \item[\macro{ENOTDIR}] non esiste un parametro corrispondente al nome - \param{name}. - \item[\macro{EFAULT}] si è specificato \param{oldlenp} zero quando - \param{oldval} è non nullo. - \item[\macro{EINVAL}] o si è specificato un valore non valido per il - parametro che si vuole settare o lo spazio provvisto per il ritorno di un - valore non è delle giuste dimensioni. - \item[\macro{ENOMEM}] talvolta viene usato più correttamente questo errore - quando non si è specificato sufficiente spazio per ricevere il valore di un - parametro. - \end{errlist} -} -\end{functions} - -I parametri a cui la funzione permettere di accedere sono organizzati in -maniera gerarchica all'interno un albero; per accedere ad uno di essi occorre -specificare un cammino attraverso i vari nodi dell'albero, in maniera analoga -a come avviene per la risoluzione di un pathname (da cui l'uso alternativo del -filesystem \file{/proc}, che vedremo dopo). - -Ciascun nodo dell'albero è identificato da un valore intero, ed il cammino che -arriva ad identificare un parametro specifico è passato alla funzione -attraverso l'array \param{name}, di lunghezza \param{nlen}, che contiene la -sequenza dei vari nodi da attraversare. Ogni parametro ha un valore in un -formato specifico che può essere un intero, una stringa o anche una struttura -complessa, per questo motivo il valori vengono passati come puntatori -\ctyp{void}. - -L'indirizzo a cui il valore corrente del parametro deve essere letto è -specificato da \param{oldvalue}, e lo spazio ivi disponibile è specificato da -\param{oldlenp} (passato come puntatore per avere indietro la dimensione -effettiva di quanto letto); il valore che si vuole settare nel sistema è -passato in \param{newval} e la sua dimensione in \param{newlen}. - -Si può effettuare anche una lettura e scrittura simultanea, nel qual caso il -valore letto restituito dalla funzione è quello precedente alla scrittura. - -I parametri accessibili attraverso questa funzione sono moltissimi, e possono -essere trovati in \file{sysctl.h}, essi inoltre dipendono anche dallo stato -corrente del kernel (ad esempio dai moduli che sono stati caricati nel -sistema) e in genere i loro nomi possono variare da una versione di kernel -all'altra; per questo è sempre il caso di evitare l'uso di \func{sysctl} -quando esistono modalità alternative per ottenere le stesse informazioni. -Alcuni esempi di parametri ottenibili sono: +Tradizionalmente la funzione che permette la lettura ed l'impostazione dei +parametri del sistema è \funcm{sysctl}. Si tratta di una funzione derivata da +BSD4.4 ed introdotta su Linux a partire dal kernel 1.3.57, ma oggi il suo uso +è totalmente deprecato. Una \textit{system call} \funcm{\_sysctl} continua ad +esistere, ma non dispone più di una interfaccia nella \acr{glibc} ed il suo +utilizzo può essere effettuato solo tramite \func{syscall}, ma di nuovo questo +viene sconsigliato in quanto la funzionalità non è più mantenuta e molto +probabilmente sarà rimossa nel prossimo futuro.\footnote{a partire dal kernel + 2.6.34 la funzione viene inserita nella compilazione del kernel previa + esplicita richiesta, ed il suo uso produce avvertimenti nei log del kernel.} +Per questo motivo eviteremo di trattarne i particolari. + +Lo scopo di \funcm{sysctl} era quello di fornire ai programmi una modalità per +modificare i parametri di sistema. Questi erano organizzati in maniera +gerarchica all'interno di un albero e per accedere a ciascuno di essi +occorreva specificare un percorso attraverso i vari nodi dell'albero, in +maniera analoga a come avviene per la risoluzione di un \textit{pathname}. + +I parametri accessibili e modificabili attraverso questa funzione sono +moltissimi, dipendendo anche dallo stato corrente del kernel, ad esempio dai +moduli che sono stati caricati nel sistema. Inoltre non essendo standardizzati +i loro nomi possono variare da una versione di kernel all'altra, alcuni esempi +di questi parametri sono: \begin{itemize*} -\item il nome di dominio -\item i parametri del meccanismo di \textit{paging}. -\item il filesystem montato come radice -\item la data di compilazione del kernel -\item i parametri dello stack TCP -\item il numero massimo di file aperti +\item il nome di dominio, +\item i parametri del meccanismo di \textit{paging}, +\item il filesystem montato come radice, +\item la data di compilazione del kernel, +\item i parametri dello stack TCP, +\item il numero massimo di file aperti, +\item il numero massimo di processi, +\item i parametri del \textit{SystemV IPC} (vedi sez.~\ref{sec:ipc_sysv}). \end{itemize*} - -Come accennato in Linux si ha una modalità alternativa per accedere alle -stesse informazioni di \func{sysctl} attraverso l'uso del filesystem -\file{/proc}. Questo è un filesystem virtuale, generato direttamente dal -kernel, che non fa riferimento a nessun dispositivo fisico, ma presenta in -forma di file alcune delle strutture interne del kernel stesso. - -In particolare l'albero dei valori di \func{sysctl} viene presentato in forma -di file nella directory \file{/proc/sys}, cosicché è possibile accedervi -specificando un pathname e leggendo e scrivendo sul file corrispondente al -parametro scelto. Il kernel si occupa di generare al volo il contenuto ed i -nomi dei file corrispondenti, e questo ha il grande vantaggio di rendere -accessibili i vari parametri a qualunque comando di shell e di permettere la -navigazione dell'albero dei valori. - -Alcune delle corrispondenze dei file presenti in \file{/proc/sys} con i valori -di \func{sysctl} sono riportate nei commenti del codice che può essere trovato -in \file{linux/sysctl.h},\footnote{indicando un file di definizioni si fa - riferimento alla directory standard dei file di include, che in ogni - distribuzione che si rispetti è \file{/usr/include}.} la informazione -disponibile in \file{/proc/sys} è riportata inoltre nella documentazione +%\noindent e molti altri che abbiamo già incontrato + +\index{file!filesystem~\texttt {/proc}!definizione|(} + +Dato che fin dall'inizio i parametri erano organizzati in una struttura +albero, è parso naturale riportare questa organizzazione all'interno del +filesystem \file{/proc}. Questo è un filesystem virtuale il cui contenuto è +generato direttamente dal kernel, che non fa riferimento a nessun dispositivo +fisico, ma presenta in forma di file e directory i dati di alcune delle +strutture interne del kernel. Il suo utilizzo principale, come denuncia il +nome stesso, è quello di fornire una interfaccia per ottenere i dati relativi +ai processi (venne introdotto a questo scopo su BSD), ma nel corso del tempo +il suo uso è stato ampliato. + +All'interno di questo filesystem sono pertanto presenti una serie di file che +riflettono il contenuto dei parametri del kernel (molti dei quali accessibili +in sola lettura) e in altrettante directory, nominate secondo il relativo +\ids{PID}, vengono mantenute le informazioni relative a ciascun processo +attivo nel sistema (abbiamo già incontrato questa caratteristica in +sez.~\ref{sec:file_openat} per accedere ai filedescriptor del processo +stesso). + +In particolare l'albero dei valori dei parametri di sistema impostabili con +\func{sysctl} viene presentato in forma di una gerarchia di file e directory a +partire dalla directory \file{/proc/sys}, cosicché è possibile accedere al +valore di un parametro del kernel tramite il \textit{pathname} ad un file +sotto \file{/proc/sys} semplicemente leggendone il contenuto, così come si può +modificare un parametro scrivendo sul file ad esso corrispondente. + +Il kernel si occupa di generare al volo il contenuto ed i nomi dei file +corrispondenti ai vari parametri che sono presenti, e questo ha il grande +vantaggio di rendere accessibili gli stessi ad un qualunque comando di shell e +di permettere la navigazione dell'albero in modo da riconoscere quali +parametri sono presenti senza dover cercare un valore all'interno di una +pagina di manuale. + +Inizialmente l'uso del filesystem \file{/proc} serviva soltanto a replicare +l'accesso, con altrettante corrispondenze ai file presenti in +\file{/proc/sys}, ai parametri impostabili tradizionalmente con \func{sysctl}, +ma vista la assoluta naturalità dell'interfaccia, e la sua maggiore +efficienza, nelle versioni più recenti del kernel questa è diventata la +modalità canonica per modificare i parametri del kernel, evitando di dover +ricorrere all'uso di una \textit{system call} specifica, che pur essendo +ancora presente prima o poi verrà eliminata. + +Nonostante la semplificazione nella gestione ottenuta con l'uso di +\file{/proc/sys} resta il problema generale di conoscere il significato di +ciascuno degli innumerevoli parametri che vi si trovano. Purtroppo la +documentazione degli stessi spesso risulta incompleta e non aggiornata, ma +buona parte di quelli può importanti sono descritti dalla documentazione inclusa nei sorgenti del kernel, nella directory \file{Documentation/sysctl}. -Ma oltre alle informazioni ottenibili da \func{sysctl} dentro \file{proc} -sono disponibili moltissime altre informazioni, fra cui ad esempio anche -quelle fornite da \func{uname} (vedi \secref{sec:sys_config}) che sono -mantenute nei file \file{ostype}, \file{hostname}, \file{osrelease}, -\file{version} e \file{domainname} di \file{/proc/kernel/}. - - - -\subsection{La gestione delle proprietà dei filesystem} -\label{sec:sys_file_config} - -Come accennato in \secref{sec:file_organization} per poter accedere ai file -occorre prima rendere disponibile al sistema il filesystem su cui essi sono -memorizzati; l'operazione di attivazione del filesystem è chiamata -\textsl{montaggio}, per far questo in Linux\footnote{la funzione è specifica - di Linux e non è portabile.} si usa la funzione \func{mount} il cui prototipo -è: -\begin{prototype}{sys/mount.h} -{mount(const char *source, const char *target, const char *filesystemtype, - unsigned long mountflags, const void *data)} - -Monta il filesystem di tipo \param{filesystemtype} contenuto in \param{source} -sulla directory \param{target}. - - \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di - fallimento, nel qual caso gli errori comuni a tutti i filesystem che possono - essere restituiti in \var{errno} sono: - \begin{errlist} - \item[\macro{EPERM}] il processo non ha i privilegi di amministratore. - \item[\macro{ENODEV}] \param{filesystemtype} non esiste o non è configurato - nel kernel. - \item[\macro{ENOTBLK}] non si è usato un \textit{block device} per - \param{source} quando era richiesto. - \item[\macro{EBUSY}] \param{source} è già montato, o non può essere - rimontato in read-only perché ci sono ancora file aperti in scrittura, o - \param{target} è ancora in uso. - \item[\macro{EINVAL}] il device \param{source} presenta un - \textit{superblock} non valido, o si è cercato di rimontare un filesystem - non ancora montato, o di montarlo senza che \param{target} sia un - \textit{mount point} o di spostarlo quando \param{target} non è un - \textit{mount point} o è \file{/}. - \item[\macro{EACCES}] non si ha il permesso di accesso su uno dei componenti - del pathname, o si è cercato di montare un filesystem disponibile in sola - lettura senza averlo specificato o il device \param{source} è su un - filesystem montato con l'opzione \macro{MS\_NODEV}. - \item[\macro{ENXIO}] il \textit{major number} del device \param{source} è - sbagliato. - \item[\macro{EMFILE}] la tabella dei device \textit{dummy} è piena. - \end{errlist} - ed inoltre \macro{ENOTDIR}, \macro{EFAULT}, \macro{ENOMEM}, - \macro{ENAMETOOLONG}, \macro{ENOENT} o \macro{ELOOP}.} -\end{prototype} - -La funzione monta sulla directory \param{target}, detta \textit{mount point}, -il filesystem contenuto in \param{source}. In generale un filesystem è -contenuto su un disco, e l'operazione di montaggio corrisponde a rendere -visibile al sistema il contenuto del suddetto disco, identificato attraverso -il file di dispositivo ad esso associato. - -Ma la struttura del virtual filesystem vista in \secref{sec:file_vfs} è molto -più flessibile e può essere usata anche per oggetti diversi da un disco. Ad -esempio usando il \textit{loop device} si può montare un file qualunque (come -l'immagine di un CD-ROM o di un floppy) che contiene un filesystem, inoltre -alcuni filesystem, come \file{proc} o \file{devfs} sono del tutto virtuali, i -loro dati sono generati al volo ad ogni lettura, e passati al kernel ad ogni -scrittura. - -Il tipo di filesystem è specificato da \param{filesystemtype}, che deve essere -una delle stringhe riportate nel file \file{/proc/filesystems}, che contiene -l'elenco dei filesystem supportati dal kernel; nel caso si sia indicato uno -dei filesystem virtuali, il contenuto di \param{source} viene ignorato. - -Dopo l'esecuzione della funzione il contenuto del filesystem viene resto -disponibile nella directory specificata come \textit{mount point}, il -precedente contenuto di detta directory viene mascherato dal contenuto della -directory radice del filesystem montato. - -Dal kernel 2.4.x inoltre è divenuto possibile sia spostare atomicamente un -\textit{mount point} da una directory ad un'altra, sia montare in diversi -\textit{mount point} lo stesso filesystem, sia montare più filesystem sullo -stesso \textit{mount point} (nel qual caso vale quanto appena detto, e solo il -contenuto dell'ultimo filesystem montato sarà visibile). - -Ciascun filesystem è dotato di caratteristiche specifiche che possono essere -attivate o meno, alcune di queste sono generali (anche se non è detto siano -disponibili in ogni filesystem), e vengono specificate come opzioni di -montaggio con l'argomento \param{mountflags}. - -In Linux \param{mountflags} deve essere un intero a 32 bit i cui 16 più -significativi sono un \textit{magic number}\footnote{cioè un numero speciale - usato come identificativo, che nel caso è \code{0xC0ED}; si può usare la - costante \macro{MS\_MGC\_MSK} per ottenere la parte di \param{mountflags} - riservata al \textit{magic number}.} mentre i 16 meno significativi sono -usati per specificare le opzioni; essi sono usati come maschera binaria e -vanno settati con un OR aritmetico della costante \macro{MS\_MGC\_VAL} con i -valori riportati in \ntab. +Ma oltre alle informazioni che sostituiscono quelle ottenibili dalla ormai +deprecata \func{sysctl} dentro \file{/proc} sono disponibili moltissime altre +informazioni, fra cui ad esempio anche quelle fornite dalla funzione di +sistema \funcd{uname},\footnote{con Linux ci sono in realtà 3 \textit{system + call} diverse per le dimensioni delle stringhe restituite, le prime due + usano rispettivamente delle lunghezze di 9 e 65 byte, la terza usa anch'essa + 65 byte, ma restituisce anche l'ultimo campo, \var{domainname}, con una + lunghezza di 257 byte, la \acr{glibc} provvede a mascherare questi dettagli + usando la versione più recente disponibile.} il cui prototipo è: + +\begin{funcproto}{ +\fhead{sys/utsname.h} +\fdecl{int uname(struct utsname *info)} +\fdesc{Restituisce informazioni generali sul sistema.} +} -\begin{table}[htb] - \footnotesize - \centering - \begin{tabular}[c]{|l|r|l|} - \hline - \textbf{Parametro} & \textbf{Valore}&\textbf{Significato}\\ - \hline - \hline - \macro{MS\_RDONLY} & 1 & monta in sola lettura\\ - \macro{MS\_NOSUID} & 2 & ignora i bit \acr{suid} e \acr{sgid}\\ - \macro{MS\_NODEV} & 4 & impedisce l'accesso ai file di dispositivo\\ - \macro{MS\_NOEXEC} & 8 & impedisce di eseguire programmi \\ - \macro{MS\_SYNCHRONOUS}& 16 & abilita la scrittura sincrona \\ - \macro{MS\_REMOUNT} & 32 & rimonta il filesystem cambiando i flag\\ - \macro{MS\_MANDLOCK} & 64 & consente il \textit{mandatory locking} (vedi - \secref{sec:file_mand_locking})\\ - \macro{S\_WRITE} & 128 & scrive normalmente \\ - \macro{S\_APPEND} & 256 & consente la scrittura solo in \textit{append - mode} (vedi \secref{sec:file_sharing})\\ - \macro{S\_IMMUTABLE} & 512 & impedisce che si possano modificare i file \\ - \macro{MS\_NOATIME} &1024 & non aggiorna gli \textit{access time} (vedi - \secref{sec:file_file_times})\\ - \macro{MS\_NODIRATIME}&2048 & non aggiorna gli \textit{access time} delle - directory\\ - \macro{MS\_BIND} &4096 & monta il filesystem altrove\\ - \macro{MS\_MOVE} &8192 & sposta atomicamente il punto di montaggio \\ - \hline - \end{tabular} - \caption{Tabella dei codici dei flag di montaggio di un filesystem.} - \label{tab:sys_mount_flags} -\end{table} +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} può assumere solo il valore \errval{EFAULT}.} +\end{funcproto} -Per il settaggio delle caratteristiche particolari di ciascun filesystem si -usa invece l'argomento \param{data} che serve per passare le ulteriori -informazioni necessarie, che ovviamente variano da filesystem a filesystem. - -La funzione \func{mount} può essere utilizzata anche per effettuare il -\textsl{rimontaggio} di un filesystem, cosa che permette di cambiarne al volo -alcune delle caratteristiche di funzionamento (ad esempio passare da sola -lettura a lettura/scrittura). Questa operazione è attivata attraverso uno dei -bit di \param{mountflags}, \macro{MS\_REMOUNT}, che se settato specifica che -deve essere effettuato il rimontaggio del filesystem (con le opzioni -specificate dagli altri bit), anche in questo caso il valore di \param{source} -viene ignorato. - -Una volta che non si voglia più utilizzare un certo filesystem è possibile -\textsl{smontarlo} usando la funzione \func{umount}, il cui prototipo è: -\begin{prototype}{sys/mount.h}{umount(const char *target)} - - Smonta il filesystem montato sulla directory \param{target}. - - \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di - fallimento, nel qual caso \var{errno} viene settata a: - \begin{errlist} - \item[\macro{EPERM}] il processo non ha i privilegi di amministratore. - \item[\macro{EBUSY}] \param{target} è la directory di lavoro di qualche - processo, o contiene dei file aperti, o un altro mount point. - \end{errlist} - ed inoltre \macro{ENOTDIR}, \macro{EFAULT}, \macro{ENOMEM}, - \macro{ENAMETOOLONG}, \macro{ENOENT} o \macro{ELOOP}.} -\end{prototype} -\noindent la funzione prende il nome della directory su cui il filesystem è -montato e non il file o il dispositivo che è stato montato,\footnote{questo è - vero a partire dal kernel 2.3.99-pre7, prima esistevano due chiamate - separate e la funzione poteva essere usata anche specificando il file di - dispositivo.} in quanto con il kernel 2.4.x è possibile montare lo stesso -dispositivo in più punti. Nel caso più di un filesystem sia stato montato -sullo stesso \textit{mount point} viene smontato quello che è stato montato -per ultimo. - -Si tenga presente che la funzione fallisce quando il filesystem è -\textsl{occupato}, questo avviene quando ci sono ancora file aperti sul -filesystem, se questo contiene la directory di lavoro corrente di un qualunque -processo o il mount point di un altro filesystem; in questo caso l'errore -restituito è \macro{EBUSY}. - -Linux provvede inoltre una seconda funzione, \func{umount2}, che in alcuni -casi permette di forzare lo smontaggio di un filesystem, anche quando questo -risulti occupato; il suo prototipo è: -\begin{prototype}{sys/mount.h}{umount2(const char *target, int flags)} - - La funzione è identica a \func{umount} per comportamento e codici di errore, - ma con \param{flags} si può specificare se forzare lo smontaggio. -\end{prototype} - -Il valore di \param{flags} è una maschera binaria, e al momento l'unico valore -definito è il bit \macro{MNT\_FORCE}; gli altri bit devono essere nulli. -Specificando \macro{MNT\_FORCE} la funzione cercherà di liberare il filesystem -anche se è occupato per via di una delle condizioni descritte in precedenza. A -seconda del tipo di filesystem alcune (o tutte) possono essere superate, -evitando l'errore di \macro{EBUSY}. In tutti i casi prima dello smontaggio -viene eseguita una sincronizzazione dei dati. - -Altre due funzioni specifiche di Linux,\footnote{esse si trovano anche su BSD, - ma con una struttura diversa.} utili per ottenere in maniera diretta -informazioni riguardo al filesystem su cui si trova un certo file, sono -\func{statfs} e \func{fstatfs}, i cui prototipi sono: -\begin{functions} - \headdecl{sys/vfs.h} - \funcdecl{int statfs(const char *path, struct statfs *buf)} - - \funcdecl{int fstatfs(int fd, struct statfs *buf)} - - Restituisce in \param{buf} le informazioni relative al filesystem su cui è - posto il file specificato. - - \bodydesc{Le funzioni ritornano 0 in caso di successo e -1 in caso di - errore, nel qual caso \var{errno} viene settato ai valori: - \begin{errlist} - \item[\macro{ENOSYS}] il filesystem su cui si trova il file specificato non - supporta la funzione. - \end{errlist} - e \macro{EFAULT} ed \macro{EIO} per entrambe, \macro{EBADF} per - \func{fstatfs}, \macro{ENOTDIR}, \macro{ENAMETOOLONG}, \macro{ENOENT}, - \macro{EACCES}, \macro{ELOOP} per \func{statfs}.} -\end{functions} - -Queste funzioni permettono di ottenere una serie di informazioni generali -riguardo al filesystem su cui si trova il file specificato; queste vengono -restituite una struttura \param{buf} di tipo \type{statfs} definita come in -\ref{fig:sys_statfs}, ed i campi che sono indefiniti per il filesystem in -esame sono settati a zero. I valori del campo \var{f\_type} sono definiti per -i vari filesystem nei relativi file di header dei sorgenti del kernel da -costanti del tipo \macro{XXX\_SUPER\_MAGIC}, dove \macro{XXX} in genere è il -nome del filesystem stesso. +La funzione, che viene usata dal comando \cmd{uname}, restituisce una serie di +informazioni relative al sistema nelle stringhe che costituiscono i campi +della struttura \struct{utsname} (la cui definizione è riportata in +fig.~\ref{fig:sys_utsname}) che viene scritta nel buffer puntato +dall'argomento \param{info}. -\begin{figure}[!htb] +\begin{figure}[!ht!b] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct statfs { - long f_type; /* tipo di filesystem */ - long f_bsize; /* dimensione ottimale dei blocchi di I/O */ - long f_blocks; /* blocchi totali nel filesystem */ - long f_bfree; /* blocchi liberi nel filesystem */ - long f_bavail; /* blocchi liberi agli utenti normali */ - long f_files; /* inodes totali nel filesystem */ - long f_ffree; /* inodes liberi nel filesystem */ - fsid_t f_fsid; /* filesystem id */ - long f_namelen; /* lunghezza massima dei nomi dei file */ - long f_spare[6]; /* riservati per uso futuro */ -}; -\end{lstlisting} + \begin{minipage}[c]{0.85\textwidth} + \includestruct{listati/ustname.h} \end{minipage} \normalsize - \caption{La struttura \var{statfs}.} - \label{fig:sys_statfs} + \caption{La struttura \structd{utsname}.} + \label{fig:sys_utsname} \end{figure} +Si noti come in fig.~\ref{fig:sys_utsname} le dimensioni delle stringhe di +\struct{utsname} non sono specificate. Il manuale della \acr{glibc} indica +due costanti per queste dimensioni, \constd{\_UTSNAME\_LENGTH} per i campi +standard e \constd{\_UTSNAME\_DOMAIN\_LENGTH} per quello relativo al nome di +dominio, altri sistemi usano nomi diversi come \constd{SYS\_NMLN} o +\constd{\_SYS\_NMLN} o \constd{UTSLEN} che possono avere valori diversi. Dato +che il buffer per \struct{utsname} deve essere preallocato l'unico modo per +farlo in maniera sicura è allora usare come dimensione il valore ottenuto con +\code{sizeof(utsname)}. + +Le informazioni vengono restituite in ciascuno dei singoli campi di +\struct{utsname} in forma di stringhe terminate dal carattere NUL. In +particolare dette informazioni sono: +\begin{itemize*} +\item il nome del sistema operativo; +\item il nome della macchine (l'\textit{hostname}); +\item il nome della release del kernel; +\item il nome della versione del kernel; +\item il tipo di hardware della macchina; +\item il nome del domino (il \textit{domainname}); +\end{itemize*} +ma l'ultima di queste informazioni è stata aggiunta di recente e non è +prevista dallo standard POSIX, per questo essa è accessibile, come mostrato in +fig.~\ref{fig:sys_utsname}, solo se si è definita la macro +\macro{\_GNU\_SOURCE}. -Le \acr{glibc} provvedono infine una serie di funzioni per la gestione dei due -file standard \file{/etc/fstab} e \file{/etc/mtab}, che convenzionalmente sono -usati in quasi tutti i sistemi unix-like per mantenere rispettivamente le -informazioni riguardo ai filesystem da montare e a quelli correntemente -montati. Le funzioni servono a leggere il contenuto di questi file in -opportune strutture \var{struct fstab} e \var{struct mntent}, e, per -\file{/etc/mtab} per inserire e rimuovere le voci presenti nel file. +Come accennato queste stesse informazioni, anche se a differenza di +\func{sysctl} la funzione continua ad essere mantenuta, si possono ottenere +direttamente tramite il filesystem \file{/proc}, esse infatti sono mantenute +rispettivamente nei file \sysctlrelfiled{kernel}{ostype}, +\sysctlrelfiled{kernel}{hostname}, \sysctlrelfiled{kernel}{osrelease}, +\sysctlrelfiled{kernel}{version} e \sysctlrelfiled{kernel}{domainname} che si +trovano sotto la directory \file{/proc/sys/kernel/}. -In generale si dovrebbero usare queste funzioni (in particolar modo quelle -relative a \file{/etc/mtab}), quando si debba scrivere un programma che -effettua il montaggio di un filesystem; in realtà in questi casi è molto più -semplice invocare direttamente il programma \cmd{mount}, per cui ne -tralasceremo la trattazione, rimandando al manuale delle \acr{glibc} -\cite{glibc} per la documentazione completa. +\index{file!filesystem~\texttt {/proc}!definizione|)} +\section{La gestione del sistema} +\label{sec:sys_management} -\subsection{La gestione di utenti e gruppi} +In questa sezione prenderemo in esame le interfacce di programmazione messe a +disposizione per affrontare una serie di tematiche attinenti la gestione +generale del sistema come quelle relative alla gestione di utenti e gruppi, al +trattamento delle informazioni relative ai collegamenti al sistema, alle +modalità per effettuare lo spegnimento o il riavvio di una macchina. + + +\subsection{La gestione delle informazioni su utenti e gruppi} \label{sec:sys_user_group} -Tradizionalmente l'informazione per la gestione di utenti e gruppi veniva -tenuta tutta nei due file di testo \file{/etc/passwd} ed \file{/etc/group}, e -tutte le funzioni facevano riferimento ad essi. Oggi la maggior parte delle -distribuzioni di Linux usa la libreria PAM (sigla che sta \textit{Pluggable - Authentication Method}) che permette di separare completamente i meccanismi -di gestione degli utenti (autenticazione, riconoscimento, ecc.) dalle modalità -in cui i relativi dati vengono mantenuti, per cui pur restando in gran parte -le stesse\footnote{in genere quello che viene cambiato è l'informazione usata - per l'autenticazione, che non è più necessariamente una password criptata da - verificare, ma può assumere le forme più diverse, come impronte digitali, - chiavi elettroniche, ecc.}, le informazioni non sono più necessariamente -mantenute in quei file. - -In questo paragrafo ci limiteremo comunque alle funzioni classiche per la -lettura delle informazioni relative a utenti e gruppi previste dallo standard -POSIX.1, che fanno riferimento a quanto memorizzato nei due file appena -citati, il cui formato è descritto dalle relative pagine del manuale (cioè -\cmd{man 5 passwd} e \cmd{man 5 group}). - -Per leggere le informazioni relative ad un utente si possono usare due -funzioni, \func{getpwuid} e \func{getpwnam}, i cui prototipi sono: -\begin{functions} - \headdecl{pwd.h} - \headdecl{sys/types.h} - \funcdecl{struct passwd *getpwuid(uid\_t uid)} - - \funcdecl{struct passwd *getpwnam(const char *name)} +Tradizionalmente le informazioni utilizzate nella gestione di utenti e gruppi +(password, corrispondenze fra nomi simbolici e \ids{UID} numerici, home +directory, ecc.) venivano registrate all'interno dei due file di testo +\conffiled{/etc/passwd} ed \conffiled{/etc/group}, il cui formato è descritto +dalle relative pagine del manuale\footnote{nella quinta sezione, quella dei + file di configurazione, dato che esistono comandi corrispondenti; per una + trattazione sistemistica dell'intero argomento coperto in questa sezione si + consulti sez.~4.3 di \cite{AGL}.} e tutte le funzioni che richiedevano +l'accesso a queste informazione andavano a leggere direttamente il contenuto +di questi file. + +In realtà oltre a questi due file da molto tempo gran parte dei sistemi +unix-like usano il cosiddetto sistema delle \textit{shadow password} che +prevede anche i due file \conffiled{/etc/shadow} e \conffiled{/etc/gshadow}, in +cui sono state spostate le informazioni di autenticazione (ed inserite alcune +estensioni di gestione avanzata) per toglierle dagli altri file che devono +poter essere letti da qualunque processo per poter effettuare l'associazione +fra username e \ids{UID}. + +Col tempo però questa impostazione ha incominciato a mostrare dei limiti. Da +una parte il meccanismo classico di autenticazione è stato ampliato, ed oggi +la maggior parte delle distribuzioni di GNU/Linux usa la libreria PAM (sigla +che sta per \textit{Pluggable Authentication Method}) che fornisce una +interfaccia comune per i processi di autenticazione, svincolando completamente +le singole applicazioni dai dettagli del come questa viene eseguita e di dove +vengono mantenuti i dati relativi. + +Si tratta di un sistema modulare, in cui è possibile utilizzare anche più +meccanismi insieme, diventa così possibile avere vari sistemi di +riconoscimento (biometria, chiavi hardware, ecc.), diversi formati per le +password e diversi supporti per le informazioni. Il tutto avviene in maniera +trasparente per le applicazioni purché per ciascun meccanismo si disponga +della opportuna libreria che implementa l'interfaccia di PAM. + +Dall'altra parte, il diffondersi delle reti e la necessità di centralizzare le +informazioni degli utenti e dei gruppi per insiemi di macchine e servizi +all'interno di una stessa organizzazione, in modo da mantenere coerenti i +dati, ha portato anche alla necessità di poter recuperare e memorizzare dette +informazioni su supporti diversi dai file citati, introducendo il sistema del +\textit{Name Service Switch}, che tratteremo brevemente in +sez.~\ref{sec:sock_resolver} dato che la sua applicazione è cruciale nella +procedura di risoluzione di nomi di rete. + +In questo paragrafo ci limiteremo comunque a trattare le funzioni classiche +per la lettura delle informazioni relative a utenti e gruppi tralasciando +completamente quelle relative all'autenticazione.\footnote{la cui + programmazione ormai attiene all'uso dell'interfaccia di PAM, che va al di + la dello scopo di questo testo.} +% Per questo non tratteremo +% affatto l'interfaccia di PAM, ma approfondiremo invece il sistema del +% \textit{Name Service Switch}, un meccanismo messo a disposizione dalla +% \acr{glibc} per modularizzare l'accesso a tutti i servizi in cui sia +% necessario trovare una corrispondenza fra un nome ed un numero (od altra +% informazione) ad esso associato, come appunto, quella fra uno username ed un +% \ids{UID} o fra un \ids{GID} ed il nome del gruppo corrispondente. +Le prime funzioni che vedremo sono quelle previste dallo standard POSIX.1; +queste sono del tutto generiche e si appoggiano direttamente al \textit{Name + Service Switch}, per cui sono in grado di ricevere informazioni qualunque +sia il supporto su cui esse vengono mantenute. Per leggere le informazioni +relative ad un utente si possono usare due funzioni, \funcd{getpwuid} e +\funcd{getpwnam}, i cui prototipi sono: + +\begin{funcproto}{ +\fhead{pwd.h} +\fhead{sys/types.h} +\fdecl{struct passwd *getpwuid(uid\_t uid)} +\fdecl{struct passwd *getpwnam(const char *name)} +\fdesc{Restituiscono le informazioni relative all'utente specificato.} +} - Restituiscono le informazioni relative all'utente specificato. - - \bodydesc{Le funzioni ritornano il puntatore alla struttura contenente le - informazioni in caso di successo e \macro{NULL} nel caso non sia stato - trovato nessun utente corrispondente a quanto specificato.} -\end{functions} - -Le due funzioni forniscono le informazioni memorizzate nel database degli -utenti (che nelle versioni più recenti possono essere ottenute attraverso PAM) -relative all'utente specificato attraverso il suo \acr{uid} o il nome di -login. Entrambe le funzioni restituiscono un puntatore ad una struttura di -tipo \type{passwd} la cui definizione (anch'essa eseguita in \file{pwd.h}) è -riportata in \figref{fig:sys_passwd_struct}, dove è pure brevemente illustrato -il significato dei vari campi. +{Le funzioni ritornano il puntatore alla struttura contenente le informazioni + in caso di successo e \val{NULL} nel caso non sia stato trovato nessun + utente corrispondente a quanto specificato, nel qual caso \var{errno} + assumerà il valore riportato dalle funzioni di sistema sottostanti.} +\end{funcproto} + +Le due funzioni forniscono le informazioni memorizzate nel registro degli +utenti (che nelle versioni più recenti per la parte di credenziali di +autenticazione vengono ottenute attraverso PAM) relative all'utente +specificato attraverso il suo \ids{UID} o il nome di login. Entrambe le +funzioni restituiscono un puntatore ad una struttura di tipo \struct{passwd} +la cui definizione (anch'essa eseguita in \headfiled{pwd.h}) è riportata in +fig.~\ref{fig:sys_passwd_struct}, dove è pure brevemente illustrato il +significato dei vari campi. \begin{figure}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct passwd { - char *pw_name; /* user name */ - char *pw_passwd; /* user password */ - uid_t pw_uid; /* user id */ - gid_t pw_gid; /* group id */ - char *pw_gecos; /* real name */ - char *pw_dir; /* home directory */ - char *pw_shell; /* shell program */ -}; - \end{lstlisting} + \begin{minipage}[c]{0.8\textwidth} + \includestruct{listati/passwd.h} \end{minipage} \normalsize - \caption{La struttura \var{passwd} contenente le informazioni relative ad un - utente del sistema.} + \caption{La struttura \structd{passwd} contenente le informazioni relative + ad un utente del sistema.} \label{fig:sys_passwd_struct} \end{figure} -La struttura usata da entrambe le funzioni è allocata staticamente, per questo +La struttura usata da entrambe le funzioni è allocata staticamente, per questo motivo viene sovrascritta ad ogni nuova invocazione, lo stesso dicasi per la memoria dove sono scritte le stringhe a cui i puntatori in essa contenuti -fanno riferimento. Ovviamente questo implica che dette funzioni non posono -essere rientranti, per cui ne esistono anche due versioni alternative -(denotate dalla solita estensione \code{\_r}), i cui prototipi sono: -\begin{functions} - \headdecl{pwd.h} - - \headdecl{sys/types.h} - - \funcdecl{struct passwd *getpwuid\_r(uid\_t uid, struct passwd *password, - char *buffer, size\_t buflen, struct passwd **result)} - - \funcdecl{struct passwd *getpwnam\_r(const char *name, struct passwd - *password, char *buffer, size\_t buflen, struct passwd **result)} +fanno riferimento. Ovviamente questo implica che dette funzioni non possono +essere rientranti; per questo motivo ne esistono anche due versioni +alternative (denotate dalla solita estensione \code{\_r}), i cui prototipi +sono: - Restituiscono le informazioni relative all'utente specificato. - - \bodydesc{Le funzioni ritornano 0 in caso di successo e un codice d'errore - altrimenti, nel qual caso \var{errno} sarà settato opportunamente.} -\end{functions} +\begin{funcproto}{ +\fhead{pwd.h} +\fhead{sys/types.h} +\fdecl{struct passwd *getpwuid\_r(uid\_t uid, struct passwd *password, + char *buffer,\\ +\phantom{struct passwd *getpwuid\_r(}size\_t buflen, struct passwd **result)} +\fdecl{struct passwd *getpwnam\_r(const char *name, struct passwd + *password, char *buffer,\\ +\phantom{struct passwd *getpwnam\_r(}size\_t buflen, struct passwd **result)} +\fdesc{Restituiscono le informazioni relative all'utente specificato.} +} -In questo caso l'uso è molto più complesso, in quanto bisogna prima allocare +{Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà il valore riportato dalle di sistema funzioni + sottostanti.} +\end{funcproto} + +In questo caso l'uso è molto più complesso, in quanto bisogna prima allocare la memoria necessaria a contenere le informazioni. In particolare i valori -della struttura \var{passwd} saranno restituiti all'indirizzo \param{password} -mentre la memoria allocata all'indirizzo \param{buffer}, per un massimo di -\param{buflen} byte, sarà utilizzata per contenere le stringhe puntate dai -campi di \param{password}. Infine all'indirizzo puntato da \param{result} -viene restituito il puntatore ai dati ottenuti, cioè \param{buffer} nel caso -l'utente esista, o \macro{NULL} altrimenti. Qualora i dati non possano essere -contenuti nei byte specificati da \param{buflen}, la funzione fallirà -restituendo \macro{ERANGE} (e \param{result} sarà comunque settato a -\macro{NULL}). - -Del tutto analoghe alle precedenti sono le funzioni \func{getgrnam} e -\func{getgrgid} (e le relative analoghe rientranti con la stessa estensione -\code{\_r}) che permettono di leggere le informazioni relative ai gruppi, i -loro prototipi sono: -\begin{functions} - \headdecl{grp.h} - \headdecl{sys/types.h} - - \funcdecl{struct group *getgrgid(gid\_t gid)} - - \funcdecl{struct group *getgrnam(const char *name)} - - \funcdecl{struct group *getpwuid\_r(gid\_t gid, struct group *password, - char *buffer, size\_t buflen, struct group **result)} - - \funcdecl{struct group *getpwnam\_r(const char *name, struct group - *password, char *buffer, size\_t buflen, struct group **result)} +della struttura \struct{passwd} saranno restituiti all'indirizzo +\param{password} mentre la memoria allocata all'indirizzo \param{buffer}, per +un massimo di \param{buflen} byte, sarà utilizzata per contenere le stringhe +puntate dai campi di \param{password}. Infine all'indirizzo puntato da +\param{result} viene restituito il puntatore ai dati ottenuti, cioè +\param{buffer} nel caso l'utente esista, o \val{NULL} altrimenti. Qualora i +dati non possano essere contenuti nei byte specificati da \param{buflen}, la +funzione fallirà restituendo \errcode{ERANGE} (e \param{result} sarà comunque +impostato a \val{NULL}). + +Sia queste versioni rientranti che precedenti gli errori eventualmente +riportati in \var{errno} in caso di fallimento dipendono dalla sottostanti +funzioni di sistema usate per ricavare le informazioni (si veda quanto +illustrato in sez.~\ref{sec:sys_errno}) per cui se lo si vuole utilizzare è +opportuno inizializzarlo a zero prima di invocare le funzioni per essere +sicuri di non avere un residuo di errore da una chiamata precedente. Il non +aver trovato l'utente richiesto infatti può essere dovuto a diversi motivi (a +partire dal fatto che non esista) per cui si possono ottenere i codici di +errore più vari a seconda dei casi. + +Del tutto analoghe alle precedenti sono le funzioni \funcd{getgrnam} e +\funcd{getgrgid} che permettono di leggere le informazioni relative ai gruppi, +i loro prototipi sono: + +\begin{funcproto}{ +\fhead{grp.h} +\fhead{sys/types.h} +\fdecl{struct group *getgrgid(gid\_t gid)} +\fdecl{struct group *getgrnam(const char *name)} +\fdesc{Restituiscono le informazioni relative al gruppo specificato.} +} - Restituiscono le informazioni relative al gruppo specificato. - - \bodydesc{Le funzioni ritornano 0 in caso di successo e un codice d'errore - altrimenti, nel qual caso \var{errno} sarà settato opportunamente.} -\end{functions} +{Le funzioni ritornano il puntatore alla struttura contenente le informazioni + in caso di successo e \val{NULL} nel caso non sia stato trovato nessun + utente corrispondente a quanto specificato, nel qual caso \var{errno} + assumerà il valore riportato dalle funzioni di sistema sottostanti.} +\end{funcproto} + +Come per le precedenti per gli utenti esistono anche le analoghe versioni +rientranti che di nuovo utilizzano la stessa estensione \code{\_r}; i loro +prototipi sono: + +\begin{funcproto}{ +\fhead{grp.h} +\fhead{sys/types.h} +\fdecl{int getgrgid\_r(gid\_t gid, struct group *grp, char *buf, + size\_t buflen,\\ +\phantom{int getgrgid\_r(}struct group **result)} +\fdecl{int getgrnam\_r(const char *name, struct group *grp, char *buf, + size\_t buflen,\\ +\phantom{int getgrnam\_r(}struct group **result)} +\fdesc{Restituiscono le informazioni relative al gruppo specificato.} +} + +{Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà il valore riportato dalle funzioni di sistema + sottostanti.} +\end{funcproto} -Il comportamento di tutte queste funzioni è assolutamente identico alle -precedenti che leggono le informazioni sugli utenti, l'unica differenza è che +Il comportamento di tutte queste funzioni è assolutamente identico alle +precedenti che leggono le informazioni sugli utenti, l'unica differenza è che in questo caso le informazioni vengono restituite in una struttura di tipo -\type{group}, la cui definizione è riportata in \figref{fig:sys_group_struct}. +\struct{group}, la cui definizione è riportata in +fig.~\ref{fig:sys_group_struct}. \begin{figure}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct group { - char *gr_name; /* group name */ - char *gr_passwd; /* group password */ - gid_t gr_gid; /* group id */ - char **gr_mem; /* group members */ -}; - \end{lstlisting} + \begin{minipage}[c]{0.8\textwidth} + \includestruct{listati/group.h} \end{minipage} \normalsize - \caption{La struttura \var{group} contenente le informazioni relative ad un - gruppo del sistema.} + \caption{La struttura \structd{group} contenente le informazioni relative ad + un gruppo del sistema.} \label{fig:sys_group_struct} \end{figure} -Le funzioni viste finora sono in grado di leggere le informazioni sia dal file -delle password in \file{/etc/passwd} che con qualunque altro metodo sia stato -utilizzato per mantenere il database degli utenti. Non permettono però di -settare direttamente le password; questo è possibile con un'altra interfaccia -al database degli utenti, derivata da SVID, che però funziona soltanto con un -database che sia tenuto su un file che abbia il formato classico di -\file{/etc/passwd}. +Le funzioni viste finora sono in grado di leggere le informazioni sia +direttamente dal file delle password in \conffile{/etc/passwd} che tramite il +sistema del \textit{Name Service Switch} e sono completamente generiche. Si +noti però che non c'è una funzione che permetta di impostare direttamente una +password.\footnote{in realtà questo può essere fatto ricorrendo alle funzioni + della libreria PAM, ma questo non è un argomento che tratteremo qui.} Dato +che POSIX non prevede questa possibilità esiste un'altra interfaccia che lo +fa, derivata da SVID le cui funzioni sono riportate in +tab.~\ref{tab:sys_passwd_func}. Questa interfaccia però funziona soltanto +quando le informazioni sono mantenute su un apposito file di \textsl{registro} +di utenti e gruppi, con il formato classico di \conffile{/etc/passwd} e +\conffile{/etc/group}. \begin{table}[htb] \footnotesize @@ -1085,571 +902,1142 @@ database che sia tenuto su un file che abbia il formato classico di \textbf{Funzione} & \textbf{Significato}\\ \hline \hline - \func{fgetpwent} & Legge una voce dal database utenti da un file - specificato aprendolo la prima volta.\\ - \func{fgetpwent\_r}& Come la precedente, ma rientrante.\\ - \func{getpwent} & Legge una voce dal database utenti (da - \file{/etc/passwd}) aprendolo la prima volta.\\ - \func{getpwent\_r} & Come la precedente, ma rientrante.\\ - \func{setpwent} & Ritorna all'inizio del database.\\ - \func{putpwent} & Immette una voce nel database utenti.\\ - \func{endpwent} & Chiude il database degli utenti.\\ - \func{fgetgrent} & Legge una voce dal database dei gruppi da un file - specificato aprendolo la prima volta.\\ - \func{fgetgrent\_r}& Come la precedente, ma rientrante.\\ - \func{getgrent} & Legge una voce dal database dei gruppi (da - \file{/etc/passwd}) aprendolo la prima volta.\\ - \func{getgrent\_r} & Come la precedente, ma rientrante.\\ - \func{setgrent} & Immette una voce nel database dei gruppi.\\ - \func{putgrent} & Immette una voce nel database dei gruppi.\\ - \func{endgrent} & Chiude il database dei gruppi.\\ + \funcm{fgetpwent} & Legge una voce dal file di registro degli utenti + specificato.\\ + \funcm{fgetpwent\_r}& Come la precedente, ma rientrante.\\ + \funcm{putpwent} & Immette una voce in un file di registro degli + utenti.\\ + \funcm{getpwent} & Legge una voce da \conffile{/etc/passwd}.\\ + \funcm{getpwent\_r} & Come la precedente, ma rientrante.\\ + \funcm{setpwent} & Ritorna all'inizio di \conffile{/etc/passwd}.\\ + \funcm{endpwent} & Chiude \conffile{/etc/passwd}.\\ + \funcm{fgetgrent} & Legge una voce dal file di registro dei gruppi + specificato.\\ + \funcm{fgetgrent\_r}& Come la precedente, ma rientrante.\\ + \funcm{putgrent} & Immette una voce in un file di registro dei gruppi.\\ + \funcm{getgrent} & Legge una voce da \conffile{/etc/group}.\\ + \funcm{getgrent\_r} & Come la precedente, ma rientrante.\\ + \funcm{setgrent} & Ritorna all'inizio di \conffile{/etc/group}.\\ + \funcm{endgrent} & Chiude \conffile{/etc/group}.\\ \hline \end{tabular} \caption{Funzioni per la manipolazione dei campi di un file usato come - database di utenti e gruppi nel formato di \file{/etc/passwd} e - \file{/etc/groups}.} + registro per utenti o gruppi nel formato di \conffile{/etc/passwd} e + \conffile{/etc/group}.} \label{tab:sys_passwd_func} \end{table} -Dato che ormai la gran parte delle distribuzioni di Linux utilizzano PAM, che -come minimo usa almeno le \textit{shadow password} (quindi con delle modifiche -rispetto al formato classico di \file{/etc/passwd}), le funzioni che danno la -capacità scrivere delle voci nel database (cioè \func{putpwent} e -\func{putgrent}) non permettono di effettuarne una specificazione in maniera -completa. Per questo motivo l'uso di queste funzioni è deprecato in favore -dell'uso di PAM, ci limiteremo pertanto ad elencarle in -\tabref{tab:sys_passwd_func}, rimandando chi fosse interessato alle rispettive -man page e al manuale delle \acr{glibc} per i dettagli del loro funzionamento. +% TODO mancano i prototipi di alcune delle funzioni +Dato che oramai tutte le distribuzioni di GNU/Linux utilizzano le +\textit{shadow password} (quindi con delle modifiche rispetto al formato +classico del file \conffile{/etc/passwd}), si tenga presente che le funzioni +di questa interfaccia che permettono di scrivere delle voci in un +\textsl{registro} degli utenti (cioè \func{putpwent} e \func{putgrent}) non +hanno la capacità di farlo specificando tutti i contenuti necessari rispetto a +questa estensione. +Per questo motivo l'uso di queste funzioni è deprecato, in quanto comunque non +funzionale rispetto ad un sistema attuale, pertanto ci limiteremo a fornire +soltanto l'elenco di tab.~\ref{tab:sys_passwd_func}, senza nessuna spiegazione +ulteriore. Chi volesse insistere ad usare questa interfaccia può fare +riferimento alle pagine di manuale delle rispettive funzioni ed al manuale +della \acr{glibc} per i dettagli del funzionamento. -\subsection{Il database di accounting} + + +\subsection{Il registro della \textsl{contabilità} degli utenti} \label{sec:sys_accounting} -L'ultimo insieme di funzioni relative alla gestione del sistema che -esamineremo è quello che permette di accedere ai dati del database di -\textit{accounting}. In esso vengono mantenute una serie di informazioni -storiche relative sia agli utenti che si sono collegati al sistema, (tanto per -quelli correntemente collegati, che per la registrazione degli accessi -precedenti), sia relative all'intero sistema, come il momento di lancio di -processi da parte di \cmd{init}, il cambiamento dell'orologio di sistema, il -cambiamento di runlevel o il riavvio della macchina. - -I dati vengono usualmente\footnote{questa è la locazione specificata dal - \textit{Linux Filesystem Hierarchy Standard}, adottato dalla gran parte - delle distribuzioni.} memorizzati nei due file \file{/var/run/utmp} e -\file{/var/log/wtmp}. Quando un utente si collega viene aggiunta una voce a -\file{/var/run/utmp} in cui viene memorizzato il nome di login, il terminale -da cui ci si collega, l'\acr{uid} della shell di login, l'orario della -connessione ed altre informazioni. La voce resta nel file fino al logout, -quando viene cancellata e spostata in \file{/var/log/wtmp}. - -In questo modo il primo file viene utilizzato per registrare sta utilizzando -il sistema al momento corrente, mentre il secondo mantiene la registrazione -delle attività degli utenti. A quest'ultimo vengono anche aggiunte delle voci -speciali per tenere conto dei cambiamenti del sistema, come la modifica del -runlevel, il riavvio della macchina, ecc. Tutte queste informazioni sono -descritte in dettaglio nel manuale delle \acr{glibc}. +Un altro insieme di funzioni relative alla gestione del sistema che +esamineremo è quello che permette di accedere ai dati del registro della +cosiddetta \textsl{contabilità} (o \textit{accounting}) degli utenti. In esso +vengono mantenute una serie di informazioni storiche relative sia agli utenti +che si sono collegati al sistema, tanto per quelli correntemente collegati, +che per la registrazione degli accessi precedenti, sia relative all'intero +sistema, come il momento di lancio di processi da parte di \cmd{init}, il +cambiamento dell'orologio di sistema, il cambiamento di runlevel o il riavvio +della macchina. + +I dati vengono usualmente memorizzati nei due file \file{/var/run/utmp} e +\file{/var/log/wtmp}. che sono quelli previsti dal \textit{Linux Filesystem + Hierarchy Standard}, adottato dalla gran parte delle distribuzioni. Quando +un utente si collega viene aggiunta una voce a \file{/var/run/utmp} in cui +viene memorizzato il nome di login, il terminale da cui ci si collega, +l'\ids{UID} della shell di login, l'orario della connessione ed altre +informazioni. La voce resta nel file fino al logout, quando viene cancellata +e spostata in \file{/var/log/wtmp}. + +In questo modo il primo file viene utilizzato per registrare chi sta +utilizzando il sistema al momento corrente, mentre il secondo mantiene la +registrazione delle attività degli utenti. A quest'ultimo vengono anche +aggiunte delle voci speciali per tenere conto dei cambiamenti del sistema, +come la modifica del runlevel, il riavvio della macchina, ecc. Tutte queste +informazioni sono descritte in dettaglio nel manuale della \acr{glibc}. Questi file non devono mai essere letti direttamente, ma le informazioni che contengono possono essere ricavate attraverso le opportune funzioni di -libreria. Queste sono analoghe alle precedenti (vedi -\tabref{tab:sys_passwd_func}) usate per accedere al database degli utenti, -solo che in questo caso la struttura del database di accounting è molto più +libreria. Queste sono analoghe alle precedenti funzioni usate per accedere al +registro degli utenti (vedi tab.~\ref{tab:sys_passwd_func}), solo che in +questo caso la struttura del registro della \textsl{contabilità} è molto più complessa, dato che contiene diversi tipi di informazione. -Le prime tre funzioni, \func{setutent}, \func{endutent} e \func{utmpname} -servono rispettivamente a aprire e a chiudere il file che contiene il -database, e a specificare su quale file esso viene mantenuto. I loro prototipi -sono: -\begin{functions} - \headdecl{utmp.h} - - \funcdecl{void utmpname(const char *file)} Specifica il file da usare come - database di \textit{accounting}. - - \funcdecl{void setutent(void)} Apre il file del database di - \textit{accounting}, posizionandosi al suo inizio. - - \funcdecl{void endutent(void)} Chiude il file del database di - \textit{accounting}. - - \bodydesc{Le funzioni non ritornano codici di errore.} -\end{functions} - -In caso questo non venga specificato nessun file viene usato il valore -standard \macro{\_PATH\_UTMP} (che è definito in \file{paths.h}); in genere -\func{utmpname} prevede due possibili valori: -\begin{basedescript}{\desclabelwidth{2.0cm}} -\item[\macro{\_PATH\_UTMP}] Specifica il database di accounting per gli utenti - correntemente collegati. -\item[\macro{\_PATH\_WTMP}] Specifica il database di accounting per l'archivio - storico degli utenti collegati. -\end{basedescript} -corrispondenti ai file \file{/var/run/utmp} e \file{/var/log/wtmp} visti in -precedenza. - -Una volta aperto il file si può eseguire una scansione leggendo o scrivendo -una voce con le funzioni \func{getutent}, \func{getutid}, \func{getutline} e -\func{pututline}, i cui prototipi sono: -\begin{functions} - \headdecl{utmp.h} - - \funcdecl{struct utmp *getutent(void)} - Legge una voce dal dalla posizione corrente nel database. - - \funcdecl{struct utmp *getutid(struct utmp *ut)} - Ricerca una voce sul database in base al contenuto di \param{ut}. +Le prime tre funzioni, \funcd{setutent}, \funcd{endutent} e \funcd{utmpname} +servono rispettivamente a aprire e a chiudere il file che contiene il registro +della \textsl{contabilità} degli, e a specificare su quale file esso viene +mantenuto; i loro prototipi sono: + +\begin{funcproto}{ +\fhead{utmp.h} +\fdecl{void utmpname(const char *file)} +\fdesc{Specifica il file da usare come registro.} +\fdecl{void setutent(void)} +\fdesc{Apre il file del registro.} +\fdecl{void endutent(void)} +\fdesc{Chiude il file del registro.} +} - \funcdecl{struct utmp *getutline(struct utmp *ut)} - Ricerca nel database la prima voce corrispondente ad un processo sulla linea - di terminale specificata tramite \param{ut}. +{Le funzioni non ritornano nulla.} +\end{funcproto} - \funcdecl{struct utmp *pututline(struct utmp *ut)} - Scrive una voce nel database. +Si tenga presente che le funzioni non restituiscono nessun valore, pertanto +non è possibile accorgersi di eventuali errori, ad esempio se si è impostato +un nome di file sbagliato con \func{utmpname}. - \bodydesc{Le funzioni ritornano il puntatore ad una struttura \var{utmp} in - caso di successo e \macro{NULL} in caso di errore.} -\end{functions} +Nel caso non si sia utilizzata \func{utmpname} per specificare un file di +registro alternativo, sia \func{setutent} che \func{endutent} operano usando +il default che è \sysfile{/var/run/utmp} il cui nome, così come una serie di +altri valori di default per i \textit{pathname} di uso più comune, viene +mantenuto nei valori di una serie di costanti definite includendo +\headfiled{paths.h}, in particolare quelle che ci interessano sono: +\begin{basedescript}{\desclabelwidth{2.0cm}} +\item[\constd{\_PATH\_UTMP}] specifica il file che contiene il registro per + gli utenti correntemente collegati, questo è il valore che viene usato se + non si è utilizzato \func{utmpname} per modificarlo; +\item[\constd{\_PATH\_WTMP}] specifica il file che contiene il registro per + l'archivio storico degli utenti collegati; +\end{basedescript} +che nel caso di Linux hanno un valore corrispondente ai file +\sysfile{/var/run/utmp} e \sysfile{/var/log/wtmp} citati in precedenza. + +Una volta aperto il file del registro degli utenti si può eseguire una +scansione leggendo o scrivendo una voce con le funzioni \funcd{getutent}, +\funcd{getutid}, \funcd{getutline} e \funcd{pututline}, i cui prototipi sono: + + +\begin{funcproto}{ +\fhead{utmp.h} +\fdecl{struct utmp *getutent(void)} +\fdesc{Legge una voce dalla posizione corrente nel registro.} +\fdecl{struct utmp *getutid(struct utmp *ut)} +\fdesc{Ricerca una voce sul registro.} +\fdecl{struct utmp *getutline(struct utmp *ut)} +\fdesc{Ricerca una voce sul registro attinente a un terminale.} +\fdecl{struct utmp *pututline(struct utmp *ut)} +\fdesc{Scrive una voce nel registro.} +} -Tutte queste funzioni fanno riferimento ad una struttura di tipo \var{utmp}, -la cui definizione in Linux è riportata in \secref{fig:sys_utmp_struct}. Le -prime tre funzioni servono per leggere una voce dal database; \func{getutent} -legge semplicemente la prima voce disponibile; le altre due permettono di -eseguire una ricerca. +{Le funzioni ritornano il puntatore ad una struttura \struct{utmp} in caso di + successo e \val{NULL} in caso di errore, nel qual caso \var{errno} assumerà + il valore riportato dalle funzioni di sistema sottostanti.} +\end{funcproto} + +Tutte queste funzioni fanno riferimento ad una struttura di tipo +\struct{utmp}, la cui definizione in Linux è riportata in +fig.~\ref{fig:sys_utmp_struct}. Le prime tre funzioni servono per leggere una +voce dal registro: \func{getutent} legge semplicemente la prima voce +disponibile, le altre due permettono di eseguire una ricerca. Aprendo il +registro con \func{setutent} ci si posiziona al suo inizio, ogni chiamata di +queste funzioni eseguirà la lettura sulle voci seguenti, pertanto la posizione +sulla voce appena letta, in modo da consentire una scansione del file. Questo +vale anche per \func{getutid} e \func{getutline}, il che comporta che queste +funzioni effettuano comunque una ricerca ``\textsl{in avanti}''. \begin{figure}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct utmp -{ - short int ut_type; /* Type of login. */ - pid_t ut_pid; /* Process ID of login process. */ - char ut_line[UT_LINESIZE]; /* Devicename. */ - char ut_id[4]; /* Inittab ID. */ - char ut_user[UT_NAMESIZE]; /* Username. */ - char ut_host[UT_HOSTSIZE]; /* Hostname for remote login. */ - struct exit_status ut_exit; /* Exit status of a process marked - as DEAD_PROCESS. */ - long int ut_session; /* Session ID, used for windowing. */ - struct timeval ut_tv; /* Time entry was made. */ - int32_t ut_addr_v6[4]; /* Internet address of remote host. */ - char __unused[20]; /* Reserved for future use. */ -}; - \end{lstlisting} + \begin{minipage}[c]{0.9\textwidth} + \includestruct{listati/utmp.h} \end{minipage} \normalsize - \caption{La struttura \var{utmp} contenente le informazioni di una voce del - database di \textit{accounting}.} + \caption{La struttura \structd{utmp} contenente le informazioni di una voce + del registro di \textsl{contabilità}.} \label{fig:sys_utmp_struct} \end{figure} -Con \func{getutid} si può cercare una voce specifica, a seconda del valore del -campo \var{ut\_type} dell'argomento \param{ut}. Questo può assumere i valori -riportati in \tabref{tab:sys_ut_type}, quando assume i valori -\macro{RUN\_LVL}, \macro{BOOT\_TIME}, \macro{OLD\_TIME}, \macro{NEW\_TIME}, -verrà restituito la prima voce che corrisponde al tipo determinato; quando -invece assume i valori \macro{INIT\_PROCESS}, \macro{LOGIN\_PROCESS}, -\macro{USER\_PROCESS} o \macro{DEAD\_PROCESS} verrà restiuita la prima voce -corripondente al valore del campo \var{ut\_id} specificato in \param{ut}. +Con \func{getutid} si può cercare una voce specifica, a seconda del valore del +campo \var{ut\_type} dell'argomento \param{ut}. Questo può assumere i valori +riportati in tab.~\ref{tab:sys_ut_type}, quando assume i valori +\const{RUN\_LVL}, \const{BOOT\_TIME}, \const{OLD\_TIME}, \const{NEW\_TIME}, +verrà restituito la prima voce che corrisponde al tipo determinato; quando +invece assume i valori \const{INIT\_PROCESS}, \const{LOGIN\_PROCESS}, +\const{USER\_PROCESS} o \const{DEAD\_PROCESS} verrà restituita la prima voce +corrispondente al valore del campo \var{ut\_id} specificato in \param{ut}. \begin{table}[htb] \footnotesize \centering \begin{tabular}[c]{|l|p{8cm}|} \hline - \textbf{Funzione} & \textbf{Significato}\\ + \textbf{Valore} & \textbf{Significato}\\ \hline \hline - \macro{EMPTY} & Non contiene informazioni valide. \\ - \macro{RUN\_LVL} & Identica il runlevel del sistema. \\ - \macro{BOOT\_TIME} & Identifica il tempo di avvio del sistema \\ - \macro{OLD\_TIME} & Identifica quando è stato modificato l'orologio di - sistema. \\ - \macro{NEW\_TIME} & Identifica da quanto è stato modificato il - sistema. \\ - \macro{INIT\_PROCESS} & Identifica un processo lanciato da \cmd{init}. \\ - \macro{LOGIN\_PROCESS}& Identifica un processo di login. \\ - \macro{USER\_PROCESS} & Identifica un processo utente. \\ - \macro{DEAD\_PROCESS} & Identifica un processo terminato. \\ - \macro{ACCOUNTING} & ??? \\ + \constd{EMPTY} & Non contiene informazioni valide.\\ + \constd{RUN\_LVL} & Identica il runlevel del sistema.\\ + \constd{BOOT\_TIME} & Identifica il tempo di avvio del sistema.\\ + \constd{OLD\_TIME} & Identifica quando è stato modificato l'orologio di + sistema.\\ + \constd{NEW\_TIME} & Identifica da quanto è stato modificato il + sistema.\\ + \constd{INIT\_PROCESS} & Identifica un processo lanciato da \cmd{init}.\\ + \constd{LOGIN\_PROCESS}& Identifica un processo di login.\\ + \constd{USER\_PROCESS} & Identifica un processo utente.\\ + \constd{DEAD\_PROCESS} & Identifica un processo terminato.\\ +% \constd{ACCOUNTING} & ??? \\ \hline \end{tabular} - \caption{Classificazione delle voci del database di accounting a seconda dei + \caption{Classificazione delle voci del registro a seconda dei possibili valori del campo \var{ut\_type}.} \label{tab:sys_ut_type} \end{table} -La funzione \func{getutline} esegue la ricerca sulle voci che hanno -\var{ut\_type} uguale a \macro{LOGIN\_PROCESS} o \macro{USER\_PROCESS}, -restituendo la prima che corrisponde al valore di \var{ut\_line}, che -specifica il device\footnote{espresso senza il \file{/dev/} iniziale.} di -terminale che interessa. Lo stesso criterio di ricerca è usato da -\func{pututline} per trovare uno spazio dove inserire la voce specificata, -qualora non sia trovata la voce viene aggiunta in coda al database. +La funzione \func{getutline} esegue la ricerca sulle voci che hanno un +\var{ut\_type} con valore uguale a \const{LOGIN\_PROCESS} o +\const{USER\_PROCESS}, restituendo la prima che corrisponde al valore di +\var{ut\_line}, che specifica il dispositivo di terminale che interessa, da +indicare senza il \file{/dev/} iniziale. Lo stesso criterio di ricerca è usato +da \func{pututline} per trovare uno spazio dove inserire la voce specificata; +qualora questo spazio non venga trovato la voce viene aggiunta in coda al +registro. -In generale occorre però tenere conto che queste funzioni non sono +In generale occorre però tenere conto che queste funzioni non sono completamente standardizzate, e che in sistemi diversi possono esserci differenze; ad esempio \func{pututline} restituisce \code{void} in vari sistemi (compreso Linux, fino alle \acr{libc5}). Qui seguiremo la sintassi -fornita dalle \acr{glibc}, ma gli standard POSIX 1003.1-2001 e XPG4.2 hanno -introdotto delle nuove strutture (e relativi file) di tipo \code{utmpx}, che -sono un sovrainsieme di \code{utmp}. - -Le \acr{glibc} utilizzano già una versione estesa di \code{utmp}, che rende -inutili queste nuove strutture; pertanto esse e le relative funzioni di -gestione (\func{getutxent}, \func{getutxid}, \func{getutxline}, -\func{pututxline}, \func{setutxent} e \func{endutxent}) sono ridefinite come -sinonimi delle funzioni appena viste. - -Come visto in \secref{sec:sys_user_group}, l'uso di strutture allocate -staticamente rende le funzioni di lettura non rientranti; per questo motivo le -\acr{glibc} forniscono anche delle versioni rientranti: \func{getutent\_r}, -\func{getutid\_r}, \func{getutline\_r}, che invece di restituire un puntatore -restituiscono un intero e prendono due argomenti aggiuntivi. Le funzioni si -comportano esattamente come le analoge non rientranti, solo che restituiscono -il risultato all'indirizzo specificato dal primo argomento aggiuntivo (di tipo -\code{struct utmp *buffer}) mentre il secondo (di tipo \code{struct utmp - **result)} viene usato per restituire il puntatore allo stesso buffer. - -Infine le \acr{glibc} forniscono come estensione per la scrittura delle voci -in \file{wmtp} altre due funzioni, \func{updwtmp} e \func{logwtmp}, i cui -prototipi sono: -\begin{functions} - \headdecl{utmp.h} - - \funcdecl{void updwtmp(const char *wtmp\_file, const struct utmp *ut)} - Aggiunge la voce \param{ut} nel database di accounting \file{wmtp}. - - \funcdecl{void logwtmp(const char *line, const char *name, const char - *host)} Aggiunge nel database di accounting una voce con i valori - specificati. +fornita dalla \acr{glibc}, ma gli standard POSIX 1003.1-2001 e XPG4.2 hanno +introdotto delle nuove strutture (e relativi file) di tipo \struct{utmpx}, che +sono un sovrainsieme della \struct{utmp} usata tradizionalmente ed altrettante +funzioni che le usano al posto di quelle citate. + +La \acr{glibc} utilizzava già una versione estesa di \struct{utmp}, che +rende inutili queste nuove strutture, per questo su Linux \struct{utmpx} viene +definita esattamente come \struct{utmp}, con gli stessi campi di +fig.~\ref{fig:sys_utmp_struct}. Altrettanto dicasi per le nuove funzioni di +gestione previste dallo standard: \funcm{getutxent}, \funcm{getutxid}, +\funcm{getutxline}, \funcm{pututxline}, \funcm{setutxent} e \funcm{endutxent}. + +Tutte queste funzioni, definite con \struct{utmpx} dal file di dichiarazione +\headfile{utmpx.h}, su Linux sono ridefinite come sinonimi delle funzioni +appena viste, con argomento di tipo \struct{utmpx} anziché \struct{utmp} ed +hanno lo stesso identico comportamento. Per completezza viene definita anche +\funcm{utmpxname} che non è prevista da POSIX.1-2001. + +Come già visto in sez.~\ref{sec:sys_user_group}, l'uso di strutture allocate +staticamente rende le funzioni di lettura dei dati appena illustrate non +rientranti. Per questo motivo la \acr{glibc} fornisce anche delle versioni +rientranti: \func{getutent\_r}, \func{getutid\_r}, \func{getutline\_r}, che +invece di restituire un puntatore restituiscono un intero e prendono due +argomenti aggiuntivi, i rispettivi prototipi sono: + +\begin{funcproto}{ +\fhead{utmp.h} +\fdecl{int *getutent\_r(struct utmp *buffer, struct utmp **result)} +\fdesc{Legge una voce dalla posizione corrente nel registro.} +\fdecl{int *getutid\_r(struct utmp *buffer, struct utmp **result, struct utmp + *ut)} +\fdesc{Ricerca una voce sul registro.} +\fdecl{int *getutline\_r(struct utmp *buffer, struct utmp **result, struct utmp + *ut)} +\fdesc{Ricerca una voce sul registro attinente a un terminale.} +} + +{Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà il valore riportato dalle funzioni di sistema + sottostanti.} +\end{funcproto} + +Le funzioni si comportano esattamente come le precedenti analoghe non +rientranti, solo che restituiscono il risultato all'indirizzo specificato dal +primo argomento aggiuntivo \param{buffer} mentre il secondo, \param{result)} +viene usato per restituire il puntatore al buffer stesso. + +Infine la \acr{glibc} fornisce altre due funzioni, \funcd{updwtmp} e +\funcd{logwtmp}, come estensione per scrivere direttamente delle voci nel file +sul registro storico \sysfile{/var/log/wtmp}; i rispettivi prototipi sono: + +\begin{funcproto}{ +\fhead{utmp.h} +\fdecl{void updwtmp(const char *wtmp\_file, const struct utmp *ut)} +\fdesc{Aggiunge una voce in coda al registro.} +\fdecl{void logwtmp(const char *line, const char *name, const char *host)} +\fdesc{Aggiunge nel registro una voce con i valori specificati.} +} + +{Le funzioni non restituiscono nulla.} +\end{funcproto} + +La prima funzione permette l'aggiunta di una voce in coda al file del registro +storico, indicato dal primo argomento, specificando direttamente una struttura +\struct{utmp}. La seconda invece utilizza gli argomenti \param{line}, +\param{name} e \param{host} per costruire la voce che poi aggiunge chiamando +\func{updwtmp}. + +Queste funzioni non sono previste da POSIX.1-2001, anche se sono presenti in +altri sistemi (ad esempio Solaris e NetBSD), per mantenere una coerenza con le +altre funzioni definite nello standard che usano la struttura \struct{utmpx} +la \acr{glibc} definisce anche una funzione \funcm{updwtmpx}, che come in +precedenza è identica a \func{updwtmp} con la sola differenza di richiedere +l'uso di \headfiled{utmpx.h} e di una struttura \struct{utmpx} come secondo +argomento. + + +\subsection{La gestione dello spegnimento e del riavvio} +\label{sec:sys_reboot} + +Una delle operazioni di gestione generale del sistema è quella che attiene +alle modalità con cui se ne può gestire lo spegnimento ed il riavvio. Perché +questo avvenga in maniera corretta, in particolare per le parti che comportano +lo spegnimento effettivo della macchina, occorre che il kernel effettui le +opportune operazioni interagendo con il BIOS ed i dispositivi che controllano +l'erogazione della potenza. + +La funzione di sistema che controlla lo spegnimento ed il riavvio (ed altri +aspetti della relativa procedura) è \funcd{reboot},\footnote{la funzione + illustrata è quella fornita dalla \acr{glibc} che maschera i dettagli di + basso livello della \textit{system call} la quale richiede attualmente tre + argomenti; fino al kernel 2.1.30 la \textit{system call} richiedeva un + ulteriore quarto argomento, i primi due indicano dei \textit{magic number} + interi che possono assumere solo alcuni valori predefiniti, il terzo un + comando, corrispondente all'unico argomento della funzione della \acr{glibc} + ed il quarto argomento aggiuntivo, ora ignorato, un puntatore generico ad + ulteriori dati.} il cui prototipo è: + +\begin{funcproto}{ +\fhead{unistd.h} +\fhead{sys/reboot.h} +\fdecl{int reboot(int cmd)} +\fdesc{Controlla il riavvio o l'arresto della macchina.} +} - \bodydesc{Le funzioni ritornano il puntatore ad una struttura \var{utmp} in - caso di successo e \macro{NULL} in caso di errore.} -\end{functions} +{La funzione non ritorna o ritorna $0$ in caso di successo e $-1$ per un + errore, nel qual caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EFAULT}] c'è un indirizzo non valido nel passaggio degli + argomenti con il comando \const{LINUX\_REBOOT\_CMD\_RESTART2} (obsoleto). + \item[\errcode{EINVAL}] si sono specificati valori non validi per gli + argomenti. + \item[\errcode{EPERM}] il chiamante non ha i privilegi di amministratore (la + \textit{capability} \const{CAP\_SYS\_BOOT}). + \end{errlist} +} +\end{funcproto} + +La funzione, oltre al riavvio ed allo spegnimento, consente anche di +controllare l'uso della combinazione di tasti tradizionalmente usata come +scorciatoia da tastiera per richiedere il riavvio (\texttt{Ctrl-Alt-Del}, +denominata in breve nella documentazione CAD) ed i suoi effetti specifici +dipendono dalla architettura hardware. Se si è richiesto un riavvio o uno +spegnimento in caso di successo la funzione, non esistendo più il programma, +ovviamente non ritorna, pertanto bisogna avere cura di aver effettuato tutte +le operazioni preliminari allo spegnimento prima di eseguirla. + +Il comportamento della funzione viene controllato dall'argomento \param{cmd} +e deve assumere indicato con una delle costanti seguente elenco, che +illustra i comandi attualmente disponibili: + +\begin{basedescript}{\desclabelwidth{2.cm}\desclabelstyle{\nextlinelabel}} +\item[\constd{LINUX\_REBOOT\_CMD\_CAD\_OFF}] Disabilita l'uso diretto della + combinazione \texttt{Ctrl-Alt-Del}, la cui pressione si traduce nell'invio + del segnale \signal{SIGINT} a \texttt{init} (o più in generale al processo + con \ids{PID} 1) il cui effetto dipende dalla configurazione di + quest'ultimo. +\item[\constd{LINUX\_REBOOT\_CMD\_CAD\_ON}] Attiva l'uso diretto della + combinazione \texttt{Ctrl-Alt-Del}, la cui pressione si traduce + nell'esecuzione dell'azione che si avrebbe avuto chiamando \func{reboot} con + il comando \const{LINUX\_REBOOT\_CMD\_RESTART}. +\item[\constd{LINUX\_REBOOT\_CMD\_HALT}] Viene inviato sulla console il + messaggio ``\textit{System halted.}'' l'esecuzione viene bloccata + immediatamente ed il controllo passato al monitor nella ROM (se esiste e + l'architettura lo consente). Se non si è eseguita una sincronizzazione dei + dati su disco con \func{sync} questi saranno perduti. +\item[\constd{LINUX\_REBOOT\_CMD\_KEXEC}] viene eseguito direttamente il nuovo + kernel che è stato opportunamente caricato in memoria da una + \func{kexec\_load} (che tratteremo a breve) eseguita in precedenza. La + funzionalità è disponibile solo a partire dal kernel 2.6.13 e se il kernel + corrente è stato compilato includendo il relativo supporto.\footnote{deve + essere stata abilitata l'opzione di compilazione \texttt{CONFIG\_KEXEC}.} + Questo meccanismo consente di eseguire una sorta di riavvio rapido che evita + di dover ripassare dalla inizializzazione da parte del BIOS ed il lancio del + kernel attraverso un bootloader. Se non si è eseguita una sincronizzazione + dei dati su disco con \func{sync} questi saranno perduti. +\item[\constd{LINUX\_REBOOT\_CMD\_POWER\_OFF}] Viene inviato sulla console il + messaggio ``\textit{Power down.}'' l'esecuzione viene bloccata + immediatamente e la macchina, se possibile, viene spenta. Se non si è + eseguita una sincronizzazione dei dati su disco con \func{sync} questi + saranno perduti. +\item[\constd{LINUX\_REBOOT\_CMD\_RESTART}] Viene inviato sulla console il + messaggio ``\textit{Restarting system.}'' ed avviata immediatamente la + procedura di riavvio ordinaria. Se non si è eseguita una sincronizzazione + dei dati su disco con \func{sync} questi saranno perduti. +\item[\constd{LINUX\_REBOOT\_CMD\_RESTART2}] Viene inviato sulla console il + messaggio ``\textit{Restarting system with command '\%s'.}'' ed avviata + immediatamente la procedura di riavvio usando il comando fornito + nell'argomento \param{arg} che viene stampato al posto di \textit{'\%s'} + (veniva usato per lanciare un altro programma al posto di \cmd{init}). Nelle + versioni recenti questo argomento viene ignorato ed il riavvio può essere + controllato dall'argomento di avvio del kernel \texttt{reboot=...} Se non + si è eseguita una sincronizzazione dei dati su disco con \func{sync} questi + saranno perduti. +\end{basedescript} -La prima funzione permette l'aggiunta di una voce a \file{wmtp} specificando -direttamente una struttura \type{utmp}, mentre la seconda utilizza gli -argomenti \param{line}, \param{name} e \param{host} per costruire la voce che -poi aggiunge chiamando \func{updwtmp}. +Come appena illustrato usando il comando \const{LINUX\_REBOOT\_CMD\_KEXEC} si +può eseguire un riavvio immediato pre-caricando una immagine del kernel, che +verrà eseguita direttamente. Questo meccanismo consente di evitare la +reinizializzazione della macchina da parte del BIOS, ed oltre a velocizzare un +eventuale riavvio, ha il vantaggio poter accedere allo stato corrente della +macchina e della memoria, per cui viene usato spesso per installare un kernel +di emergenza da eseguire in caso di crollo del sistema per recuperare il +maggior numero di informazioni possibili. -\section{Limitazione ed uso delle risorse} -\label{sec:sys_res_limits} +La funzione di sistema che consente di caricare questa immagine del kernel è +\funcd{kexec\_load}, la funzione non viene definita nella \acr{glibc} e deve +pertanto essere invocata con \func{syscall}, il suo prototipo è: +\begin{funcproto}{ +\fhead{linux/kexec.h} +\fdecl{long kexec\_load(unsigned long entry, unsigned long nr\_segments, +struct kexec\_segment\\ +\phantom{long kexec\_load(}*segments, unsigned long flags)} -Dopo aver esaminato le funzioni che permettono di controllare le varie -caratteristiche, capacità e limiti del sistema a livello globale, in questa -sezione tratteremo le varie funzioni che vengono usate per quantificare le -risorse (CPU, memoria, ecc.) utilizzate da ogni singolo processo e quelle che -permettono di imporre a ciascuno di essi vincoli e limiti di utilizzo. +\fdesc{Carica un kernel per un riavvio immediato.} +} +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EBUSY}] c'è già un caricamento in corso, o un altro kernel è + già in uso. + \item[\errcode{EINVAL}] il valore di \param{flags} non è valido o si è + indicato un valore eccessivo per \param{nr\_segments}. + \item[\errcode{EPERM}] il chiamante non ha i privilegi di amministratore (la + \textit{capability} \const{CAP\_SYS\_BOOT}). + \end{errlist} +} +\end{funcproto} -\subsection{L'uso delle risorse} -\label{sec:sys_resource_use} +Il primo argomento indica l'indirizzo fisico di esecuzione del nuovo kernel +questo viene caricato usando un vettore di strutture \struct{kexec\_segment} +(la cui definizione è riportata in fig.~\ref{fig:kexec_segment}) che +contengono i singoli segmenti dell'immagine. I primi due campi indicano +indirizzo e dimensione del segmento di memoria in \textit{user space}, i +secondi indirizzo e dimensione in \textit{kernel space}. -Come abbiamo accennato in \secref{sec:proc_wait4} le informazioni riguardo -l'utilizzo delle risorse da parte di un processo è mantenuto in una struttura -di tipo \code{struct }\type{rusage}, la cui definizione (che si trova in -\file{sys/resource.h}) è riportata in \figref{fig:sys_rusage_struct}. \begin{figure}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct rusage { - struct timeval ru_utime; /* user time used */ - struct timeval ru_stime; /* system time used */ - long ru_maxrss; /* maximum resident set size */ - long ru_ixrss; /* integral shared memory size */ - long ru_idrss; /* integral unshared data size */ - long ru_isrss; /* integral unshared stack size */ - long ru_minflt; /* page reclaims */ - long ru_majflt; /* page faults */ - long ru_nswap; /* swaps */ - long ru_inblock; /* block input operations */ - long ru_oublock; /* block output operations */ - long ru_msgsnd; /* messages sent */ - long ru_msgrcv; /* messages received */ - long ru_nsignals; ; /* signals received */ - long ru_nvcsw; /* voluntary context switches */ - long ru_nivcsw; /* involuntary context switches */ -}; - \end{lstlisting} + \begin{minipage}[c]{0.8\textwidth} + \includestruct{listati/kexec_segment.h} \end{minipage} \normalsize - \caption{La struttura \var{rusage} per la lettura delle informazioni dei - delle risorse usate da un processo.} - \label{fig:sys_rusage_struct} + \caption{La struttura \structd{kexec\_segment} per il caricamento di un + segmento di immagine del kernel.} + \label{fig:kexec_segment} \end{figure} -La struttura è ripresa da BSD 4.3, ma attualmente (con i kernel della serie -2.4.x) i soli campi che sono mantenuti sono: \var{ru\_utime}, \var{ru\_stime}, -\var{ru\_minflt}, \var{ru\_majflt}, e \var{ru\_nswap}. I primi due indicano -rispettivamente il tempo impiegato dal processo nell'eseguire le istruzioni in -user space, e quello impiegato dal kernel nelle system call eseguite per conto -del processo. +L'argomento \param{flags} è una maschera binaria contenente i flag che +consentono di indicare le modalità con cui dovrà essere eseguito il nuovo +kernel. La parte meno significativa viene usata per impostare l'architettura +di esecuzione. Il valore \const{KEXEC\_ARCH\_DEFAULT} indica l'architettura +corrente, ma se ne può specificare anche una diversa, con i valori della +seconda parte di tab.~\ref{tab:kexec_load_flags}, e questa verrà usato posto +che sia effettivamente eseguibile sul proprio processore. -Gli altri tre campi servono a quantificare l'uso della memoria virtuale e -corrispondono rispettivamente al numero di \textit{page fault}\index{page - fault} (vedi \secref{sec:proc_mem_gen}) avvenuti senza richiedere I/O (i -cosiddetti \textit{minor page fault}), a quelli che invece han richiesto I/O -(detti invece \textit{major page fault}) ed al numero di volte che il processo -è stato completamente tolto dalla memoria per essere inserito nello swap. - -In genere includere esplicitamente \file{} non è più necessario, -ma aumenta la portabilità, e serve comunque quando, come nella maggior parte -dei casi, si debba accedere ai campi di \var{rusage} relativi ai tempi di -utilizzo del processore, che sono definiti come \code{struct }\type{timeval}. - - -Questa è la stessa struttura utilizzata da \func{wait4} per ricavare la -quantità di risorse impiegato dal processo di cui si è letto lo stato di -terminazione, ma essa può anche essere letta direttamente utilizzando la -funzione \func{getrusage}, il cui prototipo è: -\begin{functions} - \headdecl{sys/time.h} - \headdecl{sys/resource.h} - \headdecl{unistd.h} - - \funcdecl{int getrusage(int who, struct rusage *usage)} - Legge la quantità di risorse usate da un processo. +\begin{table}[htb] + \footnotesize + \centering + \begin{tabular}[c]{|l|p{8cm}|} + \hline + \textbf{Valore} & \textbf{Significato}\\ + \hline + \hline + \constd{KEXEC\_ON\_CRASH} & Il kernel caricato sarà eseguito + automaticamente in caso di crollo del + sistema.\\ + \constd{KEXEC\_PRESERVE\_CONTEXT}& Viene preservato lo stato dei programmi + e dei dispositivi prima dell'esecuzione + del nuovo kernel. Viene usato + principalmente per l'ibernazione del + sistema ed ha senso solo se si è + indicato un numero di segmento maggiore + di zero.\\ + \hline + \constd{KEXEC\_ARCH\_DEFAULT} & Il kernel caricato verrà eseguito nella + architettura corrente. \\ + \texttt{KEXEC\_ARCH\_XXX} & Il kernel caricato verrà eseguito nella + architettura indicata (con \texttt{XXX} + che può essere: \texttt{386}, + \texttt{X86\_64}, \texttt{PPC}, + \texttt{PPC64}, \texttt{IA\_64}, + \texttt{ARM}, \texttt{S390}, + \texttt{SH}\texttt{MIPS} + e \texttt{MIPS\_LE}).\\ +% \const{} & \\ + \hline + \end{tabular} + \caption{Valori per l'argomento \param{flags} di \func{kexec\_load}.} + \label{tab:kexec_load_flags} +\end{table} +I due valori più importanti sono però quelli della parte più significativa +(riportati nella prima sezione di tab.~\ref{tab:kexec_load_flags}). Il primo, +\const{KEXEC\_ON\_CRASH}, consente di impostare l'esecuzione automatica del +nuovo kernel caricato in caso di crollo del sistema, e viene usato quando si +carica un kernel di emergenza da utilizzare per poter raccogliere informazioni +diagnostiche che altrimenti verrebbero perdute non essendo il kernel ordinario +più in grado di essere eseguito in maniera coerente. Il secondo valore, +\const{KEXEC\_PRESERVE\_CONTEXT}, indica invece di preservare lo stato dei +programmi e dei dispositivi, e viene in genere usato per realizzare la +cosiddetta ibernazione in RAM. - \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore, - nel qual caso \var{errno} può essere \macro{EINVAL} o \macro{EFAULT}.} -\end{functions} +% TODO: introdotta con il kernel 3.17 è stata introdotta +% kexec_file_load, per caricare immagine firmate per il secure boot, +% vedi anche http://lwn.net/Articles/603116/ -L'argomento \param{who} permette di specificare il processo di cui si vuole -leggere l'uso delle risorse; esso può assumere solo i due valori -\macro{RUSAGE\_SELF} per indicare il processo corrente e -\macro{RUSAGE\_CHILDREN} per indicare l'insieme dei processi figli di cui si è -ricevuto lo stato di terminazione. +% TODO documentare keyctl ???? +% (fare sezione dedicata ????) +% TODO documentare la Crypto API del kernel -\subsection{Limiti sulle risorse} -\label{sec:sys_resource_limit} +% TODO documentare la syscall getrandom, introdotta con il kernel 3.17, vedi +% http://lwn.net/Articles/606141/, ed introdotta con le glibc solo con la +% versione 2.25, vedi https://lwn.net/Articles/711013/ + +%\subsection{La gestione delle chiavi crittografiche} +%\label{sec:keyctl_management} + +%TODO non è chiaro se farlo qui, ma documentare la syscall bpf aggiunta con il +% kernel 3.18, vedi http://lwn.net/Articles/612878/; al riguardo vedi anche +% https://lwn.net/Articles/660331/ + +\section{Il controllo dell'uso delle risorse} +\label{sec:sys_res_limits} + + +Dopo aver esaminato in sez.~\ref{sec:sys_management} le funzioni che +permettono di controllare le varie caratteristiche, capacità e limiti del +sistema a livello globale, in questa sezione tratteremo le varie funzioni che +vengono usate per quantificare le risorse (CPU, memoria, ecc.) utilizzate da +ogni singolo processo e quelle che permettono di imporre a ciascuno di essi +vincoli e limiti di utilizzo. -Come accennato nell'introduzione oltre a leggere l'uso delle risorse da parte -di un processo si possono anche imporre dei limiti sulle sue capacità. Ogni -processo ha in generale due limiti associati ad ogni risorsa; questi sono -detti il \textsl{limite corrente} (o \textit{current limit}) che esprime il -valore che attualmente il processo non può superare, ed il \textsl{limite - massimo} (o \textit{maximum limit}) che esprime il valore massimo che può -assumere il \textsl{limite corrente}. - -In generale il primo viene chiamato un limite \textsl{soffice} (o \textit{soft - limit}) dato che il suo valore può essere aumentato, mentre il secondo è -detto \textsl{duro} (o \textit{hard limit}), in quanto un processo normale non -può modificarne il valore. Il valore di questi limiti è mantenuto in una -struttura \var{rlimit}, la cui definizione è riportata in -\figref{fig:sys_rlimit_struct}, ed i cui campi corrispondono appunto a limite -corrente e massimo. + +\subsection{L'uso delle risorse} +\label{sec:sys_resource_use} + +Come abbiamo accennato in sez.~\ref{sec:proc_wait} le informazioni riguardo +l'utilizzo delle risorse da parte di un processo è mantenuto in una struttura +di tipo \struct{rusage}, la cui definizione (che si trova in +\headfiled{sys/resource.h}) è riportata in +fig.~\ref{fig:sys_rusage_struct}. Si ricordi che questa è una delle +informazioni preservate attraverso una \func{exec}. \begin{figure}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct rlimit { - rlim_t rlim_cur; - rlim_t rlim_max; -}; - \end{lstlisting} + \begin{minipage}[c]{0.8\textwidth} + \includestruct{listati/rusage.h} \end{minipage} \normalsize - \caption{La struttura \var{rlimit} per impostare i limiti di utilizzo + \caption{La struttura \structd{rusage} per la lettura delle informazioni dei delle risorse usate da un processo.} - \label{fig:sys_rlimit_struct} + \label{fig:sys_rusage_struct} \end{figure} -In genere il superamento di un limite comporta o l'emissione di un segnale o -il fallimento della system call che lo ha provocato; per far leggere o settare -i limiti di utilizzo delle risorse da parte di un processo le \acr{glibc} -prevedono due funzioni, \func{getrlimit} e \func{setrlimit}, i cui prototipi -sono: -\begin{functions} - \headdecl{sys/time.h} - \headdecl{sys/resource.h} - \headdecl{unistd.h} - - \funcdecl{int getrlimit(int resource, struct rlimit *rlim)} - - Legge il limite corrente per la risorsa \param{resource}. - - \funcdecl{int setrlimit(int resource, const struct rlimit *rlim)} - - Setta il limite per la risorsa \param{resource}. - - \bodydesc{Le funzioni ritornano 0 in caso di successo e -1 in caso di - errore, nel qual caso \var{errno} viene settata ai valori: - \begin{errlist} - \item[\macro{INVAL}] I valori per \param{resource} non sono validi. - \item[\macro{EPERM}] Un processo senza i privilegi di amministratore ha - cercato di innalzare i propri limiti. - \end{errlist} - ed \macro{EFAULT}.} -\end{functions} +La definizione della struttura in fig.~\ref{fig:sys_rusage_struct} è ripresa +da BSD 4.3,\footnote{questo non ha a nulla a che fare con il cosiddetto + \textit{BSD accounting} (vedi sez. \ref{sec:sys_bsd_accounting}) che si + trova nelle opzioni di compilazione del kernel (e di norma è disabilitato) + che serve per mantenere una contabilità delle risorse usate da ciascun + processo in maniera molto più dettagliata.} ma attualmente solo alcuni dei +campi definiti sono effettivamente mantenuti. Con i kernel della serie 2.4 i +soli campi che sono mantenuti sono: \var{ru\_utime}, \var{ru\_stime}, +\var{ru\_minflt} e \var{ru\_majflt}. Con i kernel della serie 2.6 si +aggiungono anche \var{ru\_nvcsw} e \var{ru\_nivcsw}, a partire dal 2.6.22 +anche \var{ru\_inblock} e \var{ru\_oublock} e dal 2.6.32 anche +\var{ru\_maxrss}. + +In genere includere esplicitamente \file{} non è più strettamente +necessario, ma aumenta la portabilità, e serve comunque quando, come nella +maggior parte dei casi, si debba accedere ai campi di \struct{rusage} relativi +ai tempi di utilizzo del processore, che sono definiti come strutture di tipo +\struct{timeval} (vedi fig.~\ref{fig:sys_timeval_struct}). + +La struttura \struct{rusage} è la struttura utilizzata da \func{wait4} (si +ricordi quando visto in sez.~\ref{sec:proc_wait}) per ricavare la quantità di +risorse impiegate dal processo di cui si è letto lo stato di terminazione, ma +essa può anche essere letta direttamente utilizzando la funzione di sistema +\funcd{getrusage}, il cui prototipo è: + +\begin{funcproto}{ +\fhead{sys/time.h} +\fhead{sys/resource.h} +\fhead{unistd.h} +\fdecl{int getrusage(int who, struct rusage *usage)} + +\fdesc{Legge la quantità di risorse usate da un processo.} +} -Entrambe le funzioni permettono di specificare su quale risorsa si vuole -operare attraverso \param{resource}, i cui possibili valori sono elencati in -\secref{tab:sys_rlimit_values}, e utilizzano una struttura \var{rlimit} per -specificarne i valori. +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EINVAL}] l'argomento \param{who} non è valido + \end{errlist} + ed inoltre \errval{EFAULT} nel suo significato generico. +} +\end{funcproto} + +La funzione ritorna i valori per l'uso delle risorse nella struttura +\struct{rusage} puntata dall'argomento \param{usage}. L'argomento \param{who} +permette di specificare il soggetto di cui si vuole leggere l'uso delle +risorse; esso può assumere solo i valori illustrati in +tab.~\ref{tab:getrusage_who}, di questi \const{RUSAGE\_THREAD} è specifico di +Linux ed è disponibile solo a partire dal kernel 2.6.26. La funzione è stata +recepita nello standard POSIX.1-2001, che però indica come campi di +\struct{rusage} soltanto \var{ru\_utime} e \var{ru\_stime}. \begin{table}[htb] \footnotesize \centering - \begin{tabular}[c]{|l|p{12cm}|} + \begin{tabular}[c]{|l|p{8cm}|} \hline \textbf{Valore} & \textbf{Significato}\\ \hline \hline - \macro{RLIMIT\_CPU} & Il massimo tempo di CPU che il processo può - usare. Il superamento del limite comporta - l'emissione di un segnale di \macro{SIGXCPU}.\\ - \macro{RLIMIT\_FSIZE} & La massima dimensione di un file che un processo - può usare. Se il processo cerca di scrivere - oltre questa dimensione riceverà un segnale di - \macro{SIGXFSZ}.\\ - \macro{RLIMIT\_DATA} & La massima dimensione della memoria dati di un - processo. Il tentatico di allocare più memoria - causa il fallimento della funzione di - allocazione. \\ - \macro{RLIMIT\_STACK} & La massima dimensione dello stack del - processo. Se il processo esegue operazioni che - estendano lo stack oltre questa dimensione - riceverà un segnale di \macro{SIGSEGV}.\\ - \macro{RLIMIT\_CORE} & La massima dimensione di un file di \textit{core - dump} creato da un processo. Nel caso le - dimensioni dovessero essere maggiori il file non - verrebbe generato.\footnotemark\\ - \macro{RLIMIT\_RSS} & L'ammontare massimo di memoria fisica dato al - processo. Il limite è solo una indicazione per - il kernel, qualora ci fosse un surplus di - memoria questa verrebbe assegnata.\\ - \macro{RLIMIT\_NPROC} & Il numero massimo di processi che possono essere - creati sullo stesso user id. Se il limite viene - raggiunto \func{fork} fallirà con un - \macro{EAGAIN}.\\ - \macro{RLIMIT\_NOFILE} & Il numero massimo di file che il processo può - aprire. L'apertura di un ulteriore file fallirà - con un errore \macro{EMFILE}.\\ - \macro{RLIMIT\_MEMLOCK}& L'ammontare massimo di memoria che può essere - bloccata (vedi \secref{sec:proc_mem_lock}).\\ - \macro{RLIMIT\_AS} & La dimensione massima di tutta la memoria che il - processo può ottenere. Se il processo tenta di - allocarne di più funzioni come \func{brk}, - \func{malloc} o \func{mmap} falliranno. \\ + \constd{RUSAGE\_SELF} & Ritorna l'uso delle risorse del processo + corrente, che in caso di uso dei + \textit{thread} ammonta alla somma delle + risorse utilizzate da tutti i \textit{thread} + del processo.\\ + \constd{RUSAGE\_CHILDREN} & Ritorna l'uso delle risorse dell'insieme dei + processi figli di cui è ricevuto lo stato di + terminazione, che a loro volta comprendono + quelle dei loro figli e così via.\\ + \constd{RUSAGE\_THREAD} & Ritorna l'uso delle risorse del \textit{thread} + chiamante.\\ \hline \end{tabular} - \caption{Valori possibili dell'argomento \param{resource} delle funzioni - \func{getrlimit} e \func{setrlimit}.} - \label{tab:sys_rlimit_values} + \caption{Valori per l'argomento \param{who} di \func{getrusage}.} + \label{tab:getrusage_who} \end{table} -\footnotetext{Settare questo limite a zero è la maniera più semplice per - evitare la creazione di \file{core} file.} +I campi più utilizzati sono comunque \var{ru\_utime} e \var{ru\_stime} che +indicano rispettivamente il tempo impiegato dal processo nell'eseguire le +istruzioni in \textit{user space}, e quello impiegato dal kernel nelle +\textit{system call} eseguite per conto del processo (vedi +sez.~\ref{sec:sys_unix_time}). I campi \var{ru\_minflt} e \var{ru\_majflt} +servono a quantificare l'uso della memoria virtuale e corrispondono +rispettivamente al numero di \textit{page fault} (vedi +sez.~\ref{sec:proc_mem_gen}) avvenuti senza richiedere I/O su disco (i +cosiddetti \textit{minor page fault}), a quelli che invece han richiesto I/O +su disco (detti invece \textit{major page + fault}).% mentre \var{ru\_nswap} ed al numero di volte che +% il processo è stato completamente tolto dalla memoria per essere inserito +% nello swap. +% TODO verificare \var{ru\_nswap} non citato nelle pagine di manuali recenti e +% dato per non utilizzato. + +I campi \var{ru\_nvcsw} e \var{ru\_nivcsw} indicano il numero di volte che un +processo ha subito un \textit{context switch} da parte dello +\textit{scheduler} rispettivamente nel caso un cui questo avviene prima +dell'esaurimento della propria \textit{time-slice} (in genere a causa di una +\textit{system call} bloccante), o per averla esaurita o essere stato +interrotto da un processo a priorità maggiore. I campi \var{ru\_inblock} e +\var{ru\_oublock} indicano invece il numero di volte che è stata eseguita una +attività di I/O su un filesystem (rispettivamente in lettura e scrittura) ed +infine \var{ru\_maxrss} indica il valore più alto della \textit{Resident Set + Size} raggiunto dal processo stesso o, nel caso sia stato usato +\const{RUSAGE\_CHILDREN}, da uno dei suoi figli. + +Si tenga conto che per un errore di implementazione nei i kernel precedenti il +2.6.9, nonostante questo fosse esplicitamente proibito dallo standard POSIX.1, +l'uso di \const{RUSAGE\_CHILDREN} comportava l'inserimento dell'ammontare +delle risorse usate dai processi figli anche quando si era impostata una +azione di \const{SIG\_IGN} per il segnale \signal{SIGCHLD} (per i segnali si +veda cap.~\ref{cha:signals}). Il comportamento è stato corretto per aderire +allo standard a partire dal kernel 2.6.9. + + +\subsection{Limiti sulle risorse} +\label{sec:sys_resource_limit} + +Come accennato nell'introduzione il kernel mette a disposizione delle +funzionalità che permettono non solo di mantenere dati statistici relativi +all'uso delle risorse, ma anche di imporre dei limiti precisi sul loro +utilizzo da parte sia dei singoli processi che degli utenti. + +Per far questo sono definite una serie di risorse e ad ogni processo vengono +associati due diversi limiti per ciascuna di esse; questi sono il +\textsl{limite corrente} (o \textit{current limit}) che esprime un valore +massimo che il processo non può superare ad un certo momento, ed il +\textsl{limite massimo} (o \textit{maximum limit}) che invece esprime il +valore massimo che può assumere il \textsl{limite corrente}. In generale il +primo viene chiamato anche \textit{soft limit} dato che il suo valore può +essere aumentato dal processo stesso durante l'esecuzione, ciò può però essere +fatto solo fino al valore del secondo, che per questo viene detto \textit{hard + limit}. + +In generale il superamento di un limite corrente comporta o l'emissione di uno +specifico segnale o il fallimento della \textit{system call} che lo ha +provocato. A questo comportamento generico fanno eccezione \const{RLIMIT\_CPU} +in cui si ha in comportamento diverso per il superamento dei due limiti e +\const{RLIMIT\_CORE} che influenza soltanto la dimensione o l'eventuale +creazione dei file di \textit{core dump} (vedi sez.~\ref{sec:sig_standard}). + +Per permettere di leggere e di impostare i limiti di utilizzo delle risorse da +parte di un processo sono previste due funzioni di sistema, \funcd{getrlimit} +e \funcd{setrlimit}, i cui prototipi sono: + +\begin{funcproto}{ +\fhead{sys/time.h} +\fhead{sys/resource.h} +\fhead{unistd.h} +\fdecl{int getrlimit(int resource, struct rlimit *rlim)} +\fdesc{Legge i limiti di una risorsa.} +\fdecl{int setrlimit(int resource, const struct rlimit *rlim)} +\fdesc{Imposta i limiti di una risorsa.} +} + +{Le funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EINVAL}] i valori per \param{resource} non sono validi o + nell'impostazione si è specificato \var{rlim->rlim\_cur} maggiore di + \var{rlim->rlim\_max}. + \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha + cercato di innalzare i propri limiti. + \end{errlist} + ed inoltre \errval{EFAULT} nel suo significato generico. +} +\end{funcproto} + +Entrambe le funzioni permettono di specificare attraverso l'argomento +\param{resource} su quale risorsa si vuole operare. L'accesso (rispettivamente +in lettura e scrittura) ai valori effettivi dei limiti viene poi effettuato +attraverso la struttura \struct{rlimit} puntata da +\param{rlim}, la cui definizione è riportata in +fig.~\ref{fig:sys_rlimit_struct}, ed i cui campi corrispondono appunto a +limite corrente e limite massimo. + +\begin{figure}[!htb] + \footnotesize + \centering + \begin{minipage}[c]{0.8\textwidth} + \includestruct{listati/rlimit.h} + \end{minipage} + \normalsize + \caption{La struttura \structd{rlimit} per impostare i limiti di utilizzo + delle risorse usate da un processo.} + \label{fig:sys_rlimit_struct} +\end{figure} + +Come accennato processo ordinario può alzare il proprio limite corrente fino +al valore del limite massimo, può anche ridurre, irreversibilmente, il valore +di quest'ultimo. Nello specificare un limite, oltre a fornire dei valori +specifici, si può anche usare la costante \const{RLIM\_INFINITY} che permette +di sbloccare completamente l'uso di una risorsa. Si ricordi però che solo un +processo con i privilegi di amministratore\footnote{per essere precisi in + questo caso quello che serve è la \textit{capability} + \const{CAP\_SYS\_RESOURCE} (vedi sez.~\ref{sec:proc_capabilities}).} può +innalzare un limite al di sopra del valore corrente del limite massimo ed +usare un valore qualsiasi per entrambi i limiti. + +Ciascuna risorsa su cui si possono applicare dei limiti è identificata da uno +specifico valore dell'argomento \param{resource}, i valori possibili per +questo argomento, ed il significato della risorsa corrispondente, dei +rispettivi limiti e gli effetti causati dal superamento degli stessi sono +riportati nel seguente elenco: + +\begin{basedescript}{\desclabelwidth{2.2cm}}%\desclabelstyle{\nextlinelabel}} +\item[\constd{RLIMIT\_AS}] Questa risorsa indica, in byte, la dimensione + massima consentita per la memoria virtuale di un processo, il cosiddetto + \textit{Address Space}, (vedi sez.~\ref{sec:proc_mem_gen}). Se il limite + viene superato dall'uso di funzioni come \func{brk}, \func{mremap} o + \func{mmap} esse falliranno con un errore di \errcode{ENOMEM}, mentre se il + superamento viene causato dalla crescita dello \textit{stack} il processo + riceverà un segnale di \signal{SIGSEGV}. Dato che il valore usato è un + intero di tipo \ctyp{long} nelle macchine a 32 bit questo può assumere un + valore massimo di 2Gb (anche se la memoria disponibile può essere maggiore), + in tal caso il limite massimo indicabile resta 2Gb, altrimenti la risorsa si + dà per non limitata. + +\item[\constd{RLIMIT\_CORE}] Questa risorsa indica, in byte, la massima + dimensione per un file di \textit{core dump} (vedi + sez.~\ref{sec:sig_standard}) creato nella terminazione di un processo. File + di dimensioni maggiori verranno troncati a questo valore, mentre con un + valore nullo si bloccherà la creazione dei \textit{core dump}. + +\item[\constd{RLIMIT\_CPU}] Questa risorsa indica, in secondi, il massimo tempo + di CPU (vedi sez.~\ref{sec:sys_cpu_times}) che il processo può usare. Il + superamento del limite corrente comporta l'emissione di un segnale di + \signal{SIGXCPU}, la cui azione predefinita (vedi + sez.~\ref{sec:sig_classification}) è terminare il processo. Il segnale però + può essere intercettato e ignorato, in tal caso esso verrà riemesso una + volta al secondo fino al raggiungimento del limite massimo. Il superamento + del limite massimo comporta comunque l'emissione di un segnale di + \signal{SIGKILL}. Si tenga presente che questo è il comportamento presente + su Linux dai kernel della serie 2.2 ad oggi, altri kernel possono avere + comportamenti diversi per quanto avviene quando viene superato il + \textit{soft limit}, pertanto per avere operazioni portabili è suggerito di + intercettare sempre \signal{SIGXCPU} e terminare in maniera ordinata il + processo con la prima ricezione. + +\item[\constd{RLIMIT\_DATA}] Questa risorsa indica, in byte, la massima + dimensione del segmento dati di un processo (vedi + sez.~\ref{sec:proc_mem_layout}). Il tentativo di allocare più memoria di + quanto indicato dal limite corrente causa il fallimento della funzione di + allocazione eseguita (\func{brk} o \func{sbrk}) con un errore di + \errcode{ENOMEM}. + +\item[\constd{RLIMIT\_FSIZE}] Questa risorsa indica, in byte, la massima + dimensione di un file che un processo può usare. Se il processo cerca di + scrivere o di estendere il file oltre questa dimensione riceverà un segnale + di \signal{SIGXFSZ}, che di norma termina il processo. Se questo segnale + viene intercettato la \textit{system call} che ha causato l'errore fallirà + con un errore di \errcode{EFBIG}. + +\item[\constd{RLIMIT\_LOCKS}] Questa risorsa indica il numero massimo di + \textit{file lock} (vedi sez.~\ref{sec:file_locking}) e di \textit{file + lease} (vedi sez.~\ref{sec:file_asyncronous_lease}) che un processo poteva + effettuare. È un limite presente solo nelle prime versioni del kernel 2.4, + pertanto non deve essere più utilizzato. + +\item[\constd{RLIMIT\_MEMLOCK}] Questa risorsa indica, in byte, l'ammontare + massimo di memoria che può essere bloccata in RAM da un processo (vedi + sez.~\ref{sec:proc_mem_lock}). Dato che il \textit{memory locking} viene + effettuato sulle pagine di memoria, il valore indicato viene automaticamente + arrotondato al primo multiplo successivo della dimensione di una pagina di + memoria. Il limite comporta il fallimento delle \textit{system call} che + eseguono il \textit{memory locking} (\func{mlock}, \func{mlockall} ed anche, + vedi sez.~\ref{sec:file_memory_map}, \func{mmap} con l'operazione + \const{MAP\_LOCKED}). + + Dal kernel 2.6.9 questo limite comprende anche la memoria che può essere + bloccata da ciascun utente nell'uso della memoria condivisa (vedi + sez.~\ref{sec:ipc_sysv_shm}) con \func{shmctl}, che viene contabilizzata + separatamente ma sulla quale viene applicato questo stesso limite. In + precedenza invece questo limite veniva applicato sulla memoria condivisa per + processi con privilegi amministrativi, il limite su questi è stato rimosso e + la semantica della risorsa cambiata. + + +\item[\constd{RLIMIT\_MSGQUEUE}] Questa risorsa indica il numero massimo di + byte che possono essere utilizzati da un utente, identificato con + l'\ids{UID} reale del processo chiamante, per le code di messaggi POSIX + (vedi sez.~\ref{sec:ipc_posix_mq}). Per ciascuna coda che viene creata viene + calcolata un'occupazione pari a: +\includecodesnip{listati/mq_occupation.c} +dove \var{attr} è la struttura \struct{mq\_attr} (vedi +fig.~\ref{fig:ipc_mq_attr}) usata nella creazione della coda. Il primo addendo +consente di evitare la creazione di una coda con un numero illimitato di +messaggi vuoti che comunque richiede delle risorse di gestione. Questa risorsa +è stata introdotta con il kernel 2.6.8. + +\item[\constd{RLIMIT\_NICE}] Questa risorsa indica il numero massimo a cui può + essere il portato il valore di \textit{nice} (vedi + sez.~\ref{sec:proc_sched_stand}). Dato che non possono essere usati numeri + negativi per specificare un limite, il valore di \textit{nice} viene + calcolato come \code{20-rlim\_cur}. Questa risorsa è stata introdotta con il + kernel 2.6.12. + +\item[\constd{RLIMIT\_NOFILE}] Questa risorsa indica il numero massimo di file + che un processo può aprire. Il tentativo di creazione di un ulteriore file + descriptor farà fallire la funzione (\func{open}, \func{dup}, \func{pipe}, + ecc.) con un errore \errcode{EMFILE}. + +\item[\constd{RLIMIT\_NPROC}] Questa risorsa indica il numero massimo di + processi che possono essere creati dallo stesso utente, che viene + identificato con l'\ids{UID} reale (vedi sez.~\ref{sec:proc_access_id}) del + processo chiamante. Se il limite viene raggiunto \func{fork} fallirà con un + \errcode{EAGAIN}. + +\item[\constd{RLIMIT\_RSS}] Questa risorsa indica, in pagine di memoria, la + dimensione massima della memoria residente (il cosiddetto RSS + \itindex{Resident~Set~Size~(RSS)} \textit{Resident Set Size}) cioè + l'ammontare della memoria associata al processo che risiede effettivamente + in RAM e non a quella eventualmente portata sulla \textit{swap} o non ancora + caricata dal filesystem per il segmento testo del programma. Ha effetto + solo sulle chiamate a \func{madvise} con \const{MADV\_WILLNEED} (vedi + sez.~\ref{sec:file_memory_map}). Presente solo sui i kernel precedenti il + 2.4.30. + +\item[\constd{RLIMIT\_RTPRIO}] Questa risorsa indica il valore massimo della + priorità statica che un processo può assegnarsi o assegnare con + \func{sched\_setscheduler} e \func{sched\_setparam} (vedi + sez.~\ref{sec:proc_real_time}). Il limite è stato introdotto a partire dal + kernel 2.6.12 (ma per un bug è effettivo solo a partire dal 2.6.13). In + precedenza solo i processi con privilegi amministrativi potevano avere una + priorità statica ed utilizzare una politica di \textit{scheduling} di tipo + \textit{real-time}. + +\item[\constd{RLIMIT\_RTTIME}] Questa risorsa indica, in microsecondi, il tempo + massimo di CPU che un processo eseguito con una priorità statica può + consumare. Il superamento del limite corrente comporta l'emissione di un + segnale di \signal{SIGXCPU}, e quello del limite massimo di \signal{SIGKILL} + con le stesse regole viste \const{RLIMIT\_CPU}: se \signal{SIGXCPU} viene + intercettato ed ignorato il segnale verrà riemesso ogni secondo fino al + superamento del limite massimo. Questo limite è stato introdotto con il + kernel 2.6.25 per impedire che un processo \textit{real-time} possa bloccare + il sistema. + +\item[\constd{RLIMIT\_SIGPENDING}] Questa risorsa indica il numero massimo di + segnali che possono essere mantenuti in coda per ciascun utente, + identificato per \ids{UID} reale. Il limite comprende sia i segnali normali + che quelli \textit{real-time} (vedi sez.~\ref{sec:sig_real_time}) ed è + attivo solo per \func{sigqueue}, con \func{kill} si potrà sempre inviare un + segnale che non sia già presente su una coda. Questo limite è stato + introdotto con il kernel 2.6.8. + +\item[\constd{RLIMIT\_STACK}] Questa risorsa indica, in byte, la massima + dimensione dello \textit{stack} del processo. Se il processo esegue + operazioni che estendano lo \textit{stack} oltre questa dimensione riceverà + un segnale di \signal{SIGSEGV}. + + A partire dal kernel 2.6.23 questo stesso limite viene applicato per la gran + parte delle architetture anche ai dati che possono essere passati come + argomenti e variabili di ambiente ad un programma posto in esecuzione con + \func{execve}, nella misura di un quarto del valore indicato per lo + \textit{stack}. Questo valore in precedenza era fisso e pari a 32 pagine di + memoria, corrispondenti per la gran parte delle architetture a 128kb di + dati, dal 2.6.25, per evitare problemi di compatibilità quando + \const{RLIMIT\_STACK} è molto basso, viene comunque garantito uno spazio + base di 32 pagine qualunque sia l'architettura. -È inoltre definita la costante \macro{RLIM\_INFINITY} che permette di -sbloccare l'uso di una risorsa, ma solo un processo con i privilegi di -amministratore può innalzare un limite al di sopra del valore corrente del -limite massimo. Si tenga conto infine che tutti i limiti vengono ereditati dal -processo padre attraverso una \func{fork} (vedi \secref{sec:proc_fork}) e -mantenuti attraverso una \func{exec} (vedi \secref{sec:proc_exec}). +\end{basedescript} +Si tenga conto infine che tutti i limiti eventualmente presenti su un processo +vengono ereditati dai figli da esso creati attraverso una \func{fork} (vedi +sez.~\ref{sec:proc_fork}) e mantenuti invariati per i programmi messi in +esecuzione attraverso una \func{exec} (vedi sez.~\ref{sec:proc_exec}). + +Si noti come le due funzioni \func{getrlimit} e \func{setrlimit} consentano di +operare solo sul processo corrente. Per questo motivo a partire dal kernel +2.6.36 (e dalla \acr{glibc} 2.13) è stata introdotta un'altra funzione di +sistema \funcd{prlimit} il cui scopo è quello di estendere e sostituire le +precedenti. Il suo prototipo è: + +\begin{funcproto}{ +\fhead{sys/resource.h} +\fdecl{int prlimit(pid\_t pid, int resource, const struct rlimit *new\_limit,\\ +\phantom{int prlimit(}struct rlimit *old\_limit} +\fdesc{Legge e imposta i limiti di una risorsa.} +} -\subsection{Le risorse di memoria e processore} +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EINVAL}] i valori per \param{resource} non sono validi o + nell'impostazione si è specificato \var{rlim->rlim\_cur} maggiore di + \var{rlim->rlim\_max}. + \item[\errcode{EPERM}] un processo senza i privilegi di amministratore ha + cercato di innalzare i propri limiti o si è cercato di modificare i limiti + di un processo di un altro utente. + \item [\errcode{ESRCH}] il process \param{pid} non esiste. + \end{errlist} + ed inoltre \errval{EFAULT} nel suo significato generico. +} +\end{funcproto} + +La funzione è specifica di Linux e non portabile; per essere usata richiede +che sia stata definita la macro \macro{\_GNU\_SOURCE}. Il primo argomento +indica il \ids{PID} del processo di cui si vogliono cambiare i limiti e si può +usare un valore nullo per indicare il processo chiamante. Per modificare i +limiti di un altro processo, a meno di non avere privilegi +amministrativi,\footnote{anche in questo caso la \textit{capability} + necessaria è \const{CAP\_SYS\_RESOURCE} (vedi + sez.~\ref{sec:proc_capabilities}).} l'\ids{UID} ed il \ids{GID} reale del +chiamante devono coincidere con \ids{UID} e \ids{GID} del processo indicato +per i tre gruppi reale, effettivo e salvato. + +Se \param{new\_limit} non è \val{NULL} verrà usato come puntatore alla +struttura \struct{rlimit} contenente i valori dei nuovi limiti da impostare, +mentre se \param{old\_limit} non è \val{NULL} verranno letti i valori correnti +del limiti nella struttura \struct{rlimit} da esso puntata. In questo modo è +possibile sia leggere che scrivere, anche in contemporanea, i valori dei +limiti. Il significato dell'argomento \param{resource} resta identico rispetto +a \func{getrlimit} e \func{setrlimit}, così come i restanti requisiti. + + +\subsection{Le informazioni sulle risorse di memoria e processore} \label{sec:sys_memory_res} -La gestione della memoria è già stata affrontata in dettaglio in -\secref{sec:proc_memory}; abbiamo visto allora che il kernel provvede il +La gestione della memoria è già stata affrontata in dettaglio in +sez.~\ref{sec:proc_memory}; abbiamo visto allora che il kernel provvede il meccanismo della memoria virtuale attraverso la divisione della memoria fisica -in pagine. - -In genere questo è del tutto trasparente al singolo processo, ma in certi -casi, come per l'I/O mappato in memoria (vedi \ref{sec:file_memory_map}) che -usa lo stesso meccanismo per accedere ai file, è necessario conoscere le -dimensioni delle pagine usate dal kernel. Lo stesso vale quando si vuole -gestire in maniera ottimale l'interazione della memoria allocata con il -meccanismo della paginazione. - -Di solito la dimensione delle pagine di memoria è fissata dall'architettura -hardware, per cui in genere la dimensione delle pagine di memoria era una -costante definita in fase di compilazione, ma oggi alcune architetture (ad -esempio su Sun Sparc) permettono di variare questa dimensione, e non volendo -dover fornire binari diversi per ogni possibile modello, è necessario poter -utilizzare una funzione. - -In genere questa dimensione può essere ottenuta attraverso una chiamata a -\func{sysconf} come \func{sysconf(\_SC\_PAGESIZE)}, ma in BSD 4.2 è stata -introdotta una apposita funzione, \func{getpagesize}, che restituisce la -dimensione delle pagine di memoria; il suo prototipo è: -\begin{prototype}{unistd.h}{int getpagesize(void)} - Legge le dimensioni delle pagine di memoria. - - \bodydesc{La funzione ritorna la dimensione di una pagina in byte, e non - sono previsti errori.} -\end{prototype} +in pagine. In genere tutto ciò è del tutto trasparente al singolo processo, +ma in certi casi, come per l'I/O mappato in memoria (vedi +sez.~\ref{sec:file_memory_map}) che usa lo stesso meccanismo per accedere ai +file, è necessario conoscere le dimensioni delle pagine usate dal kernel. Lo +stesso vale quando si vuole gestire in maniera ottimale l'interazione della +memoria che si sta allocando con il meccanismo della paginazione. + +Un tempo la dimensione delle pagine di memoria era fissata una volta per tutte +dall'architettura hardware, per cui il relativo valore veniva mantenuto in una +costante che bastava utilizzare in fase di compilazione. Oggi invece molte +architetture permettono di variare questa dimensione (ad esempio sui PC +recenti si possono usare pagine di 4kb e di 4 Mb) per cui per non dover +ricompilare i programmi per ogni possibile caso e relativa scelta di +dimensioni, è necessario poter utilizzare una funzione che restituisca questi +valori quando il programma viene eseguito. + +Dato che si tratta di una caratteristica generale del sistema come abbiamo +visto in sez.~\ref{sec:sys_characteristics} questa dimensione può essere +ottenuta come tutte le altre attraverso una chiamata a \func{sysconf}, nel +caso specifico si dovrebbe utilizzare il parametro \const{\_SC\_PAGESIZE}. Ma +in BSD 4.2 è stata introdotta una apposita funzione di sistema +\funcd{getpagesize} che restituisce la dimensione delle pagine di memoria. La +funzione è disponibile anche su Linux (ma richiede che sia definita la macro +\macro{\_BSD\_SOURCE}) ed il suo prototipo è: + +\begin{funcproto}{ +\fhead{unistd.h} +\fdecl{int getpagesize(void)} +\fdesc{Legge la dimensione delle pagine di memoria.} +} + +{La funzione ritorna la dimensione di una pagina in byte, e non sono previsti + errori.} +\end{funcproto} -La funzione è prevista in SVr4, 4.4BSD e SUSv2, anche se questo ultimo +La funzione è prevista in SVr4, BSD 4.4 e SUSv2, anche se questo ultimo standard la etichetta come obsoleta, mentre lo standard POSIX 1003.1-2001 la -ha eliminata. In Linux è implementata come una system call nelle architetture -in cui essa è necessaria, ed in genere restituisce il valore del simbolo -\macro{PAGE\_SIZE} del kernel, anche se le versioni delle librerie del C -precedenti le \acr{glibc} 2.1 implementavano questa funzione restituendo -sempre un valore statico. - -Le \acr{glibc} forniscono, come specifica estensione GNU, altre due funzioni, -\func{get\_phys\_pages} e \func{get\_avphys\_pages} che permettono di ottenere -informazioni riguardo la memoria; i loro prototipi sono: -\begin{functions} - \headdecl{sys/sysinfo.h} - - \funcdecl{long int get\_phys\_pages(void)} +ha eliminata, ed i programmi che intendono essere portabili devono ricorrere +alla chiamata a \func{sysconf}. + +In Linux è implementata come una \textit{system call} nelle architetture in +cui essa è necessaria, ed in genere restituisce il valore del simbolo +\const{PAGE\_SIZE} del kernel, che dipende dalla architettura hardware, anche +se le versioni delle librerie del C precedenti la \acr{glibc} 2.1 +implementavano questa funzione restituendo sempre un valore statico. + +% TODO verificare meglio la faccenda di const{PAGE\_SIZE} + +La \textsl{glibc} fornisce, come specifica estensione GNU, altre due +funzioni, \funcd{get\_phys\_pages} e \funcd{get\_avphys\_pages} che permettono +di ottenere informazioni riguardo le pagine di memoria; i loro prototipi sono: + +\begin{funcproto}{ +\fhead{sys/sysinfo.h} +\fdecl{long int get\_phys\_pages(void)} +\fdesc{Legge il numero totale di pagine di memoria.} +\fdecl{long int get\_avphys\_pages(void)} +\fdesc{Legge il numero di pagine di memoria disponibili nel sistema.} +} - Legge il numero totale di pagine di memoria disponibili per il sistema. - - \funcdecl{long int get\_avphys\_pages(void)} - - Legge il numero di pagine di memoria disponibili nel sistema. - - \bodydesc{Le funzioni restituiscono il numero di pagine, } -\end{functions} +{La funzioni ritornano il numero di pagine, e non sono previsti + errori.} +\end{funcproto} Queste funzioni sono equivalenti all'uso della funzione \func{sysconf} -rispettivamente con i parametri \macro{\_SC\_PHYS\_PAGES} e -\macro{\_SC\_AVPHYS\_PAGES}. La prima restituisce il numero totale di pagine +rispettivamente con i parametri \const{\_SC\_PHYS\_PAGES} e +\const{\_SC\_AVPHYS\_PAGES}. La prima restituisce il numero totale di pagine corrispondenti alla RAM della macchina; la seconda invece la memoria effettivamente disponibile per i processi. -Le \acr{glibc} supportano inoltre, come estenzioni GNU, due funzioni che +La \acr{glibc} supporta inoltre, come estensioni GNU, due funzioni che restituiscono il numero di processori della macchina (e quello dei processori attivi); anche queste sono informazioni comunque ottenibili attraverso \func{sysconf} utilizzando rispettivamente i parametri -\macro{\_SC\_NPROCESSORS\_CONF} e \macro{\_SC\_NPROCESSORS\_ONLN}. +\const{\_SC\_NPROCESSORS\_CONF} e \const{\_SC\_NPROCESSORS\_ONLN}. -Infine le \acr{glibc} riprendono da BSD la funzione \func{getloadavg} che -permette di ottenere il carico di processore della macchina, in questo modo è +Infine la \acr{glibc} riprende da BSD la funzione \funcd{getloadavg} che +permette di ottenere il carico di processore della macchina, in questo modo è possibile prendere decisioni su quando far partire eventuali nuovi processi. -Il suo prototipo è: -\begin{prototype}{stdlib.h}{int getloadavg(double loadavg[], int nelem)} - Legge il carico medio della macchina. - - \bodydesc{La funzione ritorna il numero di elementi scritti o -1 in caso di - errore.} -\end{prototype} +Il suo prototipo è: + +\begin{funcproto}{ +\fhead{stdlib.h} +\fdecl{int getloadavg(double loadavg[], int nelem)} +\fdesc{Legge il carico medio della macchina.} +} + +{La funzione ritorna il numero di campionamenti restituiti e $-1$ se non + riesce ad ottenere il carico medio, \var{errno} non viene modificata.} +\end{funcproto} La funzione restituisce in ciascun elemento di \param{loadavg} il numero medio -di processi attivi sulla coda dello scheduler, calcolato su un diverso -intervalli di tempo. Il numero di intervalli che si vogliono leggere è +di processi attivi sulla coda dello \textit{scheduler}, calcolato su diversi +intervalli di tempo. Il numero di intervalli che si vogliono leggere è specificato da \param{nelem}, dato che nel caso di Linux il carico viene -valutato solo su tre intervalli (corrispondenti a 1, 5 e 15 minuti), questo è -anche il massimo valore che può essere assegnato a questo argomento. +valutato solo su tre intervalli (corrispondenti a 1, 5 e 15 minuti), questo è +anche il massimo valore che può essere assegnato a questo argomento. + + +\subsection{La \textsl{contabilità} in stile BSD} +\label{sec:sys_bsd_accounting} + +Una ultima modalità per monitorare l'uso delle risorse è, se si è compilato il +kernel con il relativo supporto,\footnote{se cioè si è abilitata l'opzione di + compilazione \texttt{CONFIG\_BSD\_PROCESS\_ACCT}.} quella di attivare il +cosiddetto \textit{BSD accounting}, che consente di registrare su file una +serie di informazioni\footnote{contenute nella struttura \texttt{acct} + definita nel file \texttt{include/linux/acct.h} dei sorgenti del kernel.} +riguardo alla \textsl{contabilità} delle risorse utilizzate da ogni processo +che viene terminato. + +Linux consente di salvare la contabilità delle informazioni relative alle +risorse utilizzate dai processi grazie alla funzione \funcd{acct}, il cui +prototipo è: + +\begin{funcproto}{ +\fhead{unistd.h} +\fdecl{int acct(const char *filename)} +\fdesc{Abilita il \textit{BSD accounting}.} +} +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EACCES}] non si hanno i permessi per accedere a + \param{pathname}. + \item[\errcode{ENOSYS}] il kernel non supporta il \textit{BSD accounting}. + \item[\errcode{EPERM}] il processo non ha privilegi sufficienti ad + abilitare il \textit{BSD accounting}. + \item[\errcode{EUSERS}] non sono disponibili nel kernel strutture per il + file o si è finita la memoria. + \end{errlist} + ed inoltre \errval{EFAULT}, \errval{EIO}, \errval{ELOOP}, + \errval{ENAMETOOLONG}, \errval{ENFILE}, \errval{ENOENT}, \errval{ENOMEM}, + \errval{ENOTDIR}, \errval{EROFS} nel loro significato generico.} +\end{funcproto} + +La funzione attiva il salvataggio dei dati sul file indicato dal +\textit{pathname} contenuti nella stringa puntata da \param{filename}; la +funzione richiede che il processo abbia i privilegi di amministratore (è +necessaria la \textit{capability} \const{CAP\_SYS\_PACCT}, vedi +sez.~\ref{sec:proc_capabilities}). Se si specifica il valore \val{NULL} per +\param{filename} il \textit{BSD accounting} viene invece disabilitato. Un +semplice esempio per l'uso di questa funzione è riportato nel programma +\texttt{AcctCtrl.c} dei sorgenti allegati alla guida. + +Quando si attiva la contabilità, il file che si indica deve esistere; esso +verrà aperto in sola scrittura e le informazioni verranno registrate in +\textit{append} in coda al file tutte le volte che un processo termina. Le +informazioni vengono salvate in formato binario, e corrispondono al contenuto +della apposita struttura dati definita all'interno del kernel. + +Il funzionamento di \func{acct} viene inoltre modificato da uno specifico +parametro di sistema, modificabile attraverso \sysctlfiled{kernel/acct} (o +tramite la corrispondente \func{sysctl}). Esso contiene tre valori interi, il +primo indica la percentuale di spazio disco libero sopra il quale viene +ripresa una registrazione che era stata sospesa per essere scesi sotto il +minimo indicato dal secondo valore (sempre in percentuale di spazio disco +libero). Infine l'ultimo valore indica la frequenza in secondi con cui deve +essere controllata detta percentuale. + +% TODO: bassa priorità, trattare la lettura del file di accounting, da +% programma, vedi man 5 acct \section{La gestione dei tempi del sistema} @@ -1666,375 +2054,1230 @@ gestione di data e ora. \subsection{La misura del tempo in Unix} \label{sec:sys_unix_time} -Storicamente i sistemi unix-like hanno sempre mantenuto due distinti tipi di -dati per la misure dei tempi all'interno del sistema: essi sono -rispettivamente chiamati \textit{calendar time} e \textit{process time}, -secondo le definizioni: -\begin{description} -\item[\textit{calendar time}]: detto anche \textsl{tempo di calendario}. È il - numero di secondi dalla mezzanotte del primo gennaio 1970, in tempo - universale coordinato (o UTC), data che viene usualmente indicata con - 00:00:00 Jan, 1 1970 (UTC) e chiamata \textit{the Epoch}. Questo tempo viene - anche chiamato anche GMT (Greenwich Mean Time) dato che l'UTC corrisponde - all'ora locale di Greenwich. È il tempo su cui viene mantenuto l'orologio - del kernel, e viene usato ad esempio per indicare le date di modifica dei - file o quelle di avvio dei processi. Per memorizzare questo tempo è stato - riservato il tipo primitivo \type{time\_t}. -\item[\textit{process time}]: detto talvolta \textsl{tempo di processore}. - Viene misurato in \textit{clock tick}. Un tempo questo corrispondeva al - numero di interruzioni effettuate dal timer di sistema, adesso lo standard - POSIX richiede che esso sia pari al valore della costante - \macro{CLOCKS\_PER\_SEC}, che deve essere definita come 1000000, qualunque - sia la risoluzione reale dell'orologio di sistema e la frequenza delle - interruzioni del timer.\footnote{quest'ultima, come accennato in - \secref{sec:proc_hierarchy}, è invece data dalla costante \macro{HZ}.} Il - dato primitivo usato per questo tempo è \type{clock\_t}, che ha quindi una - risoluzione del microsecondo. Il numero di tick al secondo può essere - ricavato anche attraverso \func{sysconf} (vedi \secref{sec:sys_sysconf}). Il - vecchio simbolo \macro{CLK\_TCK} definito in \file{time.h} è ormai - considerato obsoleto. -\end{description} - -In genere si usa il \textit{calendar time} per esprimere le date dei file e le -informazioni analoghe che riguardano i cosiddetti \textsl{tempi di orologio}, -che vengono usati ad esempio per i demoni che compiono lavori amministrativi -ad ore definite, come \cmd{cron}. - -Di solito questo tempo viene convertito automaticamente dal valore in UTC al -tempo locale, utilizzando le opportune informazioni di localizzazione -(specificate in \file{/etc/timezone}). E da tenere presente che questo tempo è -mantenuto dal sistema e non è detto che corrisponda al tempo tenuto -dall'orologio hardware del calcolatore. - -Anche il \textit{process time} di solito si esprime in secondi, ma provvede -una precisione ovviamente superiore al \textit{calendar time} (che è mantenuto -dal sistema con una granularità di un secondo) e viene usato per tenere conto -dei tempi di esecuzione dei processi. Per ciascun processo il kernel calcola -tre tempi diversi: -\begin{description*} -\item[\textit{clock time}]: il tempo \textsl{reale} (viene chiamato anche - \textit{wall clock time}) passato dall'avvio del processo. Chiaramente tale - tempo dipende anche dal carico del sistema e da quanti altri processi - stavano girando nello stesso periodo. -\item[\textit{user time}]: il tempo che la CPU ha impiegato nell'esecuzione - delle istruzioni del processo in user space. -\item[\textit{system time}]: il tempo che la CPU ha impiegato nel kernel per - eseguire delle system call per conto del processo. -\end{description*} - -In genere la somma di \textit{user time} e \textit{system time} indica il -tempo di processore totale in cui il sistema è stato effettivamente impegnato -nell'eseguire un certo processo e viene chiamato \textit{CPU time} o -\textsl{tempo di CPU}. +\itindbeg{calendar~time} +\itindbeg{process~time} + +Tradizionalmente nei sistemi unix-like sono sempre stati previsti due tipi +distinti di tempi, caratterizzati da altrettante modalità di misura ed +espressi con diversi tipi di dati, chiamati rispettivamente \textit{calendar + time} e \textit{process time}, secondo le seguenti definizioni: +\begin{basedescript}{\desclabelwidth{1.5cm}\desclabelstyle{\nextlinelabel}} + +\item[\textit{calendar time}] detto anche \textsl{tempo di calendario}, + \textsl{tempo d'orologio} o \textit{tempo reale}. Si tratta di un tempo + assoluto o di un intervallo di tempo come lo intende normalmente per le + misure fatte con un orologio. Per esprimere questo tempo è stato riservato + il tipo \type{time\_t}, e viene tradizionalmente misurato nel cosiddetto + \itindex{unix-time} \textit{unix-time}, espresso in secondi a partire dalla + mezzanotte del primo gennaio 1970, data che viene chiamata \textit{the + Epoch}. + +\item[\textit{process time}] detto anche \textsl{tempo di processore} o + \textsl{tempo di CPU}. Si tratta del tempo impiegato da un processore + nell'esecuzione del codice di un programma all'interno di un processo. Per + esprimere questo tempo è stato riservato il tipo \type{clock\_t}, e viene + misurato nei cosiddetti \textit{clock tick}, tradizionalmente corrispondenti + al numero di interruzioni del processore da parte del timer di sistema. A + differenza del precedente indica soltanto un intervallo di durata. +\end{basedescript} +Il \textit{calendar time} viene sempre mantenuto facendo riferimento +al cosiddetto \textit{tempo universale coordinato} UTC, anche se +talvolta viene usato il cosiddetto GMT (\textit{Greenwich Mean Time}) +dato che l'UTC corrisponde all'ora locale di Greenwich. Si tratta del +tempo su cui viene mantenuto il cosiddetto \textsl{orologio di + sistema}, e viene usato per indicare i tempi dei file (quelli di +sez.~\ref{sec:file_file_times}) o le date di avvio dei processi, ed è +il tempo che viene usato dai demoni che compiono lavori amministrativi +ad orari definito, come \cmd{cron}. + +Si tenga presente che questo tempo è mantenuto dal kernel e non è detto che +corrisponda al tempo misurato dall'orologio hardware presente su praticamente +tutte le piastre madri dei computer moderni (il cosiddetto \textit{hardware + clock}), il cui valore viene gestito direttamente dall'hardware in maniera +indipendente e viene usato dal kernel soltanto all'avvio per impostare un +valore iniziale dell'orologio di sistema. La risoluzione tradizionale data dal +tipo di dato \type{time\_t} è di un secondo, ma nei sistemi più recenti sono +disponibili altri tipi di dati con precisioni maggiori. + +Si tenga presente inoltre che a differenza di quanto avviene con altri sistemi +operativi,\footnote{è possibile, ancorché assolutamente sconsigliabile, + forzare l'orologio di sistema all'ora locale per compatibilità con quei + sistemi operativi che han fatto questa deprecabile scelta.} l'orologio di +sistema viene mantenuto sempre in UTC e che la conversione all'ora locale del +proprio fuso orario viene effettuata dalle funzioni di libreria utilizzando le +opportune informazioni di localizzazione (specificate in +\conffiled{/etc/timezone}). In questo modo si ha l'assicurazione che l'orologio +di sistema misuri sempre un tempo monotono crescente come nella realtà, anche +in presenza di cambi di fusi orari. + +\itindend{calendar~time} + +Il \textit{process time} invece indica sempre una misura di un lasso di tempo +e viene usato per tenere conto dei tempi di esecuzione dei processi. Esso +viene sempre diviso in \textit{user time} e \textit{system time}, per misurare +la durata di ciascun processo il kernel infatti calcola tre tempi: +\begin{basedescript}{\desclabelwidth{2.2cm}\desclabelstyle{\nextlinelabel}} +\item[\textit{clock time}] il tempo \textsl{reale}, viene chiamato anche + \textit{wall clock time} o \textit{elapsed time}, passato dall'avvio del + processo. Questo tempo fa riferimento al + \textit{calendar time} e dice la durata effettiva dell'esecuzione del + processo, ma chiaramente dipende dal carico del sistema e da quanti altri + processi stanno girando nello stesso momento. + +\item[\textit{user time}] il tempo effettivo che il processore ha impiegato + nell'esecuzione delle istruzioni del programma in \textit{user space}. È + anche quello riportato nella risorsa \var{ru\_utime} di \struct{rusage} + vista in sez.~\ref{sec:sys_resource_use}. + +\item[\textit{system time}] il tempo effettivo che il processore ha impiegato + per eseguire codice delle \textit{system call} nel kernel per conto del + processo. È anche quello riportato nella risorsa \var{ru\_stime} di + \struct{rusage} vista in sez.~\ref{sec:sys_resource_use}. +\end{basedescript} + +La somma di \textit{user time} e \textit{system time} indica il +\textit{process time}, vale a dire il tempo di processore totale che il +sistema ha effettivamente utilizzato per eseguire il programma di un certo +processo. Si può ottenere un riassunto dei valori di questi tempi quando si +esegue un qualsiasi programma lanciando quest'ultimo come argomento del +comando \cmd{time}. + +\itindend{process~time} +\itindbeg{clock~tick} + +Come accennato il \textit{process time} viene misurato nei cosiddetti +\textit{clock tick}. Un tempo questo corrispondeva al numero di interruzioni +effettuate dal timer di sistema, oggi lo standard POSIX richiede che esso sia +espresso come multiplo della costante \constd{CLOCKS\_PER\_SEC} che deve +essere definita come 1000000, qualunque sia la risoluzione reale dell'orologio +di sistema e la frequenza delle interruzioni del timer che, come accennato in +sez.~\ref{sec:proc_hierarchy} e come vedremo a breve, è invece data dalla +costante \const{HZ}. + +Il tipo di dato usato per questo tempo, \type{clock\_t}, con questa +convenzione ha una risoluzione del microsecondo. Ma non tutte le funzioni di +sistema come vedremo seguono questa convenzione, in tal caso il numero di +\textit{clock tick} al secondo può essere ricavato anche attraverso +\func{sysconf} richiedendo il valore della costante \const{\_SC\_CLK\_TCK} +(vedi sez.~\ref{sec:sys_limits}). Il vecchio simbolo \const{CLK\_TCK} +definito in \headfile{time.h} è ormai considerato obsoleto e non deve essere +usato. + +\constbeg{HZ} + +In realtà tutti calcoli dei tempi vengono effettuati dal kernel per il +cosiddetto \textit{software clock}, utilizzando il \textit{timer di sistema} e +facendo i conti in base al numero delle interruzioni generate dello stesso, i +cosiddetti \itindex{jiffies} ``\textit{jiffies}''. La durata di un +``\textit{jiffy}'' è determinata dalla frequenza di interruzione del timer, +indicata in Hertz, come accennato in sez.~\ref{sec:proc_hierarchy}, dal valore +della costante \const{HZ} del kernel, definita in \file{asm/param.h}. + +Fino al kernel 2.4 il valore di \const{HZ} era 100 su tutte le architetture +tranne l'alpha, per cui era 1000. Con il 2.6.0 è stato portato a 1000 su tutte +le architetture, ma dal 2.6.13 il valore è diventato una opzione di +compilazione del kernel, con un default di 250 e valori possibili di 100, 250, +1000. Dal 2.6.20 è stato aggiunto anche il valore 300 che è divisibile per le +frequenze di refresh della televisione (50 o 60 Hz). Si può pensare che questi +valori determinino anche la corrispondente durata dei \textit{clock tick}, ma +in realtà questa granularità viene calcolata in maniera indipendente usando la +costante del kernel \const{USER\_HZ}. + +\constend{HZ} + +Fino al kernel 2.6.21 la durata di un \textit{jiffy} costituiva la risoluzione +massima ottenibile nella misura dei tempi impiegabile in una \textit{system + call} (ad esempio per i timeout). Con il 2.6.21 e l'introduzione degli +\textit{high-resolution timers} (HRT) è divenuto possibile ottenere, per le +funzioni di attesa ed i timer, la massima risoluzione possibile fornita +dall'hardware. Torneremo su questo in sez.~\ref{sec:sig_timer_adv}. + +\itindend{clock~tick} \subsection{La gestione del \textit{process time}} \label{sec:sys_cpu_times} Di norma tutte le operazioni del sistema fanno sempre riferimento al -\textit{calendar time}, l'uso del \textit{process time} è riservato a quei -casi in cui serve conoscere i tempi di esecuzione di un processo (ad esempio -per valutarne l'efficienza). In tal caso infatti fare ricorso al -\textit{calendar time} è inutile in quanto il tempo può essere trascorso mentre -un altro processo era in esecuzione o in attesa del risultato di una -operazione di I/O. - -La funzione più semplice per leggere il \textit{process time} di un processo è -\func{clock}, che da una valutazione approssimativa del tempo di CPU -utilizzato dallo stesso; il suo prototipo è: -\begin{prototype}{time.h}{clock\_t clock(void)} - Legge il valore corrente del tempo di CPU. - - \bodydesc{La funzione ritorna il tempo di CPU usato dal programma e -1 in - caso di errore.} -\end{prototype} - -La funzione restituisce il tempo in tick, quindi se si vuole il tempo in -secondi occorre moltiplicare il risultato per la costante -\macro{CLOCKS\_PER\_SEC}.\footnote{le \acr{glibc} seguono lo standard ANSI C, - POSIX richiede che \macro{CLOCKS\_PER\_SEC} sia definito pari a 1000000 - indipendetemente dalla risoluzione del timer di sistema.} In genere +\textit{calendar time}, l'uso del \textit{process time} è riservato a +quei casi in cui serve conoscere i tempi di esecuzione di un processo +(ad esempio per valutarne l'efficienza). In tal caso infatti fare +ricorso al \textit{calendar time} è inutile in quanto il tempo può +essere trascorso mentre un altro processo era in esecuzione o in +attesa del risultato di una operazione di I/O. + +La funzione più semplice per leggere il \textit{process time} di un processo è +\funcd{clock}, che da una valutazione approssimativa del tempo di CPU +utilizzato dallo stesso; il suo prototipo è: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{clock\_t clock(void)} +\fdesc{Legge il valore corrente del tempo di CPU.} +} + +{La funzione ritorna il tempo di CPU in caso di successo e $-1$ se questo non + è ottenibile o rappresentabile in un valore di tipo \type{clock\_t}, + \var{errno} non viene usata.} +\end{funcproto} + +La funzione restituisce il tempo in \textit{clock tick} ma la \acr{glibc} +segue lo standard POSIX e quindi se si vuole il tempo in secondi occorre +dividere il risultato per la costante \const{CLOCKS\_PER\_SEC}. In genere \type{clock\_t} viene rappresentato come intero a 32 bit, il che comporta un valore massimo corrispondente a circa 72 minuti, dopo i quali il contatore -riprenderà lo stesso valore iniziale. - -Come accennato in \secref{sec:sys_unix_time} il tempo di CPU è la somma di -altri due tempi, l'\textit{user time} ed il \textit{system time} che sono -quelli effettivamente mantenuti dal kernel per ciascun processo. Questi -possono essere letti attraverso la funzione \func{times}, il cui prototipo è: -\begin{prototype}{sys/times.h}{clock\_t times(struct tms *buf)} - Legge in \param{buf} il valore corrente dei tempi di processore. - - \bodydesc{La funzione ritorna il numero di clock tick dall'avvio del sistema - in caso di successo e -1 in caso di errore.} -\end{prototype} +riprenderà lo stesso valore iniziale. + +La funzione è presente anche nello standard ANSI C, ma in tal caso non è +previsto che il valore ritornato indichi un intervallo di tempo ma solo un +valore assoluto, per questo se si vuole la massima portabilità anche al di +fuori di kernel unix-like, può essere opportuno chiamare la funzione +all'inizio del programma ed ottenere il valore del tempo con una differenza. + +Si tenga presente inoltre che con altri kernel unix-like il valore riportato +dalla funzione può includere anche il tempo di processore usato dai processi +figli di cui si è ricevuto lo stato di terminazione con \func{wait} e +affini. Questo non vale per Linux, in cui questa informazione deve essere +ottenuta separatamente. + +Come accennato in sez.~\ref{sec:sys_unix_time} il tempo di processore è la +somma di altri due tempi, l'\textit{user time} ed il \textit{system time}, che +sono quelli effettivamente mantenuti dal kernel per ciascun processo. Questi +possono essere letti separatamente attraverso la funzione \funcd{times}, il +cui prototipo è: + +\begin{funcproto}{ +\fhead{sys/times.h} +\fdecl{clock\_t times(struct tms *buf)} +\fdesc{Legge il valore corrente dei tempi di processore.} +} -La funzione restituisce i valori di process time del processo corrente in una -struttura di tipo \var{tms}, la cui definizione è riportata in -\secref{fig:sys_tms_struct}. La struttura prevede quattro campi; i primi due, -\var{tms\_utime} e \var{tms\_stime}, sono l'\textit{user time} ed il -\textit{system time} del processo, così come definiti in -\secref{sec:sys_unix_time}. +{La funzione ritorna un numero di \textit{clock tick} in caso di successo e + $-1$ per un errore, nel qual caso \var{errno} potrà assumere solo il valore + \errval{EFAULT} nel suo significato generico.} +\end{funcproto} + +La funzione restituisce i valori di \textit{process time} del processo +corrente in una struttura di tipo \struct{tms}, la cui definizione è riportata +in fig.~\ref{fig:sys_tms_struct}. La struttura prevede quattro campi; i primi +due, \var{tms\_utime} e \var{tms\_stime}, sono l'\textit{user time} ed il +\textit{system time} del processo, così come definiti in +sez.~\ref{sec:sys_unix_time}. Gli altri due campi, \var{tms\_cutime} e +\var{tms\_cstime}, riportano la somma dell'\textit{user time} e del +\textit{system time} di tutti processi figli di cui si è ricevuto lo stato di +terminazione. \begin{figure}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct tms { - clock_t tms_utime; /* user time */ - clock_t tms_stime; /* system time */ - clock_t tms_cutime; /* user time of children */ - clock_t tms_cstime; /* system time of children */ -}; - \end{lstlisting} + \begin{minipage}[c]{0.8\textwidth} + \includestruct{listati/tms.h} \end{minipage} \normalsize - \caption{La struttura \var{tms} dei tempi di processore associati a un + \caption{La struttura \structd{tms} dei tempi di processore associati a un processo.} \label{fig:sys_tms_struct} \end{figure} -Gli altri due campi mantengono rispettivamente la somma dell'\textit{user - time} ed del \textit{system time} di tutti i processi figli che sono -terminati; il kernel cioè somma in \var{tms\_cutime} il valore di -\var{tms\_utime} e \var{tms\_cutime} per ciascun figlio del quale è stato -ricevuto lo stato di terminazione, e lo stesso vale per \var{tms\_cstime}. -Si tenga conto che l'aggiornamento di \var{tms\_cutime} e \var{tms\_cstime} -viene eseguito solo quando una chiamata a \func{wait} o \func{waitpid} è -ritornata. Per questo motivo se un figlio termina prima di altri suoi figli, -questi ``nipoti'' non potranno essere considerati nel calcolo di questi tempi. +Si tenga presente che i tempi di processore dei processi figli di un processo +vengono sempre sommati al valore corrente ogni volta che se ne riceve lo stato +di terminazione, e detto valore è quello che viene a sua volta ottenuto dal +processo padre. Pertanto nei campi \var{tms\_cutime} e \var{tms\_cstime} si +sommano anche i tempi di ulteriori discendenti di cui i rispettivi genitori +abbiano ricevuto lo stato di terminazione. +Si tenga conto che l'aggiornamento di \var{tms\_cutime} e \var{tms\_cstime} +viene eseguito solo quando una chiamata a \func{wait} o \func{waitpid} è +ritornata. Per questo motivo se un processo figlio termina prima di ricevere +lo stato di terminazione di tutti i suoi figli, questi processi +``\textsl{nipoti}'' non verranno considerati nel calcolo di questi tempi e +così via per i relativi ``\textsl{discendenti}''. + +Come accennato in sez.~\ref{sec:sys_resource_use} per i kernel precedenti la +versione 2.6.9 il tempo di processore dei processi figli veniva sommato +comunque chiedendo di ignorare \signal{SIGCHLD} anche se lo standard POSIX +richiede esplicitamente che questo avvenga solo quando si riceve lo stato di +uscita con una funzione della famiglia delle \func{wait}, anche in questo caso +il comportamento è stato adeguato allo standard a partire dalla versione +2.6.9. + +A differenza di quanto avviene per \func{clock} i valori restituiti nei campi +di una struttura \struct{tms} sono misurati in numero di \textit{clock tick} +effettivi e non in multipli di \const{CLOCKS\_PER\_SEC}, pertanto per ottenere +il valore effettivo del tempo in secondi occorrerà dividere per il risultato +di \code{sysconf(\_SC\_CLK\_TCK)}. + +Lo stesso vale per il valore di ritorno della funzione, il cui significato fa +riferimento ad un tempo relativo ad un certo punto nel passato la cui +definizione dipende dalle diverse implementazioni, e varia anche fra diverse +versioni del kernel. Fino al kernel 2.4 si faceva infatti riferimento al +momento dell'avvio del kernel. Con il kernel 2.6 si fa riferimento a +$2^{32}/\mathtt{HZ}-300$ secondi prima dell'avvio. + +Considerato che il numero dei \textit{clock tick} per un kernel che è attivo +da molto tempo può eccedere le dimensioni per il tipo \type{clock\_t} il +comportamento più opportuno per i programmi è di ignorare comunque il valore +di ritorno della funzione e ricorrere alle funzioni per il tempo di calendario +del prossimo paragrafo qualora si voglia calcolare il tempo effettivamente +trascorso dall'inizio del programma. + +Infine si tenga presente che per dei limiti nelle convenzioni per il ritorno +dei valori delle \textit{system call} su alcune architetture hardware (ed in +particolare la \texttt{i386} dei PC a 32 bit) nel kernel della serie 2.6 il +valore di ritorno della funzione può risultare erroneamente uguale a $-1$, +indicando un errore, nei primi secondi dopo il boot (per la precisione nei +primi 41 secondi) e se il valore del contatore eccede le dimensione del tipo +\type{clock\_t}. \subsection{Le funzioni per il \textit{calendar time}} \label{sec:sys_time_base} -Come anticipato in \secref{sec:sys_unix_time} il \textit{calendar time} è -mantenuto dal kernel in una variabile di tipo \type{time\_t}, che usualmente -corrisponde ad un tipo nativo (in Linux è un intero a 32 bit). Il valore -corrente del \textit{calendar time} può essere ottenuto con la funzione -\func{time} che lo restituisce in nel suddetto formato; il suo prototipo è: -\begin{prototype}{time.h}{time\_t time(time\_t *t)} - Legge il valore corrente del \textit{calendar time}. - - \bodydesc{La funzione ritorna valore del \textit{calendar time} in caso di - successo e -1 in caso di errore, che può essere solo \macro{EFAULT}.} -\end{prototype} -\noindent dove \param{t}, se non nullo, è l'indirizzo su cui salvare il valore -di ritorno. - -Analoga a \func{time} è la funzione \func{stime} che serve per effettuare -l'operazione inversa, e cioè per settare l'orologio di sistema; il suo -prototipo è: -\begin{prototype}{time.h}{int stime(time\_t *t)} - Setta a \param{t} il valore corrente del \textit{calendar time}. - - \bodydesc{La funzione ritorna 0 in caso di successo e -1 in caso di errore, - che può essere \macro{EFAULT} o \macro{EPERM}.} -\end{prototype} +\itindbeg{calendar~time} + +Come anticipato in sez.~\ref{sec:sys_unix_time} il \textit{calendar time} +viene espresso normalmente con una variabile di tipo \type{time\_t}, che +usualmente corrisponde ad un tipo elementare; in Linux è definito come +\ctyp{long int}, che di norma corrisponde a 32 bit. Il valore corrente del +\textit{calendar time}, che indicheremo come \textsl{tempo di sistema}, può +essere ottenuto con la funzione \funcd{time} che lo restituisce nel suddetto +formato, il suo prototipo è: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{time\_t time(time\_t *t)} +\fdesc{Legge il valore corrente del \textit{calendar time}.} +} + +{La funzione ritorna il valore del \textit{calendar time} in caso di successo + e $-1$ per un errore, nel qual caso \var{errno} potrà assumere solo il + valore \errval{EFAULT} nel suo significato generico.} +\end{funcproto} + +L'argomento \param{t}, se non nullo, deve essere l'indirizzo di una variabile +su cui duplicare il valore di ritorno. + +Analoga a \func{time} è la funzione \funcd{stime} che serve per effettuare +l'operazione inversa, e cioè per impostare il tempo di sistema qualora questo +sia necessario; il suo prototipo è: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{int stime(time\_t *t)} +\fdesc{Imposta il valore corrente del \textit{calendar time}.} +} + +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EPERM}] non si hanno i permessi di amministrazione. + \end{errlist} + ed inoltre \errval{EFAULT} nel suo significato generico.} +\end{funcproto} + + +Dato che modificare l'ora ha un impatto su tutto il sistema il cambiamento +dell'orologio è una operazione privilegiata e questa funzione può essere usata +solo da un processo con i privilegi di amministratore (per la precisione la +\textit{capability} \const{CAP\_SYS\_TIME}), altrimenti la chiamata fallirà +con un errore di \errcode{EPERM}. + +Data la scarsa precisione nell'uso di \type{time\_t}, che ha una risoluzione +massima di un secondo, quando si devono effettuare operazioni sui tempi di +norma l'uso delle due funzioni precedenti è sconsigliato, ed esse sono di +solito sostituite da \funcd{gettimeofday} e \funcd{settimeofday},\footnote{le + due funzioni \func{time} e \func{stime} sono più antiche e derivano da SVr4, + \func{gettimeofday} e \func{settimeofday} sono state introdotte da BSD, ed + in BSD4.3 sono indicate come sostitute delle precedenti, \func{gettimeofday} + viene descritta anche in POSIX.1-2001.} i cui prototipi sono: + +\begin{funcproto}{ +\fhead{sys/time.h} +\fhead{time.h} +\fdecl{int gettimeofday(struct timeval *tv, struct timezone *tz)} +\fdesc{Legge il tempo corrente del sistema.} +\fdecl{int settimeofday(const struct timeval *tv, const struct timezone *tz)} +\fdesc{Imposta il tempo di sistema.} +} + +{La funzioni ritornano $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà i valori \errval{EINVAL}, \errval{EFAULT} e per + \func{settimeofday} anche \errval{EPERM}, nel loro significato generico.} +\end{funcproto} + + +Si noti come queste funzioni utilizzino per indicare il tempo una struttura di +tipo \struct{timeval}, la cui definizione si è già vista in +fig.~\ref{fig:sys_timeval_struct}, questa infatti permette una espressione +alternativa dei valori del \textit{calendar time}, con una precisione, +rispetto a \type{time\_t}, fino al microsecondo, ma la precisione è solo +teorica, e la precisione reale della misura del tempo dell'orologio di sistema +non dipende dall'uso di queste strutture. + +Come nel caso di \func{stime} anche \func{settimeofday} può essere utilizzata +solo da un processo coi privilegi di amministratore e più precisamente con la +capacità \const{CAP\_SYS\_TIME}. Si tratta comunque di una condizione generale +che continua a valere per qualunque funzione che vada a modificare l'orologio +di sistema, comprese tutte quelle che tratteremo in seguito. + +\itindbeg{timezone} + +Il secondo argomento di entrambe le funzioni è una struttura +\struct{timezone}, che storicamente veniva utilizzata per specificare appunto +la cosiddetta \textit{timezone}, cioè l'insieme del fuso orario e delle +convenzioni per l'ora legale che permettevano il passaggio dal tempo +universale all'ora locale. Questo argomento oggi è obsoleto ed in Linux non è +mai stato utilizzato; esso non è supportato né dalla vecchia \textsl{libc5}, +né dalla \textsl{glibc}: pertanto quando si chiama questa funzione deve essere +sempre impostato a \val{NULL}. + +\itindbeg{timezone} + +Modificare l'orologio di sistema con queste funzioni è comunque problematico, +in quanto esse effettuano un cambiamento immediato. Questo può creare dei +buchi o delle ripetizioni nello scorrere dell'orologio di sistema, con +conseguenze indesiderate. Ad esempio se si porta avanti l'orologio si possono +perdere delle esecuzioni di \cmd{cron} programmate nell'intervallo che si è +saltato. Oppure se si porta indietro l'orologio si possono eseguire due volte +delle operazioni previste nell'intervallo di tempo che viene ripetuto. + +Per questo motivo la modalità più corretta per impostare l'ora è quella di +usare la funzione \funcd{adjtime}, il cui prototipo è: + +\begin{funcproto}{ +\fhead{sys/time.h} +\fdecl{int adjtime(const struct timeval *delta, struct timeval *olddelta)} +\fdesc{Aggiusta l'orologio di sistema.} +} -Dato che modificare l'ora ha un impatto su tutto il sistema, la funzione può -essere usata solo dall'ammninistratore. +{La funzione ritorna $0$ in caso di successo e $-1$ per un errore, nel qual + caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EINVAL}] il valore di \param{delta} eccede il massimo + consentito. + \item[\errcode{EPERM}] il processo non i privilegi di amministratore. + \end{errlist} +} +\end{funcproto} + + +Questa funzione permette di avere un aggiustamento graduale del tempo di +sistema in modo che esso sia sempre crescente in maniera monotona. Il valore +indicato nella struttura \struct{timeval} puntata da \param{delta} esprime il +valore di cui si vuole spostare l'orologio. Se è positivo l'orologio sarà +accelerato per un certo tempo in modo da guadagnare il tempo richiesto, +altrimenti sarà rallentato. + +La funzione è intesa per piccoli spostamenti del tempo di sistema, ed esistono +pertanto dei limiti massimi per i valori che si possono specificare +per \param{delta}. La \acr{glibc} impone un intervallo compreso fra +\code{INT\_MIN/1000000 + 2} e \code{INT\_MAX/1000000 - 2}, corrispondente, su +una architettura PC ordinaria a 32 bit, ad un valore compreso fra $-2145$ e +$2145$ secondi. + +Inoltre se si invoca la funzione prima che una precedente richiesta di +aggiustamento sia stata completata, specificando un altro valore, il +precedente aggiustamento viene interrotto, ma la parte dello stesso che è già +stata completata non viene rimossa. Però è possibile in questo caso farsi +restituire nella struttura puntata da \param{olddelta} il tempo restante della +precedente richiesta. Fino al kernel 2.6.26 ed alla \acr{glibc} 2.8 questo +però era possibile soltanto specificando un diverso aggiustamento +per \param{delta}, il bug è stato corretto a partire dalle versioni citate e +si può ottenere l'informazione relativa alla frazione di aggiustamento +mancante usando il valore \val{NULL} per \param{delta}. + +Linux poi prevede una specifica funzione di sistema che consente un +aggiustamento molto più dettagliato del tempo, permettendo ad esempio anche di +regolare anche la velocità e le derive dell'orologio di sistema. La funzione +è \funcd{adjtimex} ed il suo prototipo è: + +\begin{funcproto}{ +\fhead{sys/timex.h} +\fdecl{int adjtimex(struct timex *buf)} +\fdesc{Regola l'orologio di sistema.} +} + +{La funzione ritorna lo stato dell'orologio (un valore $\ge 0$) in caso di + successo e $-1$ per un errore, nel qual caso \var{errno} assumerà uno dei + valori: + \begin{errlist} + \item[\errcode{EINVAL}] si sono indicati valori fuori dall'intervallo + consentito per qualcuno dei campi di \param{buf}. + \item[\errcode{EPERM}] si è richiesta una modifica dei parametri ed il + processo non ha i privilegi di amministratore. + \end{errlist} + ed inoltre \errval{EFAULT} nel suo significato generico.} +\end{funcproto} +In caso di successo la funzione restituisce un valore numerico non negativo +che indica lo stato dell'orologio, che può essere controllato con i valori +delle costanti elencate in tab.~\ref{tab:adjtimex_return}. -Dato che il tempo misurato in termini di\type{time\_t} ha comunque una -risoluzione massima di un secondo le \acr{glibc} provvedono delle -rappresentazioni alternative che consentono di indicare intervalli o tempi con -precisioni maggiori del secondo, queste sono realizzate attraverso le -strutture \var{timeval} e \var{timespec}, le cui definizioni sono riportate in -\figref{fig:sys_timeval_struct}, che consentono rispettivamente precisioni del -microsecondo e del nanosecondo\footnote{la precisione è solo astratta, - l'orologio di sistema normalmente non è in grado di misuare dei tempi con - precisioni simili.}. +\begin{table}[!htb] + \footnotesize + \centering + \begin{tabular}[c]{|l|c|l|} + \hline + \textbf{Nome} & \textbf{Valore} & \textbf{Significato}\\ + \hline + \hline + \constd{TIME\_OK} & 0 & Orologio sincronizzato.\\ + \constd{TIME\_INS} & 1 & Inserimento di un \textit{leap second}.\\ + \constd{TIME\_DEL} & 2 & Cancellazione di un \textit{leap second}.\\ + \constd{TIME\_OOP} & 3 & \textit{leap second} in corso.\\ + \constd{TIME\_WAIT} & 4 & \textit{leap second} avvenuto.\\ + \constd{TIME\_BAD} & 5 & Orologio non sincronizzato.\\ + \hline + \end{tabular} + \caption{Possibili valori ritornati da \func{adjtimex} in caso di successo.} + \label{tab:adjtimex_return} +\end{table} +La funzione richiede come argomento il puntatore ad una struttura di tipo +\struct{timex}, la cui definizione, effettuata in \headfiled{sys/timex.h}, è +riportata in fig.~\ref{fig:sys_timex_struct} per i campi che interessano la +possibilità di essere modificati documentati anche nella pagina di manuale. In +realtà la struttura è stata estesa con ulteriori campi, i cui valori sono +utilizzabili solo in lettura, la cui definizione si può trovare direttamente \begin{figure}[!htb] + \footnotesize \centering + \begin{minipage}[c]{\textwidth} + \includestruct{listati/timex.h} + \end{minipage} + \normalsize + \caption{La struttura \structd{timex} per il controllo dell'orologio di + sistema.} + \label{fig:sys_timex_struct} +\end{figure} + +L'azione della funzione dipende dal valore del campo \var{mode} +di \param{buf}, che specifica quale parametro dell'orologio di sistema, +specificato nel corrispondente campo di \struct{timex}, deve essere +impostato. Un valore nullo serve per leggere i parametri correnti, i valori +diversi da zero devono essere specificati come OR binario delle costanti +riportate in tab.~\ref{tab:sys_timex_mode}. + +\begin{table}[!htb] \footnotesize \centering - \begin{minipage}[c]{15cm} - \begin{lstlisting}[labelstep=0]{}%,frame=,indent=1cm]{} -struct timeval -{ - long tv_sec; /* seconds */ - long tv_usec; /* microseconds */ -}; -struct timespec { - time_t tv_sec; /* seconds */ - long tv_nsec; /* nanoseconds */ -}; - \end{lstlisting} + \begin{tabular}[c]{|l|c|p{8cm}|} + \hline + \textbf{Nome} & \textbf{Valore} & \textbf{Significato}\\ + \hline + \hline + \constd{ADJ\_OFFSET} & 0x0001 & Imposta la differenza fra il tempo + reale e l'orologio di sistema: + deve essere indicata in microsecondi + nel campo \var{offset} di + \struct{timex}.\\ + \constd{ADJ\_FREQUENCY} & 0x0002 & Imposta la differenza in frequenza + fra il tempo reale e l'orologio di + sistema: deve essere indicata + in parti per milione nel campo + \var{frequency} di \struct{timex}.\\ + \constd{ADJ\_MAXERROR} & 0x0004 & Imposta il valore massimo + dell'errore sul tempo, espresso in + microsecondi nel campo + \var{maxerror} di \struct{timex}.\\ + \constd{ADJ\_ESTERROR} & 0x0008 & Imposta la stima dell'errore + sul tempo, espresso in microsecondi + nel campo \var{esterror} di + \struct{timex}.\\ + \constd{ADJ\_STATUS} & 0x0010 & Imposta alcuni valori di stato + interni usati dal + sistema nella gestione + dell'orologio specificati nel campo + \var{status} di \struct{timex}.\\ + \constd{ADJ\_TIMECONST} & 0x0020 & Imposta la larghezza di banda del + PLL implementato dal kernel, + specificato nel campo + \var{constant} di \struct{timex}.\\ + \constd{ADJ\_TICK} & 0x4000 & Imposta il valore dei \textit{tick} + del timer in + microsecondi, espresso nel campo + \var{tick} di \struct{timex}.\\ + \constd{ADJ\_OFFSET\_SINGLESHOT}&0x8001&Chiede uno spostamento una tantum + dell'orologio secondo il valore del + campo \var{offset} simulando il + comportamento di \func{adjtime}.\\ + \hline + \end{tabular} + \caption{Costanti per l'assegnazione del valore del campo \var{mode} della + struttura \struct{timex}.} + \label{tab:sys_timex_mode} +\end{table} + +La funzione utilizza il meccanismo di David L. Mills, descritto +nell'\href{http://www.ietf.org/rfc/rfc1305.txt}{RFC~1305}, che è alla base del +protocollo NTP. La funzione è specifica di Linux e non deve essere usata se la +portabilità è un requisito, la \acr{glibc} provvede anche un suo omonimo +\func{ntp\_adjtime}. La trattazione completa di questa funzione necessita di +una lettura approfondita del meccanismo descritto nell'RFC~1305, ci limitiamo +a descrivere in tab.~\ref{tab:sys_timex_mode} i principali valori utilizzabili +per il campo \var{mode}, un elenco più dettagliato del significato dei vari +campi della struttura \struct{timex} può essere ritrovato in \cite{GlibcMan}. + +Il valore delle costanti per \var{mode} può essere anche espresso, secondo la +sintassi specificata per la forma equivalente di questa funzione definita come +\func{ntp\_adjtime}, utilizzando il prefisso \code{MOD} al posto di +\code{ADJ}. + +Si tenga presente infine che con l'introduzione a partire dal kernel 2.6.21 +degli \textit{high-resolution timer} ed il supporto per i cosiddetti POSIX +\textit{real-time clock}, si può ottenere il \textit{calendar time} +direttamente da questi, come vedremo in sez.~\ref{sec:sig_timer_adv}, con la +massima risoluzione possibile per l'hardware della macchina. + + + +\subsection{La gestione delle date.} +\label{sec:sys_date} + +\itindbeg{broken-down~time} + +Le funzioni viste al paragrafo precedente sono molto utili per trattare le +operazioni elementari sui tempi, però le rappresentazioni del tempo ivi +illustrate, se han senso per specificare un intervallo, non sono molto +intuitive quando si deve esprimere un'ora o una data. Per questo motivo è +stata introdotta una ulteriore rappresentazione, detta \textit{broken-down + time}, che permette appunto di \textsl{suddividere} il \textit{calendar + time} usuale in ore, minuti, secondi, ecc. e viene usata tenendo conto +anche dell'eventuale utilizzo di un fuso orario. + +\begin{figure}[!htb] + \footnotesize \centering + \begin{minipage}[c]{.8\textwidth} + \includestruct{listati/tm.h} \end{minipage} \normalsize - \caption{Le strutture \var{timeval} e \var{timespec} per il calendar time.} - \label{fig:sys_timeval_struct} + \caption{La struttura \structd{tm} per una rappresentazione del tempo in + termini di ora, minuti, secondi, ecc.} + \label{fig:sys_tm_struct} \end{figure} -Data la scarsa precisione nell'uso di \type{time\_t} per le operazioni sui -tempi di norma l'uso delle funzioni precedenti è di norma sconsigliato, ed -esse sono di solito sostituite da \func{gettimeofday} e \func{settimeofday} +Questo viene effettuato attraverso una opportuna struttura \struct{tm}, la cui +definizione è riportata in fig.~\ref{fig:sys_tm_struct}, ed è in genere questa +struttura che si utilizza quando si deve specificare un tempo a partire dai +dati naturali (ora e data), dato che essa consente anche di tenere conto della +gestione del fuso orario e dell'ora legale. In particolare gli ultimi due +campi, \var{tm\_gmtoff} e \var{tm\_zone}, sono estensioni previste da BSD e +supportate dalla \acr{glibc} quando è definita la macro \macro{\_BSD\_SOURCE}. + +Ciascuno dei campi di \struct{tm} ha dei precisi intervalli di valori +possibili, con convenzioni purtroppo non troppo coerenti. Ad esempio +\var{tm\_sec} che indica i secondi deve essere nell'intervallo da 0 a 59, ma è +possibile avere anche il valore 60 per un cosiddetto \textit{leap second} (o +\textsl{secondo intercalare}), cioè uno di quei secondi aggiunti al calcolo +dell'orologio per effettuare gli aggiustamenti del calendario per tenere conto +del disallineamento con il tempo solare.\footnote{per dettagli si consulti + \url{http://it.wikipedia.org/wiki/Leap_second}.} + +I campi \var{tm\_min} e\var{tm\_hour} che indicano rispettivamente minuti ed +ore hanno valori compresi rispettivamente fra 0 e 59 e fra 0 e 23. Il campo +\var{tm\_mday} che indica il giorno del mese prevede invece un valore compreso +fra 1 e 31, ma la \acr{glibc} supporta pure il valore 0 come indicazione +dell'ultimo giorno del mese precedente. Il campo \var{tm\_mon} indica il mese +dell'anno a partire da gennaio con valori compresi fra 0 e 11. + +I campi \var{tm\_wday} e \var{tm\_yday} indicano invece rispettivamente il +giorno della settimana, a partire dalla Domenica, ed il giorno dell'anno, a +partire del primo gennaio, ed hanno rispettivamente valori compresi fra 0 e 6 +e fra 0 e 365. L'anno espresso da \var{tm\_year} viene contato come numero di +anni a partire dal 1900. Infine \var{tm\_isdst} è un valore che indica se per +gli altri campi si intende come attiva l'ora legale ed influenza il +comportamento di \func{mktime}. + + +Le funzioni per la gestione del \textit{broken-down time} sono varie e vanno +da quelle usate per convertire gli altri formati in questo, usando o meno +l'ora locale o il tempo universale, a quelle per trasformare il valore di un +tempo in una stringa contenente data ed ora. Le prime due funzioni, +\funcd{asctime} e \funcd{ctime} servono per poter stampare in forma leggibile +un tempo, i loro prototipi sono: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{char * asctime(const struct tm *tm)} +\fdesc{Converte un \textit{broken-down time} in una stringa.} +\fdecl{char * ctime(const time\_t *timep)} +\fdesc{Converte un \textit{calendar time} in una stringa.} +} +{Le funzioni ritornano un puntatore al risultato in caso di successo e + \val{NULL} per un errore, \var{errno} non viene modificata.} +\end{funcproto} + +Le funzioni prendono rispettivamente come argomenti i puntatori ad una +struttura \struct{tm} contenente un \textit{broken-down time} o ad una +variabile di tipo \type{time\_t} che esprime il \textit{calendar time}, +restituendo il puntatore ad una stringa che esprime la data, usando le +abbreviazioni standard di giorni e mesi in inglese, nella forma: +\begin{Example} +Sun Apr 29 19:47:44 2012\n" +\end{Example} + +Nel caso di \func{ctime} la funzione tiene conto della eventuale impostazione +di una \textit{timezone} e effettua una chiamata preventiva a \func{tzset} +(che vedremo a breve), in modo che la data espressa tenga conto del fuso +orario. In realtà \func{ctime} è banalmente definita in termini di +\func{asctime} come \code{asctime(localtime(t)}. + +Dato che l'uso di una stringa statica rende le funzioni non rientranti +POSIX.1c e SUSv2 prevedono due sostitute rientranti, il cui nome è al solito +ottenuto aggiungendo un \code{\_r}, che prendono un secondo argomento +\code{char *buf}, in cui l'utente deve specificare il buffer su cui la stringa +deve essere copiata (deve essere di almeno 26 caratteri). + +Per la conversione fra \textit{broken-down time} e \textit{calendar time} sono +invece disponibili altre tre funzioni, \funcd{gmtime}, \funcd{localtime} e +\funcd{mktime} i cui prototipi sono: + +\begin{funcproto}{ +\fdecl{struct tm * gmtime(const time\_t *timep)} +\fdesc{Converte un \textit{calendar time} in un \textit{broken-down time} in + UTC.} +\fdecl{struct tm * localtime(const time\_t *timep)} +\fdesc{Converte un \textit{calendar time} in un \textit{broken-down time} + nell'ora locale.} +\fdecl{time\_t mktime(struct tm *tm)} +\fdesc{Converte un \textit{broken-down time} in un \textit{calendar time}.} +} +{Le funzioni ritornano un puntatore al risultato in caso di successo e + \val{NULL} per un errore, tranne che \func{mktime} che restituisce + direttamente il valore o $-1$ in caso di errore, \var{errno} non viene + modificata.} +\end{funcproto} + +Le le prime funzioni, \func{gmtime}, \func{localtime} servono per convertire +il tempo in \textit{calendar time} specificato da un argomento di tipo +\type{time\_t} restituendo un \textit{broken-down time} con il puntatore ad +una struttura \struct{tm}. La prima effettua la conversione senza tenere conto +del fuso orario, esprimendo la data in tempo coordinato universale (UTC), cioè +l'ora di Greenwich, mentre \func{localtime} usa l'ora locale e per questo +effettua una chiamata preventiva a \func{tzset}. + +Anche in questo caso le due funzioni restituiscono l'indirizzo di una +struttura allocata staticamente, per questo sono state definite anche altre +due versioni rientranti (con la solita estensione \code{\_r}), che prevedono +un secondo argomento \code{struct tm *result}, fornito dal chiamante, che deve +preallocare la struttura su cui sarà restituita la conversione. La versione +rientrante di \func{localtime} però non effettua la chiamata preventiva a +\func{tzset} che deve essere eseguita a cura dell'utente. + +Infine \func{mktime} esegue la conversione di un \textit{broken-down time} a +partire da una struttura \struct{tm} restituendo direttamente un valore di +tipo \type{time\_t} con il \textit{calendar time}. La funzione ignora i campi +\var{tm\_wday} e \var{tm\_yday} e per gli altri campi normalizza eventuali +valori fuori degli intervalli specificati in precedenza: se cioè si indica un +12 per \var{tm\_mon} si prenderà il gennaio dell'anno successivo. Inoltre la +funzione tiene conto del valore di \var{tm\_isdst} per effettuare le +correzioni relative al fuso orario: un valore positivo indica che deve essere +tenuta in conto l'ora legale, un valore nullo che non deve essere applicata +nessuna correzione, un valore negativo che si deve far ricorso alle +informazioni relative al proprio fuso orario per determinare lo stato dell'ora +legale. + +La funzione inoltre modifica i valori della struttura \struct{tm} in forma di +\textit{value result argument}, normalizzando i valori dei vari campi, +impostando i valori risultanti per \var{tm\_wday} e \var{tm\_yday} e +assegnando a \var{tm\_isdst} il valore (positivo o nullo) corrispondente allo +stato dell'ora legale. La funzione inoltre provvede ad impostare il valore +della variabile globale \var{tzname}. + +\itindend{calendar~time} -\subsection{Le \textit{timezone} e la gestione delle date.} -\label{sec:sys_time_base} +\begin{figure}[!htb] + \footnotesize + \centering + \begin{minipage}[c]{.75\textwidth} + \includestruct{listati/time_zone_var.c} + \end{minipage} + \normalsize + \caption{Le variabili globali usate per la gestione delle + \textit{timezone}.} + \label{fig:sys_tzname} +\end{figure} + +Come accennato l'uso del \textit{broken-down time} permette di tenere conto +anche della differenza fra tempo universale e ora locale, compresa l'eventuale +ora legale. Questo viene fatto dalle funzioni di conversione grazie alle +informazioni riguardo la propria \textit{timezone} mantenute nelle tre +variabili globali mostrate in fig.~\ref{fig:sys_tzname}, cui si può accedere +direttamente includendo \headfile{time.h}. Come illustrato queste variabili +vengono impostate internamente da alcune delle precedenti funzioni di +conversione, ma lo si può fare esplicitamente chiamando direttamente la +funzione \funcd{tzset}, il cui prototipo è: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{void tzset(void)} +\fdesc{Imposta le variabili globali della \textit{timezone}.} +} + +{La funzione non ritorna niente e non dà errori.} +\end{funcproto} + +La funzione inizializza le variabili di fig.~\ref{fig:sys_tzname} a partire +dal valore della variabile di ambiente \envvar{TZ}, se quest'ultima non è +definita verrà usato il file \conffiled{/etc/localtime}. La variabile +\var{tzname} contiene due stringhe, che indicano i due nomi standard della +\textit{timezone} corrente. La prima è il nome per l'ora solare, la seconda +per l'ora legale. Anche se in fig.~\ref{fig:sys_tzname} sono indicate come +\code{char *} non è il caso di modificare queste stringhe. La variabile +\var{timezone} indica la differenza di fuso orario in secondi, mentre +\var{daylight} indica se è attiva o meno l'ora legale. + +Benché la funzione \func{asctime} fornisca la modalità più immediata per +stampare un tempo o una data, la flessibilità non fa parte delle sue +caratteristiche; quando si vuole poter stampare solo una parte (l'ora, o il +giorno) di un tempo si può ricorrere alla più sofisticata \funcd{strftime}, +il cui prototipo è: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{size\_t strftime(char *s, size\_t max, const char *format, + const struct tm *tm)} +\fdesc{Crea una stringa con una data secondo il formato indicato.} +} + +{La funzione ritorna il numero di caratteri inseriti nella stringa \param{s} + oppure $0$, \var{errno} non viene modificata.} +\end{funcproto} + + +La funzione converte il \textit{broken-down time} indicato nella struttura +puntata dall'argomento \param{tm} in una stringa di testo da salvare +all'indirizzo puntato dall'argomento \param{s}, purché essa sia di dimensione +inferiore al massimo indicato dall'argomento \param{max}. Il numero di +caratteri generati dalla funzione viene restituito come valore di ritorno, +senza tener però conto del terminatore finale, che invece viene considerato +nel computo della dimensione. Se quest'ultima è eccessiva viene restituito 0 e +lo stato di \param{s} è indefinito. + +\begin{table}[htb] + \footnotesize + \centering + \begin{tabular}[c]{|c|l|p{6cm}|} + \hline + \textbf{Modificatore} & \textbf{Esempio} & \textbf{Significato}\\ + \hline + \hline + \var{\%a}&\texttt{Wed} & Nome del giorno, abbreviato.\\ + \var{\%A}&\texttt{Wednesday} & Nome del giorno, completo.\\ + \var{\%b}&\texttt{Apr} & Nome del mese, abbreviato.\\ + \var{\%B}&\texttt{April} & Nome del mese, completo.\\ + \var{\%c}&\texttt{Wed Apr 24 18:40:50 2002}& Data e ora.\\ + \var{\%d}&\texttt{24} & Giorno del mese.\\ + \var{\%H}&\texttt{18} & Ora del giorno, da 0 a 24.\\ + \var{\%I}&\texttt{06} & Ora del giorno, da 0 a 12.\\ + \var{\%j}&\texttt{114} & Giorno dell'anno.\\ + \var{\%m}&\texttt{04} & Mese dell'anno.\\ + \var{\%M}&\texttt{40} & Minuto.\\ + \var{\%p}&\texttt{PM} & AM/PM.\\ + \var{\%S}&\texttt{50} & Secondo.\\ + \var{\%U}&\texttt{16} & Settimana dell'anno (partendo dalla + domenica).\\ + \var{\%w}&\texttt{3} & Giorno della settimana.\\ + \var{\%W}&\texttt{16} & Settimana dell'anno (partendo dal + lunedì).\\ + \var{\%x}&\texttt{04/24/02} & La data.\\ + \var{\%X}&\texttt{18:40:50} & L'ora.\\ + \var{\%y}&\texttt{02} & Anno nel secolo.\\ + \var{\%Y}&\texttt{2002} & Anno.\\ + \var{\%Z}&\texttt{CEST} & Nome della \textit{timezone}.\\ + \var{\%\%}&\texttt{\%} & Il carattere \%.\\ + \hline + \end{tabular} + \caption{Valori previsti dallo standard ANSI C per modificatore della + stringa di formato di \func{strftime}.} + \label{tab:sys_strftime_format} +\end{table} + +Il risultato della funzione è controllato dalla stringa di formato +\param{format}, tutti i caratteri restano invariati eccetto \texttt{\%} che +viene utilizzato come modificatore. Alcuni dei possibili valori che esso può +assumere sono riportati in tab.~\ref{tab:sys_strftime_format}.\footnote{per la + precisione si sono riportati definiti dallo standard ANSI C, che sono anche + quelli ripresi in POSIX.1; la \acr{glibc} fornisce anche le estensioni + introdotte da POSIX.2 per il comando \cmd{date}, i valori introdotti da + SVID3 e ulteriori estensioni GNU; l'elenco completo dei possibili valori è + riportato nella pagina di manuale della funzione.} La funzione tiene conto +anche delle eventuali impostazioni di localizzazione per stampare i vari nomi +in maniera adeguata alla lingua scelta, e con le convenzioni nazionali per i +formati di data ed ora. + +Infine per effettuare l'operazione di conversione inversa, da una stringa ad +un \textit{broken-down time}, si può utilizzare la funzione \funcd{strptime}, +il cui prototipo è: + +\begin{funcproto}{ +\fhead{time.h} +\fdecl{char *strptime(const char *s, const char *format, struct tm *tm)} +\fdesc{Converte una stringa con in un \textit{broken-down time} secondo un + formato.} +} + +{La funzione ritorna il puntatore al primo carattere non processato della + stringa o al terminatore finale qualora questa sia processata interamente, + \var{errno} non viene modificata.} +\end{funcproto} +La funzione processa la stringa puntata dall'argomento \param{s} da sinistra a +destra, utilizzando il formato contenuto nella stringa puntata +dall'argomento \param{format}, avvalorando volta volta i corrispondenti campi +della struttura puntata dall'argomento \param{tm}. La scansione si interrompe +immediatamente in caso di mancata corrispondenza a quanto indicato nella +stringa di formato, che usa una sintassi analoga a quella già vista per +\func{strftime}. La funzione supporta i modificatori di +tab.~\ref{tab:sys_strftime_format} più altre estensioni, ma per i dettagli a +questo riguardo si rimanda alla lettura della pagina di manuale. +Si tenga presente comunque che anche in caso di scansione completamente +riuscita la funzione sovrascrive soltanto i campi di \param{tm} indicati dal +formato, la struttura originaria infatti non viene inizializzati e gli altri +campi restano ai valori che avevano in precedenza. + + +\itindend{broken-down~time} \section{La gestione degli errori} \label{sec:sys_errors} -La gestione degli errori è in genere una materia complessa. Inoltre il modello -utilizzato dai sistema unix-like è basato sull'architettura a processi, e -presenta una serie di problemi nel caso lo si debba usare con i thread. -Esamineremo in questa sezione le sue caratteristiche principali. +In questa sezione esamineremo le caratteristiche principali della gestione +degli errori in un sistema unix-like. Infatti a parte il caso particolare di +alcuni segnali (che tratteremo in cap.~\ref{cha:signals}) in un sistema +unix-like il kernel non avvisa mai direttamente un processo dell'occorrenza di +un errore nell'esecuzione di una funzione, ma di norma questo viene riportato +semplicemente usando un opportuno valore di ritorno della funzione invocata. +Inoltre il sistema di classificazione degli errori è stato progettato +sull'architettura a processi, e presenta una serie di problemi nel caso lo si +debba usare con i \textit{thread}. \subsection{La variabile \var{errno}} \label{sec:sys_errno} Quasi tutte le funzioni delle librerie del C sono in grado di individuare e -riportare condizioni di errore, ed è una buona norma di programmazione -controllare sempre che le funzioni chiamate si siano concluse correttamente. +riportare condizioni di errore, ed è una norma fondamentale di buona +programmazione controllare \textsl{sempre} che le funzioni chiamate si siano +concluse correttamente. In genere le funzioni di libreria usano un valore speciale per indicare che -c'è stato un errore. Di solito questo valore è -1 o un puntatore nullo o la -costante \macro{EOF} (a seconda della funzione); ma questo valore segnala solo -che c'è stato un errore, non il tipo di errore. +c'è stato un errore. Di solito questo valore, a seconda della funzione, è $-1$ +o un puntatore nullo o la costante \val{EOF}; ma questo valore segnala solo +che c'è stato un errore, e non il tipo di errore. Per riportare il tipo di errore il sistema usa la variabile globale -\var{errno},\footnote{L'uso di una variabile globale può comportare alcuni - problemi (ad esempio nel caso dei thread) ma lo standard ISO C consente - anche di definire \var{errno} come un \textit{modifiable lvalue}, quindi si - può anche usare una macro, e questo è infatti il modo usato da Linux per - renderla locale ai singoli thread.} definita nell'header \file{errno.h}; la -variabile è in genere definita come \ctyp{volatile} dato che può essere -cambiata in modo asincrono da un segnale (si veda \ref{sec:sig_sigchld} per un -esempio, ricordando quanto trattato in \ref{sec:proc_race_cond}), ma dato che -un manipolatore di segnale scritto bene salva e ripristina il valore della -variabile, di questo non è necessario preoccuparsi nella programmazione -normale. - -I valori che può assumere \var{errno} sono riportati in \capref{cha:errors}, -nell'header \file{errno.h} sono anche definiti i nomi simbolici per le -costanti numeriche che identificano i vari errori; essi iniziano tutti per -\macro{E} e si possono considerare come nomi riservati. In seguito faremo -sempre riferimento a tali valori, quando descriveremo i possibili errori -restituiti dalle funzioni. Il programma di esempio \cmd{errcode} stampa il -codice relativo ad un valore numerico con l'opzione \cmd{-l}. - -Il valore di \var{errno} viene sempre settato a zero all'avvio di un -programma, gran parte delle funzioni di libreria settano \var{errno} ad un -valore diverso da zero in caso di errore. Il valore è invece indefinito in -caso di successo, perché anche se una funzione ha successo, può chiamarne -altre al suo interno che falliscono, modificando così \var{errno}. - -Pertanto un valore non nullo di \var{errno} non è sintomo di errore (potrebbe -essere il risultato di un errore precedente) e non lo si può usare per -determinare quando o se una chiamata a funzione è fallita. La procedura da -seguire è sempre quella di controllare \var{errno} immediatamente dopo aver -verificato il fallimento della funzione attraverso il suo codice di ritorno. +\var{errno}, definita nell'header \headfile{errno.h}. Come accennato l'uso di +una variabile globale può comportare problemi nel caso dei \textit{thread}, ma +lo standard ISO C consente anche di definire \var{errno} come un cosiddetto +``\textit{modifiable lvalue}'', cosa che consente di usare anche una macro, e +questo è infatti il metodo usato da Linux per renderla locale ai singoli +\textit{thread}. + +La variabile è in genere definita come \dirct{volatile} dato che può essere +cambiata in modo asincrono da un segnale, per un esempio si veda +sez.~\ref{sec:sig_sigchld} ricordando quanto trattato in +sez.~\ref{sec:proc_race_cond}). Dato che un gestore di segnale scritto bene si +cura di salvare e ripristinare il valore della variabile all'uscita, nella +programmazione normale, quando si può fare l'assunzione che i gestori di +segnali siano ben scritti, di questo non è necessario preoccuparsi. + +I valori che può assumere \var{errno} sono riportati in app.~\ref{cha:errors}, +nell'header \headfile{errno.h} sono anche definiti i nomi simbolici per le +costanti numeriche che identificano i vari errori che abbiamo citato fin +dall'inizio nelle descrizioni delle funzioni. Essi iniziano tutti per \val{E} +e si possono considerare come nomi riservati, per questo abbiamo sempre fatto +riferimento a questi nomi, e lo faremo più avanti quando descriveremo i +possibili errori restituiti dalle funzioni. Il programma di esempio +\cmd{errcode} stampa il codice relativo ad un valore numerico con l'opzione +\cmd{-l}. + +Il valore di \var{errno} viene sempre impostato a zero all'avvio di un +programma, e la gran parte delle funzioni di libreria impostano \var{errno} ad +un valore diverso da zero in caso di errore. Il valore è invece indefinito in +caso di successo, perché anche se una funzione di libreria ha successo, +potrebbe averne chiamate altre al suo interno che potrebbero essere fallite +anche senza compromettere il risultato finale, modificando però \var{errno}. + +Pertanto un valore non nullo di \var{errno} non è sintomo di errore (potrebbe +essere il risultato di un errore precedente) e non lo si può usare per +determinare quando o se una chiamata a funzione è fallita. La procedura +corretta da seguire per identificare un errore è sempre quella di controllare +\var{errno} immediatamente dopo aver verificato il fallimento della funzione +attraverso il suo codice di ritorno. \subsection{Le funzioni \func{strerror} e \func{perror}} \label{sec:sys_strerror} -Benché gli errori siano identificati univocamente dal valore numerico di +Benché gli errori siano identificati univocamente dal valore numerico di \var{errno} le librerie provvedono alcune funzioni e variabili utili per riportare in opportuni messaggi le condizioni di errore verificatesi. La -prima funzione che si può usare per ricavare i messaggi di errore è -\func{strerror}, il cui prototipo è: -\begin{prototype}{string.h}{char *strerror(int errnum)} - Ritorna una stringa (statica) che descrive l'errore il cui codice è passato - come parametro. -\end{prototype} - -In generale \func{strerror} viene usata passando \var{errno} come parametro; -nel caso si specifichi un codice sbagliato verrà restituito un messaggio di -errore sconosciuto. La funzione utilizza una stringa statica che non deve -essere modificata dal programma e che è utilizzabile solo fino ad una chiamata -successiva a \func{strerror}; nel caso si usino i thread è -provvista\footnote{questa funzione è una estensione GNU, non fa parte dello - standard POSIX.} una versione apposita: -\begin{prototype}{string.h} -{char *strerror\_r(int errnum, char *buff, size\_t size)} - Analoga a \func{strerror} ma ritorna il messaggio in un buffer - specificato da \param{buff} di lunghezza massima (compreso il terminatore) - \param{size}. -\end{prototype} -\noindent -che utilizza un buffer che il singolo thread deve allocare, per evitare i -problemi connessi alla condivisione del buffer statico. Infine, per completare -la caratterizzazione dell'errore, si può usare anche la variabile -globale\footnote{anche questa è un'estensione GNU.} -\var{program\_invocation\_short\_name} che riporta il nome del programma -attualmente in esecuzione. +prima funzione che si può usare per ricavare i messaggi di errore è +\funcd{strerror}, il cui prototipo è: + +\begin{funcproto}{ +\fhead{string.h} +\fdecl{char *strerror(int errnum)} +\fdesc{Restituisce una stringa con un messaggio di errore.} +} + +{La funzione ritorna il puntatore alla stringa con il messaggio di errore, + \var{errno} non viene modificato.} +\end{funcproto} + +La funzione ritorna il puntatore alla stringa contenente il messaggio di +errore corrispondente al valore di \param{errnum}, se questo non è un valore +valido verrà comunque restituita una stringa valida contenente un messaggio +che dice che l'errore è sconosciuto nella forma. La versione della \acr{glibc} +non modifica il valore di \var{errno} in caso di errore, ma questo non è detto +valga per altri sistemi in quanto lo standard POSIX.1-2001 permette che ciò +avvenga. Non si faccia affidamento su questa caratteristica se si vogliono +scrivere programmi portabili. + +In generale \func{strerror} viene usata passando direttamente \var{errno} come +argomento, ed il valore di quest'ultima non verrà modificato. La funzione +inoltre tiene conto del valore della variabile di ambiente +\envvar{LC\_MESSAGES} per usare le appropriate traduzioni dei messaggi +d'errore nella localizzazione presente. + +La funzione \func{strerror} utilizza una stringa statica che non deve essere +modificata dal programma; essa è utilizzabile solo fino ad una chiamata +successiva a \func{strerror} o \func{perror} e nessun'altra funzione di +libreria tocca questa stringa. In ogni caso l'uso di una stringa statica rende +la funzione non rientrante, per cui nel caso si usino i \textit{thread} la +\acr{glibc} fornisce una apposita versione rientrante \funcd{strerror\_r}, il +cui prototipo è: + +\begin{funcproto}{ +\fhead{string.h} +\fdecl{char * strerror\_r(int errnum, char *buf, size\_t size)} +\fdesc{Restituisce una stringa con un messaggio di errore.} +} + +{La funzione ritorna l'indirizzo del messaggio in caso di successo e + \val{NULL} per un errore, nel qual caso \var{errno} assumerà uno dei valori: + \begin{errlist} + \item[\errcode{EINVAL}] si è specificato un valore di \param{errnum} non + valido. + \item[\errcode{ERANGE}] la lunghezza di \param{buf} è insufficiente a + contenere la stringa di errore. + \end{errlist} +} +\end{funcproto} + +Si tenga presente che questa è la versione prevista normalmente nella +\acr{glibc}, ed effettivamente definita in \headfile{string.h}, ne esiste una +analoga nello standard SUSv3 (riportata anche nella pagina di manuale), che +restituisce \code{int} al posto di \code{char *}, e che tronca la stringa +restituita a \param{size}, a cui si accede definendo le opportune macro (per +le quali si rimanda alla lettura della pagina di manuale). + +La funzione è analoga a \func{strerror} ma restituisce la stringa di errore +nel buffer \param{buf} che il singolo \textit{thread} deve allocare +autonomamente per evitare i problemi connessi alla condivisione del buffer +statico. Il messaggio è copiato fino alla dimensione massima del buffer, +specificata dall'argomento \param{size}, che deve comprendere pure il +carattere di terminazione; altrimenti la stringa risulterà troncata. Una seconda funzione usata per riportare i codici di errore in maniera -automatizzata sullo standard error (vedi \secref{sec:file_std_descr}) è -\func{perror}, il cui prototipo è: -\begin{prototype}{stdio.h}{void perror (const char *message)} - Stampa il messaggio di errore relativo al valore corrente di \var{errno} - sullo standard error; preceduto dalla stringa \var{message}. -\end{prototype} -i messaggi di errore stampati sono gli stessi di \func{strerror}, (riportati -in \capref{cha:errors}), e, usando il valore corrente di \var{errno}, si -riferiscono all'ultimo errore avvenuto. La stringa specificata con -\var{message} viene stampato prime del messaggio d'errore, seguita dai due -punti e da uno spazio, il messaggio è terminato con un a capo. - -Il messaggio può essere riportato anche usando altre variabili globali -dichiarate in \file{errno.h}: -\begin{verbatim} - const char *sys_errlist[]; - int sys_nerr; -\end{verbatim} -la prima contiene i puntatori alle stringhe di errore indicizzati da -\var{errno}; la seconda esprime il valore più alto per un codice di errore, -l'utilizzo di questa stringa è sostanzialmente equivalente a quello di -\func{strerror}. - -In \nfig\ è riportata la sezione attinente del codice del programma -\cmd{errcode}, che può essere usato per stampare i messaggi di errore e le -costanti usate per identificare i singoli errori; il sorgente completo del -programma è allegato nel file \file{ErrCode.c} e contiene pure la gestione -delle opzioni e tutte le definizioni necessarie ad associare il valore -numerico alla costante simbolica. In particolare si è riportata la sezione che -converte la stringa passata come parametro in un intero (\texttt{\small - 1--2}), controllando con i valori di ritorno di \func{strtol} che la -conversione sia avvenuta correttamente (\texttt{\small 4--10}), e poi stampa, -a seconda dell'opzione scelta il messaggio di errore (\texttt{\small 11--14}) -o la macro (\texttt{\small 15--17}) associate a quel codice. +automatizzata sullo standard error è \funcd{perror}, il cui prototipo è: -\begin{figure}[!htb] - \footnotesize - \begin{lstlisting}{} - /* convert string to number */ - err = strtol(argv[optind], NULL, 10); - /* testing error condition on conversion */ - if (err==LONG_MIN) { - perror("Underflow on error code"); - return 1; - } else if (err==LONG_MIN) { - perror("Overflow on error code"); - return 1; - } - /* conversion is fine */ - if (message) { - printf("Error message for %d is %s\n", err, strerror(err)); - } - if (label) { - printf("Error label for %d is %s\n", err, err_code[err]); - } - \end{lstlisting} +\begin{funcproto}{ +\fhead{stdio.h} +\fdecl{void perror(const char *message)} +\fdesc{Stampa un messaggio di errore personalizzato.} +} + +{La funzione non ritorna nulla e non modifica \var{errno}.} +\end{funcproto} + + +I messaggi di errore stampati sono gli stessi di \func{strerror}, (riportati +in app.~\ref{cha:errors}), e, usando il valore corrente di \var{errno}, si +riferiscono all'ultimo errore avvenuto. La stringa specificata con +\param{message} viene stampata prima del messaggio d'errore, consentono una +personalizzazione (ad esempio l'indicazione del contesto in cui si è +verificato), seguita dai due punti e da uno spazio, il messaggio è terminato +con un a capo. Il messaggio può essere riportato anche usando le due +variabili globali: +\includecodesnip{listati/errlist.c} +dichiarate in \headfile{errno.h}. La prima contiene i puntatori alle stringhe +di errore indicizzati da \var{errno}; la seconda esprime il valore più alto +per un codice di errore, l'utilizzo di una di queste stringhe è +sostanzialmente equivalente a quello di \func{strerror}. + +\begin{figure}[!htbp] + \footnotesize \centering + \begin{minipage}[c]{\codesamplewidth} + \includecodesample{listati/errcode_mess.c} + \end{minipage} + \normalsize \caption{Codice per la stampa del messaggio di errore standard.} \label{fig:sys_err_mess} \end{figure} +In fig.~\ref{fig:sys_err_mess} è riportata la sezione attinente del codice del +programma \cmd{errcode}, che può essere usato per stampare i messaggi di +errore e le costanti usate per identificare i singoli errori. Il sorgente +completo del programma è allegato nel file \file{ErrCode.c} e contiene pure la +gestione delle opzioni e tutte le definizioni necessarie ad associare il +valore numerico alla costante simbolica. In particolare si è riportata la +sezione che converte la stringa passata come argomento in un intero +(\texttt{\small 1-2}), controllando con i valori di ritorno di \funcm{strtol} +che la conversione sia avvenuta correttamente (\texttt{\small 4-10}), e poi +stampa, a seconda dell'opzione scelta il messaggio di errore (\texttt{\small + 11-14}) o la macro (\texttt{\small 15-17}) associate a quel codice. + + + +\subsection{Alcune estensioni GNU} +\label{sec:sys_err_GNU} + +Le precedenti funzioni sono quelle definite ed usate nei vari standard; la +\acr{glibc} ha però introdotto una serie di estensioni ``GNU'' che +forniscono alcune funzionalità aggiuntive per una gestione degli errori +semplificata e più efficiente. + +La prima estensione consiste in due variabili, \code{char * + program\_invocation\_name} e \code{char * program\_invocation\_short\_name} +che consentono di ricavare il nome del proprio programma. Queste sono utili +quando si deve aggiungere il nome del programma al messaggio d'errore, cosa +comune quando si ha un programma che non viene lanciato da linea di comando e +salva gli errori in un file di log. La prima contiene il nome usato per +lanciare il programma dalla shell ed in sostanza è equivalente ad +\code{argv[0]}; la seconda mantiene solo il nome del programma eliminando +eventuali directory qualora questo sia stato lanciato con un +\textit{pathname}. + +Una seconda estensione cerca di risolvere uno dei problemi che si hanno con +l'uso di \func{perror}, dovuto al fatto che non c'è flessibilità su quello che +si può aggiungere al messaggio di errore, che può essere solo una stringa. In +molte occasioni invece serve poter scrivere dei messaggi con maggiori +informazioni. Ad esempio negli standard di programmazione GNU si richiede che +ogni messaggio di errore sia preceduto dal nome del programma, ed in generale +si può voler stampare il contenuto di qualche variabile per facilitare la +comprensione di un eventuale problema. Per questo la \acr{glibc} definisce +la funzione \funcd{error}, il cui prototipo è: + +\begin{funcproto}{ +\fhead{stdio.h} +\fdecl{void error(int status, int errnum, const char *format, ...)} +\fdesc{Stampa un messaggio di errore formattato.} +} + +{La funzione non ritorna nulla e non riporta errori.} +\end{funcproto} + +La funzione fa parte delle estensioni GNU per la gestione degli errori, +l'argomento \param{format} segue la stessa sintassi di \func{printf} (vedi +sez.~\ref{sec:file_formatted_io}), ed i relativi argomenti devono essere +forniti allo stesso modo, mentre \param{errnum} indica l'errore che si vuole +segnalare (non viene quindi usato il valore corrente di \var{errno}). + +La funzione stampa sullo \textit{standard error} il nome del programma, come +indicato dalla variabile globale \var{program\_name}, seguito da due punti ed +uno spazio, poi dalla stringa generata da \param{format} e dagli argomenti +seguenti, seguita da due punti ed uno spazio infine il messaggio di errore +relativo ad \param{errnum}, il tutto è terminato da un a capo. + +Il comportamento della funzione può essere ulteriormente controllato se si +definisce una variabile \var{error\_print\_progname} come puntatore ad una +funzione \ctyp{void} che restituisce \ctyp{void} che si incarichi di stampare +il nome del programma. + +L'argomento \param{status} può essere usato per terminare direttamente il +programma in caso di errore, nel qual caso \func{error} dopo la stampa del +messaggio di errore chiama \func{exit} con questo stato di uscita. Se invece +il valore è nullo \func{error} ritorna normalmente ma viene incrementata +un'altra variabile globale, \var{error\_message\_count}, che tiene conto di +quanti errori ci sono stati. + +Un'altra funzione per la stampa degli errori, ancora più sofisticata, che +prende due argomenti aggiuntivi per indicare linea e file su cui è avvenuto +l'errore è \funcd{error\_at\_line}; il suo prototipo è: + +\begin{funcproto}{ +\fhead{stdio.h} +\fdecl{void error\_at\_line(int status, int errnum, const char *fname, + unsigned int lineno, \\ +\phantom{void error\_at\_line(}const char *format, ...)} +\fdesc{Stampa un messaggio di errore formattato.} +} +{La funzione non ritorna nulla e non riporta errori.} +\end{funcproto} + +\noindent ed il suo comportamento è identico a quello di \func{error} se non +per il fatto che, separati con il solito due punti-spazio, vengono inseriti un +nome di file indicato da \param{fname} ed un numero di linea subito dopo la +stampa del nome del programma. Inoltre essa usa un'altra variabile globale, +\var{error\_one\_per\_line}, che impostata ad un valore diverso da zero fa sì +che errori relativi alla stessa linea non vengano ripetuti. + + +% LocalWords: filesystem like kernel saved header limits sysconf sez tab float +% LocalWords: FOPEN stdio MB LEN CHAR char UCHAR unsigned SCHAR MIN signed INT +% LocalWords: SHRT short USHRT int UINT LONG long ULONG LLONG ULLONG POSIX ARG +% LocalWords: Stevens exec CHILD STREAM stream TZNAME timezone NGROUPS SSIZE +% LocalWords: ssize LISTIO JOB CONTROL job control IDS VERSION YYYYMML bits bc +% LocalWords: dall'header posix lim nell'header glibc run unistd name errno SC +% LocalWords: NGROUP CLK TCK clock tick process PATH pathname BUF CANON path +% LocalWords: pathconf fpathconf descriptor fd uname sys struct utsname info +% LocalWords: EFAULT fig SOURCE NUL LENGTH DOMAIN NMLN UTSLEN system call proc +% LocalWords: domainname sysctl BSD nlen void oldval size oldlenp newval EPERM +% LocalWords: newlen ENOTDIR EINVAL ENOMEM linux array oldvalue paging stack +% LocalWords: TCP shell Documentation ostype hostname osrelease version mount +% LocalWords: const source filesystemtype mountflags ENODEV ENOTBLK block read +% LocalWords: device EBUSY only EACCES NODEV ENXIO major RTSIG syscall PID +% LocalWords: number EMFILE dummy ENAMETOOLONG ENOENT ELOOP virtual devfs MGC +% LocalWords: magic MSK RDONLY NOSUID suid sgid NOEXEC SYNCHRONOUS REMOUNT MNT +% LocalWords: MANDLOCK mandatory locking WRITE APPEND append IMMUTABLE NOATIME +% LocalWords: access NODIRATIME BIND MOVE umount flags FORCE statfs fstatfs ut +% LocalWords: buf ENOSYS EIO EBADF type fstab mntent home shadow username uid +% LocalWords: passwd PAM Pluggable Authentication Method Service Switch pwd ru +% LocalWords: getpwuid getpwnam NULL buflen result ERANGE getgrnam getgrgid AS +% LocalWords: grp group gid SVID fgetpwent putpwent getpwent setpwent endpwent +% LocalWords: fgetgrent putgrent getgrent setgrent endgrent accounting init HZ +% LocalWords: runlevel Hierarchy logout setutent endutent utmpname utmp paths +% LocalWords: WTMP getutent getutid getutline pututline LVL OLD DEAD EMPTY dev +% LocalWords: line libc XPG utmpx getutxent getutxid getutxline pututxline who +% LocalWords: setutxent endutxent wmtp updwtmp logwtmp wtmp host rusage utime +% LocalWords: minflt majflt nswap fault swap timeval wait getrusage usage SELF +% LocalWords: CHILDREN current limit soft RLIMIT address brk mremap mmap dump +% LocalWords: SIGSEGV SIGXCPU SIGKILL sbrk FSIZE SIGXFSZ EFBIG LOCKS lock dup +% LocalWords: MEMLOCK NOFILE NPROC fork EAGAIN SIGPENDING sigqueue kill RSS tv +% LocalWords: resource getrlimit setrlimit rlimit rlim INFINITY capabilities +% LocalWords: capability CAP Sun Sparc PAGESIZE getpagesize SVr SUSv get IGN +% LocalWords: phys pages avphys NPROCESSORS CONF ONLN getloadavg stdlib double +% LocalWords: loadavg nelem scheduler CONFIG ACCT acct filename EUSER sizeof +% LocalWords: ENFILE EROFS PACCT AcctCtrl cap calendar UTC Jan the Epoch GMT +% LocalWords: Greenwich Mean l'UTC timer CLOCKS SEC cron wall elapsed times tz +% LocalWords: tms cutime cstime waitpid gettimeofday settimeofday timex NetBSD +% LocalWords: timespec adjtime olddelta adjtimex David Mills RFC NTP ntp cmd +% LocalWords: nell'RFC ADJ FREQUENCY frequency MAXERROR maxerror ESTERROR PLL +% LocalWords: esterror TIMECONST constant SINGLESHOT MOD INS insert leap OOP +% LocalWords: second delete progress has occurred BAD broken tm gmtoff asctime +% LocalWords: ctime timep gmtime localtime mktime tzname tzset daylight format +% LocalWords: strftime thread EOF modifiable lvalue app errcode strerror LC at +% LocalWords: perror string errnum MESSAGES error message strtol log jiffy asm +% LocalWords: program invocation argv printf print progname exit count fname +% LocalWords: lineno one standardese Di page Wed Wednesday Apr April PM AM CAD +% LocalWords: CEST utmpxname Solaris updwtmpx reboot RESTART Ctrl OFF SIGINT +% LocalWords: HALT halted sync KEXEC kexec load bootloader POWER Power with nr +% LocalWords: Restarting command arg entry segments segment ARCH CRASH CONTEXT +% LocalWords: PRESERVE PPC IA ARM SH MIPS nvcsw nivcsw inblock oublock maxrss +% LocalWords: context switch slice Resident SIG SIGCHLD cur Gb lease mlock Hz +% LocalWords: memory mlockall MAP LOCKED shmctl MSGQUEUE attr NICE nice MADV +% LocalWords: madvise WILLNEED RTPRIO sched setscheduler setparam scheduling +% LocalWords: RTTIME execve kb prlimit pid new old ESRCH EUSERS refresh high +% LocalWords: resolution HRT jiffies strptime pre l'I value argument %%% Local Variables: %%% mode: latex