Finito feature macro delle glibc
[gapil.git] / intro.tex
index 6e6fe60f5d13b01038d7627e28955375f0f63436..b0318e47b47d780b0836c3f991c50814a3fa99ff 100644 (file)
--- a/intro.tex
+++ b/intro.tex
@@ -67,12 +67,12 @@ eccedenza.
 Le periferiche infine vengono viste in genere attraverso un'interfaccia
 astratta che permette di trattarle come fossero file, secondo il concetto per
 cui \textit{everything is a file}, su cui torneremo in dettaglio in
-\capref{cha:files_intro}, (questo non è vero per le interfacce di rete, che
+\capref{cha:file_intro}, (questo non è vero per le interfacce di rete, che
 hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
 il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
 
 
-\section{User space e kernel space}
+\subsection{User space e kernel space}
 \label{sec:intro_user_kernel_space}
 
 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi unix è
@@ -212,7 +212,7 @@ accesso ai file e quindi anche alle periferiche, in maniera pi
 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
 
 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
-un nome espresso in caratteri è inserita nei due files \file{/etc/passwd} e
+un nome espresso in caratteri è inserita nei due file \file{/etc/passwd} e
 \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto in
 breve \acr{uid}, e il \textit{group identifier}, detto in breve \acr{gid}, che
 sono quelli che poi vengono usati dal kernel per identificare l'utente.
@@ -236,12 +236,16 @@ disattivati\footnote{i controlli infatti vengono sempre eseguiti da un codice
 \section{Gli standard di unix e GNU/Linux}
 \label{sec:intro_standard}
 
-In questa sezione prenderemo in esame alcune caratteristiche generali del
-sistema e gli standard adottati per le funzioni, i prototipi, gli errori, i
-tipi di dati.
+In questa sezione faremo una breve panoramica relativa ai vari standard che
+nel tempo sono stati formalizzati da enti, associazioni, consorzi e
+organizzazioni varie al riguardo del sistema o alle caratteristiche che si
+sono stabilite come standard di fatto in quanto facenti parte di alcune
+implementazioni molto diffuse come BSD o SVr4.
 
-\subsection{Prototipi e puntatori}
-\label{sec:intro_function}
+Ovviamente prenderemo in considerazione solo gli aspetti riguardanti
+interfacce di programmazione e le altre caratteristiche di un sistema
+unix-like ed in particolare a come e in che modo essi sono supportati da
+GNU/Linux (sia per quanto riguarda il kernel che le \acr{glibc}).
 
 
 \subsection{Lo standard ANSI C}
@@ -249,8 +253,9 @@ tipi di dati.
 
 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
   Standard Institute}, come standard del linguaggio C ed è stato
-successivamente adottatto dalla \textit{International Standard Organisation}
-come standard internazionale con la sigla ISO/IEC 9899:1990.
+successivamente adottato dalla \textit{International Standard Organisation}
+come standard internazionale con la sigla ISO/IEC 9899:1990, e va anche sotto
+il nome di standard ISO C.
 
 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
 sistemi operativi diversi, ma oltre alla sintassi e alla semantica del
@@ -258,25 +263,43 @@ linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
 anche una libreria di funzioni che devono poter essere implementate su
 qualunque sistema operativo.
 
-Linux, come molti unix moderni, provvede la compatibilità con questo standard,
-fornendo le funzioni di libreria da esso previste; queste sono dichiarate in
-quindici header files, uno per ciascuna delle quindici aree in cui è stata
-suddivisa la libreria. In \ntab\ si sono riportati questi header, insieme a
-quelli definiti negli altri standard descritti nelle sezioni successive.
-
-\subsection{Lo standard POSIX}
+Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
+di tipo unix, GNU/Linux (per essere precisi le glibc), come molti unix
+moderni, provvede la compatibilità con questo standard, fornendo le funzioni
+di libreria da esso previste. Queste sono dichiarate in quindici header file
+(anch'essi provvisti dalla \acr{glibc}), uno per ciascuna delle quindici aree
+in cui è stata suddivisa una libreria standard. In \ntab\ si sono riportati
+questi header, insieme a quelli definiti negli altri standard descritti nelle
+sezioni successive.
+
+In realtà \acr{glibc} ed i relativi header file definiscono un insieme di
+funzionalità in cui sono incluse come sottoinsieme anche quelle previste dallo
+standard ANSI C. È possibile ottenere una conformità stretta allo standard
+(scartando le funzionalità addizionali) usando il \cmd{gcc} con l'opzione
+\cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei vari
+header file soltanto le funzionalità previste dallo standard ANSI C e a non
+usare le varie estensioni al linguaggio e al preprocessore da esso supportate.
+
+
+\subsection{Lo standard IEEE -- POSIX}
 \label{sec:intro_posix}
 
-In realtà POSIX è una famiglia di standard diversi, il nome, suggerito da
+Uno standard più attinente al sistema nel suo complesso (e che concerne sia il
+kernel che le librerie e` lo standard POSIX. Esso prende origine dallo
+standard ANSI C, che contiene come sottoinsieme, prevedendo ulteriori capacità
+per le funzioni in esso definite, ed aggiungendone di nuove. Le estensioni
+principali sono 
+
+In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
 X finale denuncia la sua stretta relazione con i sistemi unix. Esso nasce dal
 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
-che ne ha prodotto una prima versione, nota come IEEE 1003.1-1988, mirante a
+che ne produsse una prima versione, nota come IEEE 1003.1-1988, mirante a
 standardizzare l'interfaccia con il sistema operativo.
 
 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
-le utilities di sistema (1003.2), per le estensioni realtime e per i thread
+le utility di sistema (1003.2), per le estensioni realtime e per i thread
 (1003.1d e 1003.1c) e vari altri. 
 
 Benché lo standard POSIX sia basato sui sistemi unix esso definisce comunque
@@ -284,25 +307,199 @@ una interfaccia e non fa riferimento ad una specifica implementazione (ad
 esempio esiste anche una implementazione di questo standard pure sotto Windows
 NT). Lo standard si è evoluto nel tempo ed una versione più aggiornata (quella
 che viene normalmente denominata POSIX.1) è stata rilasciata come standard
-internazionale con la sigla ISO/IEC 9945-1:1990.
+internazionale con la sigla ISO/IEC 9945-1:1996. 
+
+Le \acr{glibc} implementano tutte le funzioni definite nello standard POSIX.1,
+e Linux; 
 
 
 \subsection{Lo standard X/Open -- XPG3}
 \label{sec:intro_xopen}
 
-Il consorzio X/Open nacque come consorzio di venditori di sistemi unix, che
-nel 1989 produsse una voluminosa guida chiamata \textit{X/Open Portability
-  Guide, Issue 3} al cui interno definiva una ulteriore standardizzazione
-dell'interfaccia ad un sistema unix.
+Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
+unix per giungere ad una armonizzazione delle varie implementazioni.  Per far
+questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
+nome di \textit{X/Open Portability Guide} (a cui di norma si fa riferimento
+con l'abbreviazione XPGn).
 
-Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
-basato sullo standard POSIX.1, ma prevede una serie di funzionalità
-aggiuntive.
+Nel 1989 produsse una terza versione di questa guida particolarmente
+voluminosa (la \textit{X/Open Portability Guide, Issue 3}), contenente una
+ulteriore standardizzazione dell'interfaccia sistema unix, che venne presa
+come riferimento da vari produttori.
 
-Il consorzio 
-
-
-\subsection{Tipi di dati primitivi}
-\label{sec:intro_data_types}
+Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
+basato sullo standard POSIX.1, ma prevede una serie di funzionalità aggiuntive
+fra cui le specifiche delle API per l'interfaccia grafica (X11).
+
+Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
+Issue 4 (da cui la sigla XPG4) che aggiungeva l'interfaccia XTI (\textit{X
+  Transport Interface}) mirante a soppiantare (senza molto successo)
+l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
+rilasciata nel 1994, questa è nota con il nome di Spec 1170 (dal numero delle
+interfacce, header e comandi definiti). 
+
+Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
+aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
+specifiche sotto il nome di \textit{Single UNIX Specification}, l'ultima
+versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
+  Specification}, SUSv2, più comunemente nota come \textit{Unix 95}.
+
+
+\subsection{Gli standard UNIX  -- Open Group}
+\label{sec:intro_opengroup}
+
+Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
+da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
+alla costituzione dell'Open Group, un consorzio internazionale che raccoglie
+produttori, utenti industriali, entità accademiche e governative.
+
+Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
+il lavoro di standardizzazione delle varie implementazioni, rilasciando
+periodicamente nuove specifiche e strumenti per la verifica della conformità
+alle stesse.
+
+Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
+  Specification}, nota con la sigla SUSv2, in queste versione le interfacce
+specificate salgono a 1434 (e 3030 se si considerano le stazioni di lavoro
+grafiche, per le quali sono inserite pure le interfacce usate da CDE che
+richiede sia X11 che Motif). La conformità a questa versione permette l'uso
+del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard.
+
+
+\subsection{Lo ``standard'' BSD}
+\label{sec:intro_bsd}
+
+Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
+di Berkley e la AT/T generò una delle prime e più importanti fratture del
+mondo Unix.  L'Università di Berkley proseguì nello sviluppo della base di
+codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
+allora versioni disponibili, fino ad arrivare al rilascio di una versione
+completa di unix, chiamata appunto BSD, del tutto indipendente dal codice
+della AT/T.
+
+Benchè BSD non sia uno standard formalizzato, l'implementazione di unix
+dell'Università di Berkley, ha provveduto nel tempo una serie di estensioni e
+di API grande rilievo, come il link simbolici (vedi \secref{sec:file_symlink},
+la funzione \func{select}, i socket.
+
+Queste estensioni sono state via via aggiunte al sistema nelle varie versioni
+del sistema (BSD 4.2, BSD 4.3 e BSD 4.4) come pure in alcuni derivati
+commerciali come SunOS. Le \acr{glibc} provvedono tutte queste estensioni che
+sono state in gran parte incorporate negli standard successivi.
+
+
+\subsection{Lo standard System V}
+\label{sec:intro_sysv}
+
+Come noto Unix nasce nei laboratori della AT/T, che ne registrò il nome come
+marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
+versione supportata ufficialmente venne rilasciata al pubblico con il nome di
+Unix System V. Negli anni successivi l'AT/T proseguì lo sviluppo rilasciando
+varie versioni con aggiunte e integrazioni; nel 1989 un accordo fra vari
+venditori (AT/T, Sun, HP, e altro) portò ad una versione che provvedeva una
+unificazione dell interfacce comprendente Xenix e BSD, la System V release 4.
+
+La interfaccia di questa ultima release è descritta in un documento dal titolo
+\textit{System V Interface Description}, o SVID; spesso però si riferimento a
+questo standard con il nome della sua implementazione, usando la sigla SVr4.
+
+Anche questo costituisce un sovrainsieme delle interfacce definite dallo
+standard POSIX.  Nel 1992 venne rilasciata una seconda versione del sistema:
+la SVr4.2. L'anno successivo la divisione della AT/T (già a suo tempo
+rinominata in Unix System Laboratories) venne acquistata dalla Novell, che poi
+trasferì il marchio Unix al consorzio X/Open; l'ultima versione di System V fu
+la SVr4.2MP rilasciata nel Dicembre 93.
+
+Le \acr{glibc} implementano le principali funzionalità richieste da SVID che
+non sono già incluse negli standard POSIX ed ANSI C, per compatibilità con lo
+Unix System V e con altri Unix (come SunOS) che le includono. Tuttavia le
+funzionalità più oscure e meno utilizzate (che non sono presenti neanche in
+System V) sono state tralasciate.
+
+Le funzionalità implementate sono principalmente il meccanismo di
+intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
+V IPC, che vedremo in \secref{sec:ipc_sysv}) le funzioni della famiglia
+\func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
+matematiche.
+
+
+\subsection{Il comportamento standard del \cmd{gcc} e delle \acr{glibc}}
+\label{sec:intro_gcc_glibc_std}
+
+In Linux gli standard appena descritti sono ottenibili sia attraverso l'uso di
+opzioni del compilatore (il \cmd{gcc}) che definendo opportune costanti prima
+della inclusione dei file degli header.
+
+Se si vuole che i programmi seguano una stretta attinenza allo standard ANSI C
+si può usare l'opzione \cmd{-ansi} del compilatore, e non sarà riconosciuta
+nessuna funzione non riconosciuta dalle specifiche standard ISO per il C.
+
+Per attivare le varie opzioni è possibile definire le macro di preprocessore,
+che controllano le funzionalità che le \acr{glibc} possono mettere a
+disposizione questo può essere fatto attraverso l'opzione \cmd{-D} del
+compilatore, ma è buona norma inserire gli opportuni \texttt{\#define} nei
+propri header file.
+
+Le macro disponibili per i vari standard sono le seguenti:
+\begin{basedescript}{\desclabelwidth{2.0cm}}
+\item[\macro{\_POSIX\_SOURCE}] definendo questa macro si rendono disponibili
+  tutte le funzionalità dello standard POSIX.1 (la versione IEEE Standard
+  1003.1) insieme a tutte le funzionalità dello standard ISO C. Se viene anche
+  definita con un intero positivo la macro \macro{\_POSIX\_C\_SOURCE} lo stato
+  di questa non viene preso in considerazione.
+\item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
+  positivo si controlla quale livello delle funzionalità specificate da POSIX
+  viene messa a disposizione; più alto è il valore maggiori sono le
+  funzionalità. Se è uguale a '1' vengono attivate le funzionalità specificate
+  nella edizione del 1990 (IEEE Standard 1003.1-1990), valori maggiori o
+  uguali a '2' attivano le funzionalità POSIX.2 specificate nell'edizione del
+  1992 (IEEE Standard 1003.2-1992). Un valore maggiore o uguale a `199309L'
+  attiva le funzionalità POSIX.1b specificate nell'edizione del 1993 (IEEE
+  Standard 1003.1b-1993).  Un valore maggiore o uguale a `199506L' attiva le
+  funzionalità POSIX.1 specificate nell'edizione del 1996 (ISO/IEC 9945-1:
+  1996). Valori superiori abiliteranno ulteriori estensioni.
+\item[\macro{\_BSD\_SOURCE}] definendo questa macro si attivano le
+  funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
+  ISO C, POSIX.1 e POSIX.2. Alcune delle funzionalità previste da BSD sono
+  però in conflitto con le corrispondenti definite nello standard POSIX.1, in
+  questo caso le definizioni previste da BSD4.3 hanno la precedenza rispetto a
+  POSIX.  A causa della natura dei conflitti con POSIX per ottenere una piena
+  compatibilità con BSD4.3 è necessario anche usare una libreria di
+  compatibilità, dato che alcune funzioni sono definite in modo diverso. In
+  questo caso occorre pertanto anche usare l'opzione \cmd{-lbsd-compat} con il
+  compilatore per indicargli di utilizzare le versioni nella libreria di
+  compatibilità prima di quelle normali.
+\item[\macro{\_SVID\_SOURCE}] definendo questa macro si attivano le
+  funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
+  standard ISO C, POSIX.1, POSIX.2, and X/Open.
+\item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si attivano le
+  funzionalità descritte nella \textit{X/Open Portability Guide}. Anche queste
+  sono un soprainsieme di quelle definite in POSIX.1 e POSIX.2 ed in effetti
+  sia \macro{\_POSIX\_SOURCE} che \macro{\_POSIX\_C\_SOURCE} vengono
+  automaticamente definite. Sono incluse anche ulteriori funzionalità
+  disponibili in BSD e SVID. Se il valore della macro è posto a 500 questo
+  include anche le nuove definizioni introdotte con la \textit{Single Unix
+    Specification, version 2}, cioè Unix98.
+\item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] questa macro si attivano le ulteriori
+  funzionalità necessarie a esse conformi al rilascio del marchio
+  \textit{X/Open Unix}
+\item[\macro{\_ISOC99\_SOURCE}] questa macro si attivano le
+  funzionalità previste per la revisione delle librerie standard del C
+  denominato ISO C99. Dato che lo standard non è ancora adottato in maniera
+  ampia queste non sona abilitate automaticamente, ma le \acr{glibc} ha già
+  una implementazione completa che può essere attivata definendo questa macro. 
+\item[\macro{\_LARGEFILE\_SOURCE}] questa macro si attivano le
+  funzionalità per il supporto dei file di grandi dimensioni (il \textit{Large
+    File Support} o LFS) con indici e dimensioni a 64 bit. 
+\item[\macro{\_GNU\_SOURCE}] questa macro si attivano tutte le funzionalità
+  disponibili: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID, X/Open, LFS più
+  le estensioni specifiche GNU. Nel caso in cui BSD e POSIX confliggono viene
+  data la precedenza a POSIX.
+\end{basedescript}
+
+\subsection{Gli standard di Linux}
+\label{sec:intro_linux_std}
+
+Da fare (o cassare, a seconda del tempo e della voglia).