Aggiunte spiegazioni sull'esempio, e riscritto lo stesso per usare anche la
[gapil.git] / intro.tex
1 \chapter{L'architettura del sistema}
2 \label{cha:intro_unix}
3
4 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
5 cui è basato un sistema operativo di tipo Unix come GNU/Linux, in questo modo
6 potremo fornire una base di comprensione mirata a sottolineare le peculiarità
7 del sistema che sono più rilevanti per quello che riguarda la programmazione.
8
9 Dopo un'introduzione sulle caratteristiche principali di un sistema di tipo
10 Unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
11 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
12 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
13
14
15 \section{Una panoramica}
16 \label{sec:intro_unix_struct}
17
18 In questa prima sezione faremo una breve panoramica sull'architettura del
19 sistema.  Chi avesse già una conoscenza di questa materia può tranquillamente
20 saltare questa sezione.
21
22
23 \subsection{Concetti base}
24 \label{sec:intro_base_concept}
25
26 Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
27 cosiddetto \textit{kernel}, nel nostro caso Linux) a cui si demanda la
28 gestione delle risorse essenziali (la CPU, la memoria, le periferiche) mentre
29 tutto il resto, quindi anche la parte che prevede l'interazione con l'utente,
30 deve venire realizzato tramite programmi eseguiti dal kernel e che accedano
31 alle risorse hardware tramite delle richieste a quest'ultimo.
32
33 Fin dall'inizio uno Unix si presenta come un sistema operativo
34 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
35 programmi, e multiutente, in cui è possibile che più utenti siano connessi ad
36 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
37 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
38 a rotazione).
39
40 % Questa e` una distinzione essenziale da capire,
41 %specie nei confronti dei sistemi operativi successivi, nati per i personal
42 %computer (e quindi per un uso personale), sui quali l'hardware (allora
43 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
44
45 I kernel Unix più recenti, come Linux, sono realizzati sfruttando alcune
46 caratteristiche dei processori moderni come la gestione hardware della memoria
47 e la modalità protetta. In sostanza con i processori moderni si può
48 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
49 zone di memoria fisica.  Quello che succede è che il kernel è il solo
50 programma ad essere eseguito in modalità privilegiata, con il completo accesso
51 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
52 (e non possono accedere direttamente alle zone di memoria riservate o alle
53 porte di input/output).
54
55 Una parte del kernel, lo \textit{scheduler}\index{scheduler}, si occupa di
56 stabilire, ad intervalli fissi e sulla base di un opportuno calcolo delle
57 priorità, quale ``processo'' deve essere posto in esecuzione (il cosiddetto
58 \textit{preemptive scheduling}\index{preemptive scheduling}). Questo verrà
59 comunque eseguito in modalità protetta; quando necessario il processo potrà
60 accedere alle risorse hardware soltanto attraverso delle opportune chiamate al
61 sistema che restituiranno il controllo al kernel.
62
63 La memoria viene sempre gestita dal kernel attraverso il meccanismo della
64 \textsl{memoria virtuale}\index{memoria virtuale}, che consente di assegnare a
65 ciascun processo uno spazio di indirizzi ``virtuale'' (vedi
66 \secref{sec:proc_memory}) che il kernel stesso, con l'ausilio della unità di
67 gestione della memoria, si incaricherà di rimappare automaticamente sulla
68 memoria disponibile, salvando su disco quando necessario (nella cosiddetta
69 area di \textit{swap}) le pagine di memoria in eccedenza.
70
71 Le periferiche infine vengono viste in genere attraverso un'interfaccia
72 astratta che permette di trattarle come fossero file, secondo il concetto per
73 cui \textit{everything is a file}, su cui torneremo in dettaglio in
74 \capref{cha:file_intro}, (questo non è vero per le interfacce di rete, che
75 hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
76 il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
77
78
79 \subsection{User space e kernel space}
80 \label{sec:intro_user_kernel_space}
81
82 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi Unix è
83 quello della distinzione fra il cosiddetto \textit{user space}, che
84 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
85 \textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
86 programma vede sé stesso come se avesse la piena disponibilità della CPU e
87 della memoria ed è, salvo i meccanismi di comunicazione previsti
88 dall'architettura, completamente ignaro del fatto che altri programmi possono
89 essere messi in esecuzione dal kernel.
90
91 Per questa separazione non è possibile ad un singolo programma disturbare
92 l'azione di un altro programma o del sistema e questo è il principale motivo
93 della stabilità di un sistema unix-like nei confronti di altri sistemi in cui
94 i processi non hanno di questi limiti, o che vengono per vari motivi eseguiti
95 al livello del kernel.
96
97 Pertanto deve essere chiaro a chi programma in Unix che l'accesso diretto
98 all'hardware non può avvenire se non all'interno del kernel; al di fuori dal
99 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
100 fornisce allo user space. 
101
102
103 \subsection{Il kernel e il sistema}
104 \label{sec:intro_kern_and_sys}
105
106 Per capire meglio la distinzione fra kernel space e user space si può prendere
107 in esame la procedura di avvio di un sistema unix-like; all'avvio il BIOS (o
108 in generale il software di avvio posto nelle EPROM) eseguirà la procedura di
109 avvio del sistema (il cosiddetto \textit{boot}), incaricandosi di caricare il
110 kernel in memoria e di farne partire l'esecuzione; quest'ultimo, dopo aver
111 inizializzato le periferiche, farà partire il primo processo, \cmd{init}, che
112 è quello che a sua volta farà partire tutti i processi successivi. Fra questi
113 ci sarà pure quello che si occupa di dialogare con la tastiera e lo schermo
114 della console, e quello che mette a disposizione dell'utente che si vuole
115 collegare, un terminale e la \textit{shell} da cui inviare i comandi.
116
117 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
118 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
119 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
120 qualunque programma di scrittura o di disegno, in user space.
121
122 Questo significa, ad esempio, che il sistema di per sé non dispone di
123 primitive per tutta una serie di operazioni (come la copia di un file) che
124 altri sistemi (come Windows) hanno invece al loro interno. Pertanto buona
125 parte delle operazioni di normale amministrazione di un sistema, come quella
126 in esempio, sono implementate come normali programmi.
127
128 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
129 %realizzare un sistema di permessi e controlli che evitano che i programmi
130 %eseguano accessi non autorizzati. 
131
132 Per questo motivo quando ci si riferisce al sistema nella sua interezza è
133 corretto parlare di un sistema GNU/Linux: da solo il kernel è assolutamente
134 inutile; quello che costruisce un sistema operativo utilizzabile è la presenza
135 di tutta una serie di librerie e programmi di utilità (che di norma sono
136 quelli realizzati dal progetto GNU della Free Software Foundation) che
137 permettono di eseguire le normali operazioni che ci si aspetta da un sistema
138 operativo.
139
140
141 \subsection{Chiamate al sistema e librerie di funzioni}
142 \label{sec:intro_syscall}
143
144 Come accennato le interfacce con cui i programmi possono accedere all'hardware
145 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
146   call}), si tratta di un insieme di funzioni che un programma può chiamare,
147 per le quali viene generata un'interruzione del processo passando il controllo
148 dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
149 di operazioni interne come la gestione del multitasking e l'allocazione della
150 memoria) eseguirà la funzione richiesta in \textit{kernel space} restituendo i
151 risultati al chiamante.
152
153 Ogni versione di Unix ha storicamente sempre avuto un certo numero di queste
154 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale di
155   programmazione di Unix} (quella cui si accede con il comando \cmd{man 2
156   <nome>}) e Linux non fa eccezione. Queste sono poi state codificate da vari
157 standard, che esamineremo brevemente in \secref{sec:intro_standard}. Uno
158 schema elementare della struttura del sistema è riportato in
159 \figref{fig:intro_sys_struct}.
160
161 \begin{figure}[htb]
162   \centering
163   \includegraphics[width=10cm]{img/struct_sys}
164   \caption{Schema di massima della struttura di interazione fra processi,
165     kernel e dispositivi in Linux.}
166   \label{fig:intro_sys_struct}
167 \end{figure}
168
169 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
170 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
171 C, che, oltre alle interfacce alle system call, contiene anche tutta la serie
172 delle ulteriori funzioni definite dai vari standard, che sono comunemente
173 usate nella programmazione.
174
175 Questo è importante da capire perché programmare in Linux significa anzitutto
176 essere in grado di usare le varie interfacce contenute nella Libreria Standard
177 del C, in quanto né il kernel, né il linguaggio C, implementano direttamente
178 operazioni comuni come l'allocazione dinamica della memoria, l'input/output
179 bufferizzato o la manipolazione delle stringhe, presenti in qualunque
180 programma.
181
182 Quanto appena illustrato mette in evidenza il fatto che nella stragrande
183 maggioranza dei casi,\footnote{esistono implementazioni diverse delle librerie
184   del C, come le \textit{libc5} o le \textit{uclib}, che non derivano dal
185   progetto GNU, ma oggi sono, tranne casi particolari, completamente
186   soppiantate dalle \acr{glibc}.} si dovrebbe usare il nome GNU/Linux
187 (piuttosto che soltanto Linux) in quanto una parte essenziale del sistema
188 (senza la quale niente funzionerebbe) è la GNU Standard C Library (in breve
189 \acr{glibc}), ovvero la libreria realizzata dalla Free Software Foundation
190 nella quale sono state implementate tutte le funzioni essenziali definite
191 negli standard POSIX e ANSI C, utilizzabili da qualunque programma.
192
193 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
194 \textsl{Manuale di Programmazione di Unix }(cioè accessibili con il comando
195 \cmd{man 3 <nome>}) e sono costruite sulla base delle chiamate al sistema del
196 kernel; è importante avere presente questa distinzione, fondamentale dal punto
197 di vista dell'implementazione, anche se poi, nella realizzazione di normali
198 programmi, non si hanno differenze pratiche fra l'uso di una funzione di
199 libreria e quello di una chiamata al sistema.
200
201
202 \subsection{Un sistema multiutente}
203 \label{sec:intro_multiuser}
204
205 Linux, come gli altri kernel Unix, nasce fin dall'inizio come sistema
206 multiutente, cioè in grado di fare lavorare più persone in contemporanea. Per
207 questo esistono una serie di meccanismi di sicurezza, che non sono previsti in
208 sistemi operativi monoutente, e che occorre tenere presente.
209
210 Il concetto base è quello di utente (\textit{user}) del sistema, le cui
211 capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
212 Sono così previsti una serie di meccanismi per identificare i singoli utenti
213 ed una serie di permessi e protezioni per impedire che utenti diversi possano
214 danneggiarsi a vicenda o danneggiare il sistema.
215
216 Ogni utente è identificato da un nome (l'\textit{username}), che è quello che
217 viene richiesto all'ingresso nel sistema dalla procedura di \textit{login}
218 (descritta in dettaglio in \secref{sec:sess_login}).  Questa procedura si
219 incarica di verificare l'identità dell'utente, in genere attraverso la
220 richiesta di una parola d'ordine (la \textit{password}), anche se sono
221 possibili meccanismi diversi.\footnote{Ad esempio usando la libreria PAM
222   (\textit{Pluggable Autentication Methods}) è possibile astrarre
223   completamente dai meccanismi di autenticazione e sostituire ad esempio l'uso
224   delle password con meccanismi di identificazione biometrica.}
225
226 Eseguita la procedura di riconoscimento in genere il sistema manda in
227 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
228 terminale o un'interfaccia grafica) che mette a disposizione dell'utente un
229 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
230
231 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
232 \textit{default group}), ma può essere associato ad altri gruppi (i
233 \textit{supplementary group}), questo permette di gestire i permessi di
234 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
235 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
236
237 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
238 un nome espresso in caratteri è inserita nei due file \file{/etc/passwd} e
239 \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto in
240 breve \textsl{userid}, ed indicato dall'acronimo \acr{uid}, e il \textit{group
241   identifier}, detto in breve \textsl{groupid}, ed identificato dall'acronimo
242 \acr{gid}, e sono quelli che vengono usati dal kernel per identificare
243 l'utente.
244  
245 In questo modo il sistema è in grado di tenere traccia per ogni processo
246 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
247 esso. Inoltre con questo sistema viene anche garantita una forma base di
248 sicurezza interna in quanto anche l'accesso ai file (vedi
249 \secref{sec:file_access_control}) è regolato da questo meccanismo di
250 identificazione.
251
252 Infine in ogni Unix è presente un utente speciale privilegiato, il cosiddetto
253 \textit{superuser}, il cui username è di norma \textit{root}, ed il cui
254 \acr{uid} è zero. Esso identifica l'amministratore del sistema, che deve
255 essere in grado di fare qualunque operazione; per l'utente \textit{root}
256 infatti i meccanismi di controllo descritti in precedenza sono
257 disattivati.\footnote{i controlli infatti vengono sempre eseguiti da un codice
258   del tipo \code{if (uid) \{ ... \}}}
259
260
261 \section{Gli standard}
262 \label{sec:intro_standard}
263
264 In questa sezione faremo una breve panoramica relativa ai vari standard che
265 nel tempo sono stati formalizzati da enti, associazioni, consorzi e
266 organizzazioni varie al riguardo del sistema o alle caratteristiche che si
267 sono stabilite come standard di fatto in quanto facenti parte di alcune
268 implementazioni molto diffuse come BSD o SVr4.
269
270 Ovviamente prenderemo in considerazione solo gli standard riguardanti
271 interfacce di programmazione e le altre caratteristiche di un sistema
272 unix-like (alcuni standardizzano pure i comandi base del sistema e la shell)
273 ed in particolare ci concentreremo sul come ed in che modo essi sono
274 supportati sia per quanto riguarda il kernel che le librerie del C (con una
275 particolare attenzione alle \acr{glibc}).
276
277
278 \subsection{Lo standard ANSI C}
279 \label{sec:intro_ansiC}
280
281 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
282   Standard Institute}, come standard del linguaggio C ed è stato
283 successivamente adottato dalla \textit{International Standard Organisation}
284 come standard internazionale con la sigla ISO/IEC 9899:1990, e va anche sotto
285 il nome di standard ISO C.
286
287 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
288 sistemi operativi diversi, ma oltre alla sintassi ed alla semantica del
289 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
290 anche una libreria di funzioni che devono poter essere implementate su
291 qualunque sistema operativo.
292
293 Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
294 di tipo Unix, GNU/Linux (per essere precisi le \acr{glibc}), come molti Unix
295 moderni, provvede la compatibilità con questo standard, fornendo le funzioni
296 di libreria da esso previste. Queste sono dichiarate in una serie di
297 \textit{header file}\footnote{i file di dichiarazione di variabili, tipi e
298   funzioni, usati normalmente da un compilatore C. Per poter accedere alle
299   funzioni occorre includere con la direttiva \code{\#include} questi file nei
300   propri programmi; per ciascuna funzione che tratteremo in seguito
301   indicheremo anche gli \textit{header file} necessari ad usarla.}  (anch'essi
302 provvisti dalla \acr{glibc}), In \tabref{tab:intro_posix_header} si sono
303 riportati i principali \textit{header file} definiti nello standard POSIX,
304 insieme a quelli definiti negli altri standard descritti nelle sezioni
305 successive.
306
307 \begin{table}[htb]
308   \footnotesize
309   \centering
310   \begin{tabular}[c]{|l|c|c|l|}
311     \hline
312     \multirow{2}{*}{\textbf{Header}}&
313     \multicolumn{2}{|c|}{\textbf{Standard}}&
314     \multirow{2}{*}{\textbf{Contenuto}} \\
315     \cline{2-3}
316     & ANSI C& POSIX& \\
317     \hline
318     \hline
319     \file{assert.h}&$\bullet$&$\bullet$& Verifica le asserzioni fatte in un
320                                      programma.\\ 
321     \file{errno.h} &$\bullet$&$\bullet$& Errori di sistema.\\
322     \file{fcntl.h} &$\bullet$&$\bullet$& Controllo sulle opzioni dei file.\\
323     \file{limits.h}&$\bullet$&$\bullet$& Limiti e parametri del sistema.\\
324     \file{} &$\bullet$&$\bullet$& .\\
325     \file{} &$\bullet$&$\bullet$& .\\
326     \file{} &$\bullet$&$\bullet$& .\\
327     \file{} &$\bullet$&$\bullet$& .\\
328     \file{} &$\bullet$&$\bullet$& .\\
329     \file{stdio.h} &$\bullet$&$\bullet$& I/O bufferizzato in standard ANSI C.\\
330     \file{stdlib.h}&$\bullet$&$\bullet$& definizioni della libreria standard.\\
331     \hline
332   \end{tabular}
333   \caption{Elenco dei vari header file definiti dallo standard POSIX.}
334   \label{tab:intro_posix_header}
335 \end{table}
336
337
338 In realtà \acr{glibc} ed i relativi header file definiscono un insieme di
339 funzionalità in cui sono incluse come sottoinsieme anche quelle previste dallo
340 standard ANSI C. È possibile ottenere una conformità stretta allo standard
341 (scartando le funzionalità addizionali) usando il \cmd{gcc} con l'opzione
342 \cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei vari
343 header file soltanto le funzionalità previste dallo standard ANSI C e a non
344 usare le varie estensioni al linguaggio e al preprocessore da esso supportate.
345
346
347 \subsection{I tipi di dati primitivi}
348 \label{sec:intro_data_types}
349
350 Uno dei problemi di portabilità del codice più comune è quello dei tipi di
351 dati utilizzati nei programmi, che spesso variano da sistema a sistema, o
352 anche da una architettura ad un altra (ad esempio passando da macchine con
353 processori 32 bit a 64).
354
355 Storicamente alcuni tipi di dati definiti dallo standard ANSI C sono sempre
356 stati associati ad alcune variabili nei sistemi Unix, ad esempio la posizione
357 corrente all'interno di un file è sempre stato associato ad un intero a 32
358 bit, mentre il numero di dispositivo è sempre stato associato ad un intero a
359 16 bit. Tutto questo ovviamente costituisce un incubo per la portabilità tutte
360 le volte che, con l'evolversi delle piattaforme hardware, alcuni di questi
361 tipi si sono rivelati inadeguati, e se ne è dovuto cambiare la dimensione.
362
363 \begin{table}[htb]
364   \footnotesize
365   \centering
366   \begin{tabular}[c]{|l|c|c|l|}
367     \hline
368     \textbf{Tipo} & \textbf{Contenuto} \\
369     \hline
370     \hline
371     \type{caddr\_t} & core address.\\
372     \type{clock\_t} & contatore del tempo di sistema.\\
373     \type{dev\_t}   & Numero di dispositivo.\\
374     \type{gid\_t}   & Identificatore di un gruppo.\\
375     \type{ino\_t}   & Numero di \textit{inode}.\\
376     \type{key\_t}   & Chiave per il System V IPC.\\
377     \type{loff\_t}  & Posizione corrente in un file.\\
378     \type{mode\_t}  & Attributi di un file.\\
379     \type{nlink\_t} & Contatore dei link su un file.\\
380     \type{off\_t}   & Posizione corrente in un file.\\
381     \type{pid\_t}   & Identificatore di un processo.\\
382     \type{rlim\_t}  & Limite sulle risorse.\\
383     \type{sigset\_t}& Insieme di segnali.\\
384     \type{ssize\_t} & Dimensione di un oggetto.\\
385     \type{ssize\_t} & Dimensione in numero  byte ritornata dalle funzioni.\\
386     \type{ptrdiff\_t}& Differenza fra due puntatori.\\
387     \type{time\_t}  & Numero di secondi (in tempo di calendario).\\
388     \type{uid\_t}   & Identificatore di un utente.\\
389     \hline
390   \end{tabular}
391   \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
392   \label{tab:intro_primitive_types}
393 \end{table}
394
395 Per questo motivo tutte le funzioni di libreria di solito non fanno
396 riferimento ai tipi standard del linguaggio C, ma ad una serie di \textsl{tipi
397   primitivi}, riportati in \tabref{tab:intro_primitive_types}, caratteristici
398 di ogni sistema, definiti nell'header file \file{sys/types.h}, che associano i
399 tipi utilizzati dalle funzioni di sistema ai tipi elementari supportati dal
400 compilatore C.
401
402
403
404 \subsection{Lo standard IEEE -- POSIX}
405 \label{sec:intro_posix}
406
407 Uno standard più attinente al sistema nel suo complesso (e che concerne sia il
408 kernel che le librerie) è lo standard POSIX. Esso prende origine dallo
409 standard ANSI C, che contiene come sottoinsieme, prevedendo ulteriori capacità
410 per le funzioni in esso definite, ed aggiungendone di nuove.
411
412 In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
413 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
414 X finale denuncia la sua stretta relazione con i sistemi Unix. Esso nasce dal
415 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
416 che ne produsse una prima versione, nota come IEEE 1003.1-1988, mirante a
417 standardizzare l'interfaccia con il sistema operativo.
418
419 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
420 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
421 i comandi di sistema (1003.2), per le estensioni realtime e per i thread
422 (1003.1d e 1003.1c) e vari altri.  In \tabref{tab:intro_posix_std} è riportata
423 una classificazione sommaria dei principali documenti prodotti, e di come sono
424 identificati fra IEEE ed ISO; si tenga conto inoltre che molto spesso si usa
425 l'estensione IEEE anche come aggiunta al nome POSIX (ad esempio si può parlare
426 di POSIX.4 come di POSIX.1b).
427
428 Si tenga presente però che nuove specifiche e proposte di standardizzazione si
429 aggiungono continuamente, mentre le versioni precedenti vengono riviste;
430 talvolta poi i riferimenti cambiamo nome, per cui anche solo seguire le
431 denominazioni usate diventa particolarmente faticoso; una pagina dove si
432 possono recuperare varie (e di norma piuttosto intricate) informazioni è:
433 \href{http://www.pasc.org/standing/sd11.html}
434 {http://www.pasc.org/standing/sd11.html}.
435
436
437 \begin{table}[htb]
438   \footnotesize
439   \centering
440   \begin{tabular}[c]{|l|l|l|l|}
441     \hline
442     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
443     \hline
444     \hline
445     POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
446     POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
447     POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
448     POSIX.3 & 2003   &TR13210& Metodi di test                               \\
449     POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
450     POSIX.4a& 1003.1c &  --- & Threads                                      \\
451     POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
452     POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
453     POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
454     POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
455     POSIX.9 & 1003.9  &  --- & Intercaccia per il Fortran-77                \\
456     POSIX.12& 1003.1g& 9945-1& Sockets                                      \\
457     \hline
458   \end{tabular}
459   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
460   \label{tab:intro_posix_std}
461 \end{table}
462
463 Benché l'insieme degli standard POSIX siano basati sui sistemi Unix essi
464 definiscono comunque un'interfaccia di programmazione generica e non fanno
465 riferimento ad una implementazione specifica (ad esempio esiste
466 un'implementazione di POSIX.1 anche sotto Windows NT).  Lo standard principale
467 resta comunque POSIX.1, che continua ad evolversi; la versione più nota, cui
468 gran parte delle implementazioni fanno riferimento, e che costituisce una base
469 per molti altri tentativi di standardizzazione, è stata rilasciata anche come
470 standard internazionale con la sigla ISO/IEC 9945-1:1996. 
471
472 Linux e le \acr{glibc} implementano tutte le funzioni definite nello standard
473 POSIX.1, queste ultime forniscono in più alcune ulteriori capacità (per
474 funzioni di \textit{pattern matching} e per la manipolazione delle
475 \textit{regular expression}), che vengono usate dalla shell e dai comandi di
476 sistema e che sono definite nello standard POSIX.2.
477
478 Nelle versioni più recenti del kernel e delle librerie sono inoltre supportate
479 ulteriori funzionalità aggiunte dallo standard POSIX.1c per quanto riguarda i
480 \textit{thread} (vedi \capref{cha:threads}), e dallo standard POSIX.1b per
481 quanto riguarda i segnali e lo scheduling real-time
482 (\secref{sec:sig_real_time} e \secref{sec:proc_real_time}), la misura del
483 tempo, i meccanismi di intercomunicazione (\secref{sec:ipc_posix}) e l'I/O
484 asincrono (\secref{sec:file_asyncronous_io}).
485
486
487
488 \subsection{Lo standard X/Open -- XPG3}
489 \label{sec:intro_xopen}
490
491 Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
492 Unix per giungere ad un'armonizzazione delle varie implementazioni.  Per far
493 questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
494 nome di \textit{X/Open Portability Guide} (a cui di norma si fa riferimento
495 con l'abbreviazione XPGn).
496
497 Nel 1989 produsse una terza versione di questa guida particolarmente
498 voluminosa (la \textit{X/Open Portability Guide, Issue 3}), contenente
499 un'ulteriore standardizzazione dell'interfaccia di sistema di Unix, che venne
500 presa come riferimento da vari produttori.
501
502 Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
503 basato sullo standard POSIX.1, ma prevede una serie di funzionalità aggiuntive
504 fra cui le specifiche delle API (\textit{Application Programmable Interface})
505 per l'interfaccia grafica (X11).
506
507 Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
508 Issue 4 (da cui la sigla XPG4) che aggiungeva l'interfaccia XTI (\textit{X
509   Transport Interface}) mirante a soppiantare (senza molto successo)
510 l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
511 rilasciata nel 1994, questa è nota con il nome di Spec 1170 (dal numero delle
512 interfacce, header e comandi definiti). 
513
514 Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
515 aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
516 specifiche sotto il nome di \textit{Single UNIX Specification}, l'ultima
517 versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
518   Specification}, SUSv1, più comunemente nota come \textit{Unix 95}.
519
520
521 \subsection{Gli standard Unix  -- Open Group}
522 \label{sec:intro_opengroup}
523
524 Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
525 da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
526 alla costituzione dell'Open Group, un consorzio internazionale che raccoglie
527 produttori, utenti industriali, entità accademiche e governative.
528
529 Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
530 il lavoro di standardizzazione delle varie implementazioni, rilasciando
531 periodicamente nuove specifiche e strumenti per la verifica della conformità
532 alle stesse.
533
534 Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
535   Specification}, nota con la sigla SUSv2, in queste versione le interfacce
536 specificate salgono a 1434 (e 3030 se si considerano le stazioni di lavoro
537 grafiche, per le quali sono inserite pure le interfacce usate da CDE che
538 richiede sia X11 che Motif). La conformità a questa versione permette l'uso
539 del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard.
540
541
542 \subsection{Lo ``standard'' BSD}
543 \label{sec:intro_bsd}
544
545 Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
546 di Berkley e la AT\&T generò una delle prime e più importanti fratture del
547 mondo Unix.  L'Università di Berkley proseguì nello sviluppo della base di
548 codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
549 allora versioni disponibili, fino ad arrivare al rilascio di una versione
550 completa di Unix, chiamata appunto BSD, del tutto indipendente dal codice
551 della AT\&T.
552
553 Benché BSD non sia uno standard formalizzato, l'implementazione di Unix
554 dell'Università di Berkley, ha provveduto nel tempo una serie di estensioni e
555 API di grande rilievo, come il link simbolici, la funzione \code{select}, i
556 socket.
557
558 Queste estensioni sono state via via aggiunte al sistema nelle varie versioni
559 del sistema (BSD 4.2, BSD 4.3 e BSD 4.4) come pure in alcuni derivati
560 commerciali come SunOS. Il kernel e le \acr{glibc} provvedono tutte queste
561 estensioni che sono state in gran parte incorporate negli standard successivi.
562
563
564 \subsection{Lo standard System V}
565 \label{sec:intro_sysv}
566
567 Come noto Unix nasce nei laboratori della AT\&T, che ne registrò il nome come
568 marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
569 versione supportata ufficialmente venne rilasciata al pubblico con il nome di
570 Unix System V. Negli anni successivi l'AT\&T proseguì lo sviluppo rilasciando
571 varie versioni con aggiunte e integrazioni; nel 1989 un accordo fra vari
572 venditori (AT\&T, Sun, HP, e altro) portò ad una versione che provvedeva
573 un'unificazione delle interfacce comprendente Xenix e BSD, la System V release
574 4.
575
576 L'interfaccia di questa ultima release è descritta in un documento dal titolo
577 \textit{System V Interface Description}, o SVID; spesso però si fa riferimento
578 a questo standard con il nome della sua implementazione, usando la sigla SVr4.
579
580 Anche questo costituisce un sovrainsieme delle interfacce definite dallo
581 standard POSIX.  Nel 1992 venne rilasciata una seconda versione del sistema:
582 la SVr4.2. L'anno successivo la divisione della AT\&T (già a suo tempo
583 rinominata in Unix System Laboratories) venne acquistata dalla Novell, che poi
584 trasferì il marchio Unix al consorzio X/Open; l'ultima versione di System V fu
585 la SVr4.2MP rilasciata nel Dicembre 93.
586
587 Linux e le \acr{glibc} implementano le principali funzionalità richieste da
588 SVID che non sono già incluse negli standard POSIX ed ANSI C, per
589 compatibilità con lo Unix System V e con altri Unix (come SunOS) che le
590 includono. Tuttavia le funzionalità più oscure e meno utilizzate (che non sono
591 presenti neanche in System V) sono state tralasciate.
592
593 Le funzionalità implementate sono principalmente il meccanismo di
594 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
595 V IPC, che vedremo in \secref{sec:ipc_sysv}) le funzioni della famiglia
596 \func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
597 matematiche.
598
599
600 \subsection{Il comportamento standard del \cmd{gcc} e delle \acr{glibc}}
601 \label{sec:intro_gcc_glibc_std}
602
603 In Linux, grazie alle \acr{glibc}, gli standard appena descritti sono
604 ottenibili sia attraverso l'uso di opzioni del compilatore (il \cmd{gcc}) che
605 definendo opportune costanti prima dell'inclusione dei file degli header.
606
607 Se si vuole che i programmi seguano una stretta attinenza allo standard ANSI C
608 si può usare l'opzione \cmd{-ansi} del compilatore, e non sarà riconosciuta
609 nessuna funzione non riconosciuta dalle specifiche standard ISO per il C.
610
611 Per attivare le varie opzioni è possibile definire le macro di preprocessore,
612 che controllano le funzionalità che le \acr{glibc} possono mettere a
613 disposizione: questo può essere fatto attraverso l'opzione \cmd{-D} del
614 compilatore, ma è buona norma inserire gli opportuni \code{\#define} nei
615 propri header file.
616
617 Le macro disponibili per i vari standard sono le seguenti:
618 \begin{basedescript}{\desclabelwidth{3cm}\desclabelstyle{\nextlinelabel}}
619 \item[\macro{\_POSIX\_SOURCE}] definendo questa macro si rendono disponibili
620   tutte le funzionalità dello standard POSIX.1 (la versione IEEE Standard
621   1003.1) insieme a tutte le funzionalità dello standard ISO C. Se viene anche
622   definita con un intero positivo la macro \macro{\_POSIX\_C\_SOURCE} lo stato
623   di questa non viene preso in considerazione.
624 \item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
625   positivo si controlla quale livello delle funzionalità specificate da POSIX
626   viene messa a disposizione; più alto è il valore maggiori sono le
627   funzionalità. Se è uguale a '1' vengono attivate le funzionalità specificate
628   nella edizione del 1990 (IEEE Standard 1003.1-1990), valori maggiori o
629   uguali a '2' attivano le funzionalità POSIX.2 specificate nell'edizione del
630   1992 (IEEE Standard 1003.2-1992). Un valore maggiore o uguale a `199309L'
631   attiva le funzionalità POSIX.1b specificate nell'edizione del 1993 (IEEE
632   Standard 1003.1b-1993).  Un valore maggiore o uguale a `199506L' attiva le
633   funzionalità POSIX.1 specificate nell'edizione del 1996 (ISO/IEC 9945-1:
634   1996). Valori superiori abiliteranno ulteriori estensioni.
635 \item[\macro{\_BSD\_SOURCE}] definendo questa macro si attivano le
636   funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
637   ISO C, POSIX.1 e POSIX.2. Alcune delle funzionalità previste da BSD sono
638   però in conflitto con le corrispondenti definite nello standard POSIX.1, in
639   questo caso le definizioni previste da BSD4.3 hanno la precedenza rispetto a
640   POSIX.  A causa della natura dei conflitti con POSIX per ottenere una piena
641   compatibilità con BSD4.3 è necessario anche usare una libreria di
642   compatibilità, dato che alcune funzioni sono definite in modo diverso. In
643   questo caso occorre pertanto anche usare l'opzione \cmd{-lbsd-compat} con il
644   compilatore per indicargli di utilizzare le versioni nella libreria di
645   compatibilità prima di quelle normali.
646 \item[\macro{\_SVID\_SOURCE}] definendo questa macro si attivano le
647   funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
648   standard ISO C, POSIX.1, POSIX.2, and X/Open.
649 \item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si attivano le
650   funzionalità descritte nella \textit{X/Open Portability Guide}. Anche queste
651   sono un soprainsieme di quelle definite in POSIX.1 e POSIX.2 ed in effetti
652   sia \macro{\_POSIX\_SOURCE} che \macro{\_POSIX\_C\_SOURCE} vengono
653   automaticamente definite. Sono incluse anche ulteriori funzionalità
654   disponibili in BSD e SVID. Se il valore della macro è posto a 500 questo
655   include anche le nuove definizioni introdotte con la \textit{Single UNIX
656     Specification, version 2}, cioè Unix98.
657 \item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] definendo questa macro si attivano le
658   ulteriori funzionalità necessarie ad essere conformi al rilascio del marchio
659   \textit{X/Open Unix}.
660 \item[\macro{\_ISOC99\_SOURCE}] definendo questa macro si attivano le
661   funzionalità previste per la revisione delle librerie standard del C
662   denominato ISO C99. Dato che lo standard non è ancora adottato in maniera
663   ampia queste non sono abilitate automaticamente, ma le \acr{glibc} hanno già
664   un'implementazione completa che può essere attivata definendo questa macro.
665 \item[\macro{\_LARGEFILE\_SOURCE}] definendo questa macro si attivano le
666   funzionalità per il supporto dei file di grandi dimensioni (il \textit{Large
667     File Support} o LFS) con indici e dimensioni a 64 bit.
668 \item[\macro{\_GNU\_SOURCE}] definendo questa macro si attivano tutte le
669   funzionalità disponibili: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID,
670   X/Open, LFS più le estensioni specifiche GNU. Nel caso in cui BSD e POSIX
671   confliggano viene data la precedenza a POSIX.
672 \end{basedescript}
673
674 In particolare è da sottolineare che le \acr{glibc} supportano alcune
675 estensioni specifiche GNU, che non sono comprese in nessuno degli
676 standard citati. Per poterle utilizzare esse devono essere attivate
677 esplicitamente definendo la macro \macro{\_GNU\_SOURCE} prima di
678 includere i vari header file.
679
680
681 \subsection{Gli standard di GNU/Linux}
682 \label{sec:intro_linux_std}
683
684 Da fare (o cassare, a seconda del tempo e della voglia).
685
686
687
688 %%% Local Variables: 
689 %%% mode: latex
690 %%% TeX-master: "gapil"
691 %%% End: