Altre correzioni, segnalate da Massimo Fidanza
[gapil.git] / intro.tex
1 %% intro.tex
2 %%
3 %% Copyright (C) 2000-2005 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11 \chapter{L'architettura del sistema}
12 \label{cha:intro_unix}
13
14 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
15 cui è basato un sistema operativo di tipo Unix come GNU/Linux, in questo modo
16 potremo fornire una base di comprensione mirata a sottolineare le peculiarità
17 del sistema che sono più rilevanti per quello che riguarda la programmazione.
18
19 Dopo un'introduzione sulle caratteristiche principali di un sistema di tipo
20 Unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
21 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
22 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
23
24
25 \section{Una panoramica}
26 \label{sec:intro_unix_struct}
27
28 In questa prima sezione faremo una breve panoramica sull'architettura del
29 sistema.  Chi avesse già una conoscenza di questa materia può tranquillamente
30 saltare questa sezione.
31
32
33 \subsection{Concetti base}
34 \label{sec:intro_base_concept}
35
36 Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
37 cosiddetto \textit{kernel}, nel nostro caso Linux) a cui si demanda la
38 gestione delle risorse essenziali (la CPU, la memoria, le periferiche) mentre
39 tutto il resto, quindi anche la parte che prevede l'interazione con l'utente,
40 dev'essere realizzato tramite programmi eseguiti dal kernel, che accedano
41 alle risorse hardware tramite delle richieste a quest'ultimo.
42
43 Fin dall'inizio uno Unix si presenta come un sistema operativo
44 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
45 programmi, e multiutente, in cui è possibile che più utenti siano connessi ad
46 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
47 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
48 a rotazione).
49
50 % Questa e` una distinzione essenziale da capire,
51 %specie nei confronti dei sistemi operativi successivi, nati per i personal
52 %computer (e quindi per un uso personale), sui quali l'hardware (allora
53 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
54
55 I kernel Unix più recenti, come Linux, sono realizzati sfruttando alcune
56 caratteristiche dei processori moderni come la gestione hardware della memoria
57 e la modalità protetta. In sostanza con i processori moderni si può
58 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
59 zone di memoria fisica.  Quello che succede è che il kernel è il solo
60 programma ad essere eseguito in modalità privilegiata, con il completo accesso
61 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
62 (e non possono accedere direttamente alle zone di memoria riservate o alle
63 porte di input/output).
64
65 Una parte del kernel, lo \textit{scheduler}\index{\textit{scheduler}}, si
66 occupa di stabilire, ad intervalli fissi e sulla base di un opportuno calcolo
67 delle priorità, quale ``\textsl{processo}'' deve essere posto in esecuzione
68 (il cosiddetto \textit{preemptive
69   scheduling}\index{\textit{preemptive~scheduling}}).  Questo verrà comunque
70 eseguito in modalità protetta; quando necessario il processo potrà accedere
71 alle risorse hardware soltanto attraverso delle opportune chiamate al sistema
72 che restituiranno il controllo al kernel.
73
74 La memoria viene sempre gestita dal kernel attraverso il meccanismo della
75 \textsl{memoria virtuale}\index{memoria~virtuale}, che consente di assegnare a
76 ciascun processo uno spazio di indirizzi ``\textsl{virtuale}'' (vedi
77 sez.~\ref{sec:proc_memory}) che il kernel stesso, con l'ausilio della unità di
78 gestione della memoria, si incaricherà di rimappare automaticamente sulla
79 memoria disponibile, salvando su disco quando necessario (nella cosiddetta
80 area di \textit{swap}) le pagine di memoria in eccedenza.
81
82 Le periferiche infine vengono viste in genere attraverso un'interfaccia
83 astratta che permette di trattarle come fossero file, secondo il concetto per
84 cui \textit{everything is a file}, su cui torneremo in dettaglio in
85 cap.~\ref{cha:file_intro}. Questo non è vero per le interfacce di rete, che
86 hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
87 il lavoro di accesso e gestione a basso livello è effettuato dal kernel.
88
89
90 \subsection{Il kernel e il sistema}
91 \label{sec:intro_kern_and_sys}
92
93 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi Unix è
94 quello della distinzione fra il cosiddetto \textit{user space}, che
95 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
96 \textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
97 programma vede sé stesso come se avesse la piena disponibilità della CPU e
98 della memoria ed è, salvo i meccanismi di comunicazione previsti
99 dall'architettura, completamente ignaro del fatto che altri programmi possono
100 essere messi in esecuzione dal kernel.
101
102 Per questa separazione non è possibile ad un singolo programma disturbare
103 l'azione di un altro programma o del sistema e questo è il principale motivo
104 della stabilità di un sistema unix-like nei confronti di altri sistemi in cui
105 i processi non hanno di questi limiti, o che vengono per vari motivi eseguiti
106 al livello del kernel.
107
108 Pertanto deve essere chiaro a chi programma in Unix che l'accesso diretto
109 all'hardware non può avvenire se non all'interno del kernel; al di fuori dal
110 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
111 fornisce allo user space. 
112
113 Per capire meglio la distinzione fra kernel space e user space si può prendere
114 in esame la procedura di avvio di un sistema unix-like; all'avvio il BIOS (o
115 in generale il software di avvio posto nelle EPROM) eseguirà la procedura di
116 avvio del sistema (il cosiddetto \textit{bootstrap}\footnote{il nome deriva da
117   un espressione gergale che significa ``sollevarsi da terra tirandosi per le
118   stringhe delle scarpe'', per indicare il compito, almeno apparentemente
119   impossibile, di far eseguire un programma a partire da un computer appena
120   acceso che appunto non ne contiene nessuno; non è impossibile appunto perché
121   in realtà c'è un programma iniziale, che è appunto il BIOS.}), incaricandosi
122 di caricare il kernel in memoria e di farne partire l'esecuzione;
123 quest'ultimo, dopo aver inizializzato le periferiche, farà partire il primo
124 processo, \cmd{init}, che è quello che a sua volta farà partire tutti i
125 processi successivi. Fra questi ci sarà pure quello che si occupa di dialogare
126 con la tastiera e lo schermo della console, e quello che mette a disposizione
127 dell'utente che si vuole collegare, un terminale e la \textit{shell} da cui
128 inviare i comandi.
129
130 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
131 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
132 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
133 qualunque programma di scrittura o di disegno, in user space.
134
135 Questo significa, ad esempio, che il sistema di per sé non dispone di
136 primitive per tutta una serie di operazioni (come la copia di un file) che
137 altri sistemi (come Windows) hanno invece al loro interno. Pertanto buona
138 parte delle operazioni di normale amministrazione di un sistema, come quella
139 in esempio, sono implementate come normali programmi.
140
141 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
142 %realizzare un sistema di permessi e controlli che evitano che i programmi
143 %eseguano accessi non autorizzati. 
144
145 Per questo motivo quando ci si riferisce al sistema nella sua interezza è
146 corretto parlare di un sistema GNU/Linux: da solo il kernel è assolutamente
147 inutile; quello che costruisce un sistema operativo utilizzabile è la presenza
148 di tutta una serie di librerie e programmi di utilità (che di norma sono
149 quelli realizzati dal progetto GNU della Free Software Foundation) che
150 permettono di eseguire le normali operazioni che ci si aspetta da un sistema
151 operativo.
152
153
154 \subsection{Chiamate al sistema e librerie di funzioni}
155 \label{sec:intro_syscall}
156
157 Come accennato le interfacce con cui i programmi possono accedere all'hardware
158 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
159   call}), si tratta di un insieme di funzioni che un programma può chiamare,
160 per le quali viene generata un'interruzione del processo passando il controllo
161 dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
162 di operazioni interne come la gestione del multitasking e l'allocazione della
163 memoria) eseguirà la funzione richiesta in \textit{kernel space} restituendo i
164 risultati al chiamante.
165
166 Ogni versione di Unix ha storicamente sempre avuto un certo numero di queste
167 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale di
168   programmazione di Unix} (quella cui si accede con il comando \cmd{man 2
169   <nome>}) e Linux non fa eccezione. Queste sono poi state codificate da vari
170 standard, che esamineremo brevemente in sez.~\ref{sec:intro_standard}. Uno
171 schema elementare della struttura del sistema è riportato in
172 fig.~\ref{fig:intro_sys_struct}.
173
174 \begin{figure}[htb]
175   \centering
176   \includegraphics[width=10cm]{img/struct_sys}
177   \caption{Schema di massima della struttura di interazione fra processi,
178     kernel e dispositivi in Linux.}
179   \label{fig:intro_sys_struct}
180 \end{figure}
181
182 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
183 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
184 C, che, oltre alle interfacce alle system call, contiene anche tutta la serie
185 delle ulteriori funzioni definite dai vari standard, che sono comunemente
186 usate nella programmazione.
187
188 Questo è importante da capire perché programmare in Linux significa anzitutto
189 essere in grado di usare le varie interfacce contenute nella Libreria Standard
190 del C, in quanto né il kernel, né il linguaggio C, implementano direttamente
191 operazioni comuni come l'allocazione dinamica della memoria, l'input/output
192 bufferizzato o la manipolazione delle stringhe, presenti in qualunque
193 programma.
194
195 Quanto appena illustrato mette in evidenza il fatto che nella stragrande
196 maggioranza dei casi,\footnote{esistono implementazioni diverse delle librerie
197   Standard del C, come le \textit{libc5} o le \textit{uClib}, che non derivano
198   dal progetto GNU. Le \textit{libc5} oggi sono, tranne casi particolari,
199   completamente soppiantate dalle \acr{glibc}, le \textit{uClib} pur non
200   essendo complete come le \acr{glibc}, restano invece molto diffuse nel mondo
201   embedded per le loro dimensioni ridotte (e soprattutto la possibilità di
202   togliere le parti non necessarie), e pertanto costituiscono un valido
203   rimpiazzo delle \acr{glibc} in tutti quei sistemi specializzati che
204   richiedono una minima occupazione di memoria.} si dovrebbe usare il nome
205 GNU/Linux (piuttosto che soltanto Linux) in quanto una parte essenziale del
206 sistema (senza la quale niente funzionerebbe) è la GNU Standard C Library (in
207 breve \acr{glibc}), ovvero la libreria realizzata dalla Free Software
208 Foundation nella quale sono state implementate tutte le funzioni essenziali
209 definite negli standard POSIX e ANSI C, utilizzabili da qualunque programma.
210
211 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
212 \textsl{Manuale di Programmazione di Unix} (cioè accessibili con il comando
213 \cmd{man 3 <nome>}) e sono costruite sulla base delle chiamate al sistema del
214 kernel; è importante avere presente questa distinzione, fondamentale dal punto
215 di vista dell'implementazione, anche se poi, nella realizzazione di normali
216 programmi, non si hanno differenze pratiche fra l'uso di una funzione di
217 libreria e quello di una chiamata al sistema.
218
219
220 \subsection{Un sistema multiutente}
221 \label{sec:intro_multiuser}
222
223 Linux, come gli altri kernel Unix, nasce fin dall'inizio come sistema
224 multiutente, cioè in grado di fare lavorare più persone in contemporanea. Per
225 questo esistono una serie di meccanismi di sicurezza, che non sono previsti in
226 sistemi operativi monoutente, e che occorre tenere presente.
227
228 Il concetto base è quello di utente (\textit{user}) del sistema, le cui
229 capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
230 Sono così previsti una serie di meccanismi per identificare i singoli utenti
231 ed una serie di permessi e protezioni per impedire che utenti diversi possano
232 danneggiarsi a vicenda o danneggiare il sistema.
233
234 Ogni utente è identificato da un nome (l'\textit{username}), che è quello che
235 viene richiesto all'ingresso nel sistema dalla procedura di \textit{login}
236 (descritta in dettaglio in sez.~\ref{sec:sess_login}).  Questa procedura si
237 incarica di verificare l'identità dell'utente, in genere attraverso la
238 richiesta di una parola d'ordine (la \textit{password}), anche se sono
239 possibili meccanismi diversi.\footnote{Ad esempio usando la libreria PAM
240   (\textit{Pluggable Autentication Methods}) è possibile astrarre
241   completamente dai meccanismi di autenticazione e sostituire ad esempio l'uso
242   delle password con meccanismi di identificazione biometrica.}
243
244 Eseguita la procedura di riconoscimento in genere il sistema manda in
245 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
246 terminale o un'interfaccia grafica) che mette a disposizione dell'utente un
247 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
248
249 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
250 \textit{default group}), ma può essere associato ad altri gruppi (i
251 \textit{supplementary group}), questo permette di gestire i permessi di
252 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
253 definendo gruppi di lavoro, di accesso a determinate risorse, ecc.
254
255 L'utente e il gruppo sono identificati da due numeri, la cui corrispondenza ad
256 un nome espresso in caratteri è inserita nei due file \file{/etc/passwd} e
257 \file{/etc/groups}.\footnote{in realtà negli sistemi più moderni, come vedremo
258   in sez.~\ref{sec:sys_user_group} queste informazioni possono essere
259   mantenute, con l'uso del \textit{Name Service Switch}, su varie tipologie di
260   supporti, compresi server centralizzati come LDAP.}
261 \index{\textit{Name~Service~Switch}} Questi numeri sono l'\textit{user
262   identifier}, detto in breve \textsl{user-ID}, ed indicato dall'acronimo
263 \acr{uid}, e il \textit{group identifier}, detto in breve \textsl{group-ID},
264 ed identificato dall'acronimo \acr{gid}, e sono quelli che vengono usati dal
265 kernel per identificare l'utente.
266  
267 In questo modo il sistema è in grado di tenere traccia dell'utente a cui
268 appartiene ciascun processo ed impedire ad altri utenti di interferire con
269 quest'ultimo.  Inoltre con questo sistema viene anche garantita una forma base
270 di sicurezza interna in quanto anche l'accesso ai file (vedi
271 sez.~\ref{sec:file_access_control}) è regolato da questo meccanismo di
272 identificazione.
273
274 Infine in ogni Unix è presente un utente speciale privilegiato, il cosiddetto
275 \textit{superuser}, il cui username è di norma \textit{root}, ed il cui
276 \acr{uid} è zero. Esso identifica l'amministratore del sistema, che deve
277 essere in grado di fare qualunque operazione; per l'utente \textit{root}
278 infatti i meccanismi di controllo descritti in precedenza sono
279 disattivati.\footnote{i controlli infatti vengono sempre eseguiti da un codice
280   del tipo \code{if (uid) \{ ... \}}}
281
282
283 \section{Gli standard}
284 \label{sec:intro_standard}
285
286 In questa sezione faremo una breve panoramica relativa ai vari standard che
287 nel tempo sono stati formalizzati da enti, associazioni, consorzi e
288 organizzazioni varie al riguardo del sistema o alle caratteristiche che si
289 sono stabilite come standard di fatto in quanto facenti parte di alcune
290 implementazioni molto diffuse come BSD o SVr4.
291
292 Ovviamente prenderemo in considerazione solo gli standard riguardanti
293 interfacce di programmazione e le altre caratteristiche di un sistema
294 unix-like (alcuni standardizzano pure i comandi base del sistema e la shell)
295 ed in particolare ci concentreremo sul come ed in che modo essi sono
296 supportati sia per quanto riguarda il kernel che le librerie del C (con una
297 particolare attenzione alle \acr{glibc}).
298
299
300 \subsection{Lo standard ANSI C}
301 \label{sec:intro_ansiC}
302
303 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
304   Standard Institute}, come standard del linguaggio C ed è stato
305 successivamente adottato dalla \textit{International Standard Organisation}
306 come standard internazionale con la sigla ISO/IEC 9899:1990, e va anche sotto
307 il nome di standard ISO C.
308
309 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
310 sistemi operativi diversi, ma oltre alla sintassi ed alla semantica del
311 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
312 anche una libreria di funzioni che devono poter essere implementate su
313 qualunque sistema operativo.
314
315 Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
316 di tipo Unix, GNU/Linux (per essere precisi le \acr{glibc}), come molti Unix
317 moderni, provvede la compatibilità con questo standard, fornendo le funzioni
318 di libreria da esso previste. Queste sono dichiarate in una serie di
319 \textit{header file}\footnote{i file di dichiarazione di variabili, tipi e
320   funzioni, usati normalmente da un compilatore C. Per poter accedere alle
321   funzioni occorre includere con la direttiva \code{\#include} questi file nei
322   propri programmi; per ciascuna funzione che tratteremo in seguito
323   indicheremo anche gli \textit{header file} necessari ad usarla.}  (anch'essi
324 provvisti dalla \acr{glibc}), In tab.~\ref{tab:intro_posix_header} si sono
325 riportati i principali \textit{header file} definiti nello standard POSIX ed
326 ANSI C, che sono anche quelli definiti negli altri standard descritti nelle
327 sezioni successive.
328
329 \begin{table}[htb]
330   \footnotesize
331   \centering
332   \begin{tabular}[c]{|l|c|c|l|}
333     \hline
334     \multirow{2}{*}{\textbf{Header}}&
335     \multicolumn{2}{|c|}{\textbf{Standard}}&
336     \multirow{2}{*}{\textbf{Contenuto}} \\
337     \cline{2-3}
338     & ANSI C& POSIX& \\
339     \hline
340     \hline
341     \file{assert.h}&$\bullet$&         & Verifica le asserzioni fatte in un
342                                          programma.\\ 
343     \file{ctype.h} &$\bullet$&         & Tipi standard.\\
344     \file{dirent.h}&         &$\bullet$& Manipolazione delle directory.\\
345     \file{errno.h} &         &$\bullet$& Errori di sistema.\\
346     \file{fcntl.h} &         &$\bullet$& Controllo sulle opzioni dei file.\\
347     \file{limits.h}&         &$\bullet$& Limiti e parametri del sistema.\\
348     \file{malloc.h}&$\bullet$&         & Allocazione della memoria.\\
349     \file{setjmp.h}&$\bullet$&         & Salti non locali.\\
350     \file{signal.h}&         &$\bullet$& Gestione dei segnali.\\
351     \file{stdarg.h}&$\bullet$&         & .\\
352     \file{stdio.h} &$\bullet$&         & I/O bufferizzato in standard ANSI C.\\
353     \file{stdlib.h}&$\bullet$&         & definizioni della libreria standard.\\
354     \file{string.h}&$\bullet$&         & Manipolazione delle stringhe.\\
355     \file{time.h}  &         &$\bullet$& Gestione dei tempi.\\
356     \file{times.h} &$\bullet$&         & Gestione dei tempi.\\
357     \file{unistd.h}&         &$\bullet$& Unix standard library.\\
358     \file{utmp.h}  &         &$\bullet$& Registro connessioni utenti.\\
359     \hline
360   \end{tabular}
361   \caption{Elenco dei vari header file definiti dallo standard POSIX.}
362   \label{tab:intro_posix_header}
363 \end{table}
364
365
366 In realtà \acr{glibc} ed i relativi header file definiscono un insieme di
367 funzionalità in cui sono incluse come sottoinsieme anche quelle previste dallo
368 standard ANSI C. È possibile ottenere una conformità stretta allo standard
369 (scartando le funzionalità addizionali) usando il \cmd{gcc} con l'opzione
370 \cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei vari
371 header file soltanto le funzionalità previste dallo standard ANSI C e a non
372 usare le varie estensioni al linguaggio e al preprocessore da esso supportate.
373
374
375 \subsection{I tipi di dati primitivi}
376 \label{sec:intro_data_types}
377
378 Uno dei problemi di portabilità del codice più comune è quello dei tipi di
379 dati utilizzati nei programmi, che spesso variano da sistema a sistema, o
380 anche da una architettura ad un altra (ad esempio passando da macchine con
381 processori 32 bit a 64). In particolare questo è vero nell'uso dei cosiddetti
382 \textit{tipi elementari}\index{tipo!elementare} del linguaggio C (come
383 \ctyp{int}) la cui dimensione varia a seconda dell'architettura hardware.
384
385 Storicamente alcuni tipi nativi dello standard ANSI C sono sempre stati
386 associati ad alcune variabili nei sistemi Unix, dando per scontata la
387 dimensione. Ad esempio la posizione corrente all'interno di un file è sempre
388 stata associata ad un intero a 32 bit, mentre il numero di dispositivo è
389 sempre stato associato ad un intero a 16 bit. Storicamente questi erano
390 definiti rispettivamente come \ctyp{int} e \ctyp{short}, ma tutte le volte
391 che, con l'evolversi ed il mutare delle piattaforme hardware, alcuni di questi
392 tipi si sono rivelati inadeguati o sono cambiati, ci si è trovati di fronte ad
393 una infinita serie di problemi di portabilità.
394
395 \begin{table}[htb]
396   \footnotesize
397   \centering
398   \begin{tabular}[c]{|l|l|}
399     \hline
400     \textbf{Tipo} & \textbf{Contenuto} \\
401     \hline
402     \hline
403     \type{caddr\_t} & core address.\\
404     \type{clock\_t} & contatore del tempo di sistema.\\
405     \type{dev\_t}   & Numero di dispositivo.\\
406     \type{gid\_t}   & Identificatore di un gruppo.\\
407     \type{ino\_t}   & Numero di \textit{inode}\index{inode}.\\
408     \type{key\_t}   & Chiave per il System V IPC.\\
409     \type{loff\_t}  & Posizione corrente in un file.\\
410     \type{mode\_t}  & Attributi di un file.\\
411     \type{nlink\_t} & Contatore dei link su un file.\\
412     \type{off\_t}   & Posizione corrente in un file.\\
413     \type{pid\_t}   & Identificatore di un processo.\\
414     \type{rlim\_t}  & Limite sulle risorse.\\
415     \type{sigset\_t}& Insieme di segnali.\\
416     \type{size\_t}  & Dimensione di un oggetto.\\
417     \type{ssize\_t} & Dimensione in numero di byte ritornata dalle funzioni.\\
418     \type{ptrdiff\_t}& Differenza fra due puntatori.\\
419     \type{time\_t}  & Numero di secondi (in tempo di calendario).\\
420     \type{uid\_t}   & Identificatore di un utente.\\
421     \hline
422   \end{tabular}
423   \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
424   \label{tab:intro_primitive_types}
425 \end{table}
426
427 Per questo motivo tutte le funzioni di libreria di solito non fanno
428 riferimento ai tipi elementari dello standard del linguaggio C, ma ad una
429 serie di \textsl{tipi primitivi}\index{tipo!primitivo} del sistema, riportati
430 in tab.~\ref{tab:intro_primitive_types}, e definiti nell'header file
431 \file{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
432 utilizzati dalle funzioni di sistema dai tipi elementari supportati dal
433 compilatore C.
434
435
436
437 \subsection{Lo standard IEEE -- POSIX}
438 \label{sec:intro_posix}
439
440 Uno standard più attinente al sistema nel suo complesso (e che concerne sia il
441 kernel che le librerie) è lo standard POSIX. Esso prende origine dallo
442 standard ANSI C, che contiene come sottoinsieme, prevedendo ulteriori capacità
443 per le funzioni in esso definite, ed aggiungendone di nuove.
444
445 In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
446 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
447 X finale denuncia la sua stretta relazione con i sistemi Unix. Esso nasce dal
448 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
449 che ne produsse una prima versione, nota come IEEE 1003.1-1988, mirante a
450 standardizzare l'interfaccia con il sistema operativo.
451
452 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
453 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
454 i comandi di sistema (1003.2), per le estensioni realtime e per i thread
455 (1003.1d e 1003.1c) e vari altri.  In tab.~\ref{tab:intro_posix_std} è
456 riportata una classificazione sommaria dei principali documenti prodotti, e di
457 come sono identificati fra IEEE ed ISO; si tenga conto inoltre che molto
458 spesso si usa l'estensione IEEE anche come aggiunta al nome POSIX (ad esempio
459 si può parlare di POSIX.4 come di POSIX.1b).
460
461 Si tenga presente inoltre che nuove specifiche e proposte di standardizzazione
462 si aggiungono continuamente, mentre le versioni precedenti vengono riviste;
463 talvolta poi i riferimenti cambiano nome, per cui anche solo seguire le
464 denominazioni usate diventa particolarmente faticoso; una pagina dove si
465 possono recuperare varie (e di norma piuttosto intricate) informazioni è
466 \href{http://www.pasc.org/standing/sd11.html}
467 {\textsf{http://www.pasc.org/standing/sd11.html}}.
468
469 \begin{table}[htb]
470   \footnotesize
471   \centering
472   \begin{tabular}[c]{|l|l|l|l|}
473     \hline
474     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
475     \hline
476     \hline
477     POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
478     POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
479     POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
480     POSIX.3 & 2003   &TR13210& Metodi di test                               \\
481     POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
482     POSIX.4a& 1003.1c &  --- & Thread                                       \\
483     POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
484     POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
485     POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
486     POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
487     POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77                \\
488     POSIX.12& 1003.1g& 9945-1& Socket                                       \\
489     \hline
490   \end{tabular}
491   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
492   \label{tab:intro_posix_std}
493 \end{table}
494
495 Benché l'insieme degli standard POSIX siano basati sui sistemi Unix, essi
496 definiscono comunque un'interfaccia di programmazione generica e non fanno
497 riferimento ad una implementazione specifica (ad esempio esiste
498 un'implementazione di POSIX.1 anche sotto Windows NT).  Lo standard principale
499 resta comunque POSIX.1, che continua ad evolversi; la versione più nota, cui
500 gran parte delle implementazioni fanno riferimento, e che costituisce una base
501 per molti altri tentativi di standardizzazione, è stata rilasciata anche come
502 standard internazionale con la sigla ISO/IEC 9945-1:1996.
503
504 Linux e le \acr{glibc} implementano tutte le funzioni definite nello standard
505 POSIX.1, queste ultime forniscono in più alcune ulteriori capacità (per
506 funzioni di \textit{pattern matching} e per la manipolazione delle
507 \textit{regular expression}), che vengono usate dalla shell e dai comandi di
508 sistema e che sono definite nello standard POSIX.2.
509
510 Nelle versioni più recenti del kernel e delle librerie sono inoltre supportate
511 ulteriori funzionalità aggiunte dallo standard POSIX.1c per quanto riguarda i
512 \textit{thread} (vedi cap.~\ref{cha:threads}), e dallo standard POSIX.1b per
513 quanto riguarda i segnali e lo scheduling real-time
514 (sez.~\ref{sec:sig_real_time} e sez.~\ref{sec:proc_real_time}), la misura del
515 tempo, i meccanismi di intercomunicazione (sez.~\ref{sec:ipc_posix}) e l'I/O
516 asincrono (sez.~\ref{sec:file_asyncronous_io}).
517
518
519
520 \subsection{Lo standard X/Open -- XPG3}
521 \label{sec:intro_xopen}
522
523 Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
524 Unix per giungere ad un'armonizzazione delle varie implementazioni.  Per far
525 questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
526 nome di \textit{X/Open Portability Guide} (a cui di norma si fa riferimento
527 con l'abbreviazione XPG$n$ con $n$ che indica la versione).
528
529 Nel 1989 il consorzio produsse una terza versione di questa guida
530 particolarmente voluminosa (la \textit{X/Open Portability Guide, Issue 3}),
531 contenente un'ulteriore standardizzazione dell'interfaccia di sistema di Unix,
532 che venne presa come riferimento da vari produttori.
533
534 Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
535 basato sullo standard POSIX.1, ma prevede una serie di funzionalità aggiuntive
536 fra cui le specifiche delle API (\textit{Application Programmable Interface})
537 per l'interfaccia grafica (X11).
538
539 Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
540 Issue 4 (da cui la sigla XPG4) che aggiungeva l'interfaccia XTI (\textit{X
541   Transport Interface}) mirante a soppiantare (senza molto successo)
542 l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
543 rilasciata nel 1994, questa è nota con il nome di Spec 1170 (dal numero delle
544 interfacce, header e comandi definiti). 
545
546 Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
547 aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
548 specifiche sotto il nome di \textit{Single UNIX Specification}, l'ultima
549 versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
550   Specification}, SUSv1, più comunemente nota come \textit{Unix 95}.
551
552
553 \subsection{Gli standard Unix  -- Open Group}
554 \label{sec:intro_opengroup}
555
556 Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
557 da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
558 alla costituzione dell'Open Group, un consorzio internazionale che raccoglie
559 produttori, utenti industriali, entità accademiche e governative.
560
561 Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
562 il lavoro di standardizzazione delle varie implementazioni, rilasciando
563 periodicamente nuove specifiche e strumenti per la verifica della conformità
564 alle stesse.
565
566 Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
567   Specification}, nota con la sigla SUSv2, in queste versione le interfacce
568 specificate salgono a 1434 (e 3030 se si considerano le stazioni di lavoro
569 grafiche, per le quali sono inserite pure le interfacce usate da CDE che
570 richiede sia X11 che Motif). La conformità a questa versione permette l'uso
571 del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard.
572
573
574 \subsection{Lo ``\textsl{standard}'' BSD}
575 \label{sec:intro_bsd}
576
577 Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
578 di Berkley e la AT\&T generò una delle prime e più importanti fratture del
579 mondo Unix.  L'Università di Berkley proseguì nello sviluppo della base di
580 codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
581 versioni allora disponibili, fino ad arrivare al rilascio di una versione
582 completa di Unix, chiamata appunto BSD, del tutto indipendente dal codice
583 della AT\&T.
584
585 Benché BSD non sia uno standard formalizzato, l'implementazione di Unix
586 dell'Università di Berkley, ha provveduto nel tempo una serie di estensioni e
587 API di grande rilievo, come i link simbolici, la funzione \code{select} ed i
588 socket.
589
590 Queste estensioni sono state via via aggiunte al sistema nelle varie versioni
591 del sistema (BSD 4.2, BSD 4.3 e BSD 4.4) come pure in alcuni derivati
592 commerciali come SunOS. Il kernel Linux e le \acr{glibc} provvedono tutte
593 queste estensioni che sono state in gran parte incorporate negli standard
594 successivi.
595
596
597 \subsection{Lo standard System V}
598 \label{sec:intro_sysv}
599
600 Come noto Unix nasce nei laboratori della AT\&T, che ne registrò il nome come
601 marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
602 versione supportata ufficialmente venne rilasciata al pubblico con il nome di
603 Unix System V. Negli anni successivi l'AT\&T proseguì lo sviluppo rilasciando
604 varie versioni con aggiunte e integrazioni; nel 1989 un accordo fra vari
605 venditori (AT\&T, Sun, HP, e altro) portò ad una versione che provvedeva
606 un'unificazione delle interfacce comprendente Xenix e BSD, la System V release
607 4.
608
609 L'interfaccia di questa ultima release è descritta in un documento dal titolo
610 \textit{System V Interface Description}, o SVID; spesso però si fa riferimento
611 a questo standard con il nome della sua implementazione, usando la sigla SVr4.
612
613 Anche questo costituisce un sovrainsieme delle interfacce definite dallo
614 standard POSIX.  Nel 1992 venne rilasciata una seconda versione del sistema:
615 la SVr4.2. L'anno successivo la divisione della AT\&T (già a suo tempo
616 rinominata in Unix System Laboratories) venne acquistata dalla Novell, che poi
617 trasferì il marchio Unix al consorzio X/Open; l'ultima versione di System V fu
618 la SVr4.2MP rilasciata nel Dicembre 93.
619
620 Linux e le \acr{glibc} implementano le principali funzionalità richieste da
621 SVID che non sono già incluse negli standard POSIX ed ANSI C, per
622 compatibilità con lo Unix System V e con altri Unix (come SunOS) che le
623 includono. Tuttavia le funzionalità più oscure e meno utilizzate (che non sono
624 presenti neanche in System V) sono state tralasciate.
625
626 Le funzionalità implementate sono principalmente il meccanismo di
627 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
628 V IPC, che vedremo in sez.~\ref{sec:ipc_sysv}) le funzioni della famiglia
629 \func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
630 matematiche.
631
632
633 \subsection{Il comportamento standard del \cmd{gcc} e delle \acr{glibc}}
634 \label{sec:intro_gcc_glibc_std}
635
636 In Linux, grazie alle \acr{glibc}, gli standard appena descritti sono
637 ottenibili sia attraverso l'uso di opzioni del compilatore (il \cmd{gcc}) che
638 definendo opportune costanti prima dell'inclusione dei file degli header.
639
640 Se si vuole che i programmi seguano una stretta attinenza allo standard ANSI C
641 si può usare l'opzione \cmd{-ansi} del compilatore, e non sarà riconosciuta
642 nessuna funzione non riconosciuta dalle specifiche standard ISO per il C.
643
644 Per attivare le varie opzioni è possibile definire le macro di preprocessore,
645 che controllano le funzionalità che le \acr{glibc} possono mettere a
646 disposizione: questo può essere fatto attraverso l'opzione \cmd{-D} del
647 compilatore, ma è buona norma inserire gli opportuni \code{\#define} nei
648 propri header file.
649
650 Le macro disponibili per i vari standard sono le seguenti:
651 \begin{basedescript}{\desclabelwidth{3cm}\desclabelstyle{\nextlinelabel}}
652 \item[\macro{\_POSIX\_SOURCE}] definendo questa macro si rendono disponibili
653   tutte le funzionalità dello standard POSIX.1 (la versione IEEE Standard
654   1003.1) insieme a tutte le funzionalità dello standard ISO C. Se viene anche
655   definita con un intero positivo la macro \macro{\_POSIX\_C\_SOURCE} lo stato
656   di questa non viene preso in considerazione.
657 \item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
658   positivo si controlla quale livello delle funzionalità specificate da POSIX
659   viene messa a disposizione; più alto è il valore maggiori sono le
660   funzionalità. Se è uguale a ``\texttt{1}'' vengono attivate le funzionalità
661   specificate nella edizione del 1990 (IEEE Standard 1003.1-1990), valori
662   maggiori o uguali a ``\texttt{2}'' attivano le funzionalità POSIX.2
663   specificate nell'edizione del 1992 (IEEE Standard 1003.2-1992). Un valore
664   maggiore o uguale a ``\texttt{199309L}'' attiva le funzionalità POSIX.1b
665   specificate nell'edizione del 1993 (IEEE Standard 1003.1b-1993).  Un valore
666   maggiore o uguale a ``\texttt{199506L}'' attiva le funzionalità POSIX.1
667   specificate nell'edizione del 1996 (ISO/IEC 9945-1: 1996). Valori superiori
668   abiliteranno ulteriori estensioni.
669 \item[\macro{\_BSD\_SOURCE}] definendo questa macro si attivano le
670   funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
671   ISO C, POSIX.1 e POSIX.2. Alcune delle funzionalità previste da BSD sono
672   però in conflitto con le corrispondenti definite nello standard POSIX.1, in
673   questo caso le definizioni previste da BSD4.3 hanno la precedenza rispetto a
674   POSIX.  A causa della natura dei conflitti con POSIX per ottenere una piena
675   compatibilità con BSD4.3 è necessario anche usare una libreria di
676   compatibilità, dato che alcune funzioni sono definite in modo diverso. In
677   questo caso occorre pertanto anche usare l'opzione \cmd{-lbsd-compat} con il
678   compilatore per indicargli di utilizzare le versioni nella libreria di
679   compatibilità prima di quelle normali.
680 \item[\macro{\_SVID\_SOURCE}] definendo questa macro si attivano le
681   funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
682   standard ISO C, POSIX.1, POSIX.2, e X/Open.
683 \item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si attivano le
684   funzionalità descritte nella \textit{X/Open Portability Guide}. Anche queste
685   sono un sovrainsieme di quelle definite in POSIX.1 e POSIX.2 ed in effetti
686   sia \macro{\_POSIX\_SOURCE} che \macro{\_POSIX\_C\_SOURCE} vengono
687   automaticamente definite. Sono incluse anche ulteriori funzionalità
688   disponibili in BSD e SVID. Se il valore della macro è posto a
689   ``\texttt{500}'' questo include anche le nuove definizioni introdotte con la
690   \textit{Single UNIX Specification, version 2}, cioè Unix98.
691 \item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] definendo questa macro si attivano le
692   ulteriori funzionalità necessarie ad essere conformi al rilascio del marchio
693   \textit{X/Open Unix}.
694 \item[\macro{\_ISOC99\_SOURCE}] definendo questa macro si attivano le
695   funzionalità previste per la revisione delle librerie standard del C
696   denominato ISO C99. Dato che lo standard non è ancora adottato in maniera
697   ampia queste non sono abilitate automaticamente, ma le \acr{glibc} hanno già
698   un'implementazione completa che può essere attivata definendo questa macro.
699 \item[\macro{\_LARGEFILE\_SOURCE}] definendo questa macro si attivano le
700   funzionalità per il supporto dei file di grandi dimensioni (il \textit{Large
701     File Support} o LFS) con indici e dimensioni a 64 bit.
702 \item[\macro{\_GNU\_SOURCE}] definendo questa macro si attivano tutte le
703   funzionalità disponibili: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID,
704   X/Open, LFS più le estensioni specifiche GNU. Nel caso in cui BSD e POSIX
705   confliggano viene data la precedenza a POSIX.
706 \end{basedescript}
707
708 In particolare è da sottolineare che le \acr{glibc} supportano alcune
709 estensioni specifiche GNU, che non sono comprese in nessuno degli
710 standard citati. Per poterle utilizzare esse devono essere attivate
711 esplicitamente definendo la macro \macro{\_GNU\_SOURCE} prima di
712 includere i vari header file.
713
714
715 %% \subsection{Gli standard di GNU/Linux}
716 %% \label{sec:intro_linux_std}
717
718 %% Da fare (o cassare, a seconda del tempo e della voglia).
719
720
721
722 %%% Local Variables: 
723 %%% mode: latex
724 %%% TeX-master: "gapil"
725 %%% End: