Correzioni per l'introduzione
[gapil.git] / intro.tex
1 %% intro.tex
2 %%
3 %% Copyright (C) 2000-2002 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11 \part{Programmazione di sistema}
12 \label{part:progr-di-sist}
13
14
15 \chapter{L'architettura del sistema}
16 \label{cha:intro_unix}
17
18 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
19 cui è basato un sistema operativo di tipo Unix come GNU/Linux, in questo modo
20 potremo fornire una base di comprensione mirata a sottolineare le peculiarità
21 del sistema che sono più rilevanti per quello che riguarda la programmazione.
22
23 Dopo un'introduzione sulle caratteristiche principali di un sistema di tipo
24 Unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
25 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
26 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
27
28
29 \section{Una panoramica}
30 \label{sec:intro_unix_struct}
31
32 In questa prima sezione faremo una breve panoramica sull'architettura del
33 sistema.  Chi avesse già una conoscenza di questa materia può tranquillamente
34 saltare questa sezione.
35
36
37 \subsection{Concetti base}
38 \label{sec:intro_base_concept}
39
40 Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
41 cosiddetto \textit{kernel}, nel nostro caso Linux) a cui si demanda la
42 gestione delle risorse essenziali (la CPU, la memoria, le periferiche) mentre
43 tutto il resto, quindi anche la parte che prevede l'interazione con l'utente,
44 deve venire realizzato tramite programmi eseguiti dal kernel e che accedano
45 alle risorse hardware tramite delle richieste a quest'ultimo.
46
47 Fin dall'inizio uno Unix si presenta come un sistema operativo
48 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
49 programmi, e multiutente, in cui è possibile che più utenti siano connessi ad
50 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
51 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
52 a rotazione).
53
54 % Questa e` una distinzione essenziale da capire,
55 %specie nei confronti dei sistemi operativi successivi, nati per i personal
56 %computer (e quindi per un uso personale), sui quali l'hardware (allora
57 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
58
59 I kernel Unix più recenti, come Linux, sono realizzati sfruttando alcune
60 caratteristiche dei processori moderni come la gestione hardware della memoria
61 e la modalità protetta. In sostanza con i processori moderni si può
62 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
63 zone di memoria fisica.  Quello che succede è che il kernel è il solo
64 programma ad essere eseguito in modalità privilegiata, con il completo accesso
65 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
66 (e non possono accedere direttamente alle zone di memoria riservate o alle
67 porte di input/output).
68
69 Una parte del kernel, lo \textit{scheduler}\index{scheduler}, si occupa di
70 stabilire, ad intervalli fissi e sulla base di un opportuno calcolo delle
71 priorità, quale ``\textsl{processo}'' deve essere posto in esecuzione (il
72 cosiddetto \textit{preemptive scheduling}\index{preemptive scheduling}).
73 Questo verrà comunque eseguito in modalità protetta; quando necessario il
74 processo potrà accedere alle risorse hardware soltanto attraverso delle
75 opportune chiamate al sistema che restituiranno il controllo al kernel.
76
77 La memoria viene sempre gestita dal kernel attraverso il meccanismo della
78 \textsl{memoria virtuale}\index{memoria virtuale}, che consente di assegnare a
79 ciascun processo uno spazio di indirizzi ``\textsl{virtuale}'' (vedi
80 \secref{sec:proc_memory}) che il kernel stesso, con l'ausilio della unità di
81 gestione della memoria, si incaricherà di rimappare automaticamente sulla
82 memoria disponibile, salvando su disco quando necessario (nella cosiddetta
83 area di \textit{swap}) le pagine di memoria in eccedenza.
84
85 Le periferiche infine vengono viste in genere attraverso un'interfaccia
86 astratta che permette di trattarle come fossero file, secondo il concetto per
87 cui \textit{everything is a file}, su cui torneremo in dettaglio in
88 \capref{cha:file_intro}, (questo non è vero per le interfacce di rete, che
89 hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
90 il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
91
92
93 \subsection{User space e kernel space}
94 \label{sec:intro_user_kernel_space}
95
96 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi Unix è
97 quello della distinzione fra il cosiddetto \textit{user space}, che
98 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
99 \textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
100 programma vede sé stesso come se avesse la piena disponibilità della CPU e
101 della memoria ed è, salvo i meccanismi di comunicazione previsti
102 dall'architettura, completamente ignaro del fatto che altri programmi possono
103 essere messi in esecuzione dal kernel.
104
105 Per questa separazione non è possibile ad un singolo programma disturbare
106 l'azione di un altro programma o del sistema e questo è il principale motivo
107 della stabilità di un sistema unix-like nei confronti di altri sistemi in cui
108 i processi non hanno di questi limiti, o che vengono per vari motivi eseguiti
109 al livello del kernel.
110
111 Pertanto deve essere chiaro a chi programma in Unix che l'accesso diretto
112 all'hardware non può avvenire se non all'interno del kernel; al di fuori dal
113 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
114 fornisce allo user space. 
115
116
117 \subsection{Il kernel e il sistema}
118 \label{sec:intro_kern_and_sys}
119
120 Per capire meglio la distinzione fra kernel space e user space si può prendere
121 in esame la procedura di avvio di un sistema unix-like; all'avvio il BIOS (o
122 in generale il software di avvio posto nelle EPROM) eseguirà la procedura di
123 avvio del sistema (il cosiddetto \textit{boot}), incaricandosi di caricare il
124 kernel in memoria e di farne partire l'esecuzione; quest'ultimo, dopo aver
125 inizializzato le periferiche, farà partire il primo processo, \cmd{init}, che
126 è quello che a sua volta farà partire tutti i processi successivi. Fra questi
127 ci sarà pure quello che si occupa di dialogare con la tastiera e lo schermo
128 della console, e quello che mette a disposizione dell'utente che si vuole
129 collegare, un terminale e la \textit{shell} da cui inviare i comandi.
130
131 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
132 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
133 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
134 qualunque programma di scrittura o di disegno, in user space.
135
136 Questo significa, ad esempio, che il sistema di per sé non dispone di
137 primitive per tutta una serie di operazioni (come la copia di un file) che
138 altri sistemi (come Windows) hanno invece al loro interno. Pertanto buona
139 parte delle operazioni di normale amministrazione di un sistema, come quella
140 in esempio, sono implementate come normali programmi.
141
142 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
143 %realizzare un sistema di permessi e controlli che evitano che i programmi
144 %eseguano accessi non autorizzati. 
145
146 Per questo motivo quando ci si riferisce al sistema nella sua interezza è
147 corretto parlare di un sistema GNU/Linux: da solo il kernel è assolutamente
148 inutile; quello che costruisce un sistema operativo utilizzabile è la presenza
149 di tutta una serie di librerie e programmi di utilità (che di norma sono
150 quelli realizzati dal progetto GNU della Free Software Foundation) che
151 permettono di eseguire le normali operazioni che ci si aspetta da un sistema
152 operativo.
153
154
155 \subsection{Chiamate al sistema e librerie di funzioni}
156 \label{sec:intro_syscall}
157
158 Come accennato le interfacce con cui i programmi possono accedere all'hardware
159 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
160   call}), si tratta di un insieme di funzioni che un programma può chiamare,
161 per le quali viene generata un'interruzione del processo passando il controllo
162 dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
163 di operazioni interne come la gestione del multitasking e l'allocazione della
164 memoria) eseguirà la funzione richiesta in \textit{kernel space} restituendo i
165 risultati al chiamante.
166
167 Ogni versione di Unix ha storicamente sempre avuto un certo numero di queste
168 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale di
169   programmazione di Unix} (quella cui si accede con il comando \cmd{man 2
170   <nome>}) e Linux non fa eccezione. Queste sono poi state codificate da vari
171 standard, che esamineremo brevemente in \secref{sec:intro_standard}. Uno
172 schema elementare della struttura del sistema è riportato in
173 \figref{fig:intro_sys_struct}.
174
175 \begin{figure}[htb]
176   \centering
177   \includegraphics[width=10cm]{img/struct_sys}
178   \caption{Schema di massima della struttura di interazione fra processi,
179     kernel e dispositivi in Linux.}
180   \label{fig:intro_sys_struct}
181 \end{figure}
182
183 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
184 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
185 C, che, oltre alle interfacce alle system call, contiene anche tutta la serie
186 delle ulteriori funzioni definite dai vari standard, che sono comunemente
187 usate nella programmazione.
188
189 Questo è importante da capire perché programmare in Linux significa anzitutto
190 essere in grado di usare le varie interfacce contenute nella Libreria Standard
191 del C, in quanto né il kernel, né il linguaggio C, implementano direttamente
192 operazioni comuni come l'allocazione dinamica della memoria, l'input/output
193 bufferizzato o la manipolazione delle stringhe, presenti in qualunque
194 programma.
195
196 Quanto appena illustrato mette in evidenza il fatto che nella stragrande
197 maggioranza dei casi,\footnote{esistono implementazioni diverse delle librerie
198   Standard del C, come le \textit{libc5} o le \textit{uClib}, che non derivano
199   dal progetto GNU. Le \textit{libc5} oggi sono, tranne casi particolari,
200   completamente soppiantate dalle \acr{glibc}, le \textit{uClib} pur non
201   essendo complete come le \acr{glibc}, restano invece molto diffuse nel mondo
202   embedded per le loro di dimensioni ridotte (e soprattutto la possibilità di
203   togliere le parti non necessarie), e pertanto costituiscono un valido
204   rimpiazzo delle \acr{glibc} in tutti quei sistemi specializzati che
205   richiedono una minima occupazione di memoria.} si dovrebbe usare il nome
206 GNU/Linux (piuttosto che soltanto Linux) in quanto una parte essenziale del
207 sistema (senza la quale niente funzionerebbe) è la GNU Standard C Library (in
208 breve \acr{glibc}), ovvero la libreria realizzata dalla Free Software
209 Foundation nella quale sono state implementate tutte le funzioni essenziali
210 definite negli standard POSIX e ANSI C, utilizzabili da qualunque programma.
211
212 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
213 \textsl{Manuale di Programmazione di Unix} (cioè accessibili con il comando
214 \cmd{man 3 <nome>}) e sono costruite sulla base delle chiamate al sistema del
215 kernel; è importante avere presente questa distinzione, fondamentale dal punto
216 di vista dell'implementazione, anche se poi, nella realizzazione di normali
217 programmi, non si hanno differenze pratiche fra l'uso di una funzione di
218 libreria e quello di una chiamata al sistema.
219
220
221 \subsection{Un sistema multiutente}
222 \label{sec:intro_multiuser}
223
224 Linux, come gli altri kernel Unix, nasce fin dall'inizio come sistema
225 multiutente, cioè in grado di fare lavorare più persone in contemporanea. Per
226 questo esistono una serie di meccanismi di sicurezza, che non sono previsti in
227 sistemi operativi monoutente, e che occorre tenere presente.
228
229 Il concetto base è quello di utente (\textit{user}) del sistema, le cui
230 capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
231 Sono così previsti una serie di meccanismi per identificare i singoli utenti
232 ed una serie di permessi e protezioni per impedire che utenti diversi possano
233 danneggiarsi a vicenda o danneggiare il sistema.
234
235 Ogni utente è identificato da un nome (l'\textit{username}), che è quello che
236 viene richiesto all'ingresso nel sistema dalla procedura di \textit{login}
237 (descritta in dettaglio in \secref{sec:sess_login}).  Questa procedura si
238 incarica di verificare l'identità dell'utente, in genere attraverso la
239 richiesta di una parola d'ordine (la \textit{password}), anche se sono
240 possibili meccanismi diversi.\footnote{Ad esempio usando la libreria PAM
241   (\textit{Pluggable Autentication Methods}) è possibile astrarre
242   completamente dai meccanismi di autenticazione e sostituire ad esempio l'uso
243   delle password con meccanismi di identificazione biometrica.}
244
245 Eseguita la procedura di riconoscimento in genere il sistema manda in
246 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
247 terminale o un'interfaccia grafica) che mette a disposizione dell'utente un
248 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
249
250 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
251 \textit{default group}), ma può essere associato ad altri gruppi (i
252 \textit{supplementary group}), questo permette di gestire i permessi di
253 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
254 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
255
256 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
257 un nome espresso in caratteri è inserita nei due file \file{/etc/passwd} e
258 \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto in
259 breve \textsl{user-ID}, ed indicato dall'acronimo \acr{uid}, e il
260 \textit{group identifier}, detto in breve \textsl{group-ID}, ed identificato
261 dall'acronimo \acr{gid}, e sono quelli che vengono usati dal kernel per
262 identificare l'utente.
263  
264 In questo modo il sistema è in grado di tenere traccia per ogni processo
265 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
266 esso. Inoltre con questo sistema viene anche garantita una forma base di
267 sicurezza interna in quanto anche l'accesso ai file (vedi
268 \secref{sec:file_access_control}) è regolato da questo meccanismo di
269 identificazione.
270
271 Infine in ogni Unix è presente un utente speciale privilegiato, il cosiddetto
272 \textit{superuser}, il cui username è di norma \textit{root}, ed il cui
273 \acr{uid} è zero. Esso identifica l'amministratore del sistema, che deve
274 essere in grado di fare qualunque operazione; per l'utente \textit{root}
275 infatti i meccanismi di controllo descritti in precedenza sono
276 disattivati.\footnote{i controlli infatti vengono sempre eseguiti da un codice
277   del tipo \code{if (uid) \{ ... \}}}
278
279
280 \section{Gli standard}
281 \label{sec:intro_standard}
282
283 In questa sezione faremo una breve panoramica relativa ai vari standard che
284 nel tempo sono stati formalizzati da enti, associazioni, consorzi e
285 organizzazioni varie al riguardo del sistema o alle caratteristiche che si
286 sono stabilite come standard di fatto in quanto facenti parte di alcune
287 implementazioni molto diffuse come BSD o SVr4.
288
289 Ovviamente prenderemo in considerazione solo gli standard riguardanti
290 interfacce di programmazione e le altre caratteristiche di un sistema
291 unix-like (alcuni standardizzano pure i comandi base del sistema e la shell)
292 ed in particolare ci concentreremo sul come ed in che modo essi sono
293 supportati sia per quanto riguarda il kernel che le librerie del C (con una
294 particolare attenzione alle \acr{glibc}).
295
296
297 \subsection{Lo standard ANSI C}
298 \label{sec:intro_ansiC}
299
300 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
301   Standard Institute}, come standard del linguaggio C ed è stato
302 successivamente adottato dalla \textit{International Standard Organisation}
303 come standard internazionale con la sigla ISO/IEC 9899:1990, e va anche sotto
304 il nome di standard ISO C.
305
306 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
307 sistemi operativi diversi, ma oltre alla sintassi ed alla semantica del
308 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
309 anche una libreria di funzioni che devono poter essere implementate su
310 qualunque sistema operativo.
311
312 Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
313 di tipo Unix, GNU/Linux (per essere precisi le \acr{glibc}), come molti Unix
314 moderni, provvede la compatibilità con questo standard, fornendo le funzioni
315 di libreria da esso previste. Queste sono dichiarate in una serie di
316 \textit{header file}\footnote{i file di dichiarazione di variabili, tipi e
317   funzioni, usati normalmente da un compilatore C. Per poter accedere alle
318   funzioni occorre includere con la direttiva \code{\#include} questi file nei
319   propri programmi; per ciascuna funzione che tratteremo in seguito
320   indicheremo anche gli \textit{header file} necessari ad usarla.}  (anch'essi
321 provvisti dalla \acr{glibc}), In \tabref{tab:intro_posix_header} si sono
322 riportati i principali \textit{header file} definiti nello standard POSIX,
323 insieme a quelli definiti negli altri standard descritti nelle sezioni
324 successive.
325
326 \begin{table}[htb]
327   \footnotesize
328   \centering
329   \begin{tabular}[c]{|l|c|c|l|}
330     \hline
331     \multirow{2}{*}{\textbf{Header}}&
332     \multicolumn{2}{|c|}{\textbf{Standard}}&
333     \multirow{2}{*}{\textbf{Contenuto}} \\
334     \cline{2-3}
335     & ANSI C& POSIX& \\
336     \hline
337     \hline
338     \file{assert.h}&$\bullet$&$\bullet$& Verifica le asserzioni fatte in un
339                                      programma.\\ 
340     \file{errno.h} &$\bullet$&$\bullet$& Errori di sistema.\\
341     \file{fcntl.h} &$\bullet$&$\bullet$& Controllo sulle opzioni dei file.\\
342     \file{limits.h}&$\bullet$&$\bullet$& Limiti e parametri del sistema.\\
343     \file{} &$\bullet$&$\bullet$& .\\
344     \file{} &$\bullet$&$\bullet$& .\\
345     \file{} &$\bullet$&$\bullet$& .\\
346     \file{} &$\bullet$&$\bullet$& .\\
347     \file{} &$\bullet$&$\bullet$& .\\
348     \file{stdio.h} &$\bullet$&$\bullet$& I/O bufferizzato in standard ANSI C.\\
349     \file{stdlib.h}&$\bullet$&$\bullet$& definizioni della libreria standard.\\
350     \hline
351   \end{tabular}
352   \caption{Elenco dei vari header file definiti dallo standard POSIX.}
353   \label{tab:intro_posix_header}
354 \end{table}
355
356
357 In realtà \acr{glibc} ed i relativi header file definiscono un insieme di
358 funzionalità in cui sono incluse come sottoinsieme anche quelle previste dallo
359 standard ANSI C. È possibile ottenere una conformità stretta allo standard
360 (scartando le funzionalità addizionali) usando il \cmd{gcc} con l'opzione
361 \cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei vari
362 header file soltanto le funzionalità previste dallo standard ANSI C e a non
363 usare le varie estensioni al linguaggio e al preprocessore da esso supportate.
364
365
366 \subsection{I tipi di dati primitivi}
367 \label{sec:intro_data_types}
368
369 Uno dei problemi di portabilità del codice più comune è quello dei tipi di
370 dati utilizzati nei programmi, che spesso variano da sistema a sistema, o
371 anche da una architettura ad un altra (ad esempio passando da macchine con
372 processori 32 bit a 64). In particolare questo è vero nell'uso dei cosiddetti
373 \textit{tipi elementari}\index{tipo!elementare} del linguaggio C (come
374 \ctyp{int}) la cui dimensione varia a seconda dell'architettura hardware.
375
376 Storicamente alcuni tipi nativi dello standard ANSI C sono sempre stati
377 associati ad alcune variabili nei sistemi Unix, dando per scontata la
378 dimensione. Ad esempio la posizione corrente all'interno di un file è sempre
379 stata associata ad un intero a 32 bit, mentre il numero di dispositivo è
380 sempre stato associato ad un intero a 16 bit. Storicamente questi erano
381 definiti rispettivamente come \ctyp{int} e \ctyp{short}, ma tutte le volte
382 che, con l'evolversi ed il mutare delle piattaforme hardware, alcuni di questi
383 tipi si sono rivelati inadeguati o sono cambiati, ci si è trovati di fronte ad
384 una infinita serie di problemi di portabilità.
385
386 \begin{table}[htb]
387   \footnotesize
388   \centering
389   \begin{tabular}[c]{|l|l|}
390     \hline
391     \textbf{Tipo} & \textbf{Contenuto} \\
392     \hline
393     \hline
394     \type{caddr\_t} & core address.\\
395     \type{clock\_t} & contatore del tempo di sistema.\\
396     \type{dev\_t}   & Numero di dispositivo.\\
397     \type{gid\_t}   & Identificatore di un gruppo.\\
398     \type{ino\_t}   & Numero di \textit{inode}\index{inode}.\\
399     \type{key\_t}   & Chiave per il System V IPC.\\
400     \type{loff\_t}  & Posizione corrente in un file.\\
401     \type{mode\_t}  & Attributi di un file.\\
402     \type{nlink\_t} & Contatore dei link su un file.\\
403     \type{off\_t}   & Posizione corrente in un file.\\
404     \type{pid\_t}   & Identificatore di un processo.\\
405     \type{rlim\_t}  & Limite sulle risorse.\\
406     \type{sigset\_t}& Insieme di segnali.\\
407     \type{size\_t}  & Dimensione di un oggetto.\\
408     \type{ssize\_t} & Dimensione in numero di byte ritornata dalle funzioni.\\
409     \type{ptrdiff\_t}& Differenza fra due puntatori.\\
410     \type{time\_t}  & Numero di secondi (in tempo di calendario).\\
411     \type{uid\_t}   & Identificatore di un utente.\\
412     \hline
413   \end{tabular}
414   \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
415   \label{tab:intro_primitive_types}
416 \end{table}
417
418 Per questo motivo tutte le funzioni di libreria di solito non fanno
419 riferimento ai tipi elementari dello standard del linguaggio C, ma ad una
420 serie di \textsl{tipi primitivi}\index{tipo!primitivo} del sistema, riportati
421 in \tabref{tab:intro_primitive_types}, e definiti nell'header file
422 \file{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
423 utilizzati dalle funzioni di sistema dai tipi elementari supportati dal
424 compilatore C.
425
426
427
428 \subsection{Lo standard IEEE -- POSIX}
429 \label{sec:intro_posix}
430
431 Uno standard più attinente al sistema nel suo complesso (e che concerne sia il
432 kernel che le librerie) è lo standard POSIX. Esso prende origine dallo
433 standard ANSI C, che contiene come sottoinsieme, prevedendo ulteriori capacità
434 per le funzioni in esso definite, ed aggiungendone di nuove.
435
436 In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
437 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
438 X finale denuncia la sua stretta relazione con i sistemi Unix. Esso nasce dal
439 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
440 che ne produsse una prima versione, nota come IEEE 1003.1-1988, mirante a
441 standardizzare l'interfaccia con il sistema operativo.
442
443 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
444 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
445 i comandi di sistema (1003.2), per le estensioni realtime e per i thread
446 (1003.1d e 1003.1c) e vari altri.  In \tabref{tab:intro_posix_std} è riportata
447 una classificazione sommaria dei principali documenti prodotti, e di come sono
448 identificati fra IEEE ed ISO; si tenga conto inoltre che molto spesso si usa
449 l'estensione IEEE anche come aggiunta al nome POSIX (ad esempio si può parlare
450 di POSIX.4 come di POSIX.1b).
451
452 Si tenga presente inoltre che nuove specifiche e proposte di standardizzazione
453 si aggiungono continuamente, mentre le versioni precedenti vengono riviste;
454 talvolta poi i riferimenti cambiamo nome, per cui anche solo seguire le
455 denominazioni usate diventa particolarmente faticoso; una pagina dove si
456 possono recuperare varie (e di norma piuttosto intricate) informazioni è:
457 \href{http://www.pasc.org/standing/sd11.html}
458 {http://www.pasc.org/standing/sd11.html}.
459
460 \begin{table}[htb]
461   \footnotesize
462   \centering
463   \begin{tabular}[c]{|l|l|l|l|}
464     \hline
465     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
466     \hline
467     \hline
468     POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
469     POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
470     POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
471     POSIX.3 & 2003   &TR13210& Metodi di test                               \\
472     POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
473     POSIX.4a& 1003.1c &  --- & Thread                                       \\
474     POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
475     POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
476     POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
477     POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
478     POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77                \\
479     POSIX.12& 1003.1g& 9945-1& Socket                                       \\
480     \hline
481   \end{tabular}
482   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
483   \label{tab:intro_posix_std}
484 \end{table}
485
486 Benché l'insieme degli standard POSIX siano basati sui sistemi Unix essi
487 definiscono comunque un'interfaccia di programmazione generica e non fanno
488 riferimento ad una implementazione specifica (ad esempio esiste
489 un'implementazione di POSIX.1 anche sotto Windows NT).  Lo standard principale
490 resta comunque POSIX.1, che continua ad evolversi; la versione più nota, cui
491 gran parte delle implementazioni fanno riferimento, e che costituisce una base
492 per molti altri tentativi di standardizzazione, è stata rilasciata anche come
493 standard internazionale con la sigla ISO/IEC 9945-1:1996. 
494
495 Linux e le \acr{glibc} implementano tutte le funzioni definite nello standard
496 POSIX.1, queste ultime forniscono in più alcune ulteriori capacità (per
497 funzioni di \textit{pattern matching} e per la manipolazione delle
498 \textit{regular expression}), che vengono usate dalla shell e dai comandi di
499 sistema e che sono definite nello standard POSIX.2.
500
501 Nelle versioni più recenti del kernel e delle librerie sono inoltre supportate
502 ulteriori funzionalità aggiunte dallo standard POSIX.1c per quanto riguarda i
503 \textit{thread} (vedi \capref{cha:threads}), e dallo standard POSIX.1b per
504 quanto riguarda i segnali e lo scheduling real-time
505 (\secref{sec:sig_real_time} e \secref{sec:proc_real_time}), la misura del
506 tempo, i meccanismi di intercomunicazione (\secref{sec:ipc_posix}) e l'I/O
507 asincrono (\secref{sec:file_asyncronous_io}).
508
509
510
511 \subsection{Lo standard X/Open -- XPG3}
512 \label{sec:intro_xopen}
513
514 Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
515 Unix per giungere ad un'armonizzazione delle varie implementazioni.  Per far
516 questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
517 nome di \textit{X/Open Portability Guide} (a cui di norma si fa riferimento
518 con l'abbreviazione XPGn).
519
520 Nel 1989 produsse una terza versione di questa guida particolarmente
521 voluminosa (la \textit{X/Open Portability Guide, Issue 3}), contenente
522 un'ulteriore standardizzazione dell'interfaccia di sistema di Unix, che venne
523 presa come riferimento da vari produttori.
524
525 Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
526 basato sullo standard POSIX.1, ma prevede una serie di funzionalità aggiuntive
527 fra cui le specifiche delle API (\textit{Application Programmable Interface})
528 per l'interfaccia grafica (X11).
529
530 Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
531 Issue 4 (da cui la sigla XPG4) che aggiungeva l'interfaccia XTI (\textit{X
532   Transport Interface}) mirante a soppiantare (senza molto successo)
533 l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
534 rilasciata nel 1994, questa è nota con il nome di Spec 1170 (dal numero delle
535 interfacce, header e comandi definiti). 
536
537 Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
538 aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
539 specifiche sotto il nome di \textit{Single UNIX Specification}, l'ultima
540 versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
541   Specification}, SUSv1, più comunemente nota come \textit{Unix 95}.
542
543
544 \subsection{Gli standard Unix  -- Open Group}
545 \label{sec:intro_opengroup}
546
547 Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
548 da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
549 alla costituzione dell'Open Group, un consorzio internazionale che raccoglie
550 produttori, utenti industriali, entità accademiche e governative.
551
552 Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
553 il lavoro di standardizzazione delle varie implementazioni, rilasciando
554 periodicamente nuove specifiche e strumenti per la verifica della conformità
555 alle stesse.
556
557 Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
558   Specification}, nota con la sigla SUSv2, in queste versione le interfacce
559 specificate salgono a 1434 (e 3030 se si considerano le stazioni di lavoro
560 grafiche, per le quali sono inserite pure le interfacce usate da CDE che
561 richiede sia X11 che Motif). La conformità a questa versione permette l'uso
562 del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard.
563
564
565 \subsection{Lo ``\textsl{standard}'' BSD}
566 \label{sec:intro_bsd}
567
568 Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
569 di Berkley e la AT\&T generò una delle prime e più importanti fratture del
570 mondo Unix.  L'Università di Berkley proseguì nello sviluppo della base di
571 codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
572 allora versioni disponibili, fino ad arrivare al rilascio di una versione
573 completa di Unix, chiamata appunto BSD, del tutto indipendente dal codice
574 della AT\&T.
575
576 Benché BSD non sia uno standard formalizzato, l'implementazione di Unix
577 dell'Università di Berkley, ha provveduto nel tempo una serie di estensioni e
578 API di grande rilievo, come il link simbolici, la funzione \code{select}, i
579 socket.
580
581 Queste estensioni sono state via via aggiunte al sistema nelle varie versioni
582 del sistema (BSD 4.2, BSD 4.3 e BSD 4.4) come pure in alcuni derivati
583 commerciali come SunOS. Il kernel e le \acr{glibc} provvedono tutte queste
584 estensioni che sono state in gran parte incorporate negli standard successivi.
585
586
587 \subsection{Lo standard System V}
588 \label{sec:intro_sysv}
589
590 Come noto Unix nasce nei laboratori della AT\&T, che ne registrò il nome come
591 marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
592 versione supportata ufficialmente venne rilasciata al pubblico con il nome di
593 Unix System V. Negli anni successivi l'AT\&T proseguì lo sviluppo rilasciando
594 varie versioni con aggiunte e integrazioni; nel 1989 un accordo fra vari
595 venditori (AT\&T, Sun, HP, e altro) portò ad una versione che provvedeva
596 un'unificazione delle interfacce comprendente Xenix e BSD, la System V release
597 4.
598
599 L'interfaccia di questa ultima release è descritta in un documento dal titolo
600 \textit{System V Interface Description}, o SVID; spesso però si fa riferimento
601 a questo standard con il nome della sua implementazione, usando la sigla SVr4.
602
603 Anche questo costituisce un sovrainsieme delle interfacce definite dallo
604 standard POSIX.  Nel 1992 venne rilasciata una seconda versione del sistema:
605 la SVr4.2. L'anno successivo la divisione della AT\&T (già a suo tempo
606 rinominata in Unix System Laboratories) venne acquistata dalla Novell, che poi
607 trasferì il marchio Unix al consorzio X/Open; l'ultima versione di System V fu
608 la SVr4.2MP rilasciata nel Dicembre 93.
609
610 Linux e le \acr{glibc} implementano le principali funzionalità richieste da
611 SVID che non sono già incluse negli standard POSIX ed ANSI C, per
612 compatibilità con lo Unix System V e con altri Unix (come SunOS) che le
613 includono. Tuttavia le funzionalità più oscure e meno utilizzate (che non sono
614 presenti neanche in System V) sono state tralasciate.
615
616 Le funzionalità implementate sono principalmente il meccanismo di
617 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
618 V IPC, che vedremo in \secref{sec:ipc_sysv}) le funzioni della famiglia
619 \func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
620 matematiche.
621
622
623 \subsection{Il comportamento standard del \cmd{gcc} e delle \acr{glibc}}
624 \label{sec:intro_gcc_glibc_std}
625
626 In Linux, grazie alle \acr{glibc}, gli standard appena descritti sono
627 ottenibili sia attraverso l'uso di opzioni del compilatore (il \cmd{gcc}) che
628 definendo opportune costanti prima dell'inclusione dei file degli header.
629
630 Se si vuole che i programmi seguano una stretta attinenza allo standard ANSI C
631 si può usare l'opzione \cmd{-ansi} del compilatore, e non sarà riconosciuta
632 nessuna funzione non riconosciuta dalle specifiche standard ISO per il C.
633
634 Per attivare le varie opzioni è possibile definire le macro di preprocessore,
635 che controllano le funzionalità che le \acr{glibc} possono mettere a
636 disposizione: questo può essere fatto attraverso l'opzione \cmd{-D} del
637 compilatore, ma è buona norma inserire gli opportuni \code{\#define} nei
638 propri header file.
639
640 Le macro disponibili per i vari standard sono le seguenti:
641 \begin{basedescript}{\desclabelwidth{3cm}\desclabelstyle{\nextlinelabel}}
642 \item[\macro{\_POSIX\_SOURCE}] definendo questa macro si rendono disponibili
643   tutte le funzionalità dello standard POSIX.1 (la versione IEEE Standard
644   1003.1) insieme a tutte le funzionalità dello standard ISO C. Se viene anche
645   definita con un intero positivo la macro \macro{\_POSIX\_C\_SOURCE} lo stato
646   di questa non viene preso in considerazione.
647 \item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
648   positivo si controlla quale livello delle funzionalità specificate da POSIX
649   viene messa a disposizione; più alto è il valore maggiori sono le
650   funzionalità. Se è uguale a '1' vengono attivate le funzionalità specificate
651   nella edizione del 1990 (IEEE Standard 1003.1-1990), valori maggiori o
652   uguali a '2' attivano le funzionalità POSIX.2 specificate nell'edizione del
653   1992 (IEEE Standard 1003.2-1992). Un valore maggiore o uguale a `199309L'
654   attiva le funzionalità POSIX.1b specificate nell'edizione del 1993 (IEEE
655   Standard 1003.1b-1993).  Un valore maggiore o uguale a `199506L' attiva le
656   funzionalità POSIX.1 specificate nell'edizione del 1996 (ISO/IEC 9945-1:
657   1996). Valori superiori abiliteranno ulteriori estensioni.
658 \item[\macro{\_BSD\_SOURCE}] definendo questa macro si attivano le
659   funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
660   ISO C, POSIX.1 e POSIX.2. Alcune delle funzionalità previste da BSD sono
661   però in conflitto con le corrispondenti definite nello standard POSIX.1, in
662   questo caso le definizioni previste da BSD4.3 hanno la precedenza rispetto a
663   POSIX.  A causa della natura dei conflitti con POSIX per ottenere una piena
664   compatibilità con BSD4.3 è necessario anche usare una libreria di
665   compatibilità, dato che alcune funzioni sono definite in modo diverso. In
666   questo caso occorre pertanto anche usare l'opzione \cmd{-lbsd-compat} con il
667   compilatore per indicargli di utilizzare le versioni nella libreria di
668   compatibilità prima di quelle normali.
669 \item[\macro{\_SVID\_SOURCE}] definendo questa macro si attivano le
670   funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
671   standard ISO C, POSIX.1, POSIX.2, and X/Open.
672 \item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si attivano le
673   funzionalità descritte nella \textit{X/Open Portability Guide}. Anche queste
674   sono un sovrainsieme di quelle definite in POSIX.1 e POSIX.2 ed in effetti
675   sia \macro{\_POSIX\_SOURCE} che \macro{\_POSIX\_C\_SOURCE} vengono
676   automaticamente definite. Sono incluse anche ulteriori funzionalità
677   disponibili in BSD e SVID. Se il valore della macro è posto a 500 questo
678   include anche le nuove definizioni introdotte con la \textit{Single UNIX
679     Specification, version 2}, cioè Unix98.
680 \item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] definendo questa macro si attivano le
681   ulteriori funzionalità necessarie ad essere conformi al rilascio del marchio
682   \textit{X/Open Unix}.
683 \item[\macro{\_ISOC99\_SOURCE}] definendo questa macro si attivano le
684   funzionalità previste per la revisione delle librerie standard del C
685   denominato ISO C99. Dato che lo standard non è ancora adottato in maniera
686   ampia queste non sono abilitate automaticamente, ma le \acr{glibc} hanno già
687   un'implementazione completa che può essere attivata definendo questa macro.
688 \item[\macro{\_LARGEFILE\_SOURCE}] definendo questa macro si attivano le
689   funzionalità per il supporto dei file di grandi dimensioni (il \textit{Large
690     File Support} o LFS) con indici e dimensioni a 64 bit.
691 \item[\macro{\_GNU\_SOURCE}] definendo questa macro si attivano tutte le
692   funzionalità disponibili: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID,
693   X/Open, LFS più le estensioni specifiche GNU. Nel caso in cui BSD e POSIX
694   confliggano viene data la precedenza a POSIX.
695 \end{basedescript}
696
697 In particolare è da sottolineare che le \acr{glibc} supportano alcune
698 estensioni specifiche GNU, che non sono comprese in nessuno degli
699 standard citati. Per poterle utilizzare esse devono essere attivate
700 esplicitamente definendo la macro \macro{\_GNU\_SOURCE} prima di
701 includere i vari header file.
702
703
704 \subsection{Gli standard di GNU/Linux}
705 \label{sec:intro_linux_std}
706
707 Da fare (o cassare, a seconda del tempo e della voglia).
708
709
710
711 %%% Local Variables: 
712 %%% mode: latex
713 %%% TeX-master: "gapil"
714 %%% End: