Inizio della revisione del formato per la suddivisione in due parti,
[gapil.git] / intro.tex
1 %% intro.tex
2 %%
3 %% Copyright (C) 2000-2011 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{L'architettura del sistema}
13 \label{cha:intro_unix}
14
15 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
16 cui è basato un sistema operativo di tipo Unix come GNU/Linux, in questo modo
17 potremo fornire una base di comprensione mirata a sottolineare le peculiarità
18 del sistema che sono più rilevanti per quello che riguarda la programmazione.
19
20 Dopo un'introduzione sulle caratteristiche principali di un sistema di tipo
21 Unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
22 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
23 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
24
25
26 \section{Una panoramica}
27 \label{sec:intro_unix_struct}
28
29 In questa prima sezione faremo una breve panoramica sull'architettura di un
30 sistema operativo di tipo Unix, come GNU/Linux, e della relazione fra le varie
31 parti che lo compongono. Chi avesse già una conoscenza di questa materia può
32 tranquillamente saltare questa sezione ad eccezione di
33 sez.~\ref{sec:intro_syscall} dove introdotti alcuni concetti fondamentali
34 relativi alle funzioni di libreria.
35
36
37 \subsection{Concetti base}
38 \label{sec:intro_base_concept}
39
40 Il concetto principale su cui è basata l'architettura di un sistema unix-like
41 è quello di un nucleo del sistema, il cosiddetto \textit{kernel} (nel nostro
42 caso Linux) a cui si demanda la gestione delle risorse della propria macchina
43 (la CPU, la memoria, le periferiche) mentre tutto il resto, quindi anche la
44 parte che prevede l'interazione con l'utente, dev'essere realizzato tramite
45 programmi eseguiti dal kernel, che accedano alle risorse tramite opportune
46 richieste a quest'ultimo.
47
48 Fin dai suoi albori Unix nasce come sistema operativo \textit{multitasking},
49 cioè in grado di eseguire contemporaneamente più programmi, e multiutente, in
50 cui è possibile che più utenti siano connessi ad una macchina eseguendo più
51 programmi ``\textsl{in contemporanea}''. In realtà, almeno per le macchine a
52 processore singolo, i programmi vengono semplicemente eseguiti uno alla volta
53 in una opportuna \textsl{rotazione}.\footnote{anche se oggi, con la presenza
54   di sistemi multiprocessore, si possono avere più processi eseguiti in
55   contemporanea, il concetto di ``\textsl{rotazione}'' resta comunque valido,
56   dato che in genere il numero di processi da eseguire eccede il numero dei
57   precessori disponibili. }
58
59 % Questa e` una distinzione essenziale da capire,
60 %specie nei confronti dei sistemi operativi successivi, nati per i personal
61 %computer (e quindi per un uso personale), sui quali l'hardware (allora
62 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
63
64 I kernel Unix più recenti, come Linux, sono realizzati sfruttando alcune
65 caratteristiche dei processori moderni come la gestione hardware della memoria
66 e la modalità protetta. In sostanza con i processori moderni si può
67 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
68 zone di memoria fisica.  Quello che succede è che il kernel è il solo
69 programma ad essere eseguito in modalità privilegiata, con il completo accesso
70 a tutte le risorse della macchina, mentre i programmi normali vengono eseguiti
71 in modalità protetta senza accesso diretto alle risorse.  Uno schema
72 elementare della struttura del sistema è riportato in
73 fig.~\ref{fig:intro_sys_struct}.
74
75 \begin{figure}[htb]
76   \centering
77   \includegraphics[width=10cm]{img/struct_sys}
78   % \begin{tikzpicture}
79   %   \filldraw[fill=black!20] (0,0) rectangle (7.5,1);
80   %   \draw (3.75,0.5) node {\textsl{System Call Interface}};
81   %   \filldraw[fill=black!35] (0,1) rectangle (7.5,4);
82   %   \draw (3.75,2.5) node {\huge{\textsf{kernel}}};
83   %   \filldraw[fill=black!20] (0,4) rectangle (2.5,5);
84   %   \draw (1.25,4.5) node {\textsf{scheduler}};
85   %   \filldraw[fill=black!20] (2.5,4) rectangle (5,5);
86   %   \draw (3.75,4.5) node {\textsf{VM}};
87   %   \filldraw[fill=black!20] (5,4) rectangle (7.5,5);
88   %   \draw (6.25,4.5) node {\textsf{driver}};
89
90   %   \draw (1.25,7) node(cpu) [ellipse,draw] {\textsf{CPU}};
91   %   \draw (3.75,7) node(mem) [ellipse,draw] {\textsf{memoria}};
92   %   \draw (6.25,7) node(disk) [ellipse,draw] {\textsf{disco}};
93
94   %   \draw[<->] (cpu) -- (1.25,5);
95   %   \draw[<->] (mem) -- (3.75,5);
96   %   \draw[<->] (disk) -- (6.25,5);
97
98   %   \draw (7.5,0) node [anchor=base west] {\textit{kernel space}};
99   %   \draw (7.5,-1) node [anchor=west] {\textit{user space}};
100
101   %   \draw (-1,-0.5) -- (8.5, -0.5);
102
103   %   \draw (0,-2) rectangle (7.5,-1);
104   %   \draw (3.75, -1.5) node {\textsl{GNU C Library}};
105   %   \draw[->] (1.25,-1) -- (1.25,0);
106   %   \draw[->] (3.75,-1) -- (3.75,0);
107   %   \draw[->] (6.25,-1) -- (6.25,0);
108
109   %   \draw (1.25,-3) node(proc1) [rectangle,draw] {\textsf{processo}};
110   %   \draw (3.75,-3) node(proc2) [rectangle,draw] {\textsf{processo}};
111   %   \draw (6.25,-3) node(proc3) [rectangle,draw] {\textsf{processo}};
112
113   %   \draw[->] (1.25,-2) -- (proc1);
114   %   \draw[->] (3.75,-2) -- (proc2);
115   %   \draw[->] (6.25,-2) -- (proc3);
116   % \end{tikzpicture}
117   \caption{Schema di massima della struttura di interazione fra processi,
118     kernel e dispositivi in Linux.}
119   \label{fig:intro_sys_struct}
120 \end{figure}
121
122 Una parte del kernel, lo \itindex{scheduler} \textit{scheduler}, si occupa di
123 stabilire, sulla base di un opportuno calcolo delle priorità e con una
124 suddivisione appropriata del tempo di processore, quali fra i vari
125 ``\textsl{processi}'' presenti nel sistema deve essere eseguito, realizzando
126 il cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
127   multitasking}.\footnote{si chiama così quella gestione del
128   \textit{multitasking} in cui è il kernel a decidere a chi assegnare l'uso
129   della CPU, potendo interrompere l'esecuzione di un processo in qualunque
130   momento.}  Ogni processo verrà comunque eseguito in modalità protetta;
131 quando necessario esso potrà accedere alle risorse della macchina soltanto
132 attraverso delle ``\textsl{chiamate al sistema}'' (vedi
133 sez.~\ref{sec:intro_syscall}) che restituiranno il controllo al kernel per
134 eseguire le operazioni necessarie.
135
136 La memoria viene sempre gestita dal kernel attraverso il meccanismo della
137 \index{memoria~virtuale} \textsl{memoria virtuale}, che consente di assegnare
138 a ciascun processo uno spazio di indirizzi ``\textsl{virtuale}'' (vedi
139 sez.~\ref{sec:proc_memory}) che il kernel stesso, con l'ausilio della unità di
140 gestione della memoria, si incaricherà di rimappare automaticamente sulla
141 memoria fisica disponibile, con la possibilità ulteriore di spostare
142 temporaneamente su disco (nella cosiddetta area di \textit{swap}) parte di
143 detta memoria qualora ci si trovi nella necessità di liberare risorse.
144
145 Le periferiche infine vengono normalmente viste attraverso un'interfaccia
146 astratta che permette di trattarle come se fossero dei file, secondo uno dei
147 concetti base della architettura di Unix, per cui ``\textsl{tutto è in file}''
148 (\textit{everything is a file}) su cui torneremo in dettaglio in
149 cap.~\ref{cha:file_intro}. In realtà questo non è sempre vero (ad esempio non
150 lo è per le interfacce di rete) dato che ci sono periferiche che non
151 rispondendo bene a questa astrazione richiedono un'interfaccia diversa.  Anche
152 in questo caso però resta valido il concetto generale che tutto il lavoro di
153 accesso e gestione delle periferiche a basso livello viene effettuato dal
154 kernel tramite l'opportuno codice di gestione delle stesse, che in
155 fig.~\ref{fig:intro_sys_struct} si è indicato come \textit{driver}.
156
157
158 \subsection{Il kernel e il sistema}
159 \label{sec:intro_kern_and_sys}
160
161 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi Unix è
162 quello della distinzione fra il cosiddetto \textit{user space}, che
163 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
164 \textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
165 programma vede sé stesso come se avesse la piena disponibilità della CPU e
166 della memoria ed è, salvo i meccanismi di comunicazione previsti dal sistema,
167 completamente ignaro del fatto che altri programmi possono essere messi in
168 esecuzione dal kernel.
169
170 Per questa separazione non è possibile ad un singolo programma disturbare
171 l'azione di un altro programma o del kernel stesso, e questo è il principale
172 motivo della stabilità di un sistema unix-like nei confronti di altri sistemi
173 in cui i processi non hanno di questi limiti o in cui essi vengono eseguiti
174 allo stesso livello del kernel. Pertanto deve essere chiaro a chi programma in
175 un sistema unix-like che l'accesso diretto all'hardware non può avvenire se
176 non all'interno del kernel; al di fuori dal kernel il programmatore deve usare
177 le opportune interfacce che quest'ultimo fornisce per i programmi in
178 \textit{user space}.
179
180 Per capire meglio la distinzione fra \textit{kernel space} e \textit{user
181   space} si può prendere in esame la procedura di avvio di un sistema
182 unix-like. All'accensione il \textit{firmware} presente nella EPROM della
183 propria macchina (per i PC compatibili il BIOS), eseguirà la procedura di
184 avvio del sistema, il cosiddetto \textit{bootstrap},\footnote{il nome deriva
185   da un'espressione gergale che significa ``sollevarsi da terra tirandosi per
186   le stringhe delle scarpe'', per indicare il compito, almeno apparentemente
187   impossibile, di far eseguire un programma a partire da un computer appena
188   acceso che appunto non ne contiene nessuno; non è impossibile perché in
189   realtà c'è un programma iniziale, che è il BIOS.} incaricandosi di caricare
190 il kernel in memoria e di farne partire l'esecuzione. A questo punto il
191 controllo passerà al kernel, il quale però da parte sua, una volta
192 inizializzato opportunamente l'hardware, si limiterà a lanciare un unico
193 processo di inizializzazione (che per questo in genere genere si chiama
194 \cmd{init}). A questo punto tutto il lavoro verrà eseguito \textit{user space}
195 da questo programma, che sua volta si incaricherà di lanciare tutti gli altri,
196 fra cui ci sarà quello che si occupa di dialogare con la tastiera e lo schermo
197 della console, quello che mette a disposizione un terminale e la
198 \textit{shell} da cui inviare i comandi all'utente che si vuole collegare, ed
199 in generale tutto quanto necessario ad avere un sistema utilizzabile.
200
201 E' da rimarcare come tutto ciò che riguarda l'interazione con l'utente, che
202 usualmente viene visto come parte del sistema, non abbia in realtà niente a
203 che fare con il kernel, ma sia effettuato da opportuni programmi che vengono
204 eseguiti, allo stesso modo di un qualunque programma di scrittura o di disegno
205 e della stessa interfaccia grafica, in \textit{user space}.
206
207 Questo significa ad esempio che il sistema di per sé non dispone di primitive
208 per tutta una serie di operazioni (ad esempio come la copia di un file) che
209 altri sistemi (come Windows) hanno invece al loro interno. Questo perché tutte
210 le operazioni di normale amministrazione di un sistema, sono effettuata
211 attraverso dei normali programmi utilizzando le interfacce di programmazione
212 che il kernel mette a disposizione.
213
214 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
215 %realizzare un sistema di permessi e controlli che evitano che i programmi
216 %eseguano accessi non autorizzati. 
217
218 È per questo motivo che quando ci si riferisce al sistema nella sua interezza
219 viene spesso sottolineato come sia corretto parlare di ``GNU/Linux'' e non di
220 Linux; da solo infatti il kernel non è sufficiente, quello che costruisce un
221 sistema operativo utilizzabile è la presenza di tutta una serie di librerie e
222 programmi di utilità, ed i più comuni sono appunto quelli realizzati dal
223 progetto GNU della Free Software Foundation, grazie ai quali si possono
224 eseguire le normali operazioni che ci si aspetta da un sistema operativo.
225
226
227 \subsection{\textit{System call} e funzioni di libreria}
228 \label{sec:intro_syscall}
229
230 Come illustrato in fig.~\ref{fig:intro_sys_struct} i programmi possono
231 accedere ai servizi forniti dal kernel tramite opportune interfacce dette
232 \textit{system call} (\textsl{chiamate al sistema}, appunto). Si tratta di un
233 insieme di funzioni che un programma può invocare, per le quali viene generata
234 un'interruzione nell'esecuzione del codice del processo, passando il controllo
235 al kernel. Sarà quest'ultimo che eseguirà in le operazioni relative alla
236 funzione richiesta in \textit{kernel space}, restituendo poi i risultati al
237 chiamante.
238
239 Ogni versione di Unix ha storicamente sempre avuto un certo numero di
240 \textit{system call}, che sono documentate nella seconda sezione del
241 \textsl{Manuale di programmazione di Unix}, quella cui si accede con il
242 comando \cmd{man 2 <nome>}, ed anche Linux non fa eccezione. Queste
243 \textit{system call} sono poi state codificate da vari standard, che
244 esamineremo brevemente in sez.~\ref{sec:intro_standard}.
245
246 Normalmente ciascuna chiamata al sistema fornita dal kernel viene associata ad
247 una funzione con lo stesso nome definita all'interno della libreria
248 fondamentale del sistema, quella che viene chiamata \textsl{Libreria Standard
249   del C} (\textit{C Standard Library}) in ragione del fatto che il primo
250 kernel Unix e tutti i programmi eseguiti su di esso vennero scritti in C,
251 usando le librerie di questo linguaggio. Questa libreria, oltre alle
252 interfacce delle \textit{system call}, contiene anche tutta una serie di
253 ulteriori funzioni di utilità che vengono comunemente usate nella
254 programmazione e sono definite nei vari standard che documentano le interfacce
255 di programmazione di un sistema unix-like.
256
257 Questo concetto è importante da tener presente perché programmare in Linux
258 significa anzitutto essere in grado di usare le funzioni fornite dalla
259 \textsl{Libreria Standard del C}, in quanto né il kernel, né il linguaggio C
260 implementano direttamente operazioni ordinarie come l'allocazione dinamica
261 della memoria, l'input/output bufferizzato sui file o la manipolazione delle
262 stringhe, che sono comunemente usate da qualunque programma.
263
264 Tutto ciò mette nuovamente in evidenza il fatto che nella stragrande
265 maggioranza dei casi si dovrebbe usare il nome GNU/Linux in quanto una parte
266 essenziale del sistema, senza la quale niente funzionerebbe, è appunto la
267 \textit{GNU Standard C Library} (a cui faremo da qui in avanti riferimento
268 come \acr{glibc}), ovvero la Libreria Standard del C realizzata dalla Free
269 Software Foundation, nella quale sono state implementate tutte le funzioni
270 essenziali definite negli standard POSIX e ANSI C (e molte altre), che vengono
271 utilizzate da qualunque programma.
272
273 Si tenga comunque presente che questo non è sempre vero, dato che esistono
274 implementazioni alternative della Libreria Standard del C, come la
275 \textit{libc5} o la \textit{uClib}, che non derivano dal progetto GNU. La
276 \textit{libc5}, che era usata con le prime versioni del kernel Linux, è oggi
277 ormai completamente soppiantata dalla \acr{glibc}. La \textit{uClib} invece,
278 pur non essendo completa come la \acr{glibc}, resta molto diffusa nel mondo
279 dei dispositivi \textit{embedded} per le sue dimensioni estremamente ridotte,
280 e soprattutto per la possibilità di togliere le parti non necessarie. Pertanto
281 costituisce un valido rimpiazzo della \acr{glibc} in tutti quei sistemi
282 specializzati che richiedono una minima occupazione di memoria. Infine per lo
283 sviluppo del sistema Android è stata realizzata da Google un'altra Libreria
284 Standard del C, utilizzata principalmente per evitare l'uso della \acr{glibc}.
285
286 Tradizionalmente le funzioni specifiche della Libreria Standard del C sono
287 riportate nella terza sezione del \textsl{Manuale di Programmazione di Unix}
288 (cioè accessibili con il comando \cmd{man 3 <nome>}) e come accennato non sono
289 direttamente associate ad una \textit{system call} anche se, ad esempio per la
290 gestione dei file o della allocazione dinamica della memoria, possono farne
291 uso nella loro implementazione.  Nonostante questa questa distinzione,
292 fondamentale per capire il funzionamento del sistema, l'uso da parte dei
293 programmi di una di queste funzioni resta lo stesso, sia che si tratti di una
294 funzione interna della libreria che di una \textit{system call}.
295
296 Come accennato in genere ogni \textit{system call} è associata ad una omonima
297 funzione di libreria, che è quella che si usa normalmente per invocarla. Le
298 \textsl{glibc} consentono comunque, nel caso non sia presente una specifica
299 funzione di libreria corrispondente o qualora si voglia eseguire una specifica
300 versione,\footnote{alcune \textit{system call} sono state modificate nel corso
301   degli anni per aggiungere ad esempio delle funzionalità, l'interfaccia
302   proposta dalle \textsl{glibc} si cura in genere di mantenere una uniformità
303   chiamando le versioni corrette, ma qualora si voglia lavorare a basso
304   livello ed usare una specifica versione, si può fare ricorso a questa
305   funzione.} di eseguire direttamente una \textit{system call} tramite la
306 funzione \funcd{syscall}, il cui prototipo (accessibile se si è definita la
307 macro \macro{\_GNU\_SOURCE}, vedi sez.~\ref{sec:intro_gcc_glibc_std}) è:
308
309 \begin{funcproto}{
310   \fhead{unistd.h}
311   \fhead{sys/syscall.h}
312   \fdecl{int syscall(int number, ...)}
313   \fdesc{Esegue la \textit{system call} indicata da \param{number}.}
314 }
315 {La funzione ritorna un intero dipendente dalla \textit{system call} invocata,
316 in generale $0$ indica il successo e un valore negativo un errore.}
317 \end{funcproto}
318
319 La funzione richiede come primo argomento il numero della \textit{system call}
320 da invocare, seguita dagli argomenti da passare alla stessa, che ovviamente
321 dipendono da quest'ultima, e restituisce il codice di ritorno della
322 \textit{system call} invocata. In generale un valore nullo indica il successo
323 ed un valore negativo è un codice di errore che poi viene memorizzato nella
324 variabile \var{errno} (sulla gestione degli errori torneremo in dettaglio in
325 sez.~\ref{sec:sys_errors}).
326
327 Il valore di \param{number} dipende sia dalla versione di kernel che
328 dall'architettura,\footnote{in genere le vecchie \textit{system call} non
329   vengono eliminate e se ne aggiungono di nuove con nuovi numeri.}  ma
330 ciascuna \textit{system call} viene in genere identificata da una costante
331 nella forma \texttt{SYS\_*} dove al prefisso viene aggiunto il nome che spesso
332 corrisponde anche alla omonima funzione di libreria; queste costanti sono
333 definite nel file \texttt{sys/syscall.h}, ma si possono anche usare
334 direttamente valori numerici.
335
336 %
337 % TODO:trattare non so se qui o altrove vsyscall e vDSO, vedi
338 % http://davisdoesdownunder.blogspot.com/2011/02/linux-syscall-vsyscall-and-vdso-oh-my.html 
339 % http://www.win.tue.nl/~aeb/linux/lk/lk-4.html
340 %
341
342 \subsection{Un sistema multiutente}
343 \label{sec:intro_multiuser}
344
345 Linux, come gli altri kernel Unix, nasce fin dall'inizio come sistema
346 multiutente, cioè in grado di fare lavorare più persone in contemporanea. Per
347 questo esistono una serie di meccanismi di sicurezza, che non sono previsti in
348 sistemi operativi monoutente, e che occorre tenere presenti. In questa sezione
349 parleremo brevemente soltanto dei meccanismi di sicurezza tradizionali di un
350 sistema unix-like, oggi molti di questi sono stati notevolmente estesi
351 rispetto al modello tradizionale, ma per il momento ignoreremo queste
352 estensioni.
353
354 Il concetto base è quello di utente (\textit{user}) del sistema, le cui
355 capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
356 Sono così previsti una serie di meccanismi per identificare i singoli utenti
357 ed una serie di permessi e protezioni per impedire che utenti diversi possano
358 danneggiarsi a vicenda o danneggiare il sistema. Questi meccanismi sono
359 realizzati dal kernel stesso ed attengono alle operazioni più varie, e
360 torneremo su di essi in dettaglio più avanti.
361
362 Normalmente l'utente è identificato da un nome (il cosiddetto
363 \textit{username}), che ad esempio è quello che viene richiesto all'ingresso
364 nel sistema dalla procedura di \textit{login} (torneremo su questo in
365 sez.~\ref{sec:sess_login}).  Questa procedura si incarica di verificare
366 l'identità dell'utente, in genere attraverso la richiesta di una parola
367 d'ordine (la \textit{password}), anche se sono possibili meccanismi
368 diversi.\footnote{ad esempio usando la libreria PAM (\textit{Pluggable
369     Autentication Methods}) è possibile astrarre completamente dai meccanismi
370   di autenticazione e sostituire ad esempio l'uso delle password con
371   meccanismi di identificazione biometrica, per un approfondimento
372   dell'argomento si rimanda alla sez.~4.3 di \cite{AGL}.} Eseguita la
373 procedura di riconoscimento in genere il sistema manda in esecuzione un
374 programma di interfaccia (che può essere la \textit{shell} su terminale o
375 un'interfaccia grafica) che mette a disposizione dell'utente un meccanismo con
376 cui questo può impartire comandi o eseguire altri programmi.
377
378 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
379 \textit{default group}), ma può essere associato ad altri gruppi (i
380 \textit{supplementary group}), questo permette di gestire i permessi di
381 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
382 definendo gruppi di lavoro, di accesso a determinate risorse, ecc. 
383
384 L'utente e il gruppo sono identificati dal kernel un identificativo numerico,
385 la cui corrispondenza ad un nome espresso in caratteri è inserita nei due file
386 \conffile{/etc/passwd} e \conffile{/etc/group}.\footnote{in realtà negli
387   sistemi più moderni, come vedremo in sez.~\ref{sec:sys_user_group} queste
388   informazioni possono essere mantenute, con l'uso del
389   \itindex{Name~Service~Switch} \textit{Name Service Switch}, su varie
390   tipologie di supporti, compresi server centralizzati come LDAP.}  Questi
391 identificativi sono l'\textit{user identifier}, detto in breve
392 \textsl{user-ID}, ed indicato dall'acronimo \acr{uid}, e il \textit{group
393   identifier}, detto in breve \textsl{group-ID}, ed identificato dall'acronimo
394 \acr{gid}, torneremo in dettaglio su questo argomento in
395 sez.~\ref{sec:proc_perms}.  Il kernel conosce ed utilizza soltanto questi
396 valori numerici, i nomi ad essi associati sono interamente gestiti in
397 \textit{user space} con opportune funzioni di libreria, torneremo su questo
398 argomento in sez.~\ref{sec:sys_user_group}.
399  
400 Grazie a questi identificativi il sistema è in grado di tenere traccia
401 dell'utente a cui appartiene ciascun processo ed impedire ad altri utenti di
402 interferire con quest'ultimo.  Inoltre con questo sistema viene anche
403 garantita una forma base di sicurezza interna in quanto anche l'accesso ai
404 file (vedi sez.~\ref{sec:file_access_control}) è regolato da questo meccanismo
405 di identificazione.
406
407 Infine in ogni sistema unix-like è presente uno speciale utente privilegiato,
408 il cosiddetto \textit{superuser}, il cui username è di norma \textit{root}, ed
409 il cui \acr{uid} è zero. Esso identifica l'amministratore del sistema, che
410 deve essere in grado di fare qualunque operazione; per l'utente \textit{root}
411 infatti i meccanismi di controllo cui si è accennato in precedenza sono
412 disattivati.\footnote{i controlli infatti vengono eseguiti da uno pseudocodice
413   del tipo: ``\code{if (uid) \{ \textellipsis\ \}}''.}
414
415
416 \section{Gli standard}
417 \label{sec:intro_standard}
418
419 In questa sezione faremo una breve panoramica relativa ai vari standard che
420 nel tempo sono stati formalizzati da enti, associazioni, consorzi e
421 organizzazioni varie al riguardo ai sistemi operativi di tipo Unix o alle
422 caratteristiche che si sono stabilite come standard di fatto in quanto facenti
423 parte di alcune implementazioni molto diffuse come BSD o System V.
424
425 Ovviamente prenderemo in considerazione solo gli standard riguardanti
426 interfacce di programmazione e le altre caratteristiche di un sistema
427 unix-like (alcuni standardizzano pure i comandi base del sistema e la shell)
428 ed in particolare ci concentreremo sul come ed in che modo essi sono
429 supportati sia per quanto riguarda il kernel che la Libreria Standard del C,
430 con una particolare attenzione alle \acr{glibc}.
431
432
433 \subsection{Lo standard ANSI C}
434 \label{sec:intro_ansiC}
435
436 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
437   Standard Institute} come prima standardizzazione del linguaggio C e per
438 questo si fa riferimento ad esso anche come C89. L'anno successivo è stato
439 adottato dalla ISO (\textit{International Standard Organisation}) come
440 standard internazionale con la sigla ISO/IEC 9899:1990, e per questo è noto
441 anche sotto il nome di standard ISO C, o ISO C90.  Nel 1999 è stata pubblicata
442 una revisione dello standard C89, che viene usualmente indicata come C99,
443 anche questa è stata ratificata dalla ISO con la sigla ISO/IEC 9899:1990, per
444 cui vi si fa riferimento anche come ISO C99.
445
446 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
447 sistemi operativi diversi, ma oltre alla sintassi ed alla semantica del
448 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
449 anche una libreria di funzioni che devono poter essere implementate su
450 qualunque sistema operativo.
451
452 \begin{table}[htb]
453   \footnotesize
454   \centering
455   \begin{tabular}[c]{|l|c|c|l|}
456     \hline
457     \multirow{2}{*}{\textbf{Header}}&
458     \multicolumn{2}{|c|}{\textbf{Standard}}&
459     \multirow{2}{*}{\textbf{Contenuto}} \\
460     \cline{2-3}
461     & ANSI C& POSIX& \\
462     \hline
463     \hline
464     \file{assert.h}&$\bullet$&    --   & Verifica le asserzioni fatte in un
465                                          programma.\\ 
466     \file{ctype.h} &$\bullet$&    --   & Tipi standard.\\
467     \file{dirent.h}&   --    &$\bullet$& Manipolazione delle directory.\\
468     \file{errno.h} &   --    &$\bullet$& Errori di sistema.\\
469     \file{fcntl.h} &   --    &$\bullet$& Controllo sulle opzioni dei file.\\
470     \file{limits.h}&   --    &$\bullet$& Limiti e parametri del sistema.\\
471     \file{malloc.h}&$\bullet$&    --   & Allocazione della memoria.\\
472     \file{setjmp.h}&$\bullet$&    --   & Salti non locali.\\
473     \file{signal.h}&   --    &$\bullet$& Gestione dei segnali.\\
474     \file{stdarg.h}&$\bullet$&    --   & Gestione di funzioni a argomenti
475                                          variabili.\\ 
476     \file{stdio.h} &$\bullet$&    --   & I/O bufferizzato in standard ANSI C.\\
477     \file{stdlib.h}&$\bullet$&    --   & Definizioni della libreria standard.\\
478     \file{string.h}&$\bullet$&    --   & Manipolazione delle stringhe.\\
479     \file{time.h}  &   --    &$\bullet$& Gestione dei tempi.\\
480     \file{times.h} &$\bullet$&    --   & Gestione dei tempi.\\
481     \file{unistd.h}&   --    &$\bullet$& Unix standard library.\\
482     \file{utmp.h}  &   --    &$\bullet$& Registro connessioni utenti.\\
483     \hline
484   \end{tabular}
485   \caption{Elenco dei vari header file definiti dallo standard POSIX.}
486   \label{tab:intro_posix_header}
487 \end{table}
488
489 Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
490 di tipo Unix, GNU/Linux (per essere precisi la \acr{glibc}), come molti Unix
491 moderni, provvede la compatibilità con questo standard, fornendo le funzioni
492 di libreria da esso previste. Queste sono dichiarate in una serie di
493 \textit{header file}\footnote{si chiamano così i file di dichiarazione di
494   variabili, tipi e funzioni, usati normalmente da un compilatore C; per poter
495   accedere alle funzioni occorre includere con la direttiva \code{\#include}
496   questi file nei propri programmi ed in seguito per ciascuna funzione che
497   tratteremo indicheremo anche gli \textit{header file} necessari ad usarla.}
498 (anch'essi forniti dalla \acr{glibc}); in tab.~\ref{tab:intro_posix_header} si
499 sono riportati i principali \textit{header file} definiti negli standard POSIX
500 ed ANSI C, che sono anche quelli definiti negli altri standard descritti nelle
501 sezioni successive.
502
503 In realtà la \acr{glibc} ed i relativi \textit{header file} definiscono un
504 insieme di funzionalità in cui sono incluse come sottoinsieme anche quelle
505 previste dallo standard ANSI C. È possibile ottenere una conformità stretta
506 allo standard (scartando le funzionalità addizionali) usando il \cmd{gcc} con
507 l'opzione \cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei
508 vari header file soltanto le funzionalità previste dallo standard ANSI C e a
509 non usare le varie estensioni al linguaggio e al preprocessore da esso
510 supportate.
511
512
513 \subsection{I tipi di dati primitivi}
514 \label{sec:intro_data_types}
515
516 Uno dei problemi di portabilità del codice più comune è quello dei tipi di
517 dati utilizzati nei programmi, che spesso variano da sistema a sistema, o
518 anche da una architettura ad un'altra (ad esempio passando da macchine con
519 processori 32 bit a 64). In particolare questo è vero nell'uso dei cosiddetti
520 \index{tipo!elementare} \textit{tipi elementari} del linguaggio C (come
521 \ctyp{int}) la cui dimensione varia a seconda dell'architettura hardware.
522
523 Storicamente alcuni tipi nativi dello standard ANSI C sono sempre stati
524 associati ad alcune variabili nei sistemi Unix, dando per scontata la
525 dimensione. Ad esempio la posizione corrente all'interno di un file è stata
526 associata ad un intero a 32 bit, mentre il numero di dispositivo è stato
527 associato ad un intero a 16 bit. Storicamente questi erano definiti
528 rispettivamente come \ctyp{int} e \ctyp{short}, ma tutte le volte che, con
529 l'evolversi ed il mutare delle piattaforme hardware, alcuni di questi tipi si
530 sono rivelati inadeguati o sono cambiati, ci si è trovati di fronte ad una
531 infinita serie di problemi di portabilità.
532
533 \begin{table}[htb]
534   \footnotesize
535   \centering
536   \begin{tabular}[c]{|l|l|}
537     \hline
538     \textbf{Tipo} & \textbf{Contenuto} \\
539     \hline
540     \hline
541     \type{caddr\_t} & Core address.\\
542     \type{clock\_t} & Contatore del \textit{process time} (vedi
543                       sez.~\ref{sec:sys_cpu_times}.\\ 
544     \type{dev\_t}   & Numero di dispositivo (vedi sez.~\ref{sec:file_mknod}).\\
545     \type{gid\_t}   & Identificatore di un gruppo (vedi
546                       sez.~\ref{sec:proc_access_id}).\\
547     \type{ino\_t}   & Numero di \index{inode} \textit{inode}.\\
548     \type{key\_t}   & Chiave per il System V IPC (vedi
549                       sez.~\ref{sec:ipc_sysv_generic}).\\
550     \type{loff\_t}  & Posizione corrente in un file.\\
551     \type{mode\_t}  & Attributi di un file.\\
552     \type{nlink\_t} & Contatore dei link su un file.\\
553     \type{off\_t}   & Posizione corrente in un file.\\
554     \type{pid\_t}   & Identificatore di un processo (vedi
555                       sez.~\ref{sec:proc_pid}).\\
556     \type{rlim\_t}  & Limite sulle risorse.\\
557     \type{sigset\_t}& Insieme di segnali (vedi sez.~\ref{sec:sig_sigset}).\\
558     \type{size\_t}  & Dimensione di un oggetto.\\
559     \type{ssize\_t} & Dimensione in numero di byte ritornata dalle funzioni.\\
560     \type{ptrdiff\_t}& Differenza fra due puntatori.\\
561     \type{time\_t}  & Numero di secondi (in \itindex{calendar~time}
562                       \textit{calendar time}, vedi 
563                       sez.~\ref{sec:sys_time}).\\
564     \type{uid\_t}   & Identificatore di un utente (vedi
565                       sez.~\ref{sec:proc_access_id}).\\
566     \hline
567   \end{tabular}
568   \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
569   \label{tab:intro_primitive_types}
570 \end{table}
571
572 Per questo motivo tutte le funzioni di libreria di solito non fanno
573 riferimento ai tipi elementari dello standard del linguaggio C, ma ad una
574 serie di \index{tipo!primitivo} \textsl{tipi primitivi} del sistema, riportati
575 in tab.~\ref{tab:intro_primitive_types}, e definiti nell'header file
576 \file{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
577 utilizzati dalle funzioni di sistema dai tipi elementari supportati dal
578 compilatore C.
579
580
581 \subsection{Lo standard System V}
582 \label{sec:intro_sysv}
583
584 Come noto Unix nasce nei laboratori della AT\&T, che ne registrò il nome come
585 marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
586 versione supportata ufficialmente venne rilasciata al pubblico con il nome di
587 Unix System V, e si fa rifermento a questa implementazione con la sigla SysV o
588 SV.
589
590 Negli anni successivi l'AT\&T proseguì lo sviluppo rilasciando varie versioni
591 con aggiunte e integrazioni, ed in particolare la \textit{release 2} nel 1985,
592 a cui si fa riferimento con SVr2 e la \textit{release 3} nel 1986 (denominata
593 SVr3). Le interfacce di programmazione di queste due versioni vennero
594 descritte formalmente in due documenti denominati \textit{System V Interface
595   Definition} (o SVID), pertanto nel 1995 venne rilasciata la specifica SVID 1
596 e nel 1986 la specifica SVID 2.
597
598 Nel 1989 un accordo fra vari venditori (AT\&T, Sun, HP, ed altri) portò ad una
599 versione di System V che provvedeva un'unificazione delle interfacce
600 comprendente anche Xenix e BSD, questa venne denominata \textit{release 4} o
601 SVr4. Anche le relative interfacce vennero descritte in un documento dal
602 titolo \textit{System V Interface Description}, venendo a costituire lo
603 standard SVID 3, che viene considerato la specifica finale di System V, ed a
604 cui spesso si fa riferimento semplicemente con SVID. Anche SVID costituisce un
605 sovrainsieme delle interfacce definite dallo standard POSIX.  
606
607 Nel 1992 venne rilasciata una seconda versione del sistema, la SVr4.2; l'anno
608 successivo la divisione della AT\&T (già a suo tempo rinominata in Unix System
609 Laboratories) venne acquistata dalla Novell, che poi trasferì il marchio Unix
610 al consorzio X/Open. L'ultima versione di System V fu la SVr4.2MP rilasciata
611 nel Dicembre 93. Infine nel 1995 è stata rilasciata da SCO, che aveva
612 acquisito alcuni diritti sul codice di System V, una ulteriore versione delle
613 \textit{System V Interface Description}, che va sotto la denominazione di SVID
614 4.
615
616 Linux e le \acr{glibc} implementano le principali funzionalità richieste dalle
617 specifiche SVID che non sono già incluse negli standard POSIX ed ANSI C, per
618 compatibilità con lo Unix System V e con altri Unix (come SunOS) che le
619 includono. Tuttavia le funzionalità più oscure e meno utilizzate (che non sono
620 presenti neanche in System V) sono state tralasciate.
621
622 Le funzionalità implementate sono principalmente il meccanismo di
623 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
624 V IPC, che vedremo in sez.~\ref{sec:ipc_sysv}) le funzioni della famiglia
625 \func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
626 matematiche.
627
628
629 \subsection{Lo ``\textsl{standard}'' BSD}
630 \label{sec:intro_bsd}
631
632 Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
633 di Berkeley e la AT\&T generò una delle prime e più importanti fratture del
634 mondo Unix.  L'università di Berkeley proseguì nello sviluppo della base di
635 codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
636 versioni allora disponibili, fino ad arrivare al rilascio di una versione
637 completa di Unix, chiamata appunto BSD, del tutto indipendente dal codice
638 della AT\&T.
639
640 Benché BSD non sia mai stato uno standard formalizzato, l'implementazione
641 dello Unix dell'Università di Berkeley nella sua storia ha introdotto una
642 serie di estensioni e interfacce di grandissima rilevanza, come i link
643 simbolici, la funzione \code{select} ed i socket di rete. Per questo motivo si
644 fa spesso riferimento esplicito alle interfacce presenti nelle varie versioni
645 dello Unix di Berkeley con una apposita sigla.
646
647 Nel 1983, con il rilascio della versione 4.2 di BSD, venne definita una
648 implementazione delle funzioni di interfaccia a cui si fa riferimento con la
649 sigla 4.2BSD. Per fare riferimento alle precedenti versioni si usano poi le
650 sigle 3BSD e 4BSD (per le due versioni pubblicate nel 1980), e 4.1BSD per
651 quella pubblicata nel 1981.
652
653 Le varie estensioni ideate a Berkeley sono state via via aggiunte al sistema
654 nelle varie versioni succedutesi negli anni, che vanno sotto il nome di
655 4.3BSD, per la versione rilasciata nel 1986 e 4.4BSD, per la versione
656 rilasciata nel 1993, che costituisce l'ultima release ufficiale
657 dell'università di Berkeley. Si tenga presente che molte di queste interfacce
658 sono presenti in derivati commerciali di BSD come SunOS. Il kernel Linux e la
659 \acr{glibc} forniscono tutte queste estensioni che sono state in gran parte
660 incorporate negli standard successivi.
661
662
663 \subsection{Gli standard IEEE -- POSIX}
664 \label{sec:intro_posix}
665
666 Lo standard ufficiale creato da un organismo indipendente più attinente alle
667 interfacce di un sistema unix-like nel suo complesso (e che concerne sia il
668 kernel che le librerie che i comandi) è stato lo standard POSIX. Esso prende
669 origine dallo standard ANSI C, che contiene come sottoinsieme, prevedendo
670 ulteriori capacità per le funzioni in esso definite, ed aggiungendone di
671 nuove.
672
673 In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
674 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
675 X finale denuncia la sua stretta relazione con i sistemi Unix. Esso nasce dal
676 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
677 che ne produsse una prima versione, nota come \textsl{IEEE 1003.1-1988},
678 mirante a standardizzare l'interfaccia con il sistema operativo.
679
680 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
681 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
682 i comandi di sistema (1003.2), per le estensioni \textit{real-time} e per i
683 \itindex{thread} \textit{thread} (rispettivamente 1003.1d e 1003.1c) per i
684 socket (1003.1g) e vari altri.  In tab.~\ref{tab:intro_posix_std} è riportata
685 una classificazione sommaria dei principali documenti prodotti, e di come sono
686 identificati fra IEEE ed ISO; si tenga conto inoltre che molto spesso si usa
687 l'estensione IEEE anche come aggiunta al nome POSIX; ad esempio è più comune
688 parlare di POSIX.4 come di POSIX.1b.
689
690 Si tenga presente inoltre che nuove specifiche e proposte di standardizzazione
691 si aggiungono continuamente, mentre le versioni precedenti vengono riviste;
692 talvolta poi i riferimenti cambiano nome, per cui anche solo seguire le
693 denominazioni usate diventa particolarmente faticoso; una pagina dove si
694 possono recuperare varie (e di norma piuttosto intricate) informazioni è
695 \href{http://www.pasc.org/standing/sd11.html}
696 {\textsf{http://www.pasc.org/standing/sd11.html}}.
697
698 \begin{table}[htb]
699   \footnotesize
700   \centering
701   \begin{tabular}[c]{|l|l|l|l|}
702     \hline
703     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
704     \hline
705     \hline
706     POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
707     POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
708     POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
709     POSIX.3 & 2003   &TR13210& Metodi di test                               \\
710     POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
711     POSIX.4a& 1003.1c &  --- & \itindex{thread} Thread                      \\
712     POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
713     POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
714     POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
715     POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
716     POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77                \\
717     POSIX.12& 1003.1g& 9945-1& Socket                                       \\
718     \hline
719   \end{tabular}
720   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
721   \label{tab:intro_posix_std}
722 \end{table}
723
724 Benché l'insieme degli standard POSIX siano basati sui sistemi Unix, essi
725 definiscono comunque un'interfaccia di programmazione generica e non fanno
726 riferimento ad una implementazione specifica (ad esempio esiste
727 un'implementazione di POSIX.1 anche sotto Windows NT).  
728
729 Linux e la \acr{glibc} implementano tutte le funzioni definite nello standard
730 POSIX.1, queste ultime forniscono in più alcune ulteriori capacità (per
731 funzioni di \textit{pattern matching} e per la manipolazione delle
732 \textit{regular expression}), che vengono usate dalla shell e dai comandi di
733 sistema e che sono definite nello standard POSIX.2.
734
735 Nelle versioni più recenti del kernel e delle librerie sono inoltre supportate
736 ulteriori funzionalità aggiunte dallo standard POSIX.1c per quanto riguarda i
737 \itindex{thread} \textit{thread} (vedi cap.~\ref{cha:threads}), e dallo
738 standard POSIX.1b per quanto riguarda i segnali e lo \itindex{scheduler}
739 scheduling real-time (sez.~\ref{sec:sig_real_time} e
740 sez.~\ref{sec:proc_real_time}), la misura del tempo, i meccanismi di
741 intercomunicazione (sez.~\ref{sec:ipc_posix}) e l'I/O asincrono
742 (sez.~\ref{sec:file_asyncronous_io}).
743
744 Lo standard principale resta comunque POSIX.1, che continua ad evolversi; la
745 versione più nota, cui gran parte delle implementazioni fanno riferimento, e
746 che costituisce una base per molti altri tentativi di standardizzazione, è
747 stata rilasciata anche come standard internazionale con la sigla
748 \textsl{ISO/IEC 9945-1:1996} ed include i precedenti POSIX.1b e POSIX.1c. In
749 genere si fa riferimento ad essa come POSIX.1-1996.
750
751 Nel 2001 è stata poi eseguita una sintesi degli standard POSIX.1, POSIX.2 e
752 SUSv3 (vedi sez.~\ref{sec:intro_xopen}) in un unico documento, redatto sotto
753 gli auspici del cosiddetto gruppo Austin che va sotto il nome di POSIX.1-2001.
754 Questo standard definisce due livelli di conformità, quello POSIX, in cui sono
755 presenti solo le interfacce di base, e quello XSI che richiede la presenza di
756 una serie di estensioni opzionali per lo standard POSIX, riprese da SUSv3.
757 Inoltre lo standard è stato allineato allo standard C99, e segue lo stesso
758 nella definizione delle interfacce.
759
760 A questo standard sono stati aggiunti due documenti di correzione e
761 perfezionamento denominati \textit{Technical Corrigenda}, il TC1 del 2003 ed
762 il TC2 del 2004, e talvolta si fa riferimento agli stessi con le sigle
763 POSIX.1-2003 e POSIX.1-2004. 
764
765 Una ulteriore revisione degli standard POSIX e SUS è stata completata e
766 ratificata nel 2008, cosa che ha portato al rilascio di una nuova versione
767 sotto il nome di POSIX.1-2008 (e SUSv4), con l'incorporazione di alcune nuove
768 interfacce, la obsolescenza di altre, la trasformazione da opzionali a
769 richieste di alcune specifiche di base, oltre alle solite precisazioni ed
770 aggiornamenti. Anche in questo caso è prevista la suddivisione in una
771 conformità di base, e delle interfacce aggiuntive.
772
773 Le procedure di aggiornamento dello standard POSIX prevedono comunque un
774 percorso continuo, che prevede la possibilità di introduzione di nuove
775 interfacce e la definizione di precisazioni ed aggiornamenti, per questo in
776 futuro verranno rilasciate nuove versioni. Alla stesura di queste note
777 l'ultima revisione approvata resta POSIX.1-2008, uno stato della situazione
778 corrente del supporto degli standard è allegato alla documentazione della
779 \acr{glibc} e si può ottenere con il comando \texttt{man standards}.
780
781
782 \subsection{Gli standard X/Open -- Opengroup -- Unix}
783 \label{sec:intro_xopen}
784
785 Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
786 Unix per giungere ad un'armonizzazione delle varie implementazioni.  Per far
787 questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
788 nome di \textit{X/Open Portability Guide} a cui di norma si fa riferimento con
789 l'abbreviazione XPG$n$, con $n$ che indica la versione.
790
791 Nel 1989 il consorzio produsse una terza versione di questa guida
792 particolarmente voluminosa (la \textit{X/Open Portability Guide, Issue 3}),
793 contenente una dettagliata standardizzazione dell'interfaccia di sistema di
794 Unix, che venne presa come riferimento da vari produttori. Questo standard,
795 detto anche XPG3 dal nome della suddetta guida, è sempre basato sullo standard
796 POSIX.1, ma prevede una serie di funzionalità aggiuntive fra cui le specifiche
797 delle API\footnote{le \textit{Application Programmable Interface}, in sostanze
798   le interfacce di programmazione.} per l'interfaccia grafica (X11).
799
800 Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
801 Issue 4, da cui la sigla XPG4, che aggiungeva l'interfaccia XTI (\textit{X
802   Transport Interface}) mirante a soppiantare (senza molto successo)
803 l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
804 rilasciata nel 1994; questa è nota con il nome di Spec 1170 (dal numero delle
805 interfacce, header e comandi definiti) ma si fa riferimento ad essa anche come
806 XPG4v2.
807
808 Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
809 aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
810 specifiche sotto il nome di \textit{Single UNIX Specification} o SUS, l'ultima
811 versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
812   Specification}, detta SUS o SUSv1, ma più comunemente nota anche come
813 \textit{Unix 95}.
814
815 Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
816 da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
817 alla costituzione dell'\textit{Open Group}, un consorzio internazionale che
818 raccoglie produttori, utenti industriali, entità accademiche e governative.
819 Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
820 il lavoro di standardizzazione delle varie implementazioni, rilasciando
821 periodicamente nuove specifiche e strumenti per la verifica della conformità
822 alle stesse.
823
824 Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
825   Specification}, nota con la sigla SUSv2, in questa versione le interfacce
826 specificate salgono a 1434, e addirittura a 3030 se si considerano le stazioni
827 di lavoro grafiche, per le quali sono inserite pure le interfacce usate da CDE
828 che richiede sia X11 che Motif. La conformità a questa versione permette l'uso
829 del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard. Un
830 altro nome alternativo di queste specifiche, date le origini, è XPG5.
831
832 Come accennato nel 2001, con il rilascio dello standard POSIX.1-2001, è stato
833 effettuato uno sforzo di sintesi in cui sono state comprese, nella parte di
834 interfacce estese, anche le interfacce definite nelle \textit{Single UNIX
835   Specification}, pertanto si può fare riferimento a detto standard, quando
836 comprensivo del rispetto delle estensioni XSI, come SUSv3, e fregiarsi del
837 marchio UNIX 03 se conformi ad esso. 
838
839 Infine, come avvenuto per POSIX.1-2001, anche con la successiva revisione
840 dello standard POSIX.1 (la POSIX.1-2008) è stato stabilito che la conformità
841 completa a tutte quelle che sono le nuove estensioni XSI previste
842 dall'aggiornamento vada a definire la quarta versione delle \textit{Single
843   UNIX Specification}, chiamata appunto SUSv4.
844
845
846 \subsection{Il controllo di aderenza agli standard}
847 \label{sec:intro_gcc_glibc_std}
848
849 In Linux, se si usa la \acr{glibc}, la conformità agli standard appena
850 descritti può essere richiesta sia attraverso l'uso di opportune opzioni del
851 compilatore (il \texttt{gcc}) che definendo delle specifiche costanti prima
852 dell'inclusione dei file di dichiarazione (gli \textit{header file}) che
853 definiscono le funzioni di libreria.
854
855 Ad esempio se si vuole che i programmi seguano una stretta attinenza allo
856 standard ANSI C si può usare l'opzione \texttt{-ansi} del compilatore, e non
857 potrà essere utilizzata nessuna funzione non riconosciuta dalle specifiche
858 standard ISO per il C.  Il \texttt{gcc} possiede inoltre una specifica opzione
859 per richiedere la conformità ad uno standard, nella forma \texttt{-std=nome},
860 dove \texttt{nome} può essere \texttt{c89} per indicare lo standard ANSI C
861 (vedi sez.~\ref{sec:intro_ansiC}) o \texttt{c99} per indicare la conformità
862 allo standard C99.\footnote{che non è al momento completa, esistono anche le
863   possibilità di usare i valori \texttt{gnu89}, l'attuale default, che indica
864   l'uso delle estensioni GNU al C89, riprese poi dal C99, o \texttt{gnu89} che
865   indica il dialetto GNU del C99, che diventerà il default quando la
866   conformità a quest'ultimo sarà completa.}
867
868 Per attivare le varie opzioni di controllo di aderenza agli standard è poi
869 possibile definire delle macro di preprocessore che controllano le
870 funzionalità che la \acr{glibc} può mettere a disposizione:\footnote{le macro
871   sono definite nel file di dichiarazione \file{<features.h>}, ma non è
872   necessario includerlo nei propri programmi in quanto viene automaticamente
873   incluso da tutti gli altri file di dichiarazione che utilizzano le macro in
874   esso definite; si tenga conto inoltre che il file definisce anche delle
875   ulteriori macro interne, in genere con un doppio prefisso di \texttt{\_},
876   che non devono assolutamente mai essere usate direttamente. } questo può
877 essere fatto attraverso l'opzione \texttt{-D} del compilatore, ma è buona
878 norma farlo inserendo gli opportuni \code{\#define} prima della inclusione dei
879 propri \textit{header file}.
880
881 Le macro disponibili per controllare l'aderenza ai vari standard messi a
882 disposizione della \acr{glibc}, che rendono disponibili soltanto le funzioni
883 in essi definite, sono illustrate nel seguente elenco:
884 \begin{basedescript}{\desclabelwidth{2.7cm}\desclabelstyle{\nextlinelabel}}
885 \item[\macro{\_\_STRICT\_ANSI\_\_}] richiede l'aderenza stretta allo standard
886   C ISO; viene automaticamente predefinita qualora si invochi il \texttt{gcc}
887   con le opzione \texttt{-ansi} o \texttt{-std=c99}.
888
889 \item[\macro{\_POSIX\_SOURCE}] definendo questa macro (considerata obsoleta)
890   si rendono disponibili tutte le funzionalità dello standard POSIX.1 (la
891   versione IEEE Standard 1003.1) insieme a tutte le funzionalità dello
892   standard ISO C. Se viene anche definita con un intero positivo la macro
893   \macro{\_POSIX\_C\_SOURCE} lo stato di questa non viene preso in
894   considerazione.
895
896 \item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
897   positivo si controlla quale livello delle funzionalità specificate da POSIX
898   viene messa a disposizione; più alto è il valore maggiori sono le
899   funzionalità:
900   \begin{itemize}
901   \item un valore uguale a ``\texttt{1}'' rende disponibili le funzionalità
902     specificate nella edizione del 1990 (IEEE Standard 1003.1-1990);
903   \item valori maggiori o uguali a ``\texttt{2}'' rendono disponibili le
904     funzionalità previste dallo standard POSIX.2 specificate nell'edizione del
905     1992 (IEEE Standard 1003.2-1992),
906   \item un valore maggiore o uguale a ``\texttt{199309L}'' rende disponibili
907     le funzionalità previste dallo standard POSIX.1b specificate nell'edizione
908     del 1993 (IEEE Standard 1003.1b-1993);
909   \item un valore maggiore o uguale a ``\texttt{199506L}'' rende disponibili
910     le funzionalità previste dallo standard POSIX.1 specificate nell'edizione
911     del 1996 (\textit{ISO/IEC 9945-1:1996}), ed in particolare le definizioni
912     dello standard POSIX.1c per i \itindex{thread} \textit{thread};
913   \item a partire dalla versione 2.3.3 della \acr{glibc} un valore maggiore o
914     uguale a ``\texttt{200112L}'' rende disponibili le funzionalità di base
915     previste dallo standard POSIX.1-2001, escludendo le estensioni XSI;
916   \item a partire dalla versione 2.10 della \acr{glibc} un valore maggiore o
917     uguale a ``\texttt{200809L}'' rende disponibili le funzionalità di base
918     previste dallo standard POSIX.1-2008, escludendo le estensioni XSI;
919   \item in futuro valori superiori potranno abilitare ulteriori estensioni.
920   \end{itemize}
921
922 \item[\macro{\_BSD\_SOURCE}] definendo questa macro si rendono disponibili le
923   funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
924   ISO C, POSIX.1 e POSIX.2; alcune delle funzionalità previste da BSD sono
925   però in conflitto con le corrispondenti definite nello standard POSIX.1, in
926   questo caso se la macro è definita le definizioni previste da BSD4.3 avranno
927   la precedenza rispetto a POSIX.
928
929   A causa della natura dei conflitti con POSIX per ottenere una piena
930   compatibilità con BSD4.3 può essere necessario anche usare una libreria di
931   compatibilità, dato che alcune funzioni sono definite in modo diverso. In
932   questo caso occorrerà anche usare l'opzione \cmd{-lbsd-compat} con il
933   compilatore per indicargli di utilizzare le versioni nella libreria di
934   compatibilità prima di quelle normali.
935
936   Si tenga inoltre presente che la preferenza verso le versioni delle funzioni
937   usate da BSD viene mantenuta soltanto se nessuna delle ulteriori macro di
938   specificazione di standard successivi (vale a dire una fra
939   \macro{\_POSIX\_C\_SOURCE}, \macro{\_POSIX\_SOURCE}, \macro{\_SVID\_SOURCE},
940   \macro{\_XOPEN\_SOURCE}, \macro{\_XOPEN\_SOURCE\_EXTENDED} o
941   \macro{\_GNU\_SOURCE}) è stata a sua volta attivata, nel qual caso queste
942   hanno la precedenza. Se però si definisce \macro{\_BSD\_SOURCE} dopo aver
943   definito una di queste macro, l'effetto sarà quello di dare la precedenza
944   alle funzioni in forma BSD.
945
946 \item[\macro{\_SVID\_SOURCE}] definendo questa macro si rendono disponibili le
947   funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
948   standard ISO C, POSIX.1, POSIX.2, e X/Open (XPG$n$) illustrati in
949   precedenza.
950
951 \item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si rendono disponibili
952   le funzionalità descritte nella \textit{X/Open Portability Guide}. Anche
953   queste sono un sovrainsieme di quelle definite negli standard POSIX.1 e
954   POSIX.2 ed in effetti sia \macro{\_POSIX\_SOURCE} che
955   \macro{\_POSIX\_C\_SOURCE} vengono automaticamente definite. Sono incluse
956   anche ulteriori funzionalità disponibili in BSD e SVID, più una serie di
957   estensioni a secondo dei seguenti valori:
958   \begin{itemize}
959   \item la definizione della macro ad un valore qualunque attiva le
960     funzionalità specificate negli standard POSIX.1, POSIX.2 e XPG4;
961   \item un valore di ``\texttt{500}'' o superiore rende disponibili anche le
962     funzionalità introdotte con SUSv2, vale a dire la conformità ad Unix98;
963   \item a partire dalla versione 2.2 della \acr{glibc} un valore uguale a
964     ``\texttt{600}'' o superiore rende disponibili anche le funzionalità
965     introdotte con SUSv3, corrispondenti allo standard POSIX.1-2001 più le
966     estensioni XSI.
967   \item a partire dalla versione 2.10 della \acr{glibc} un valore uguale a
968     ``\texttt{700}'' o superiore rende disponibili anche le funzionalità
969     introdotte con SUSv4, corrispondenti allo standard POSIX.1-2008 più le
970     estensioni XSI.
971   \end{itemize}
972
973 \item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] definendo questa macro si rendono
974   disponibili le ulteriori funzionalità necessarie ad essere conformi al
975   rilascio del marchio \textit{X/Open Unix} corrispondenti allo standard
976   Unix95, vale a dire quelle specificate da SUSv1/XPG4v2. Questa macro viene
977   definita implicitamente tutte le volte che si imposta
978   \macro{\_XOPEN\_SOURCE} ad un valore maggiore o uguale a 500.
979
980 \item[\macro{\_ISOC99\_SOURCE}] definendo questa macro si rendono disponibili
981   le funzionalità previste per la revisione delle librerie standard del C
982   introdotte con lo standard ISO C99. La macro è definita a partire dalla
983   versione 2.1.3 della \acr{glibc}. 
984
985   Le versioni precedenti la serie 2.1.x riconoscevano le stesse estensioni con
986   la macro \macro{\_ISOC9X\_SOURCE}, dato che lo standard non era stato
987   finalizzato, ma la \acr{glibc} aveva già un'implementazione completa che
988   poteva essere attivata definendo questa macro. Benché questa sia obsoleta
989   viene tuttora riconosciuta come equivalente di \macro{\_ISOC99\_SOURCE} per
990   compatibilità.
991
992 \item[\macro{\_GNU\_SOURCE}] definendo questa macro si rendono disponibili
993   tutte le funzionalità disponibili nei vari standard oltre a varie estensioni
994   specifiche presenti solo nella \acr{glibc} ed in Linux. Gli standard coperti
995   sono: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID, X/Open, SUS.
996
997   L'uso di \macro{\_GNU\_SOURCE} è equivalente alla definizione contemporanea
998   delle macro: \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
999   \macro{\_POSIX\_SOURCE}, \macro{\_ISOC99\_SOURCE}, e inoltre di
1000   \macro{\_POSIX\_C\_SOURCE} con valore ``\texttt{200112L}'' (o
1001   ``\texttt{199506L}'' per le versioni della \acr{glibc} precedenti la 2.5),
1002   \macro{\_XOPEN\_SOURCE\_EXTENDED} e \macro{\_XOPEN\_SOURCE} con valore 600
1003   (o 500 per le versioni della \acr{glibc} precedenti la 2.2); oltre a queste
1004   vengono pure attivate le ulteriori due macro \macro{\_ATFILE\_SOURCE} e
1005   \macro{\_LARGEFILE64\_SOURCE} che definiscono funzioni previste
1006   esclusivamente dalla \acr{glibc}.
1007  
1008 \end{basedescript}
1009
1010 Benché Linux supporti in maniera estensiva gli standard più diffusi, esistono
1011 comunque delle estensioni e funzionalità specifiche, non presenti in altri
1012 standard e lo stesso vale per la \acr{glibc}, che definisce anche delle
1013 ulteriori funzioni di libreria. Ovviamente l'uso di queste funzionalità deve
1014 essere evitato se si ha a cuore la portabilità, ma qualora questo non sia un
1015 requisito esse possono rivelarsi molto utili.
1016
1017 Come per l'aderenza ai vari standard, le funzionalità aggiuntive possono
1018 essere rese esplicitamente disponibili tramite la definizione di opportune
1019 macro di preprocessore, alcune di queste vengono attivate con la definizione
1020 di \macro{\_GNU\_SOURCE}, mentre altre devono essere attivate esplicitamente,
1021 inoltre alcune estensioni possono essere attivate indipendentemente tramite
1022 una opportuna macro; queste estensioni sono illustrate nel seguente elenco:
1023
1024 \begin{basedescript}{\desclabelwidth{2.7cm}\desclabelstyle{\nextlinelabel}}
1025
1026 \item[\macro{\_LARGEFILE\_SOURCE}] definendo questa macro si rendono
1027   disponibili alcune funzioni che consentono di superare una inconsistenza
1028   presente negli standard con i file di grandi dimensioni, ed in particolare
1029   definire le due funzioni \func{fseeko} e \func{ftello} che al contrario
1030   delle corrispettive \func{fseek} e \func{ftell} usano il tipo di dato
1031   specifico \ctyp{off\_t} (vedi sez.~\ref{sec:file_fseek}).
1032
1033 \item[\macro{\_LARGEFILE64\_SOURCE}] definendo questa macro si rendono
1034   disponibili le funzioni di una interfaccia alternativa al supporto di valori
1035   a 64 bit nelle funzioni di gestione dei file (non supportati in certi
1036   sistemi), caratterizzate dal suffisso \texttt{64} aggiunto ai vari nomi di
1037   tipi di dato e funzioni (come \ctyp{off64\_t} al posto di \ctyp{off\_t} o
1038   \func{lseek64} al posto di \func{lseek}).
1039
1040   Le funzioni di questa interfaccia alternativa sono state proposte come una
1041   estensione ad uso di transizione per le \textit{Single UNIX Specification},
1042   per consentire la gestione di file di grandi dimensioni anche nei sistemi a
1043   32 bit, in cui la dimensione massima, espressa con un intero, non poteva
1044   superare i 2Gb.  Nei nuovi programmi queste funzioni devono essere evitate,
1045   a favore dell'uso macro \macro{\_FILE\_OFFSET\_BITS}, che definita al valore
1046   di \texttt{64} consente di usare in maniera trasparente le funzioni
1047   dell'interfaccia classica.
1048
1049 \item[\macro{\_FILE\_OFFSET\_BITS}] la definizione di questa macro al valore
1050   di \texttt{64} consente di attivare la conversione automatica di tutti i
1051   riferimenti a dati e funzioni a 32 bit nelle funzioni di interfaccia ai file
1052   con le equivalenti a 64 bit, senza dover utilizzare esplicitamente
1053   l'interfaccia alternativa appena illustrata. In questo modo diventa
1054   possibile usare le ordinarie funzioni per effettuare operazioni a 64 bit sui
1055   file anche su sistemi a 32 bit.\footnote{basterà ricompilare il programma
1056     dopo averla definita, e saranno usate in modo trasparente le funzioni a 64
1057     bit.}
1058
1059   Se la macro non è definita o è definita con valore \texttt{32} questo
1060   comportamento viene disabilitato, e sui sistemi a 32 bit verranno usate le
1061   ordinarie funzioni a 32 bit, non avendo più il supporto per file di grandi
1062   dimensioni. Su sistemi a 64 bit invece, dove il problema non sussiste, la
1063   macro non ha nessun effetto.
1064
1065 \item[\macro{\_ATFILE\_SOURCE}] definendo questa macro si rendono disponibili
1066   le estensioni delle funzioni di creazione, accesso e modifica di file e
1067   directory che risolvono i problemi di sicurezza insiti nell'uso di pathname
1068   relativi con programmi \itindex{thread} \textit{multi-thread} illustrate in
1069   sez.~\ref{sec:file_openat}.
1070
1071 \item[\macro{\_REENTRANT}] definendo questa macro, o la equivalente
1072   \macro{\_THREAD\_SAFE} (fornita per compatibilità) si rendono disponibili le
1073   versioni \index{funzioni!rientranti} rientranti (vedi
1074   sez.~\ref{sec:proc_reentrant}) di alcune funzioni, necessarie quando si
1075   usano i \itindex{thread} \textit{thread}.  Alcune di queste funzioni sono
1076   anche previste nello standard POSIX.1c, ma ve ne sono altre che sono
1077   disponibili soltanto su alcuni sistemi, o specifiche della \acr{glibc}, e
1078   possono essere utilizzate una volta definita la macro.
1079
1080 \item[\macro{\_FORTIFY\_SOURCE}] definendo questa macro viene abilitata
1081   l'inserimento di alcuni controlli per alcune funzioni di allocazione e
1082   manipolazione di memoria e stringhe che consentono di rilevare
1083   automaticamente alcuni errori di \textit{buffer overflow} nell'uso delle
1084   stesse. La funzionalità è stata introdotta a partire dalla versione 2.3.4
1085   della \acr{glibc} e richiede anche il supporto da parte del compilatore, che
1086   è disponibile solo a partire dalla versione 4.0 del \texttt{gcc}.
1087
1088   Le funzioni di libreria che vengono messe sotto controllo quando questa
1089   funzionalità viene attivata sono, al momento della stesura di queste note,
1090   le seguenti: \func{memcpy}, \func{mempcpy}, \func{memmove}, \func{memset},
1091   \func{stpcpy}, \func{strcpy}, \func{strncpy}, \func{strcat}, \func{strncat},
1092   \func{sprintf}, \func{snprintf}, \func{vsprintf}, \func{vsnprintf}, e
1093   \func{gets}.
1094
1095   La macro prevede due valori, con \texttt{1} vengono eseguiti dei controlli
1096   di base che non cambiano il comportamento dei programmi se si richiede una
1097   ottimizzazione di livello uno o superiore,\footnote{vale a dire se si usa
1098     l'opzione \texttt{-O1} o superiore del \texttt{gcc}.}  mentre con il
1099   valore \texttt{2} vengono aggiunti maggiori controlli. Dato che alcuni dei
1100   controlli vengono effettuati in fase di compilazione l'uso di questa macro
1101   richiede anche la collaborazione del compilatore, disponibile dalla
1102   versione 4.0 del \texttt{gcc}.
1103
1104 \end{basedescript}
1105
1106 Se non è stata specificata esplicitamente nessuna di queste macro il default
1107 assunto è che siano definite \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
1108 \macro{\_POSIX\_SOURCE} e, con le versioni della \acr{glibc} più recenti, che
1109 la macro \macro{\_POSIX\_C\_SOURCE} abbia il valore ``\texttt{200809L}'', per
1110 versioni precedenti della \acr{glibc} il valore assegnato a
1111 \macro{\_POSIX\_C\_SOURCE} era di ``\texttt{200112L}'' prima delle 2.10, di
1112 ``\texttt{199506L}'' prima delle 2.4, di ``\texttt{199506L}'' prima delle
1113 2.1. Si ricordi infine che perché queste macro abbiano effetto devono essere
1114 sempre definite prima dell'inclusione dei file di dichiarazione.
1115
1116
1117 % vedi anche man feature_test_macros
1118
1119 % LocalWords:  like kernel multitasking scheduler preemptive sez swap is cap VM
1120 % LocalWords:  everything bootstrap init shell Windows Foundation system call
1121 % LocalWords:  fig libc uClib glibc embedded Library POSIX username PAM Methods
1122 % LocalWords:  Pluggable Autentication group supplementary Name Service Switch
1123 % LocalWords:  LDAP identifier uid gid superuser root if BSD SVr dall' American
1124 % LocalWords:  National Institute International Organisation IEC header tab gcc
1125 % LocalWords:  assert ctype dirent errno fcntl limits malloc setjmp signal utmp
1126 % LocalWords:  stdarg stdio stdlib string times unistd library int short caddr
1127 % LocalWords:  address clock dev ino inode key IPC loff nlink off pid rlim size
1128 % LocalWords:  sigset ssize ptrdiff sys nell'header IEEE Richard Portable of TR
1129 % LocalWords:  Operating Interface dell'IEEE Electrical and Electronics thread
1130 % LocalWords:  Engeneers Socket NT matching regular expression scheduling l'I
1131 % LocalWords:  XPG Portability Issue Application Programmable XTI Transport AT
1132 % LocalWords:  socket Spec Novell Specification SUSv CDE Motif Berkley select
1133 % LocalWords:  SunOS l'AT Sun HP Xenix Description SVID Laboratories MP hsearch
1134 % LocalWords:  drand fmtmsg define SOURCE lbsd compat XOPEN version ISOC Large
1135 % LocalWords:  LARGEFILE Support LFS dell' black rectangle node fill cpu draw
1136 % LocalWords:  ellipse mem anchor west proc SysV SV Definition SCO Austin XSI
1137 % LocalWords:  Technical TC SUS Opengroup features STRICT std ATFILE fseeko
1138 % LocalWords:  ftello fseek ftell lseek FORTIFY REENTRANT SAFE overflow memcpy
1139 % LocalWords:  mempcpy memmove memset stpcpy strcpy strncpy strcat strncat gets
1140 % LocalWords:  sprintf snprintf vsprintf vsnprintf syscall number calendar BITS
1141 % LocalWords:  pathname Google Android standards
1142
1143 %%% Local Variables: 
1144 %%% mode: latex
1145 %%% TeX-master: "gapil"
1146 %%% End: