d0513cfc7ca5e8f8fdfa9def92e639de82bcd6c6
[gapil.git] / intro.tex
1 %% intro.tex
2 %%
3 %% Copyright (C) 2000-2011 Simone Piccardi.  Permission is granted to
4 %% copy, distribute and/or modify this document under the terms of the GNU Free
5 %% Documentation License, Version 1.1 or any later version published by the
6 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
8 %% license is included in the section entitled "GNU Free Documentation
9 %% License".
10 %%
11
12 \chapter{L'architettura del sistema}
13 \label{cha:intro_unix}
14
15 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
16 cui è basato un sistema operativo di tipo Unix come GNU/Linux, in questo modo
17 potremo fornire una base di comprensione mirata a sottolineare le peculiarità
18 del sistema che sono più rilevanti per quello che riguarda la programmazione.
19
20 Dopo un'introduzione sulle caratteristiche principali di un sistema di tipo
21 Unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
22 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
23 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
24
25
26 \section{Una panoramica}
27 \label{sec:intro_unix_struct}
28
29 In questa prima sezione faremo una breve panoramica sull'architettura di un
30 sistema operativo di tipo Unix, come GNU/Linux, e della relazione fra le varie
31 parti che lo compongono. Chi avesse già una conoscenza di questa materia può
32 tranquillamente saltare questa sezione.
33
34 \subsection{Concetti base}
35 \label{sec:intro_base_concept}
36
37 Il concetto principale su cui è basata l'architettura di un sistema unix-like
38 è quello di un nucleo del sistema, il cosiddetto \textit{kernel} (nel nostro
39 caso Linux) a cui si demanda la gestione delle risorse della propria macchina
40 (la CPU, la memoria, le periferiche) mentre tutto il resto, quindi anche la
41 parte che prevede l'interazione con l'utente, dev'essere realizzato tramite
42 programmi eseguiti dal kernel, che accedano alle risorse tramite opportune
43 richieste a quest'ultimo.
44
45 Fin dai suoi albori Unix nasce come sistema operativo \textit{multitasking},
46 cioè in grado di eseguire contemporaneamente più programmi, e multiutente, in
47 cui è possibile che più utenti siano connessi ad una macchina eseguendo più
48 programmi ``\textsl{in contemporanea}''. In realtà, almeno per le macchine a
49 processore singolo, i programmi vengono semplicemente eseguiti uno alla volta
50 in una opportuna \textsl{rotazione}.\footnote{anche se oggi, con la presenza
51   di sistemi multiprocessore, si possono avere più processi eseguiti in
52   contemporanea, il concetto di ``\textsl{rotazione}'' resta comunque valido,
53   dato che in genere il numero di processi da eseguire eccede il numero dei
54   precessori disponibili. }
55
56 % Questa e` una distinzione essenziale da capire,
57 %specie nei confronti dei sistemi operativi successivi, nati per i personal
58 %computer (e quindi per un uso personale), sui quali l'hardware (allora
59 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
60
61 I kernel Unix più recenti, come Linux, sono realizzati sfruttando alcune
62 caratteristiche dei processori moderni come la gestione hardware della memoria
63 e la modalità protetta. In sostanza con i processori moderni si può
64 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
65 zone di memoria fisica.  Quello che succede è che il kernel è il solo
66 programma ad essere eseguito in modalità privilegiata, con il completo accesso
67 a tutte le risorse della macchina, mentre i programmi normali vengono eseguiti
68 in modalità protetta senza accesso diretto alle risorse.  Uno schema
69 elementare della struttura del sistema è riportato in
70 fig.~\ref{fig:intro_sys_struct}.
71
72 \begin{figure}[htb]
73   \centering
74   \includegraphics[width=10cm]{img/struct_sys}
75   % \begin{tikzpicture}
76   %   \filldraw[fill=black!20] (0,0) rectangle (7.5,1);
77   %   \draw (3.75,0.5) node {\textsl{System Call Interface}};
78   %   \filldraw[fill=black!35] (0,1) rectangle (7.5,4);
79   %   \draw (3.75,2.5) node {\huge{\textsf{kernel}}};
80   %   \filldraw[fill=black!20] (0,4) rectangle (2.5,5);
81   %   \draw (1.25,4.5) node {\textsf{scheduler}};
82   %   \filldraw[fill=black!20] (2.5,4) rectangle (5,5);
83   %   \draw (3.75,4.5) node {\textsf{VM}};
84   %   \filldraw[fill=black!20] (5,4) rectangle (7.5,5);
85   %   \draw (6.25,4.5) node {\textsf{driver}};
86
87   %   \draw (1.25,7) node(cpu) [ellipse,draw] {\textsf{CPU}};
88   %   \draw (3.75,7) node(mem) [ellipse,draw] {\textsf{memoria}};
89   %   \draw (6.25,7) node(disk) [ellipse,draw] {\textsf{disco}};
90
91   %   \draw[<->] (cpu) -- (1.25,5);
92   %   \draw[<->] (mem) -- (3.75,5);
93   %   \draw[<->] (disk) -- (6.25,5);
94
95   %   \draw (7.5,0) node [anchor=base west] {\textit{kernel space}};
96   %   \draw (7.5,-1) node [anchor=west] {\textit{user space}};
97
98   %   \draw (-1,-0.5) -- (8.5, -0.5);
99
100   %   \draw (0,-2) rectangle (7.5,-1);
101   %   \draw (3.75, -1.5) node {\textsl{GNU C Library}};
102   %   \draw[->] (1.25,-1) -- (1.25,0);
103   %   \draw[->] (3.75,-1) -- (3.75,0);
104   %   \draw[->] (6.25,-1) -- (6.25,0);
105
106   %   \draw (1.25,-3) node(proc1) [rectangle,draw] {\textsf{processo}};
107   %   \draw (3.75,-3) node(proc2) [rectangle,draw] {\textsf{processo}};
108   %   \draw (6.25,-3) node(proc3) [rectangle,draw] {\textsf{processo}};
109
110   %   \draw[->] (1.25,-2) -- (proc1);
111   %   \draw[->] (3.75,-2) -- (proc2);
112   %   \draw[->] (6.25,-2) -- (proc3);
113   % \end{tikzpicture}
114   \caption{Schema di massima della struttura di interazione fra processi,
115     kernel e dispositivi in Linux.}
116   \label{fig:intro_sys_struct}
117 \end{figure}
118
119 Una parte del kernel, lo \itindex{scheduler} \textit{scheduler}, si occupa di
120 stabilire, sulla base di un opportuno calcolo delle priorità e con una
121 suddivisione appropriata del tempo di processore, quali fra i vari
122 ``\textsl{processi}'' presenti nel sistema deve essere eseguito, realizzando
123 il cosiddetto \itindex{preemptive~multitasking} \textit{preemptive
124   multitasking}.\footnote{si chiama così quella gestione del
125   \textit{multitasking} in cui è il kernel a decidere a chi assegnare l'uso
126   della CPU, potendo interrompere l'esecuzione di un processo in qualunque
127   momento.}  Ogni processo verrà comunque eseguito in modalità protetta;
128 quando necessario esso potrà accedere alle risorse della macchina soltanto
129 attraverso delle ``\textsl{chiamate al sistema}'' (vedi
130 sez.~\ref{sec:intro_syscall}) che restituiranno il controllo al kernel per
131 eseguire le operazioni necessarie.
132
133 La memoria viene sempre gestita dal kernel attraverso il meccanismo della
134 \index{memoria~virtuale} \textsl{memoria virtuale}, che consente di assegnare
135 a ciascun processo uno spazio di indirizzi ``\textsl{virtuale}'' (vedi
136 sez.~\ref{sec:proc_memory}) che il kernel stesso, con l'ausilio della unità di
137 gestione della memoria, si incaricherà di rimappare automaticamente sulla
138 memoria fisica disponibile, con la possibilità ulteriore di spostare
139 temporaneamente su disco (nella cosiddetta area di \textit{swap}) parte di
140 detta memoria qualora ci si trovi nella necessità di liberare risorse.
141
142 Le periferiche infine vengono normalmente viste attraverso un'interfaccia
143 astratta che permette di trattarle come se fossero dei file, secondo uno dei
144 concetti base della architettura di Unix, per cui ``\textsl{tutto è in file}''
145 (\textit{everything is a file}) su cui torneremo in dettaglio in
146 cap.~\ref{cha:file_intro}. In realtà questo non è sempre vero (ad esempio non
147 lo è per le interfacce di rete) dato che ci sono periferiche che non
148 rispondendo bene a questa astrazione richiedono un'interfaccia diversa.  Anche
149 in questo caso però resta valido il concetto generale che tutto il lavoro di
150 accesso e gestione delle periferiche a basso livello viene effettuato dal
151 kernel tramite l'opportuno codice di gestione delle stesse, che in
152 fig.~\ref{fig:intro_sys_struct} si è indicato come \textit{driver}.
153
154
155 \subsection{Il kernel e il sistema}
156 \label{sec:intro_kern_and_sys}
157
158 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi Unix è
159 quello della distinzione fra il cosiddetto \textit{user space}, che
160 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
161 \textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
162 programma vede sé stesso come se avesse la piena disponibilità della CPU e
163 della memoria ed è, salvo i meccanismi di comunicazione previsti dal sistema,
164 completamente ignaro del fatto che altri programmi possono essere messi in
165 esecuzione dal kernel.
166
167 Per questa separazione non è possibile ad un singolo programma disturbare
168 l'azione di un altro programma o del kernel stesso, e questo è il principale
169 motivo della stabilità di un sistema unix-like nei confronti di altri sistemi
170 in cui i processi non hanno di questi limiti o in cui essi vengono eseguiti
171 allo stesso livello del kernel. Pertanto deve essere chiaro a chi programma in
172 un sistema unix-like che l'accesso diretto all'hardware non può avvenire se
173 non all'interno del kernel; al di fuori dal kernel il programmatore deve usare
174 le opportune interfacce che quest'ultimo fornisce per i programmi in
175 \textit{user space}.
176
177 Per capire meglio la distinzione fra \textit{kernel space} e \textit{user
178   space} si può prendere in esame la procedura di avvio di un sistema
179 unix-like. All'accensione il \textit{firmware} presente nella EPROM della
180 propria macchina (per i PC compatibili il BIOS), eseguirà la procedura di
181 avvio del sistema, il cosiddetto \textit{bootstrap},\footnote{il nome deriva
182   da un'espressione gergale che significa ``sollevarsi da terra tirandosi per
183   le stringhe delle scarpe'', per indicare il compito, almeno apparentemente
184   impossibile, di far eseguire un programma a partire da un computer appena
185   acceso che appunto non ne contiene nessuno; non è impossibile perché in
186   realtà c'è un programma iniziale, che è il BIOS.} incaricandosi di caricare
187 il kernel in memoria e di farne partire l'esecuzione. A questo punto il
188 controllo passerà al kernel, il quale però da parte sua, una volta
189 inizializzato opportunamente l'hardware, si limiterà a lanciare un unico
190 processo di inizializzazione (che per questo in genere genere si chiama
191 \cmd{init}). A questo punto tutto il lavoro verrà eseguito \textit{user space}
192 da questo programma, che sua volta si incaricherà di lanciare tutti gli altri,
193 fra cui ci sarà quello che si occupa di dialogare con la tastiera e lo schermo
194 della console, quello che mette a disposizione un terminale e la
195 \textit{shell} da cui inviare i comandi all'utente che si vuole collegare, ed
196 in generale tutto quanto necessario ad avere un sistema utilizzabile.
197
198 E' da rimarcare come tutto ciò che riguarda l'interazione con l'utente, che
199 usualmente viene visto come parte del sistema, non abbia in realtà niente a
200 che fare con il kernel, ma sia effettuato da opportuni programmi che vengono
201 eseguiti, allo stesso modo di un qualunque programma di scrittura o di disegno
202 e della stessa interfaccia grafica, in \textit{user space}.
203
204 Questo significa ad esempio che il sistema di per sé non dispone di primitive
205 per tutta una serie di operazioni (ad esempio come la copia di un file) che
206 altri sistemi (come Windows) hanno invece al loro interno. Questo perché tutte
207 le operazioni di normale amministrazione di un sistema, sono effettuata
208 attraverso dei normali programmi utilizzando le interfacce di programmazione
209 che il kernel mette a disposizione.
210
211 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
212 %realizzare un sistema di permessi e controlli che evitano che i programmi
213 %eseguano accessi non autorizzati. 
214
215 È per questo motivo che quando ci si riferisce al sistema nella sua interezza
216 viene spesso sottolineato come sia corretto parlare di ``GNU/Linux'' e non di
217 Linux; da solo infatti il kernel non è sufficiente, quello che costruisce un
218 sistema operativo utilizzabile è la presenza di tutta una serie di librerie e
219 programmi di utilità, ed i più comuni sono appunto quelli realizzati dal
220 progetto GNU della Free Software Foundation, grazie ai quali si possono
221 eseguire le normali operazioni che ci si aspetta da un sistema operativo.
222
223
224 \subsection{\textit{System call} e funzioni di libreria}
225 \label{sec:intro_syscall}
226
227 Come illustrato in fig.~\ref{fig:intro_sys_struct} i programmi possono
228 accedere ai servizi forniti dal kernel tramite opportune interfacce dette
229 \textit{system call} (\textsl{chiamate al sistema}, appunto). Si tratta di un
230 insieme di funzioni che un programma può invocare, per le quali viene generata
231 un'interruzione nell'esecuzione del codice del processo, passando il controllo
232 al kernel. Sarà quest'ultimo che eseguirà in le operazioni relative alla
233 funzione richiesta in \textit{kernel space}, restituendo poi i risultati al
234 chiamante.
235
236 Ogni versione di Unix ha storicamente sempre avuto un certo numero di
237 \textit{system call}, che sono documentate nella seconda sezione del
238 \textsl{Manuale di programmazione di Unix}, quella cui si accede con il
239 comando \cmd{man 2 <nome>}, ed anche Linux non fa eccezione. Queste
240 \textit{system call} sono poi state codificate da vari standard, che
241 esamineremo brevemente in sez.~\ref{sec:intro_standard}.
242
243 Normalmente ciascuna chiamata al sistema fornita dal kernel viene associata ad
244 una funzione con lo stesso nome definita all'interno della libreria
245 fondamentale del sistema, quella che viene chiamata \textsl{Libreria Standard
246   del C} (\textit{C Standard Library}) in ragione del fatto che il primo
247 kernel Unix e tutti i programmi eseguiti su di esso vennero scritti in C,
248 usando le librerie di questo linguaggio. Questa libreria, oltre alle
249 interfacce delle \textit{system call}, contiene anche tutta una serie di
250 ulteriori funzioni di utilità che vengono comunemente usate nella
251 programmazione e sono definite nei vari standard che documentano le interfacce
252 di programmazione di un sistema unix-like.
253
254 Questo concetto è importante da tener presente perché programmare in Linux
255 significa anzitutto essere in grado di usare le funzioni fornite dalla
256 \textsl{Libreria Standard del C}, in quanto né il kernel, né il linguaggio C
257 implementano direttamente operazioni ordinarie come l'allocazione dinamica
258 della memoria, l'input/output bufferizzato sui file o la manipolazione delle
259 stringhe, che sono comunemente usate da qualunque programma.
260
261 Tutto ciò mette nuovamente in evidenza il fatto che nella stragrande
262 maggioranza dei casi si dovrebbe usare il nome GNU/Linux in quanto una parte
263 essenziale del sistema, senza la quale niente funzionerebbe, è appunto la
264 \textit{GNU Standard C Library} (a cui faremo da qui in avanti riferimento
265 come \acr{glibc}), ovvero la Libreria Standard del C realizzata dalla Free
266 Software Foundation, nella quale sono state implementate tutte le funzioni
267 essenziali definite negli standard POSIX e ANSI C (e molte altre), che vengono
268 utilizzate da qualunque programma.
269
270 Si tenga comunque presente che questo non è sempre vero, dato che esistono
271 implementazioni alternative della Libreria Standard del C, come la
272 \textit{libc5} o la \textit{uClib}, che non derivano dal progetto GNU. La
273 \textit{libc5}, che era usata con le prime versioni del kernel Linux, è oggi
274 ormai completamente soppiantata dalla \acr{glibc}. La \textit{uClib} invece,
275 pur non essendo completa come la \acr{glibc}, resta molto diffusa nel mondo
276 dei dispositivi \textit{embedded} per le sue dimensioni estremamente ridotte,
277 e soprattutto per la possibilità di togliere le parti non necessarie. Pertanto
278 costituisce un valido rimpiazzo della \acr{glibc} in tutti quei sistemi
279 specializzati che richiedono una minima occupazione di memoria. Infine per lo
280 sviluppo del sistema Android è stata realizzata da Google un'altra Libreria
281 Standard del C, utilizzata principalmente per evitare l'uso della \acr{glibc}.
282
283 Tradizionalmente le funzioni specifiche della Libreria Standard del C sono
284 riportate nella terza sezione del \textsl{Manuale di Programmazione di Unix}
285 (cioè accessibili con il comando \cmd{man 3 <nome>}) e come accennato non sono
286 direttamente associate ad una \textit{system call} anche se, ad esempio per la
287 gestione dei file o della allocazione dinamica della memoria, possono farne
288 uso nella loro implementazione.  Nonostante questa questa distinzione,
289 fondamentale per capire il funzionamento del sistema, l'uso da parte dei
290 programmi di una di queste funzioni resta lo stesso, sia che si tratti di una
291 funzione interna della libreria che di una \textit{system call}.
292
293
294 \subsection{Un sistema multiutente}
295 \label{sec:intro_multiuser}
296
297 Linux, come gli altri kernel Unix, nasce fin dall'inizio come sistema
298 multiutente, cioè in grado di fare lavorare più persone in contemporanea. Per
299 questo esistono una serie di meccanismi di sicurezza, che non sono previsti in
300 sistemi operativi monoutente, e che occorre tenere presenti. In questa sezione
301 parleremo brevemente soltanto dei meccanismi di sicurezza tradizionali di un
302 sistema unix-like, oggi molti di questi sono stati notevolmente estesi
303 rispetto al modello tradizionale, ma per il momento ignoreremo queste
304 estensioni.
305
306 Il concetto base è quello di utente (\textit{user}) del sistema, le cui
307 capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
308 Sono così previsti una serie di meccanismi per identificare i singoli utenti
309 ed una serie di permessi e protezioni per impedire che utenti diversi possano
310 danneggiarsi a vicenda o danneggiare il sistema. Questi meccanismi sono
311 realizzati dal kernel stesso ed attengono alle operazioni più varie, e
312 torneremo su di essi in dettaglio più avanti.
313
314 Normalmente l'utente è identificato da un nome (il cosiddetto
315 \textit{username}), che ad esempio è quello che viene richiesto all'ingresso
316 nel sistema dalla procedura di \textit{login} (torneremo su questo in
317 sez.~\ref{sec:sess_login}).  Questa procedura si incarica di verificare
318 l'identità dell'utente, in genere attraverso la richiesta di una parola
319 d'ordine (la \textit{password}), anche se sono possibili meccanismi
320 diversi.\footnote{ad esempio usando la libreria PAM (\textit{Pluggable
321     Autentication Methods}) è possibile astrarre completamente dai meccanismi
322   di autenticazione e sostituire ad esempio l'uso delle password con
323   meccanismi di identificazione biometrica, per un approfondimento
324   dell'argomento si rimanda alla sez.~4.3 di \cite{AGL}.} Eseguita la
325 procedura di riconoscimento in genere il sistema manda in esecuzione un
326 programma di interfaccia (che può essere la \textit{shell} su terminale o
327 un'interfaccia grafica) che mette a disposizione dell'utente un meccanismo con
328 cui questo può impartire comandi o eseguire altri programmi.
329
330 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
331 \textit{default group}), ma può essere associato ad altri gruppi (i
332 \textit{supplementary group}), questo permette di gestire i permessi di
333 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
334 definendo gruppi di lavoro, di accesso a determinate risorse, ecc. 
335
336 L'utente e il gruppo sono identificati dal kernel un identificativo numerico,
337 la cui corrispondenza ad un nome espresso in caratteri è inserita nei due file
338 \conffile{/etc/passwd} e \conffile{/etc/group}.\footnote{in realtà negli
339   sistemi più moderni, come vedremo in sez.~\ref{sec:sys_user_group} queste
340   informazioni possono essere mantenute, con l'uso del
341   \itindex{Name~Service~Switch} \textit{Name Service Switch}, su varie
342   tipologie di supporti, compresi server centralizzati come LDAP.}  Questi
343 identificativi sono l'\textit{user identifier}, detto in breve
344 \textsl{user-ID}, ed indicato dall'acronimo \acr{uid}, e il \textit{group
345   identifier}, detto in breve \textsl{group-ID}, ed identificato dall'acronimo
346 \acr{gid}, torneremo in dettaglio su questo argomento in
347 sez.~\ref{sec:proc_perms}.  Il kernel conosce ed utilizza soltanto questi
348 valori numerici, i nomi ad essi associati sono interamente gestiti in
349 \textit{user space} con opportune funzioni di libreria, torneremo su questo
350 argomento in sez.~\ref{sec:sys_user_group}.
351  
352 Grazie a questi identificativi il sistema è in grado di tenere traccia
353 dell'utente a cui appartiene ciascun processo ed impedire ad altri utenti di
354 interferire con quest'ultimo.  Inoltre con questo sistema viene anche
355 garantita una forma base di sicurezza interna in quanto anche l'accesso ai
356 file (vedi sez.~\ref{sec:file_access_control}) è regolato da questo meccanismo
357 di identificazione.
358
359 Infine in ogni sistema unix-like è presente uno speciale utente privilegiato,
360 il cosiddetto \textit{superuser}, il cui username è di norma \textit{root}, ed
361 il cui \acr{uid} è zero. Esso identifica l'amministratore del sistema, che
362 deve essere in grado di fare qualunque operazione; per l'utente \textit{root}
363 infatti i meccanismi di controllo cui si è accennato in precedenza sono
364 disattivati.\footnote{i controlli infatti vengono eseguiti da uno pseudocodice
365   del tipo: ``\code{if (uid) \{ \textellipsis\ \}}''.}
366
367
368 \section{Gli standard}
369 \label{sec:intro_standard}
370
371 In questa sezione faremo una breve panoramica relativa ai vari standard che
372 nel tempo sono stati formalizzati da enti, associazioni, consorzi e
373 organizzazioni varie al riguardo ai sistemi operativi di tipo Unix o alle
374 caratteristiche che si sono stabilite come standard di fatto in quanto facenti
375 parte di alcune implementazioni molto diffuse come BSD o System V.
376
377 Ovviamente prenderemo in considerazione solo gli standard riguardanti
378 interfacce di programmazione e le altre caratteristiche di un sistema
379 unix-like (alcuni standardizzano pure i comandi base del sistema e la shell)
380 ed in particolare ci concentreremo sul come ed in che modo essi sono
381 supportati sia per quanto riguarda il kernel che la Libreria Standard del C,
382 con una particolare attenzione alla \acr{glibc}.
383
384
385 \subsection{Lo standard ANSI C}
386 \label{sec:intro_ansiC}
387
388 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
389   Standard Institute} come prima standardizzazione del linguaggio C e per
390 questo si fa riferimento ad esso anche come C89. L'anno successivo è stato
391 adottato dalla ISO (\textit{International Standard Organisation}) come
392 standard internazionale con la sigla ISO/IEC 9899:1990, e per questo è noto
393 anche sotto il nome di standard ISO C, o ISO C90.  Nel 1999 è stata pubblicata
394 una revisione dello standard C89, che viene usualmente indicata come C99,
395 anche questa è stata ratificata dalla ISO con la sigla ISO/IEC 9899:1990, per
396 cui vi si fa riferimento anche come ISO C99.
397
398 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
399 sistemi operativi diversi, ma oltre alla sintassi ed alla semantica del
400 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
401 anche una libreria di funzioni che devono poter essere implementate su
402 qualunque sistema operativo.
403
404 Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
405 di tipo Unix, GNU/Linux (per essere precisi la \acr{glibc}), come molti Unix
406 moderni, provvede la compatibilità con questo standard, fornendo le funzioni
407 di libreria da esso previste. Queste sono dichiarate in una serie di
408 \textit{header file} anch'essi forniti dalla \acr{glibc} (tratteremo
409 l'argomento in sez.~\ref{sec:proc_syscall}).
410
411 In realtà la \acr{glibc} ed i relativi \textit{header file} definiscono un
412 insieme di funzionalità in cui sono incluse come sottoinsieme anche quelle
413 previste dallo standard ANSI C. È possibile ottenere una conformità stretta
414 allo standard (scartando le funzionalità addizionali) usando il \cmd{gcc} con
415 l'opzione \cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei
416 vari \textit{header file} soltanto le funzionalità previste dallo standard
417 ANSI C e a non usare le varie estensioni al linguaggio e al preprocessore da
418 esso supportate.
419
420
421 \subsection{I tipi di dati primitivi}
422 \label{sec:intro_data_types}
423
424 Uno dei problemi di portabilità del codice più comune è quello dei tipi di
425 dati utilizzati nei programmi, che spesso variano da sistema a sistema, o
426 anche da una architettura ad un'altra (ad esempio passando da macchine con
427 processori 32 bit a 64). In particolare questo è vero nell'uso dei cosiddetti
428 \index{tipo!elementare} \textit{tipi elementari} del linguaggio C (come
429 \ctyp{int}) la cui dimensione varia a seconda dell'architettura hardware.
430
431 Storicamente alcuni tipi nativi dello standard ANSI C sono sempre stati
432 associati ad alcune variabili nei sistemi Unix, dando per scontata la
433 dimensione. Ad esempio la posizione corrente all'interno di un file è stata
434 associata ad un intero a 32 bit, mentre il numero di dispositivo è stato
435 associato ad un intero a 16 bit. Storicamente questi erano definiti
436 rispettivamente come \ctyp{int} e \ctyp{short}, ma tutte le volte che, con
437 l'evolversi ed il mutare delle piattaforme hardware, alcuni di questi tipi si
438 sono rivelati inadeguati o sono cambiati, ci si è trovati di fronte ad una
439 infinita serie di problemi di portabilità.
440
441 \begin{table}[htb]
442   \footnotesize
443   \centering
444   \begin{tabular}[c]{|l|l|}
445     \hline
446     \textbf{Tipo} & \textbf{Contenuto} \\
447     \hline
448     \hline
449     \type{caddr\_t} & Core address.\\
450     \type{clock\_t} & Contatore del \textit{process time} (vedi
451                       sez.~\ref{sec:sys_cpu_times}.\\ 
452     \type{dev\_t}   & Numero di dispositivo (vedi sez.~\ref{sec:file_mknod}).\\
453     \type{gid\_t}   & Identificatore di un gruppo (vedi
454                       sez.~\ref{sec:proc_access_id}).\\
455     \type{ino\_t}   & Numero di \index{inode} \textit{inode}.\\
456     \type{key\_t}   & Chiave per il System V IPC (vedi
457                       sez.~\ref{sec:ipc_sysv_generic}).\\
458     \type{loff\_t}  & Posizione corrente in un file.\\
459     \type{mode\_t}  & Attributi di un file.\\
460     \type{nlink\_t} & Contatore dei link su un file.\\
461     \type{off\_t}   & Posizione corrente in un file.\\
462     \type{pid\_t}   & Identificatore di un processo (vedi
463                       sez.~\ref{sec:proc_pid}).\\
464     \type{rlim\_t}  & Limite sulle risorse.\\
465     \type{sigset\_t}& Insieme di segnali (vedi sez.~\ref{sec:sig_sigset}).\\
466     \type{size\_t}  & Dimensione di un oggetto.\\
467     \type{ssize\_t} & Dimensione in numero di byte ritornata dalle funzioni.\\
468     \type{ptrdiff\_t}& Differenza fra due puntatori.\\
469     \type{time\_t}  & Numero di secondi (in \itindex{calendar~time}
470                       \textit{calendar time}, vedi 
471                       sez.~\ref{sec:sys_time}).\\
472     \type{uid\_t}   & Identificatore di un utente (vedi
473                       sez.~\ref{sec:proc_access_id}).\\
474     \hline
475   \end{tabular}
476   \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
477   \label{tab:intro_primitive_types}
478 \end{table}
479
480 Per questo motivo tutte le funzioni di libreria di solito non fanno
481 riferimento ai tipi elementari dello standard del linguaggio C, ma ad una
482 serie di \index{tipo!primitivo} \textsl{tipi primitivi} del sistema, riportati
483 in tab.~\ref{tab:intro_primitive_types}, e definiti nell'\textit{header file}
484 \file{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
485 utilizzati dalle funzioni di sistema dai tipi elementari supportati dal
486 compilatore C.
487
488
489 \subsection{Lo standard System V}
490 \label{sec:intro_sysv}
491
492 Come noto Unix nasce nei laboratori della AT\&T, che ne registrò il nome come
493 marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
494 versione supportata ufficialmente venne rilasciata al pubblico con il nome di
495 Unix System V, e si fa rifermento a questa implementazione con la sigla SysV o
496 SV.
497
498 Negli anni successivi l'AT\&T proseguì lo sviluppo rilasciando varie versioni
499 con aggiunte e integrazioni, ed in particolare la \textit{release 2} nel 1985,
500 a cui si fa riferimento con SVr2 e la \textit{release 3} nel 1986 (denominata
501 SVr3). Le interfacce di programmazione di queste due versioni vennero
502 descritte formalmente in due documenti denominati \textit{System V Interface
503   Definition} (o SVID), pertanto nel 1995 venne rilasciata la specifica SVID 1
504 e nel 1986 la specifica SVID 2.
505
506 Nel 1989 un accordo fra vari venditori (AT\&T, Sun, HP, ed altri) portò ad una
507 versione di System V che provvedeva un'unificazione delle interfacce
508 comprendente anche Xenix e BSD, questa venne denominata \textit{release 4} o
509 SVr4. Anche le relative interfacce vennero descritte in un documento dal
510 titolo \textit{System V Interface Description}, venendo a costituire lo
511 standard SVID 3, che viene considerato la specifica finale di System V, ed a
512 cui spesso si fa riferimento semplicemente con SVID. Anche SVID costituisce un
513 sovrainsieme delle interfacce definite dallo standard POSIX.  
514
515 Nel 1992 venne rilasciata una seconda versione del sistema, la SVr4.2; l'anno
516 successivo la divisione della AT\&T (già a suo tempo rinominata in Unix System
517 Laboratories) venne acquistata dalla Novell, che poi trasferì il marchio Unix
518 al consorzio X/Open. L'ultima versione di System V fu la SVr4.2MP rilasciata
519 nel Dicembre 93. Infine nel 1995 è stata rilasciata da SCO, che aveva
520 acquisito alcuni diritti sul codice di System V, una ulteriore versione delle
521 \textit{System V Interface Description}, che va sotto la denominazione di SVID
522 4.
523
524 Linux e le \acr{glibc} implementano le principali funzionalità richieste dalle
525 specifiche SVID che non sono già incluse negli standard POSIX ed ANSI C, per
526 compatibilità con lo Unix System V e con altri Unix (come SunOS) che le
527 includono. Tuttavia le funzionalità più oscure e meno utilizzate (che non sono
528 presenti neanche in System V) sono state tralasciate.
529
530 Le funzionalità implementate sono principalmente il meccanismo di
531 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
532 V IPC, che vedremo in sez.~\ref{sec:ipc_sysv}) le funzioni della famiglia
533 \func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
534 matematiche.
535
536
537 \subsection{Lo ``\textsl{standard}'' BSD}
538 \label{sec:intro_bsd}
539
540 Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
541 di Berkeley e la AT\&T generò una delle prime e più importanti fratture del
542 mondo Unix.  L'università di Berkeley proseguì nello sviluppo della base di
543 codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
544 versioni allora disponibili, fino ad arrivare al rilascio di una versione
545 completa di Unix, chiamata appunto BSD, del tutto indipendente dal codice
546 della AT\&T.
547
548 Benché BSD non sia mai stato uno standard formalizzato, l'implementazione
549 dello Unix dell'Università di Berkeley nella sua storia ha introdotto una
550 serie di estensioni e interfacce di grandissima rilevanza, come i link
551 simbolici, la funzione \code{select} ed i socket di rete. Per questo motivo si
552 fa spesso riferimento esplicito alle interfacce presenti nelle varie versioni
553 dello Unix di Berkeley con una apposita sigla.
554
555 Nel 1983, con il rilascio della versione 4.2 di BSD, venne definita una
556 implementazione delle funzioni di interfaccia a cui si fa riferimento con la
557 sigla 4.2BSD. Per fare riferimento alle precedenti versioni si usano poi le
558 sigle 3BSD e 4BSD (per le due versioni pubblicate nel 1980), e 4.1BSD per
559 quella pubblicata nel 1981.
560
561 Le varie estensioni ideate a Berkeley sono state via via aggiunte al sistema
562 nelle varie versioni succedutesi negli anni, che vanno sotto il nome di
563 4.3BSD, per la versione rilasciata nel 1986 e 4.4BSD, per la versione
564 rilasciata nel 1993, che costituisce l'ultima release ufficiale
565 dell'università di Berkeley. Si tenga presente che molte di queste interfacce
566 sono presenti in derivati commerciali di BSD come SunOS. Il kernel Linux e la
567 \acr{glibc} forniscono tutte queste estensioni che sono state in gran parte
568 incorporate negli standard successivi.
569
570
571 \subsection{Gli standard IEEE -- POSIX}
572 \label{sec:intro_posix}
573
574 Lo standard ufficiale creato da un organismo indipendente più attinente alle
575 interfacce di un sistema unix-like nel suo complesso (e che concerne sia il
576 kernel che le librerie che i comandi) è stato lo standard POSIX. Esso prende
577 origine dallo standard ANSI C, che contiene come sottoinsieme, prevedendo
578 ulteriori capacità per le funzioni in esso definite, ed aggiungendone di
579 nuove.
580
581 In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
582 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
583 X finale denuncia la sua stretta relazione con i sistemi Unix. Esso nasce dal
584 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
585 che ne produsse una prima versione, nota come \textsl{IEEE 1003.1-1988},
586 mirante a standardizzare l'interfaccia con il sistema operativo.
587
588 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
589 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
590 i comandi di sistema (1003.2), per le estensioni \textit{real-time} e per i
591 \itindex{thread} \textit{thread} (rispettivamente 1003.1d e 1003.1c) per i
592 socket (1003.1g) e vari altri.  In tab.~\ref{tab:intro_posix_std} è riportata
593 una classificazione sommaria dei principali documenti prodotti, e di come sono
594 identificati fra IEEE ed ISO; si tenga conto inoltre che molto spesso si usa
595 l'estensione IEEE anche come aggiunta al nome POSIX; ad esempio è più comune
596 parlare di POSIX.4 come di POSIX.1b.
597
598 Si tenga presente inoltre che nuove specifiche e proposte di standardizzazione
599 si aggiungono continuamente, mentre le versioni precedenti vengono riviste;
600 talvolta poi i riferimenti cambiano nome, per cui anche solo seguire le
601 denominazioni usate diventa particolarmente faticoso; una pagina dove si
602 possono recuperare varie (e di norma piuttosto intricate) informazioni è
603 \href{http://www.pasc.org/standing/sd11.html}
604 {\textsf{http://www.pasc.org/standing/sd11.html}}.
605
606 \begin{table}[htb]
607   \footnotesize
608   \centering
609   \begin{tabular}[c]{|l|l|l|l|}
610     \hline
611     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
612     \hline
613     \hline
614     POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
615     POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
616     POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
617     POSIX.3 & 2003   &TR13210& Metodi di test                               \\
618     POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
619     POSIX.4a& 1003.1c &  --- & \itindex{thread} Thread                      \\
620     POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
621     POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
622     POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
623     POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
624     POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77                \\
625     POSIX.12& 1003.1g& 9945-1& Socket                                       \\
626     \hline
627   \end{tabular}
628   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
629   \label{tab:intro_posix_std}
630 \end{table}
631
632 Benché l'insieme degli standard POSIX siano basati sui sistemi Unix, essi
633 definiscono comunque un'interfaccia di programmazione generica e non fanno
634 riferimento ad una implementazione specifica (ad esempio esiste
635 un'implementazione di POSIX.1 anche sotto Windows NT).  
636
637 Linux e la \acr{glibc} implementano tutte le funzioni definite nello standard
638 POSIX.1, queste ultime forniscono in più alcune ulteriori capacità (per
639 funzioni di \textit{pattern matching} e per la manipolazione delle
640 \textit{regular expression}), che vengono usate dalla shell e dai comandi di
641 sistema e che sono definite nello standard POSIX.2.
642
643 Nelle versioni più recenti del kernel e delle librerie sono inoltre supportate
644 ulteriori funzionalità aggiunte dallo standard POSIX.1c per quanto riguarda i
645 \itindex{thread} \textit{thread} (vedi cap.~\ref{cha:threads}), e dallo
646 standard POSIX.1b per quanto riguarda i segnali e lo \itindex{scheduler}
647 scheduling real-time (sez.~\ref{sec:sig_real_time} e
648 sez.~\ref{sec:proc_real_time}), la misura del tempo, i meccanismi di
649 intercomunicazione (sez.~\ref{sec:ipc_posix}) e l'I/O asincrono
650 (sez.~\ref{sec:file_asyncronous_io}).
651
652 Lo standard principale resta comunque POSIX.1, che continua ad evolversi; la
653 versione più nota, cui gran parte delle implementazioni fanno riferimento, e
654 che costituisce una base per molti altri tentativi di standardizzazione, è
655 stata rilasciata anche come standard internazionale con la sigla
656 \textsl{ISO/IEC 9945-1:1996} ed include i precedenti POSIX.1b e POSIX.1c. In
657 genere si fa riferimento ad essa come POSIX.1-1996.
658
659 Nel 2001 è stata poi eseguita una sintesi degli standard POSIX.1, POSIX.2 e
660 SUSv3 (vedi sez.~\ref{sec:intro_xopen}) in un unico documento, redatto sotto
661 gli auspici del cosiddetto gruppo Austin che va sotto il nome di POSIX.1-2001.
662 Questo standard definisce due livelli di conformità, quello POSIX, in cui sono
663 presenti solo le interfacce di base, e quello XSI che richiede la presenza di
664 una serie di estensioni opzionali per lo standard POSIX, riprese da SUSv3.
665 Inoltre lo standard è stato allineato allo standard C99, e segue lo stesso
666 nella definizione delle interfacce.
667
668 A questo standard sono stati aggiunti due documenti di correzione e
669 perfezionamento denominati \textit{Technical Corrigenda}, il TC1 del 2003 ed
670 il TC2 del 2004, e talvolta si fa riferimento agli stessi con le sigle
671 POSIX.1-2003 e POSIX.1-2004. 
672
673 Una ulteriore revisione degli standard POSIX e SUS è stata completata e
674 ratificata nel 2008, cosa che ha portato al rilascio di una nuova versione
675 sotto il nome di POSIX.1-2008 (e SUSv4), con l'incorporazione di alcune nuove
676 interfacce, la obsolescenza di altre, la trasformazione da opzionali a
677 richieste di alcune specifiche di base, oltre alle solite precisazioni ed
678 aggiornamenti. Anche in questo caso è prevista la suddivisione in una
679 conformità di base, e delle interfacce aggiuntive.
680
681 Le procedure di aggiornamento dello standard POSIX prevedono comunque un
682 percorso continuo, che prevede la possibilità di introduzione di nuove
683 interfacce e la definizione di precisazioni ed aggiornamenti, per questo in
684 futuro verranno rilasciate nuove versioni. Alla stesura di queste note
685 l'ultima revisione approvata resta POSIX.1-2008, uno stato della situazione
686 corrente del supporto degli standard è allegato alla documentazione della
687 \acr{glibc} e si può ottenere con il comando \texttt{man standards}.
688
689
690 \subsection{Gli standard X/Open -- Opengroup -- Unix}
691 \label{sec:intro_xopen}
692
693 Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
694 Unix per giungere ad un'armonizzazione delle varie implementazioni.  Per far
695 questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
696 nome di \textit{X/Open Portability Guide} a cui di norma si fa riferimento con
697 l'abbreviazione XPG$n$, con $n$ che indica la versione.
698
699 Nel 1989 il consorzio produsse una terza versione di questa guida
700 particolarmente voluminosa (la \textit{X/Open Portability Guide, Issue 3}),
701 contenente una dettagliata standardizzazione dell'interfaccia di sistema di
702 Unix, che venne presa come riferimento da vari produttori. Questo standard,
703 detto anche XPG3 dal nome della suddetta guida, è sempre basato sullo standard
704 POSIX.1, ma prevede una serie di funzionalità aggiuntive fra cui le specifiche
705 delle API\footnote{le \textit{Application Programmable Interface}, in sostanze
706   le interfacce di programmazione.} per l'interfaccia grafica (X11).
707
708 Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
709 Issue 4, da cui la sigla XPG4, che aggiungeva l'interfaccia XTI (\textit{X
710   Transport Interface}) mirante a soppiantare (senza molto successo)
711 l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
712 rilasciata nel 1994; questa è nota con il nome di Spec 1170 (dal numero delle
713 interfacce, intestazioni e comandi definiti) ma si fa riferimento ad essa
714 anche come XPG4v2.
715
716 Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
717 aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
718 specifiche sotto il nome di \textit{Single UNIX Specification} o SUS, l'ultima
719 versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
720   Specification}, detta SUS o SUSv1, ma più comunemente nota anche come
721 \textit{Unix 95}.
722
723 Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
724 da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
725 alla costituzione dell'\textit{Open Group}, un consorzio internazionale che
726 raccoglie produttori, utenti industriali, entità accademiche e governative.
727 Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
728 il lavoro di standardizzazione delle varie implementazioni, rilasciando
729 periodicamente nuove specifiche e strumenti per la verifica della conformità
730 alle stesse.
731
732 Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
733   Specification}, nota con la sigla SUSv2, in questa versione le interfacce
734 specificate salgono a 1434, e addirittura a 3030 se si considerano le stazioni
735 di lavoro grafiche, per le quali sono inserite pure le interfacce usate da CDE
736 che richiede sia X11 che Motif. La conformità a questa versione permette l'uso
737 del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard. Un
738 altro nome alternativo di queste specifiche, date le origini, è XPG5.
739
740 Come accennato nel 2001, con il rilascio dello standard POSIX.1-2001, è stato
741 effettuato uno sforzo di sintesi in cui sono state comprese, nella parte di
742 interfacce estese, anche le interfacce definite nelle \textit{Single UNIX
743   Specification}, pertanto si può fare riferimento a detto standard, quando
744 comprensivo del rispetto delle estensioni XSI, come SUSv3, e fregiarsi del
745 marchio UNIX 03 se conformi ad esso. 
746
747 Infine, come avvenuto per POSIX.1-2001, anche con la successiva revisione
748 dello standard POSIX.1 (la POSIX.1-2008) è stato stabilito che la conformità
749 completa a tutte quelle che sono le nuove estensioni XSI previste
750 dall'aggiornamento vada a definire la quarta versione delle \textit{Single
751   UNIX Specification}, chiamata appunto SUSv4.
752
753
754 \subsection{Il controllo di aderenza agli standard}
755 \label{sec:intro_gcc_glibc_std}
756
757 In Linux, se si usa la \acr{glibc}, la conformità agli standard appena
758 descritti può essere richiesta sia attraverso l'uso di opportune opzioni del
759 compilatore (il \texttt{gcc}) che definendo delle specifiche costanti prima
760 dell'inclusione dei file di intestazione (gli \textit{header file}, vedi
761 sez.~\ref{sec:proc_syscall}) che definiscono le funzioni di libreria.
762
763 Ad esempio se si vuole che i programmi seguano una stretta attinenza allo
764 standard ANSI C si può usare l'opzione \texttt{-ansi} del compilatore, e non
765 potrà essere utilizzata nessuna funzione non riconosciuta dalle specifiche
766 standard ISO per il C.  Il \texttt{gcc} possiede inoltre una specifica opzione
767 per richiedere la conformità ad uno standard, nella forma \texttt{-std=nome},
768 dove \texttt{nome} può essere \texttt{c89} per indicare lo standard ANSI C
769 (vedi sez.~\ref{sec:intro_ansiC}) o \texttt{c99} per indicare la conformità
770 allo standard C99.\footnote{che non è al momento completa, esistono anche le
771   possibilità di usare i valori \texttt{gnu89}, l'attuale default, che indica
772   l'uso delle estensioni GNU al C89, riprese poi dal C99, o \texttt{gnu89} che
773   indica il dialetto GNU del C99, che diventerà il default quando la
774   conformità a quest'ultimo sarà completa.}
775
776 Per attivare le varie opzioni di controllo di aderenza agli standard è poi
777 possibile definire delle macro di preprocessore che controllano le
778 funzionalità che la \acr{glibc} può mettere a disposizione:\footnote{le macro
779   sono definite nel file di dichiarazione \file{<features.h>}, ma non è
780   necessario includerlo nei propri programmi in quanto viene automaticamente
781   incluso da tutti gli altri file di dichiarazione che utilizzano le macro in
782   esso definite; si tenga conto inoltre che il file definisce anche delle
783   ulteriori macro interne, in genere con un doppio prefisso di \texttt{\_},
784   che non devono assolutamente mai essere usate direttamente. } questo può
785 essere fatto attraverso l'opzione \texttt{-D} del compilatore, ma è buona
786 norma farlo inserendo gli opportuni \code{\#define} prima della inclusione dei
787 propri \textit{header file} (vedi sez.~\ref{sec:proc_syscall}).
788
789 Le macro disponibili per controllare l'aderenza ai vari standard messi a
790 disposizione della \acr{glibc}, che rendono disponibili soltanto le funzioni
791 in essi definite, sono illustrate nel seguente elenco:
792 \begin{basedescript}{\desclabelwidth{2.7cm}\desclabelstyle{\nextlinelabel}}
793 \item[\macro{\_\_STRICT\_ANSI\_\_}] richiede l'aderenza stretta allo standard
794   C ISO; viene automaticamente predefinita qualora si invochi il \texttt{gcc}
795   con le opzione \texttt{-ansi} o \texttt{-std=c99}.
796
797 \item[\macro{\_POSIX\_SOURCE}] definendo questa macro (considerata obsoleta)
798   si rendono disponibili tutte le funzionalità dello standard POSIX.1 (la
799   versione IEEE Standard 1003.1) insieme a tutte le funzionalità dello
800   standard ISO C. Se viene anche definita con un intero positivo la macro
801   \macro{\_POSIX\_C\_SOURCE} lo stato di questa non viene preso in
802   considerazione.
803
804 \item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
805   positivo si controlla quale livello delle funzionalità specificate da POSIX
806   viene messa a disposizione; più alto è il valore maggiori sono le
807   funzionalità:
808   \begin{itemize}
809   \item un valore uguale a ``\texttt{1}'' rende disponibili le funzionalità
810     specificate nella edizione del 1990 (IEEE Standard 1003.1-1990);
811   \item valori maggiori o uguali a ``\texttt{2}'' rendono disponibili le
812     funzionalità previste dallo standard POSIX.2 specificate nell'edizione del
813     1992 (IEEE Standard 1003.2-1992),
814   \item un valore maggiore o uguale a ``\texttt{199309L}'' rende disponibili
815     le funzionalità previste dallo standard POSIX.1b specificate nell'edizione
816     del 1993 (IEEE Standard 1003.1b-1993);
817   \item un valore maggiore o uguale a ``\texttt{199506L}'' rende disponibili
818     le funzionalità previste dallo standard POSIX.1 specificate nell'edizione
819     del 1996 (\textit{ISO/IEC 9945-1:1996}), ed in particolare le definizioni
820     dello standard POSIX.1c per i \itindex{thread} \textit{thread};
821   \item a partire dalla versione 2.3.3 della \acr{glibc} un valore maggiore o
822     uguale a ``\texttt{200112L}'' rende disponibili le funzionalità di base
823     previste dallo standard POSIX.1-2001, escludendo le estensioni XSI;
824   \item a partire dalla versione 2.10 della \acr{glibc} un valore maggiore o
825     uguale a ``\texttt{200809L}'' rende disponibili le funzionalità di base
826     previste dallo standard POSIX.1-2008, escludendo le estensioni XSI;
827   \item in futuro valori superiori potranno abilitare ulteriori estensioni.
828   \end{itemize}
829
830 \item[\macro{\_BSD\_SOURCE}] definendo questa macro si rendono disponibili le
831   funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
832   ISO C, POSIX.1 e POSIX.2; alcune delle funzionalità previste da BSD sono
833   però in conflitto con le corrispondenti definite nello standard POSIX.1, in
834   questo caso se la macro è definita le definizioni previste da BSD4.3 avranno
835   la precedenza rispetto a POSIX.
836
837   A causa della natura dei conflitti con POSIX per ottenere una piena
838   compatibilità con BSD4.3 può essere necessario anche usare una libreria di
839   compatibilità, dato che alcune funzioni sono definite in modo diverso. In
840   questo caso occorrerà anche usare l'opzione \cmd{-lbsd-compat} con il
841   compilatore per indicargli di utilizzare le versioni nella libreria di
842   compatibilità prima di quelle normali.
843
844   Si tenga inoltre presente che la preferenza verso le versioni delle funzioni
845   usate da BSD viene mantenuta soltanto se nessuna delle ulteriori macro di
846   specificazione di standard successivi (vale a dire una fra
847   \macro{\_POSIX\_C\_SOURCE}, \macro{\_POSIX\_SOURCE}, \macro{\_SVID\_SOURCE},
848   \macro{\_XOPEN\_SOURCE}, \macro{\_XOPEN\_SOURCE\_EXTENDED} o
849   \macro{\_GNU\_SOURCE}) è stata a sua volta attivata, nel qual caso queste
850   hanno la precedenza. Se però si definisce \macro{\_BSD\_SOURCE} dopo aver
851   definito una di queste macro, l'effetto sarà quello di dare la precedenza
852   alle funzioni in forma BSD.
853
854 \item[\macro{\_SVID\_SOURCE}] definendo questa macro si rendono disponibili le
855   funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
856   standard ISO C, POSIX.1, POSIX.2, e X/Open (XPG$n$) illustrati in
857   precedenza.
858
859 \item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si rendono disponibili
860   le funzionalità descritte nella \textit{X/Open Portability Guide}. Anche
861   queste sono un sovrainsieme di quelle definite negli standard POSIX.1 e
862   POSIX.2 ed in effetti sia \macro{\_POSIX\_SOURCE} che
863   \macro{\_POSIX\_C\_SOURCE} vengono automaticamente definite. Sono incluse
864   anche ulteriori funzionalità disponibili in BSD e SVID, più una serie di
865   estensioni a secondo dei seguenti valori:
866   \begin{itemize}
867   \item la definizione della macro ad un valore qualunque attiva le
868     funzionalità specificate negli standard POSIX.1, POSIX.2 e XPG4;
869   \item un valore di ``\texttt{500}'' o superiore rende disponibili anche le
870     funzionalità introdotte con SUSv2, vale a dire la conformità ad Unix98;
871   \item a partire dalla versione 2.2 della \acr{glibc} un valore uguale a
872     ``\texttt{600}'' o superiore rende disponibili anche le funzionalità
873     introdotte con SUSv3, corrispondenti allo standard POSIX.1-2001 più le
874     estensioni XSI.
875   \item a partire dalla versione 2.10 della \acr{glibc} un valore uguale a
876     ``\texttt{700}'' o superiore rende disponibili anche le funzionalità
877     introdotte con SUSv4, corrispondenti allo standard POSIX.1-2008 più le
878     estensioni XSI.
879   \end{itemize}
880
881 \item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] definendo questa macro si rendono
882   disponibili le ulteriori funzionalità necessarie ad essere conformi al
883   rilascio del marchio \textit{X/Open Unix} corrispondenti allo standard
884   Unix95, vale a dire quelle specificate da SUSv1/XPG4v2. Questa macro viene
885   definita implicitamente tutte le volte che si imposta
886   \macro{\_XOPEN\_SOURCE} ad un valore maggiore o uguale a 500.
887
888 \item[\macro{\_ISOC99\_SOURCE}] definendo questa macro si rendono disponibili
889   le funzionalità previste per la revisione delle librerie standard del C
890   introdotte con lo standard ISO C99. La macro è definita a partire dalla
891   versione 2.1.3 della \acr{glibc}. 
892
893   Le versioni precedenti la serie 2.1.x riconoscevano le stesse estensioni con
894   la macro \macro{\_ISOC9X\_SOURCE}, dato che lo standard non era stato
895   finalizzato, ma la \acr{glibc} aveva già un'implementazione completa che
896   poteva essere attivata definendo questa macro. Benché questa sia obsoleta
897   viene tuttora riconosciuta come equivalente di \macro{\_ISOC99\_SOURCE} per
898   compatibilità.
899
900 \item[\macro{\_GNU\_SOURCE}] definendo questa macro si rendono disponibili
901   tutte le funzionalità disponibili nei vari standard oltre a varie estensioni
902   specifiche presenti solo nella \acr{glibc} ed in Linux. Gli standard coperti
903   sono: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID, X/Open, SUS.
904
905   L'uso di \macro{\_GNU\_SOURCE} è equivalente alla definizione contemporanea
906   delle macro: \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
907   \macro{\_POSIX\_SOURCE}, \macro{\_ISOC99\_SOURCE}, e inoltre di
908   \macro{\_POSIX\_C\_SOURCE} con valore ``\texttt{200112L}'' (o
909   ``\texttt{199506L}'' per le versioni della \acr{glibc} precedenti la 2.5),
910   \macro{\_XOPEN\_SOURCE\_EXTENDED} e \macro{\_XOPEN\_SOURCE} con valore 600
911   (o 500 per le versioni della \acr{glibc} precedenti la 2.2); oltre a queste
912   vengono pure attivate le ulteriori due macro \macro{\_ATFILE\_SOURCE} e
913   \macro{\_LARGEFILE64\_SOURCE} che definiscono funzioni previste
914   esclusivamente dalla \acr{glibc}.
915  
916 \end{basedescript}
917
918 Benché Linux supporti in maniera estensiva gli standard più diffusi, esistono
919 comunque delle estensioni e funzionalità specifiche, non presenti in altri
920 standard e lo stesso vale per la \acr{glibc}, che definisce anche delle
921 ulteriori funzioni di libreria. Ovviamente l'uso di queste funzionalità deve
922 essere evitato se si ha a cuore la portabilità, ma qualora questo non sia un
923 requisito esse possono rivelarsi molto utili.
924
925 Come per l'aderenza ai vari standard, le funzionalità aggiuntive possono
926 essere rese esplicitamente disponibili tramite la definizione di opportune
927 macro di preprocessore, alcune di queste vengono attivate con la definizione
928 di \macro{\_GNU\_SOURCE}, mentre altre devono essere attivate esplicitamente,
929 inoltre alcune estensioni possono essere attivate indipendentemente tramite
930 una opportuna macro; queste estensioni sono illustrate nel seguente elenco:
931
932 \begin{basedescript}{\desclabelwidth{2.7cm}\desclabelstyle{\nextlinelabel}}
933
934 \item[\macro{\_LARGEFILE\_SOURCE}] definendo questa macro si rendono
935   disponibili alcune funzioni che consentono di superare una inconsistenza
936   presente negli standard con i file di grandi dimensioni, ed in particolare
937   definire le due funzioni \func{fseeko} e \func{ftello} che al contrario
938   delle corrispettive \func{fseek} e \func{ftell} usano il tipo di dato
939   specifico \ctyp{off\_t} (vedi sez.~\ref{sec:file_fseek}).
940
941 \item[\macro{\_LARGEFILE64\_SOURCE}] definendo questa macro si rendono
942   disponibili le funzioni di una interfaccia alternativa al supporto di valori
943   a 64 bit nelle funzioni di gestione dei file (non supportati in certi
944   sistemi), caratterizzate dal suffisso \texttt{64} aggiunto ai vari nomi di
945   tipi di dato e funzioni (come \ctyp{off64\_t} al posto di \ctyp{off\_t} o
946   \func{lseek64} al posto di \func{lseek}).
947
948   Le funzioni di questa interfaccia alternativa sono state proposte come una
949   estensione ad uso di transizione per le \textit{Single UNIX Specification},
950   per consentire la gestione di file di grandi dimensioni anche nei sistemi a
951   32 bit, in cui la dimensione massima, espressa con un intero, non poteva
952   superare i 2Gb.  Nei nuovi programmi queste funzioni devono essere evitate,
953   a favore dell'uso macro \macro{\_FILE\_OFFSET\_BITS}, che definita al valore
954   di \texttt{64} consente di usare in maniera trasparente le funzioni
955   dell'interfaccia classica.
956
957 \item[\macro{\_FILE\_OFFSET\_BITS}] la definizione di questa macro al valore
958   di \texttt{64} consente di attivare la conversione automatica di tutti i
959   riferimenti a dati e funzioni a 32 bit nelle funzioni di interfaccia ai file
960   con le equivalenti a 64 bit, senza dover utilizzare esplicitamente
961   l'interfaccia alternativa appena illustrata. In questo modo diventa
962   possibile usare le ordinarie funzioni per effettuare operazioni a 64 bit sui
963   file anche su sistemi a 32 bit.\footnote{basterà ricompilare il programma
964     dopo averla definita, e saranno usate in modo trasparente le funzioni a 64
965     bit.}
966
967   Se la macro non è definita o è definita con valore \texttt{32} questo
968   comportamento viene disabilitato, e sui sistemi a 32 bit verranno usate le
969   ordinarie funzioni a 32 bit, non avendo più il supporto per file di grandi
970   dimensioni. Su sistemi a 64 bit invece, dove il problema non sussiste, la
971   macro non ha nessun effetto.
972
973 \item[\macro{\_ATFILE\_SOURCE}] definendo questa macro si rendono disponibili
974   le estensioni delle funzioni di creazione, accesso e modifica di file e
975   directory che risolvono i problemi di sicurezza insiti nell'uso di pathname
976   relativi con programmi \itindex{thread} \textit{multi-thread} illustrate in
977   sez.~\ref{sec:file_openat}.
978
979 \item[\macro{\_REENTRANT}] definendo questa macro, o la equivalente
980   \macro{\_THREAD\_SAFE} (fornita per compatibilità) si rendono disponibili le
981   versioni \index{funzioni!rientranti} rientranti (vedi
982   sez.~\ref{sec:proc_reentrant}) di alcune funzioni, necessarie quando si
983   usano i \itindex{thread} \textit{thread}.  Alcune di queste funzioni sono
984   anche previste nello standard POSIX.1c, ma ve ne sono altre che sono
985   disponibili soltanto su alcuni sistemi, o specifiche della \acr{glibc}, e
986   possono essere utilizzate una volta definita la macro.
987
988 \item[\macro{\_FORTIFY\_SOURCE}] definendo questa macro viene abilitata
989   l'inserimento di alcuni controlli per alcune funzioni di allocazione e
990   manipolazione di memoria e stringhe che consentono di rilevare
991   automaticamente alcuni errori di \textit{buffer overflow} nell'uso delle
992   stesse. La funzionalità è stata introdotta a partire dalla versione 2.3.4
993   della \acr{glibc} e richiede anche il supporto da parte del compilatore, che
994   è disponibile solo a partire dalla versione 4.0 del \texttt{gcc}.
995
996   Le funzioni di libreria che vengono messe sotto controllo quando questa
997   funzionalità viene attivata sono, al momento della stesura di queste note,
998   le seguenti: \func{memcpy}, \func{mempcpy}, \func{memmove}, \func{memset},
999   \func{stpcpy}, \func{strcpy}, \func{strncpy}, \func{strcat}, \func{strncat},
1000   \func{sprintf}, \func{snprintf}, \func{vsprintf}, \func{vsnprintf}, e
1001   \func{gets}.
1002
1003   La macro prevede due valori, con \texttt{1} vengono eseguiti dei controlli
1004   di base che non cambiano il comportamento dei programmi se si richiede una
1005   ottimizzazione di livello uno o superiore,\footnote{vale a dire se si usa
1006     l'opzione \texttt{-O1} o superiore del \texttt{gcc}.}  mentre con il
1007   valore \texttt{2} vengono aggiunti maggiori controlli. Dato che alcuni dei
1008   controlli vengono effettuati in fase di compilazione l'uso di questa macro
1009   richiede anche la collaborazione del compilatore, disponibile dalla
1010   versione 4.0 del \texttt{gcc}.
1011
1012 \end{basedescript}
1013
1014 Se non è stata specificata esplicitamente nessuna di queste macro il default
1015 assunto è che siano definite \macro{\_BSD\_SOURCE}, \macro{\_SVID\_SOURCE},
1016 \macro{\_POSIX\_SOURCE} e, con le versioni della \acr{glibc} più recenti, che
1017 la macro \macro{\_POSIX\_C\_SOURCE} abbia il valore ``\texttt{200809L}'', per
1018 versioni precedenti della \acr{glibc} il valore assegnato a
1019 \macro{\_POSIX\_C\_SOURCE} era di ``\texttt{200112L}'' prima delle 2.10, di
1020 ``\texttt{199506L}'' prima delle 2.4, di ``\texttt{199506L}'' prima delle
1021 2.1. Si ricordi infine che perché queste macro abbiano effetto devono essere
1022 sempre definite prima dell'inclusione dei file di dichiarazione.
1023
1024
1025 % vedi anche man feature_test_macros
1026
1027 % LocalWords:  like kernel multitasking scheduler preemptive sez swap is cap VM
1028 % LocalWords:  everything bootstrap init shell Windows Foundation system call
1029 % LocalWords:  fig libc uClib glibc embedded Library POSIX username PAM Methods
1030 % LocalWords:  Pluggable Autentication group supplementary Name Service Switch
1031 % LocalWords:  LDAP identifier uid gid superuser root if BSD SVr dall' American
1032 % LocalWords:  National Institute International Organisation IEC header tab gcc
1033 % LocalWords:  assert ctype dirent errno fcntl limits malloc setjmp signal utmp
1034 % LocalWords:  stdarg stdio stdlib string times unistd library int short caddr
1035 % LocalWords:  address clock dev ino inode key IPC loff nlink off pid rlim size
1036 % LocalWords:  sigset ssize ptrdiff sys IEEE Richard Portable of TR
1037 % LocalWords:  Operating Interface dell'IEEE Electrical and Electronics thread
1038 % LocalWords:  Engeneers Socket NT matching regular expression scheduling l'I
1039 % LocalWords:  XPG Portability Issue Application Programmable XTI Transport AT
1040 % LocalWords:  socket Spec Novell Specification SUSv CDE Motif Berkley select
1041 % LocalWords:  SunOS l'AT Sun HP Xenix Description SVID Laboratories MP hsearch
1042 % LocalWords:  drand fmtmsg define SOURCE lbsd compat XOPEN version ISOC Large
1043 % LocalWords:  LARGEFILE Support LFS dell' black rectangle node fill cpu draw
1044 % LocalWords:  ellipse mem anchor west proc SysV SV Definition SCO Austin XSI
1045 % LocalWords:  Technical TC SUS Opengroup features STRICT std ATFILE fseeko
1046 % LocalWords:  ftello fseek ftell lseek FORTIFY REENTRANT SAFE overflow memcpy
1047 % LocalWords:  mempcpy memmove memset stpcpy strcpy strncpy strcat strncat gets
1048 % LocalWords:  sprintf snprintf vsprintf vsnprintf syscall number calendar BITS
1049 % LocalWords:  pathname Google Android standards
1050
1051 %%% Local Variables: 
1052 %%% mode: latex
1053 %%% TeX-master: "gapil"
1054 %%% End: