intro.tex

   1 %% intro.tex
   2 %%
   3 %% Copyright (C) 2000-2003 Simone Piccardi.  Permission is granted to
   4 %% copy, distribute and/or modify this document under the terms of the GNU Free
   5 %% Documentation License, Version 1.1 or any later version published by the
   6 %% Free Software Foundation; with the Invariant Sections being "Prefazione",
   7 %% with no Front-Cover Texts, and with no Back-Cover Texts.  A copy of the
   8 %% license is included in the section entitled "GNU Free Documentation
   9 %% License".
  10 %%
  11 \chapter{L'architettura del sistema}
  12 \label{cha:intro_unix}
  13
  14 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
  15 cui è basato un sistema operativo di tipo Unix come GNU/Linux, in questo modo
  16 potremo fornire una base di comprensione mirata a sottolineare le peculiarità
  17 del sistema che sono più rilevanti per quello che riguarda la programmazione.
  18
  19 Dopo un'introduzione sulle caratteristiche principali di un sistema di tipo
  20 Unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
  21 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
  22 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
  23
  24
  25 \section{Una panoramica}
  26 \label{sec:intro_unix_struct}
  27
  28 In questa prima sezione faremo una breve panoramica sull'architettura del
  29 sistema.  Chi avesse già una conoscenza di questa materia può tranquillamente
  30 saltare questa sezione.
  31
  32
  33 \subsection{Concetti base}
  34 \label{sec:intro_base_concept}
  35
  36 Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
  37 cosiddetto \textit{kernel}, nel nostro caso Linux) a cui si demanda la
  38 gestione delle risorse essenziali (la CPU, la memoria, le periferiche) mentre
  39 tutto il resto, quindi anche la parte che prevede l'interazione con l'utente,
  40 deve venire realizzato tramite programmi eseguiti dal kernel e che accedano
  41 alle risorse hardware tramite delle richieste a quest'ultimo.
  42
  43 Fin dall'inizio uno Unix si presenta come un sistema operativo
  44 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
  45 programmi, e multiutente, in cui è possibile che più utenti siano connessi ad
  46 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
  47 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
  48 a rotazione).
  49
  50 % Questa e` una distinzione essenziale da capire,
  51 %specie nei confronti dei sistemi operativi successivi, nati per i personal
  52 %computer (e quindi per un uso personale), sui quali l'hardware (allora
  53 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
  54
  55 I kernel Unix più recenti, come Linux, sono realizzati sfruttando alcune
  56 caratteristiche dei processori moderni come la gestione hardware della memoria
  57 e la modalità protetta. In sostanza con i processori moderni si può
  58 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
  59 zone di memoria fisica.  Quello che succede è che il kernel è il solo
  60 programma ad essere eseguito in modalità privilegiata, con il completo accesso
  61 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
  62 (e non possono accedere direttamente alle zone di memoria riservate o alle
  63 porte di input/output).
  64
  65 Una parte del kernel, lo \textit{scheduler}\index{scheduler}, si occupa di
  66 stabilire, ad intervalli fissi e sulla base di un opportuno calcolo delle
  67 priorità, quale ``\textsl{processo}'' deve essere posto in esecuzione (il
  68 cosiddetto \textit{preemptive scheduling}\index{preemptive scheduling}).
  69 Questo verrà comunque eseguito in modalità protetta; quando necessario il
  70 processo potrà accedere alle risorse hardware soltanto attraverso delle
  71 opportune chiamate al sistema che restituiranno il controllo al kernel.
  72
  73 La memoria viene sempre gestita dal kernel attraverso il meccanismo della
  74 \textsl{memoria virtuale}\index{memoria virtuale}, che consente di assegnare a
  75 ciascun processo uno spazio di indirizzi ``\textsl{virtuale}'' (vedi
  76 \secref{sec:proc_memory}) che il kernel stesso, con l'ausilio della unità di
  77 gestione della memoria, si incaricherà di rimappare automaticamente sulla
  78 memoria disponibile, salvando su disco quando necessario (nella cosiddetta
  79 area di \textit{swap}) le pagine di memoria in eccedenza.
  80
  81 Le periferiche infine vengono viste in genere attraverso un'interfaccia
  82 astratta che permette di trattarle come fossero file, secondo il concetto per
  83 cui \textit{everything is a file}, su cui torneremo in dettaglio in
  84 \capref{cha:file_intro}, (questo non è vero per le interfacce di rete, che
  85 hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
  86 il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
  87
  88
  89 \subsection{User space e kernel space}
  90 \label{sec:intro_user_kernel_space}
  91
  92 Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi Unix è
  93 quello della distinzione fra il cosiddetto \textit{user space}, che
  94 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
  95 \textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
  96 programma vede sé stesso come se avesse la piena disponibilità della CPU e
  97 della memoria ed è, salvo i meccanismi di comunicazione previsti
  98 dall'architettura, completamente ignaro del fatto che altri programmi possono
  99 essere messi in esecuzione dal kernel.
 100
 101 Per questa separazione non è possibile ad un singolo programma disturbare
 102 l'azione di un altro programma o del sistema e questo è il principale motivo
 103 della stabilità di un sistema unix-like nei confronti di altri sistemi in cui
 104 i processi non hanno di questi limiti, o che vengono per vari motivi eseguiti
 105 al livello del kernel.
 106
 107 Pertanto deve essere chiaro a chi programma in Unix che l'accesso diretto
 108 all'hardware non può avvenire se non all'interno del kernel; al di fuori dal
 109 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
 110 fornisce allo user space.
 111
 112
 113 \subsection{Il kernel e il sistema}
 114 \label{sec:intro_kern_and_sys}
 115
 116 Per capire meglio la distinzione fra kernel space e user space si può prendere
 117 in esame la procedura di avvio di un sistema unix-like; all'avvio il BIOS (o
 118 in generale il software di avvio posto nelle EPROM) eseguirà la procedura di
 119 avvio del sistema (il cosiddetto \textit{boot}), incaricandosi di caricare il
 120 kernel in memoria e di farne partire l'esecuzione; quest'ultimo, dopo aver
 121 inizializzato le periferiche, farà partire il primo processo, \cmd{init}, che
 122 è quello che a sua volta farà partire tutti i processi successivi. Fra questi
 123 ci sarà pure quello che si occupa di dialogare con la tastiera e lo schermo
 124 della console, e quello che mette a disposizione dell'utente che si vuole
 125 collegare, un terminale e la \textit{shell} da cui inviare i comandi.
 126
 127 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
 128 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
 129 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
 130 qualunque programma di scrittura o di disegno, in user space.
 131
 132 Questo significa, ad esempio, che il sistema di per sé non dispone di
 133 primitive per tutta una serie di operazioni (come la copia di un file) che
 134 altri sistemi (come Windows) hanno invece al loro interno. Pertanto buona
 135 parte delle operazioni di normale amministrazione di un sistema, come quella
 136 in esempio, sono implementate come normali programmi.
 137
 138 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
 139 %realizzare un sistema di permessi e controlli che evitano che i programmi
 140 %eseguano accessi non autorizzati.
 141
 142 Per questo motivo quando ci si riferisce al sistema nella sua interezza è
 143 corretto parlare di un sistema GNU/Linux: da solo il kernel è assolutamente
 144 inutile; quello che costruisce un sistema operativo utilizzabile è la presenza
 145 di tutta una serie di librerie e programmi di utilità (che di norma sono
 146 quelli realizzati dal progetto GNU della Free Software Foundation) che
 147 permettono di eseguire le normali operazioni che ci si aspetta da un sistema
 148 operativo.
 149
 150
 151 \subsection{Chiamate al sistema e librerie di funzioni}
 152 \label{sec:intro_syscall}
 153
 154 Come accennato le interfacce con cui i programmi possono accedere all'hardware
 155 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
 156   call}), si tratta di un insieme di funzioni che un programma può chiamare,
 157 per le quali viene generata un'interruzione del processo passando il controllo
 158 dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
 159 di operazioni interne come la gestione del multitasking e l'allocazione della
 160 memoria) eseguirà la funzione richiesta in \textit{kernel space} restituendo i
 161 risultati al chiamante.
 162
 163 Ogni versione di Unix ha storicamente sempre avuto un certo numero di queste
 164 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale di
 165   programmazione di Unix} (quella cui si accede con il comando \cmd{man 2
 166   <nome>}) e Linux non fa eccezione. Queste sono poi state codificate da vari
 167 standard, che esamineremo brevemente in \secref{sec:intro_standard}. Uno
 168 schema elementare della struttura del sistema è riportato in
 169 \figref{fig:intro_sys_struct}.
 170
 171 \begin{figure}[htb]
 172   \centering
 173   \includegraphics[width=10cm]{img/struct_sys}
 174   \caption{Schema di massima della struttura di interazione fra processi,
 175     kernel e dispositivi in Linux.}
 176   \label{fig:intro_sys_struct}
 177 \end{figure}
 178
 179 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
 180 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
 181 C, che, oltre alle interfacce alle system call, contiene anche tutta la serie
 182 delle ulteriori funzioni definite dai vari standard, che sono comunemente
 183 usate nella programmazione.
 184
 185 Questo è importante da capire perché programmare in Linux significa anzitutto
 186 essere in grado di usare le varie interfacce contenute nella Libreria Standard
 187 del C, in quanto né il kernel, né il linguaggio C, implementano direttamente
 188 operazioni comuni come l'allocazione dinamica della memoria, l'input/output
 189 bufferizzato o la manipolazione delle stringhe, presenti in qualunque
 190 programma.
 191
 192 Quanto appena illustrato mette in evidenza il fatto che nella stragrande
 193 maggioranza dei casi,\footnote{esistono implementazioni diverse delle librerie
 194   Standard del C, come le \textit{libc5} o le \textit{uClib}, che non derivano
 195   dal progetto GNU. Le \textit{libc5} oggi sono, tranne casi particolari,
 196   completamente soppiantate dalle \acr{glibc}, le \textit{uClib} pur non
 197   essendo complete come le \acr{glibc}, restano invece molto diffuse nel mondo
 198   embedded per le loro di dimensioni ridotte (e soprattutto la possibilità di
 199   togliere le parti non necessarie), e pertanto costituiscono un valido
 200   rimpiazzo delle \acr{glibc} in tutti quei sistemi specializzati che
 201   richiedono una minima occupazione di memoria.} si dovrebbe usare il nome
 202 GNU/Linux (piuttosto che soltanto Linux) in quanto una parte essenziale del
 203 sistema (senza la quale niente funzionerebbe) è la GNU Standard C Library (in
 204 breve \acr{glibc}), ovvero la libreria realizzata dalla Free Software
 205 Foundation nella quale sono state implementate tutte le funzioni essenziali
 206 definite negli standard POSIX e ANSI C, utilizzabili da qualunque programma.
 207
 208 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
 209 \textsl{Manuale di Programmazione di Unix} (cioè accessibili con il comando
 210 \cmd{man 3 <nome>}) e sono costruite sulla base delle chiamate al sistema del
 211 kernel; è importante avere presente questa distinzione, fondamentale dal punto
 212 di vista dell'implementazione, anche se poi, nella realizzazione di normali
 213 programmi, non si hanno differenze pratiche fra l'uso di una funzione di
 214 libreria e quello di una chiamata al sistema.
 215
 216
 217 \subsection{Un sistema multiutente}
 218 \label{sec:intro_multiuser}
 219
 220 Linux, come gli altri kernel Unix, nasce fin dall'inizio come sistema
 221 multiutente, cioè in grado di fare lavorare più persone in contemporanea. Per
 222 questo esistono una serie di meccanismi di sicurezza, che non sono previsti in
 223 sistemi operativi monoutente, e che occorre tenere presente.
 224
 225 Il concetto base è quello di utente (\textit{user}) del sistema, le cui
 226 capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
 227 Sono così previsti una serie di meccanismi per identificare i singoli utenti
 228 ed una serie di permessi e protezioni per impedire che utenti diversi possano
 229 danneggiarsi a vicenda o danneggiare il sistema.
 230
 231 Ogni utente è identificato da un nome (l'\textit{username}), che è quello che
 232 viene richiesto all'ingresso nel sistema dalla procedura di \textit{login}
 233 (descritta in dettaglio in \secref{sec:sess_login}).  Questa procedura si
 234 incarica di verificare l'identità dell'utente, in genere attraverso la
 235 richiesta di una parola d'ordine (la \textit{password}), anche se sono
 236 possibili meccanismi diversi.\footnote{Ad esempio usando la libreria PAM
 237   (\textit{Pluggable Autentication Methods}) è possibile astrarre
 238   completamente dai meccanismi di autenticazione e sostituire ad esempio l'uso
 239   delle password con meccanismi di identificazione biometrica.}
 240
 241 Eseguita la procedura di riconoscimento in genere il sistema manda in
 242 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
 243 terminale o un'interfaccia grafica) che mette a disposizione dell'utente un
 244 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
 245
 246 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
 247 \textit{default group}), ma può essere associato ad altri gruppi (i
 248 \textit{supplementary group}), questo permette di gestire i permessi di
 249 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
 250 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
 251
 252 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
 253 un nome espresso in caratteri è inserita nei due file \file{/etc/passwd} e
 254 \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto in
 255 breve \textsl{user-ID}, ed indicato dall'acronimo \acr{uid}, e il
 256 \textit{group identifier}, detto in breve \textsl{group-ID}, ed identificato
 257 dall'acronimo \acr{gid}, e sono quelli che vengono usati dal kernel per
 258 identificare l'utente.
 259
 260 In questo modo il sistema è in grado di tenere traccia per ogni processo
 261 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
 262 esso. Inoltre con questo sistema viene anche garantita una forma base di
 263 sicurezza interna in quanto anche l'accesso ai file (vedi
 264 \secref{sec:file_access_control}) è regolato da questo meccanismo di
 265 identificazione.
 266
 267 Infine in ogni Unix è presente un utente speciale privilegiato, il cosiddetto
 268 \textit{superuser}, il cui username è di norma \textit{root}, ed il cui
 269 \acr{uid} è zero. Esso identifica l'amministratore del sistema, che deve
 270 essere in grado di fare qualunque operazione; per l'utente \textit{root}
 271 infatti i meccanismi di controllo descritti in precedenza sono
 272 disattivati.\footnote{i controlli infatti vengono sempre eseguiti da un codice
 273   del tipo \code{if (uid) \{ ... \}}}
 274
 275
 276 \section{Gli standard}
 277 \label{sec:intro_standard}
 278
 279 In questa sezione faremo una breve panoramica relativa ai vari standard che
 280 nel tempo sono stati formalizzati da enti, associazioni, consorzi e
 281 organizzazioni varie al riguardo del sistema o alle caratteristiche che si
 282 sono stabilite come standard di fatto in quanto facenti parte di alcune
 283 implementazioni molto diffuse come BSD o SVr4.
 284
 285 Ovviamente prenderemo in considerazione solo gli standard riguardanti
 286 interfacce di programmazione e le altre caratteristiche di un sistema
 287 unix-like (alcuni standardizzano pure i comandi base del sistema e la shell)
 288 ed in particolare ci concentreremo sul come ed in che modo essi sono
 289 supportati sia per quanto riguarda il kernel che le librerie del C (con una
 290 particolare attenzione alle \acr{glibc}).
 291
 292
 293 \subsection{Lo standard ANSI C}
 294 \label{sec:intro_ansiC}
 295
 296 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
 297   Standard Institute}, come standard del linguaggio C ed è stato
 298 successivamente adottato dalla \textit{International Standard Organisation}
 299 come standard internazionale con la sigla ISO/IEC 9899:1990, e va anche sotto
 300 il nome di standard ISO C.
 301
 302 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
 303 sistemi operativi diversi, ma oltre alla sintassi ed alla semantica del
 304 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
 305 anche una libreria di funzioni che devono poter essere implementate su
 306 qualunque sistema operativo.
 307
 308 Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
 309 di tipo Unix, GNU/Linux (per essere precisi le \acr{glibc}), come molti Unix
 310 moderni, provvede la compatibilità con questo standard, fornendo le funzioni
 311 di libreria da esso previste. Queste sono dichiarate in una serie di
 312 \textit{header file}\footnote{i file di dichiarazione di variabili, tipi e
 313   funzioni, usati normalmente da un compilatore C. Per poter accedere alle
 314   funzioni occorre includere con la direttiva \code{\#include} questi file nei
 315   propri programmi; per ciascuna funzione che tratteremo in seguito
 316   indicheremo anche gli \textit{header file} necessari ad usarla.}  (anch'essi
 317 provvisti dalla \acr{glibc}), In \tabref{tab:intro_posix_header} si sono
 318 riportati i principali \textit{header file} definiti nello standard POSIX,
 319 insieme a quelli definiti negli altri standard descritti nelle sezioni
 320 successive.
 321
 322 \begin{table}[htb]
 323   \footnotesize
 324   \centering
 325   \begin{tabular}[c]{|l|c|c|l|}
 326     \hline
 327     \multirow{2}{*}{\textbf{Header}}&
 328     \multicolumn{2}{|c|}{\textbf{Standard}}&
 329     \multirow{2}{*}{\textbf{Contenuto}} \\
 330     \cline{2-3}
 331     & ANSI C& POSIX& \\
 332     \hline
 333     \hline
 334     \file{assert.h}&$\bullet$&$\bullet$& Verifica le asserzioni fatte in un
 335                                      programma.\\
 336     \file{errno.h} &$\bullet$&$\bullet$& Errori di sistema.\\
 337     \file{fcntl.h} &$\bullet$&$\bullet$& Controllo sulle opzioni dei file.\\
 338     \file{limits.h}&$\bullet$&$\bullet$& Limiti e parametri del sistema.\\
 339     \file{} &$\bullet$&$\bullet$& .\\
 340     \file{} &$\bullet$&$\bullet$& .\\
 341     \file{} &$\bullet$&$\bullet$& .\\
 342     \file{} &$\bullet$&$\bullet$& .\\
 343     \file{} &$\bullet$&$\bullet$& .\\
 344     \file{stdio.h} &$\bullet$&$\bullet$& I/O bufferizzato in standard ANSI C.\\
 345     \file{stdlib.h}&$\bullet$&$\bullet$& definizioni della libreria standard.\\
 346     \hline
 347   \end{tabular}
 348   \caption{Elenco dei vari header file definiti dallo standard POSIX.}
 349   \label{tab:intro_posix_header}
 350 \end{table}
 351
 352
 353 In realtà \acr{glibc} ed i relativi header file definiscono un insieme di
 354 funzionalità in cui sono incluse come sottoinsieme anche quelle previste dallo
 355 standard ANSI C. È possibile ottenere una conformità stretta allo standard
 356 (scartando le funzionalità addizionali) usando il \cmd{gcc} con l'opzione
 357 \cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei vari
 358 header file soltanto le funzionalità previste dallo standard ANSI C e a non
 359 usare le varie estensioni al linguaggio e al preprocessore da esso supportate.
 360
 361
 362 \subsection{I tipi di dati primitivi}
 363 \label{sec:intro_data_types}
 364
 365 Uno dei problemi di portabilità del codice più comune è quello dei tipi di
 366 dati utilizzati nei programmi, che spesso variano da sistema a sistema, o
 367 anche da una architettura ad un altra (ad esempio passando da macchine con
 368 processori 32 bit a 64). In particolare questo è vero nell'uso dei cosiddetti
 369 \textit{tipi elementari}\index{tipo!elementare} del linguaggio C (come
 370 \ctyp{int}) la cui dimensione varia a seconda dell'architettura hardware.
 371
 372 Storicamente alcuni tipi nativi dello standard ANSI C sono sempre stati
 373 associati ad alcune variabili nei sistemi Unix, dando per scontata la
 374 dimensione. Ad esempio la posizione corrente all'interno di un file è sempre
 375 stata associata ad un intero a 32 bit, mentre il numero di dispositivo è
 376 sempre stato associato ad un intero a 16 bit. Storicamente questi erano
 377 definiti rispettivamente come \ctyp{int} e \ctyp{short}, ma tutte le volte
 378 che, con l'evolversi ed il mutare delle piattaforme hardware, alcuni di questi
 379 tipi si sono rivelati inadeguati o sono cambiati, ci si è trovati di fronte ad
 380 una infinita serie di problemi di portabilità.
 381
 382 \begin{table}[htb]
 383   \footnotesize
 384   \centering
 385   \begin{tabular}[c]{|l|l|}
 386     \hline
 387     \textbf{Tipo} & \textbf{Contenuto} \\
 388     \hline
 389     \hline
 390     \type{caddr\_t} & core address.\\
 391     \type{clock\_t} & contatore del tempo di sistema.\\
 392     \type{dev\_t}   & Numero di dispositivo.\\
 393     \type{gid\_t}   & Identificatore di un gruppo.\\
 394     \type{ino\_t}   & Numero di \textit{inode}\index{inode}.\\
 395     \type{key\_t}   & Chiave per il System V IPC.\\
 396     \type{loff\_t}  & Posizione corrente in un file.\\
 397     \type{mode\_t}  & Attributi di un file.\\
 398     \type{nlink\_t} & Contatore dei link su un file.\\
 399     \type{off\_t}   & Posizione corrente in un file.\\
 400     \type{pid\_t}   & Identificatore di un processo.\\
 401     \type{rlim\_t}  & Limite sulle risorse.\\
 402     \type{sigset\_t}& Insieme di segnali.\\
 403     \type{size\_t}  & Dimensione di un oggetto.\\
 404     \type{ssize\_t} & Dimensione in numero di byte ritornata dalle funzioni.\\
 405     \type{ptrdiff\_t}& Differenza fra due puntatori.\\
 406     \type{time\_t}  & Numero di secondi (in tempo di calendario).\\
 407     \type{uid\_t}   & Identificatore di un utente.\\
 408     \hline
 409   \end{tabular}
 410   \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
 411   \label{tab:intro_primitive_types}
 412 \end{table}
 413
 414 Per questo motivo tutte le funzioni di libreria di solito non fanno
 415 riferimento ai tipi elementari dello standard del linguaggio C, ma ad una
 416 serie di \textsl{tipi primitivi}\index{tipo!primitivo} del sistema, riportati
 417 in \tabref{tab:intro_primitive_types}, e definiti nell'header file
 418 \file{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
 419 utilizzati dalle funzioni di sistema dai tipi elementari supportati dal
 420 compilatore C.
 421
 422
 423
 424 \subsection{Lo standard IEEE -- POSIX}
 425 \label{sec:intro_posix}
 426
 427 Uno standard più attinente al sistema nel suo complesso (e che concerne sia il
 428 kernel che le librerie) è lo standard POSIX. Esso prende origine dallo
 429 standard ANSI C, che contiene come sottoinsieme, prevedendo ulteriori capacità
 430 per le funzioni in esso definite, ed aggiungendone di nuove.
 431
 432 In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
 433 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
 434 X finale denuncia la sua stretta relazione con i sistemi Unix. Esso nasce dal
 435 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
 436 che ne produsse una prima versione, nota come IEEE 1003.1-1988, mirante a
 437 standardizzare l'interfaccia con il sistema operativo.
 438
 439 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
 440 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
 441 i comandi di sistema (1003.2), per le estensioni realtime e per i thread
 442 (1003.1d e 1003.1c) e vari altri.  In \tabref{tab:intro_posix_std} è riportata
 443 una classificazione sommaria dei principali documenti prodotti, e di come sono
 444 identificati fra IEEE ed ISO; si tenga conto inoltre che molto spesso si usa
 445 l'estensione IEEE anche come aggiunta al nome POSIX (ad esempio si può parlare
 446 di POSIX.4 come di POSIX.1b).
 447
 448 Si tenga presente inoltre che nuove specifiche e proposte di standardizzazione
 449 si aggiungono continuamente, mentre le versioni precedenti vengono riviste;
 450 talvolta poi i riferimenti cambiamo nome, per cui anche solo seguire le
 451 denominazioni usate diventa particolarmente faticoso; una pagina dove si
 452 possono recuperare varie (e di norma piuttosto intricate) informazioni è:
 453 \href{http://www.pasc.org/standing/sd11.html}
 454 {http://www.pasc.org/standing/sd11.html}.
 455
 456 \begin{table}[htb]
 457   \footnotesize
 458   \centering
 459   \begin{tabular}[c]{|l|l|l|l|}
 460     \hline
 461     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
 462     \hline
 463     \hline
 464     POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
 465     POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
 466     POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
 467     POSIX.3 & 2003   &TR13210& Metodi di test                               \\
 468     POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
 469     POSIX.4a& 1003.1c &  --- & Thread                                       \\
 470     POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
 471     POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
 472     POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
 473     POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
 474     POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77                \\
 475     POSIX.12& 1003.1g& 9945-1& Socket                                       \\
 476     \hline
 477   \end{tabular}
 478   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
 479   \label{tab:intro_posix_std}
 480 \end{table}
 481
 482 Benché l'insieme degli standard POSIX siano basati sui sistemi Unix essi
 483 definiscono comunque un'interfaccia di programmazione generica e non fanno
 484 riferimento ad una implementazione specifica (ad esempio esiste
 485 un'implementazione di POSIX.1 anche sotto Windows NT).  Lo standard principale
 486 resta comunque POSIX.1, che continua ad evolversi; la versione più nota, cui
 487 gran parte delle implementazioni fanno riferimento, e che costituisce una base
 488 per molti altri tentativi di standardizzazione, è stata rilasciata anche come
 489 standard internazionale con la sigla ISO/IEC 9945-1:1996.
 490
 491 Linux e le \acr{glibc} implementano tutte le funzioni definite nello standard
 492 POSIX.1, queste ultime forniscono in più alcune ulteriori capacità (per
 493 funzioni di \textit{pattern matching} e per la manipolazione delle
 494 \textit{regular expression}), che vengono usate dalla shell e dai comandi di
 495 sistema e che sono definite nello standard POSIX.2.
 496
 497 Nelle versioni più recenti del kernel e delle librerie sono inoltre supportate
 498 ulteriori funzionalità aggiunte dallo standard POSIX.1c per quanto riguarda i
 499 \textit{thread} (vedi \capref{cha:threads}), e dallo standard POSIX.1b per
 500 quanto riguarda i segnali e lo scheduling real-time
 501 (\secref{sec:sig_real_time} e \secref{sec:proc_real_time}), la misura del
 502 tempo, i meccanismi di intercomunicazione (\secref{sec:ipc_posix}) e l'I/O
 503 asincrono (\secref{sec:file_asyncronous_io}).
 504
 505
 506
 507 \subsection{Lo standard X/Open -- XPG3}
 508 \label{sec:intro_xopen}
 509
 510 Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
 511 Unix per giungere ad un'armonizzazione delle varie implementazioni.  Per far
 512 questo iniziò a pubblicare una serie di documentazioni e specifiche sotto il
 513 nome di \textit{X/Open Portability Guide} (a cui di norma si fa riferimento
 514 con l'abbreviazione XPGn).
 515
 516 Nel 1989 produsse una terza versione di questa guida particolarmente
 517 voluminosa (la \textit{X/Open Portability Guide, Issue 3}), contenente
 518 un'ulteriore standardizzazione dell'interfaccia di sistema di Unix, che venne
 519 presa come riferimento da vari produttori.
 520
 521 Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
 522 basato sullo standard POSIX.1, ma prevede una serie di funzionalità aggiuntive
 523 fra cui le specifiche delle API (\textit{Application Programmable Interface})
 524 per l'interfaccia grafica (X11).
 525
 526 Nel 1992 lo standard venne rivisto con una nuova versione della guida, la
 527 Issue 4 (da cui la sigla XPG4) che aggiungeva l'interfaccia XTI (\textit{X
 528   Transport Interface}) mirante a soppiantare (senza molto successo)
 529 l'interfaccia dei socket derivata da BSD. Una seconda versione della guida fu
 530 rilasciata nel 1994, questa è nota con il nome di Spec 1170 (dal numero delle
 531 interfacce, header e comandi definiti).
 532
 533 Nel 1993 il marchio Unix passò di proprietà dalla Novell (che a sua volta lo
 534 aveva comprato dalla AT\&T) al consorzio X/Open che iniziò a pubblicare le sue
 535 specifiche sotto il nome di \textit{Single UNIX Specification}, l'ultima
 536 versione di Spec 1170 diventò così la prima versione delle \textit{Single UNIX
 537   Specification}, SUSv1, più comunemente nota come \textit{Unix 95}.
 538
 539
 540 \subsection{Gli standard Unix  -- Open Group}
 541 \label{sec:intro_opengroup}
 542
 543 Nel 1996 la fusione del consorzio X/Open con la Open Software Foundation (nata
 544 da un gruppo di aziende concorrenti rispetto ai fondatori di X/Open) portò
 545 alla costituzione dell'Open Group, un consorzio internazionale che raccoglie
 546 produttori, utenti industriali, entità accademiche e governative.
 547
 548 Attualmente il consorzio è detentore del marchio depositato Unix, e prosegue
 549 il lavoro di standardizzazione delle varie implementazioni, rilasciando
 550 periodicamente nuove specifiche e strumenti per la verifica della conformità
 551 alle stesse.
 552
 553 Nel 1997 fu annunciata la seconda versione delle \textit{Single UNIX
 554   Specification}, nota con la sigla SUSv2, in queste versione le interfacce
 555 specificate salgono a 1434 (e 3030 se si considerano le stazioni di lavoro
 556 grafiche, per le quali sono inserite pure le interfacce usate da CDE che
 557 richiede sia X11 che Motif). La conformità a questa versione permette l'uso
 558 del nome \textit{Unix 98}, usato spesso anche per riferirsi allo standard.
 559
 560
 561 \subsection{Lo ``\textsl{standard}'' BSD}
 562 \label{sec:intro_bsd}
 563
 564 Lo sviluppo di BSD iniziò quando la fine della collaborazione fra l'Università
 565 di Berkley e la AT\&T generò una delle prime e più importanti fratture del
 566 mondo Unix.  L'Università di Berkley proseguì nello sviluppo della base di
 567 codice di cui disponeva, e che presentava parecchie migliorie rispetto alle
 568 allora versioni disponibili, fino ad arrivare al rilascio di una versione
 569 completa di Unix, chiamata appunto BSD, del tutto indipendente dal codice
 570 della AT\&T.
 571
 572 Benché BSD non sia uno standard formalizzato, l'implementazione di Unix
 573 dell'Università di Berkley, ha provveduto nel tempo una serie di estensioni e
 574 API di grande rilievo, come il link simbolici, la funzione \code{select}, i
 575 socket.
 576
 577 Queste estensioni sono state via via aggiunte al sistema nelle varie versioni
 578 del sistema (BSD 4.2, BSD 4.3 e BSD 4.4) come pure in alcuni derivati
 579 commerciali come SunOS. Il kernel e le \acr{glibc} provvedono tutte queste
 580 estensioni che sono state in gran parte incorporate negli standard successivi.
 581
 582
 583 \subsection{Lo standard System V}
 584 \label{sec:intro_sysv}
 585
 586 Come noto Unix nasce nei laboratori della AT\&T, che ne registrò il nome come
 587 marchio depositato, sviluppandone una serie di versioni diverse; nel 1983 la
 588 versione supportata ufficialmente venne rilasciata al pubblico con il nome di
 589 Unix System V. Negli anni successivi l'AT\&T proseguì lo sviluppo rilasciando
 590 varie versioni con aggiunte e integrazioni; nel 1989 un accordo fra vari
 591 venditori (AT\&T, Sun, HP, e altro) portò ad una versione che provvedeva
 592 un'unificazione delle interfacce comprendente Xenix e BSD, la System V release
 593 4.
 594
 595 L'interfaccia di questa ultima release è descritta in un documento dal titolo
 596 \textit{System V Interface Description}, o SVID; spesso però si fa riferimento
 597 a questo standard con il nome della sua implementazione, usando la sigla SVr4.
 598
 599 Anche questo costituisce un sovrainsieme delle interfacce definite dallo
 600 standard POSIX.  Nel 1992 venne rilasciata una seconda versione del sistema:
 601 la SVr4.2. L'anno successivo la divisione della AT\&T (già a suo tempo
 602 rinominata in Unix System Laboratories) venne acquistata dalla Novell, che poi
 603 trasferì il marchio Unix al consorzio X/Open; l'ultima versione di System V fu
 604 la SVr4.2MP rilasciata nel Dicembre 93.
 605
 606 Linux e le \acr{glibc} implementano le principali funzionalità richieste da
 607 SVID che non sono già incluse negli standard POSIX ed ANSI C, per
 608 compatibilità con lo Unix System V e con altri Unix (come SunOS) che le
 609 includono. Tuttavia le funzionalità più oscure e meno utilizzate (che non sono
 610 presenti neanche in System V) sono state tralasciate.
 611
 612 Le funzionalità implementate sono principalmente il meccanismo di
 613 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
 614 V IPC, che vedremo in \secref{sec:ipc_sysv}) le funzioni della famiglia
 615 \func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
 616 matematiche.
 617
 618
 619 \subsection{Il comportamento standard del \cmd{gcc} e delle \acr{glibc}}
 620 \label{sec:intro_gcc_glibc_std}
 621
 622 In Linux, grazie alle \acr{glibc}, gli standard appena descritti sono
 623 ottenibili sia attraverso l'uso di opzioni del compilatore (il \cmd{gcc}) che
 624 definendo opportune costanti prima dell'inclusione dei file degli header.
 625
 626 Se si vuole che i programmi seguano una stretta attinenza allo standard ANSI C
 627 si può usare l'opzione \cmd{-ansi} del compilatore, e non sarà riconosciuta
 628 nessuna funzione non riconosciuta dalle specifiche standard ISO per il C.
 629
 630 Per attivare le varie opzioni è possibile definire le macro di preprocessore,
 631 che controllano le funzionalità che le \acr{glibc} possono mettere a
 632 disposizione: questo può essere fatto attraverso l'opzione \cmd{-D} del
 633 compilatore, ma è buona norma inserire gli opportuni \code{\#define} nei
 634 propri header file.
 635
 636 Le macro disponibili per i vari standard sono le seguenti:
 637 \begin{basedescript}{\desclabelwidth{3cm}\desclabelstyle{\nextlinelabel}}
 638 \item[\macro{\_POSIX\_SOURCE}] definendo questa macro si rendono disponibili
 639   tutte le funzionalità dello standard POSIX.1 (la versione IEEE Standard
 640   1003.1) insieme a tutte le funzionalità dello standard ISO C. Se viene anche
 641   definita con un intero positivo la macro \macro{\_POSIX\_C\_SOURCE} lo stato
 642   di questa non viene preso in considerazione.
 643 \item[\macro{\_POSIX\_C\_SOURCE}] definendo questa macro ad un valore intero
 644   positivo si controlla quale livello delle funzionalità specificate da POSIX
 645   viene messa a disposizione; più alto è il valore maggiori sono le
 646   funzionalità. Se è uguale a '1' vengono attivate le funzionalità specificate
 647   nella edizione del 1990 (IEEE Standard 1003.1-1990), valori maggiori o
 648   uguali a '2' attivano le funzionalità POSIX.2 specificate nell'edizione del
 649   1992 (IEEE Standard 1003.2-1992). Un valore maggiore o uguale a `199309L'
 650   attiva le funzionalità POSIX.1b specificate nell'edizione del 1993 (IEEE
 651   Standard 1003.1b-1993).  Un valore maggiore o uguale a `199506L' attiva le
 652   funzionalità POSIX.1 specificate nell'edizione del 1996 (ISO/IEC 9945-1:
 653   1996). Valori superiori abiliteranno ulteriori estensioni.
 654 \item[\macro{\_BSD\_SOURCE}] definendo questa macro si attivano le
 655   funzionalità derivate da BSD4.3, insieme a quelle previste dagli standard
 656   ISO C, POSIX.1 e POSIX.2. Alcune delle funzionalità previste da BSD sono
 657   però in conflitto con le corrispondenti definite nello standard POSIX.1, in
 658   questo caso le definizioni previste da BSD4.3 hanno la precedenza rispetto a
 659   POSIX.  A causa della natura dei conflitti con POSIX per ottenere una piena
 660   compatibilità con BSD4.3 è necessario anche usare una libreria di
 661   compatibilità, dato che alcune funzioni sono definite in modo diverso. In
 662   questo caso occorre pertanto anche usare l'opzione \cmd{-lbsd-compat} con il
 663   compilatore per indicargli di utilizzare le versioni nella libreria di
 664   compatibilità prima di quelle normali.
 665 \item[\macro{\_SVID\_SOURCE}] definendo questa macro si attivano le
 666   funzionalità derivate da SVID. Esse comprendono anche quelle definite negli
 667   standard ISO C, POSIX.1, POSIX.2, and X/Open.
 668 \item[\macro{\_XOPEN\_SOURCE}] definendo questa macro si attivano le
 669   funzionalità descritte nella \textit{X/Open Portability Guide}. Anche queste
 670   sono un sovrainsieme di quelle definite in POSIX.1 e POSIX.2 ed in effetti
 671   sia \macro{\_POSIX\_SOURCE} che \macro{\_POSIX\_C\_SOURCE} vengono
 672   automaticamente definite. Sono incluse anche ulteriori funzionalità
 673   disponibili in BSD e SVID. Se il valore della macro è posto a 500 questo
 674   include anche le nuove definizioni introdotte con la \textit{Single UNIX
 675     Specification, version 2}, cioè Unix98.
 676 \item[\macro{\_XOPEN\_SOURCE\_EXTENDED}] definendo questa macro si attivano le
 677   ulteriori funzionalità necessarie ad essere conformi al rilascio del marchio
 678   \textit{X/Open Unix}.
 679 \item[\macro{\_ISOC99\_SOURCE}] definendo questa macro si attivano le
 680   funzionalità previste per la revisione delle librerie standard del C
 681   denominato ISO C99. Dato che lo standard non è ancora adottato in maniera
 682   ampia queste non sono abilitate automaticamente, ma le \acr{glibc} hanno già
 683   un'implementazione completa che può essere attivata definendo questa macro.
 684 \item[\macro{\_LARGEFILE\_SOURCE}] definendo questa macro si attivano le
 685   funzionalità per il supporto dei file di grandi dimensioni (il \textit{Large
 686     File Support} o LFS) con indici e dimensioni a 64 bit.
 687 \item[\macro{\_GNU\_SOURCE}] definendo questa macro si attivano tutte le
 688   funzionalità disponibili: ISO C89, ISO C99, POSIX.1, POSIX.2, BSD, SVID,
 689   X/Open, LFS più le estensioni specifiche GNU. Nel caso in cui BSD e POSIX
 690   confliggano viene data la precedenza a POSIX.
 691 \end{basedescript}
 692
 693 In particolare è da sottolineare che le \acr{glibc} supportano alcune
 694 estensioni specifiche GNU, che non sono comprese in nessuno degli
 695 standard citati. Per poterle utilizzare esse devono essere attivate
 696 esplicitamente definendo la macro \macro{\_GNU\_SOURCE} prima di
 697 includere i vari header file.
 698
 699
 700 %% \subsection{Gli standard di GNU/Linux}
 701 %% \label{sec:intro_linux_std}
 702
 703 %% Da fare (o cassare, a seconda del tempo e della voglia).
 704
 705
 706
 707 %%% Local Variables:
 708 %%% mode: latex
 709 %%% TeX-master: "gapil"
 710 %%% End: