intro.tex

   1 \chapter{L'architettura di GNU/Linux}
   2 \label{cha:intro_unix}
   3
   4 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
   5 cui è basato un sistema di tipo unix come GNU/Linux, in questo modo potremo
   6 fornire una base di comprensione mirata a sottolineare le peculiarità del
   7 sistema che sono più rilevanti per quello che riguarda la programmazione.
   8
   9 Dopo un introduzione sulle caratteristiche principali di un sistema di tipo
  10 unix passeremo ad illustrare alcuni dei concetti basi dell'architettura di
  11 GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
  12 introdurremo alcuni degli standard principali a cui viene fatto riferimento.
  13
  14
  15 \section{Una panoramica sulla struttura}
  16 \label{sec:intro_unix_struct}
  17
  18 In questa prima sezione faremo una panoramica sulla struttura di un sistema
  19 \textit{unix-like} come GNU/Linux.  Chi avesse già una conoscenza di questa
  20 materia può tranquillamente saltare questa sezione.
  21
  22 Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
  23 cosiddetto \textit{kernel}) a cui si demanda la gestione delle risorse
  24 essenziali (la CPU, la memoria, le periferiche) mentre tutto il resto, quindi
  25 anche la parte che prevede l'interazione con l'utente, deve venire realizzato
  26 tramite programmi eseguiti dal kernel e che accedano alle risorse hardware
  27 tramite delle richieste a quest'ultimo.
  28
  29 Fin dall'inizio uno unix si presenta come un sistema operativo
  30 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
  31 programmi, e multiutente, in cui é possibile che più utenti siano connessi ad
  32 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
  33 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
  34 a rotazione).
  35
  36 % Questa e` una distinzione essenziale da capire,
  37 %specie nei confronti dei sistemi operativi successivi, nati per i personal
  38 %computer (e quindi per un uso personale), sui quali l'hardware (allora
  39 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
  40
  41 Gli unix più recenti, come Linux, sono realizzati sfruttando alcune
  42 caratteristiche dei processori moderni come la gestione hardware della memoria
  43 e la modalità protetta. In sostanza con i processori moderni si può
  44 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
  45 zone di memoria fisica.  Quello che succede é che il kernel é il solo
  46 programma ad essere eseguito in modalità privilegiata, con il completo accesso
  47 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
  48 (e non possono accedere direttamente alle zone di memoria riservate o alle
  49 porte di input/output).
  50
  51 Una parte del kernel, lo \textit{scheduler}, si occupa di stabilire, ad
  52 intervalli fissi e sulla base di un opportuno calcolo delle priorità, quale
  53 ``processo'' deve essere posto in esecuzione (il cosiddetto
  54 \textit{prehemptive scheduling}). Questo verrà comunque eseguito in modalità
  55 protetta; quando necessario il processo potrà accedere alle risorse hardware
  56 soltanto attraverso delle opportune chiamate al sistema che restituiranno il
  57 controllo al kernel.
  58
  59 La memoria viene sempre gestita del kernel attraverso il meccanismo della
  60 \textsl{memoria virtuale}, che consente di assegnare a ciascun processo uno
  61 spazio di indirizzi ``virtuale'' (vedi \secref{sec:proc_memory}) che il kernel
  62 stesso, con l'ausilio della unità di gestione della memoria, si incaricherà di
  63 rimappare automaticamente sulla memoria disponibile, salvando su disco quando
  64 necessario (nella cosiddetta area di \textit{swap}) le pagine di memoria in
  65 eccedenza.
  66
  67 Le periferiche infine vengono viste in genere attraverso un'interfaccia
  68 astratta che permette di trattarle come fossero file, secondo il concetto per
  69 cui \textit{everything is a file}, su cui torneremo in dettaglio in
  70 \capref{cha:files_intro}, (questo non è vero per le interfacce di rete, che
  71 hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
  72 il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
  73
  74
  75 \section{User space e kernel space}
  76 \label{sec:intro_user_kernel_space}
  77
  78 Uno dei concetti fondamentale su cui si basa l'architettura dei sistemi unix è
  79 quello della distinzione fra il cosiddetto \textit{user space}, che
  80 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
  81 \textit{kernel space} che é l'ambiente in cui viene eseguito il kernel. Ogni
  82 programma vede se stesso come se avesse la piena disponibilità della CPU e
  83 della memoria ed è, salvo i meccanismi di comunicazione previsti
  84 dall'architettura, completamente ignaro del fatto che altri programmi possono
  85 essere messi in esecuzione dal kernel.
  86
  87 Per questa separazione non è possibile ad un singolo programma disturbare
  88 l'azione di un altro programma o del sistema e questo è il principale motivo
  89 della stabilità di un sistema unix nei confronti di altri sistemi in cui i
  90 processi non hanno di questi limiti, o che vengono per vari motivi eseguiti al
  91 livello del kernel.
  92
  93 Pertanto deve essere chiaro a chi programma in unix che l'accesso diretto
  94 all'hardware non può avvenire se non all'interno del kernel; al di fuori dal
  95 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
  96 fornisce allo user space.
  97
  98
  99 \subsection{Il kernel e il sistema}
 100 \label{sec:intro_kern_and_sys}
 101
 102 Per capire meglio la distinzione fra kernel space e user space si può prendere
 103 in esame la procedura di avvio di un sistema unix; all'avvio il BIOS (o in
 104 generale il software di avvio posto nelle EPROM) eseguirà la procedura di
 105 avvio del sistema (il cosiddetto \textit{boot}) incaricandosi di caricare il
 106 kernel in memoria e di farne partire l'esecuzione; quest'ultimo, dopo aver
 107 inizializzato le periferiche farà partire il primo processo, \cmd{init} che è
 108 quello che a sua volta farà partire tutti i processi successivi,fra i quali
 109 c'è pure quello che si occupa di dialogare con la tastiera e lo schermo della
 110 console, e quello che mette a disposizione dell'utente che si vuole collegare
 111 un terminale e la stessa \textit{shell} da cui inviare i comandi.
 112
 113 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
 114 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
 115 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
 116 qualunque programma di scrittura o di disegno, in user space.
 117
 118 Questo significa ad esempio che il sistema di per sé non dispone di primitive
 119 per tutta una serie di operazioni (come la copia di un file) che altri sistemi
 120 (come Windows) hanno invece al loro interno. Pertanto buona parte delle
 121 operazioni di normale amministrazione di un sistema, come quella in esempio,
 122 sono implementate come normali programmi.
 123
 124 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
 125 %realizzare un sistema di permessi e controlli che evitano che i programmi
 126 %eseguano accessi non autorizzati.
 127
 128 Per questo motivo è più corretto parlare di sistema GNU/Linux, in quanto da
 129 solo il kernel è assolutamente inutile, quello che costruisce un sistema
 130 operativo utilizzabile è la presenza di tutta una serie di librerie e
 131 programmi di utilità che permettono di eseguire le normali operazioni che ci
 132 si aspetta da un sistema operativo.
 133
 134
 135 \subsection{Chiamate al sistema e librerie di funzioni}
 136 \label{sec:intro_syscall}
 137
 138 Come accennato le interfacce con cui i programmi possono accedere all'hardware
 139 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
 140   call}), si tratta di un insieme di funzioni, che un programma può chiamare,
 141 per le quali viene generata una interruzione processo e il controllo è passato
 142 dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
 143 di operazioni interne come la gestione del multitasking e il l'allocazione
 144 della memoria) eseguirà la funzione richiesta in kernel space restituendo i
 145 risultati al chiamante.
 146
 147 Ogni versione unix ha storicamente sempre avuto un certo numero di queste
 148 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale della
 149   programmazione di unix} (quella che si accede con il comando \cmd{man 2
 150   nome}) e GNU/Linux non fa eccezione. Queste sono poi state codificate da vari
 151 standard, che esamineremo brevemente in \secref{sec:intro_standard}.
 152
 153 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
 154 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
 155 C, che oltre alle interfacce alle system call contiene anche tutta una serie
 156 di ulteriori funzioni usate comunemente nella programmazione.
 157
 158 Questo è importante da capire perché programmare in Linux significa anzitutto
 159 essere in grado di usare la Libreria Standard del C, in quanto né il kernel né
 160 il linguaggio C implementano direttamente operazioni comuni come la
 161 allocazione dinamica della memoria, l'input/output bufferizzato o la
 162 manipolazione delle stringhe presenti in qualunque programma.
 163
 164 Anche per questo in Linux è in effetti GNU/Linux, in quanto una parte
 165 essenziale del sistema (senza la quale niente può funzionare) è la
 166 realizzazione fatta dalla Free Software Foundation della suddetta libreria (la
 167 GNU Standard C Library, in breve \textit{glibc}), in cui sono state
 168 implementate tutte le funzioni essenziali definite negli standard POSIX e ANSI
 169 C, che vengono utilizzate da qualunque programma.
 170
 171 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
 172 Manuale di Programmazione di Unix (cioè accessibili con il comando \cmd{man 2
 173   nome}), e sono costruite sulla base delle chiamate al sistema del kernel; è
 174 importante avere presente questa distinzione, fondamentale dal punto di vista
 175 dell'implementazione, anche se poi nella realizzazione di normali programmi
 176 non si hanno differenze pratiche fra l'uso di una funzione di libreria e
 177 quello di una chiamata al sistema.
 178
 179
 180 \subsection{Un sistema multiutente}
 181 \label{sec:intro_multiuser}
 182
 183 Linux, come gli altri unix, nasce fin dall'inizio come sistema multiutente,
 184 cioè in grado di fare lavorare più persone in contemporanea. Per questo
 185 esistono una serie di meccanismi di sicurezza che non sono previsti in sistemi
 186 operativi monoutente e che occorre tenere presente.
 187
 188 Il concetto base è quello di utente (\textit{user}) del sistema, utente che ha
 189 dei ben definiti limiti e capacità rispetto a quello che può fare. Sono così
 190 previsti una serie di meccanismi per identificare i singoli utenti ed una
 191 serie di permessi e protezioni per impedire che utenti diversi possano
 192 danneggiarsi a vicenda o danneggiare il sistema.
 193
 194 Ad ogni utente è dato un nome \textit{username}, che è quello che viene
 195 richiesto all'ingresso nel sistema dalla procedura di \textit{login}. Questa
 196 procedura si incarica di verificare la identità dell'utente (in genere
 197 attraverso la richiesta di una parola d'ordine, anche se sono possibili
 198 meccanismi diversi\footnote{Ad esempio usando la libreria PAM
 199   (\textit{Pluggable Autentication Methods}) è possibile astrarre
 200   completamente i meccanismi di autenticazione e sostituire ad esempio l'uso
 201   delle password con meccanismi di identificazione biometrica}.
 202
 203 Eseguita la procedura di riconoscimento in genere il sistema manda in
 204 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
 205 terminale o una interfaccia grafica) che mette a disposizione dell'utente un
 206 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
 207
 208 Ogni utente appartiene anche ad almeno un gruppo (il cosiddetto
 209 \textit{default group}), ma può essere associato ad altri gruppi (i
 210 \textit{supplementary group}), questo permette di gestire i permessi di
 211 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
 212 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
 213
 214 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
 215 un nome in espresso in caratteri è inserita nei due files \file{/etc/passwd}
 216 e \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto
 217 in breve \acr{uid} e il \textit{group identifier}, detto in breve \acr{gid}
 218 che sono quelli che poi vengono usati dal kernel per riconoscere l'utente.
 219
 220 In questo modo il sistema è in grado di tenere traccia per ogni processo
 221 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
 222 esso. Inoltre con questo sistema viene anche garantita una forma base di
 223 sicurezza interna in quanto anche l'accesso ai file (vedi
 224 \secref{sec:file_access_control}) è regolato da questo meccanismo di
 225 identificazione.
 226
 227 Infine in ogni unix è presente un utente speciale privilegiato, di norma
 228 chiamato \textit{root}, il cui \acr{uid} è zero. Esso identifica
 229 l'amministratore del sistema, che deve essere in grado di fare qualunque
 230 operazione; per l'utente \textit{root} infatti i meccanismi di controllo
 231 descritti in precedenza sono disattivati\footnote{i controlli infatti vengono
 232   sempre eseguiti da un codice del tipo \texttt{if (uid) \{ ... \}}}.
 233
 234
 235 \section{Gli standard di unix e GNU/Linux}
 236 \label{sec:intro_standard}
 237
 238 In questa sezione prenderemo in esame alcune caratteristiche generali del
 239 sistema e gli standard adottati per le funzioni, i prototipi, gli errori, i
 240 tipi di dati.
 241
 242 \subsection{Prototipi e puntatori}
 243 \label{sec:intro_function}
 244
 245
 246 \subsection{Lo standard ANSI C}
 247 \label{sec:intro_ansiC}
 248
 249 Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
 250   Standard Institute}, come standard del linguaggio C ed è stato
 251 successivamente adottatto dalla \textit{International Standard Organisation}
 252 come standard internazionale con la sigla ISO/IEC 9899:1990.
 253
 254 Scopo dello standard è quello di garantire la portabilità dei programmi C fra
 255 sistemi operativi diversi, ma oltre alla sintassi e alla semantica del
 256 linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
 257 anche una libreria di funzioni standard che devono poter essere implementate
 258 su qualunque sistema operativo.
 259
 260 Linux, come molti unix moderni, provvede la compatibilità con questo standard,
 261 fornendo le funzioni di libreria da esso previste; queste sono dichiarate in
 262 quindici header files, uno per ciascuna delle quindici aree in cui è stata
 263 suddivisa la libreria. In \ntab\ si sono riportati questi header, insieme a
 264 quelli definiti negli altri standard descritti nelle sezioni successive.
 265
 266 \subsection{Lo standard POSIX}
 267 \label{sec:intro_posix}
 268
 269 In realtà POSIX è una famiglia di standard diversi, il nome, suggerito da
 270 Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
 271 X finale denuncia la sua stretta relazione con i sistemi unix. Esso nasce dal
 272 lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
 273 che ne ha prodotto un primo una prima versione, nota come IEEE 1003.1-1988,
 274 mirante a standardizzare l'interfaccia con il sistema operativo.
 275
 276 Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
 277 libreria, e in seguito sono stati prodotti anche altri standard per la shell e
 278 le utilities di sistema (1003.2), per le estensioni realtime e per i thread
 279 (1003.1d e 1003.1c) e molti altri.
 280
 281 Benchè lo standard POSIX sia basato sui sistemi unix esso definisce comunque
 282 una interfaccia e non fa riferimento ad una specifica implementazione (per cui
 283 esiste ad esempio anche una implementazione di questo standard pure sotto
 284 Windows NT). Lo standard si è evoluto nel tempo ed una nuova versione (quella
 285 che viene normalmente denominata POSIX.1) è stata rilasciata come standard
 286 internazionale con la sigla ISO/IEC 9945-1:1990.
 287
 288
 289 \subsection{Lo standard X/Open -- XPG3}
 290 \label{sec:intro_xopen}
 291
 292 Il consorzio X/Open nasce come consorzio di venditori di sistemi unix, che nel
 293 1989 produsse una voluminosa guida chiamata \textit{X/Open Portability Guide,
 294   Issue 3} al cui interno definiva una ulteriore standardizzazione
 295 dell'interfaccia ad un sistema unix.
 296
 297 Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
 298 basato sullo standard POSIX.1, ma prevede una serie di funzionalità
 299 aggiuntive.
 300
 301 Il consorzio
 302
 303
 304 \subsection{Valori e limiti del sistema}
 305 \label{sec:intro_limits}
 306
 307
 308 \subsection{Tipi di dati primitivi}
 309 \label{sec:intro_data_types}
 310
 311