Ristrutturazione della introduzione.
[gapil.git] / intro.tex
1 \chapter{L'architettura di GNU/Linux}
2 \label{cha:intro_unix}
3
4 In questo primo capitolo sarà fatta un'introduzione ai concetti generali su
5 cui è basato un sistema di tipo unix come GNU/Linux, per fornire una base di
6 comprensione mirata a sottolineare le peculiarità che saranno poi importanti
7 per quello che riguarda la programmazione. 
8
9 Dopo un introduzione sulle caratteristiche principali di un sistema di tipo
10 unix passeremo ad illustrare alcuni dei concetti basi dell'architettura di
11 Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
12 introdurremo alcunoi degli standard princincipali a cui si fa riferimento.
13
14
15 \section{Una panoramica sulla struttura}
16 \label{sec:intro_unix_struct}
17
18 In questa prima sezione faremo una panoramica sulla struttura di un sistema
19 \textit{unix-like} come Linux.  Chi avesse già una conoscenza di questa
20 materia può tranquillamente saltare questa sezione.
21
22 Il concetto base di un sistema unix-like é quello di un nucleo del sistema (il
23 cosiddetto \textit{kernel}) a cui si demanda la gestione delle risorse
24 essenziali (la CPU, la memoria, le periferiche) mentre tutto il resto, quindi
25 anche la parte che prevede l'interazione con l'utente, deve venire realizzato
26 tramite programmi eseguiti dal kernel e che accedano alle risorse hardware
27 tramite delle richieste a quest'ultimo.
28
29 Fin dall'inizio unix si presenta come un sistema operativo
30 \textit{multitasking}, cioè in grado di eseguire contemporaneamente più
31 programmi, e multiutente, in cui é possibile che più utenti siano connessi ad
32 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
33 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
34 a rotazione).
35
36 % Questa e' una distinzione essenziale da capire,
37 %specie nei confronti dei sistemi operativi successivi, nati per i personal
38 %computer (e quindi per un uso personale), sui quali l'hardware (allora
39 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
40
41 Gli unix più recenti, come Linux, sono stati realizzati usando alcune
42 caratteristiche dei processori moderni come la gestione hardware della memoria
43 e la modalità protetta. In sostanza con i processori moderni si può
44 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
45 zone di memoria fisica.  Quello che succede é che il kernel é il solo
46 programma ad essere eseguito in modalità privilegiata, con il completo accesso
47 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
48 (e non possono accedere direttamente alle zone di memoria riservate
49 o alle porte di input/output).
50
51 Una parte del kernel, lo \textit{scheduler}, si occupa di stabilire, ad
52 intervalli fissi e sulla base di un opportuno calcolo delle priorità, quale
53 ``processo'' deve essere posto in esecuzione (il cosiddetto
54 \textit{prehemptive scheduling}). Questo verrà comunque eseguito in modalità
55 protetta; quando necessario il processo potrà accedere alle risorse hardware
56 soltanto attraverso delle opportune chiamate al sistema che restituiranno il
57 controllo al kernel.
58
59 La memoria viene sempre gestita del kernel attraverso il meccanismo della
60 memoria virtuale, che consente di assegnare a ciascun processo uno spazio di
61 indirizzi ``virtuale'' (vedi \secref{sec:proc_memory}) che il kernel stesso,
62 con l'ausilio della unità di gestione della memoria, si incaricherà di
63 rimappare automaticamente sulla memoria disponibile, salvando quando
64 necessario su disco (nella cosiddetta \textit{swap}) le pagine di memoria in
65 eccedenza.
66
67 Le periferiche infine vengono viste in genere attraverso un'interfaccia
68 astratta che permette di trattarle come fossero file, secondo il concetto per
69 cui \textit{everything is a file}, vedi \capref{cha:files_intro}, (questo non
70 è vero per le interfacce di rete, che hanno un'interfaccia diversa, ma resta
71 valido il concetto generale che tutto il lavoro di accesso e gestione a basso
72 livello è effettuato dal kernel).
73
74
75 \section{User space e kernel space}
76 \label{sec:intro_user_kernel_space}
77
78 Uno dei concetti fondamentale su cui si basa l'architettura dei sistemi unix è
79 quello della distinzione fra il cosiddetto \textit{user space}, che
80 contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
81 \textit{kernel space} che é l'ambiente in cui viene eseguito il kernel. Ogni
82 programma vede se stesso come se avesse la piena disponibilità della CPU e
83 della memoria ed è, salvo i meccanismi di comunicazione previsti
84 dall'architettura completamente ignaro del fatto che altri programmi possono
85 essere messi in esecuzione dal kernel.
86
87 Per questa separazione non è possibile ad un singolo programma disturbare
88 l'azione di un altro programma o del sistema e questo è il principale motivo
89 della stabilità di un sistema unix nei confronti di altri sistemi in cui i
90 processi non hanno di questi limiti, o che vengono per vari motivi eseguiti al
91 livello del kernel.
92
93 Pertanto deve essere chiaro a chi programma in unix che l'accesso diretto
94 all'hardware non può avvenire se non all'interno del kernel, al di fuori dal
95 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
96 fornisce allo user space. 
97
98
99 \subsection{Il kernel e il resto}
100 \label{sec:intro_kern_and_sys}
101
102 Per capire meglio la distinzione fra kernel space e user space si può prendere
103 in esame la procedura di avvio di un sistema unix; all'avvio il BIOS (o in
104 generale il software di avvio posto nelle EPROM) eseguirà il \textit{boot}
105 incaricandosi di caricare il kernel in memoria e di farne partire
106 l'esecuzione; quest'ultimo, dopo aver inizializzato le periferiche farà
107 partire il primo processo, \textit{init} che è quello che si incaricherà di
108 far partire tutti i processi successivi, come quello che si occupa di
109 dialogare con la tastiera e lo schermo della console, mettendo a disposizione
110 dell'utente che si vuole collegare un terminale e la stessa \textit{shell} da
111 cui inviare i comandi.
112
113 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
114 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
115 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
116 programma di scrittura o di disegno, in user space.
117
118 Questo significa ad esempio che il sistema di per sé non dispone di primitive
119 per tutta una serie di operazioni (come la copia di un file) che altri sistemi
120 (come Windows) hanno invece al loro interno. Per questo può capitare che
121 alcune operazioni, come quella in esempio, siano implementate come normali
122 programmi.
123
124 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
125 %realizzare un sistema di permessi e controlli che evitano che i programmi
126 %eseguano accessi non autorizzati. 
127
128 Per questo motivo è più corretto parlare di sistema GNU/Linux, in quanto da
129 solo il kernel è assolutamente inutile, quello che costruisce un sistema
130 operativo utilizzabile è la presenza di tutta una serie di librerie e
131 programmi di utilità che permettono di eseguire le normali operazioni che ci
132 si aspetta da un sistema operativo.
133
134
135 \subsection{Chiamate al sistema e librerie di funzioni}
136 \label{sec:intro_syscall}
137
138 Come accennato le interfacce con cui i programmi possono accedere all'hardware
139 vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
140   call}), si tratta di un insieme di routine che un programma può chiamare per
141 le quali viene generata una interruzione e il controllo è passato dal
142 programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie di
143 operazioni interne come la gestione del multitaskin e il l'allocazione della
144 memoria) eseguirà la funzione richiesta in kernel space restituendo i
145 risultati al chiamante.
146
147 Ogni versione unix ha storicamente sempre avuto un certo numero di queste
148 chiamate, che sono riportate nella seconda sezione del \textsl{Manuale della
149   programmazione di unix} (quella che si accede con il comando \texttt{man 2})
150 e linux non fa eccezione. Queste sono poi state codificate da vari standard,
151 che esamineremo brevemente in \secref{sec:intro_standard}.
152
153 Normalmente ciascuna di queste chiamate al sistema viene rimappata in
154 opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
155 C, che oltre alle interfacce alle system call contiene anche tutta una serie
156 di ulteriori funzioni usate comunemente nella programmazione.
157
158 Questo è importante da capire perché programmare in Linux significa anzitutto
159 essere in grado di usare la Libreria Standard del C, in quanto né il kernel né
160 il linguaggio C implementano direttamente operazioni comuni come la
161 allocazione dinamica della memoria, l'input/output bufferizzato o la
162 manipolazione delle stringhe presenti in qualunque programma.
163
164 Per questo in Linux è in effetti GNU/Linux, in quanto una parte essenziale del
165 sistema (senza la quale niente può funzionare) è la realizzazione fatta dalla
166 Free Software Foundation della suddetta libreria (la GNU Standard C Library,
167 in breve \textit{glibc}), in cui sono state implementate tutte le funzioni
168 essenziali definite negli standard POSIX e ANSI C, e che viene utilizzata da
169 qualunque programma.
170
171 Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
172 Manuale di Programmazione di Unix, e sono costruite sulla base delle chiamate
173 al sistema del kernel; è importante avere presente questa distinzione,
174 fondamentale dal punto di vista dell'implementazione, anche se poi nella
175 relizzazione di normali programmi non si hanno differenze pratiche fra l'uso
176 di una funzione di libreria e quello di una chiamata al sistema.
177
178
179 \subsection{Utenti e gruppi, permessi e protezioni}
180 \label{sec:intro_usergroup}
181
182 Unix nasce fin dall'inizio come sistema multiutente, cioè in grado di fare
183 lavorare più persone in contemporanea. Per questo esistono una serie di
184 meccanismi base di sicurezza che non sono previsti in sistemi operativi
185 monoutente.
186
187 Il concetto base è quello di utente (\textit{user}) del sistema, utente che ha
188 dei ben definiti limiti e capacità rispetto a quello che può fare. Sono così
189 previsti una serie di meccanismi per identificare i singoli utenti ed una
190 serie di permessi e protezioni per impedire che utenti diversi possano
191 danneggiarsi a vicenda o danneggiare il sistema.
192
193 Ad ogni utente è dato un nome \textit{username}, che è quello che viene
194 richiesto all'ingresso nel sistema dalla procedura di \textit{login}. Questa
195 procedura si incarica di verificare la identità dell'utente (in genere
196 attraverso la richiesta di una parola d'ordine, anche se sono possibili
197 meccanismi diversi).
198
199 Eseguita la procedura di riconoscimento in genere il sistema manda in
200 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
201 terminale o una interfaccia grafica) che mette a disposizione dell'utente un
202 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
203
204 Ogni utente appartiene anche ad almeno un gruppo (\textit{group}), ma può
205 essere associato a più gruppi, questo permette di gestire i permessi di
206 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
207 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
208
209 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
210 un nome in espresso in caratteri \`e inserita nei due files
211 \texttt{/etc/passwd} e \texttt{/etc/groups}). Questi numeri sono
212 l'\textit{user identifier}, detto in breve \textit{uid} e il \textit{group
213  identifier}, detto in breve \textit{gid} che sono quelli che identificano
214 l'utente di fronte al sistema.
215
216 In questo modo il sistema è in grado di tenere traccia per ogni processo
217 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
218 esso. Inoltre con questo sistema viene anche garantita una forma base di
219 sicurezza interna in quanto anche l'accesso ai file (vedi
220 \secref{sec:fileintr_access_ctrl}) è regolato da questo meccanismo di
221 identificazione.
222
223 Un utente speciale del sistema è \textit{root}, il cui uid è zero. Esso
224 identifica l'amministratore del sistema, che deve essere in grado di fare
225 qualunque operazione; pertanto per l'utente root i meccanismi di controllo
226 descritti in precedenza sono disattivati.
227
228
229 \section{Gli standard di unix e Linux}
230 \label{sec:intro_standard}
231
232
233
234 \subsection{Lo standard ANSI C}
235 \label{sec:intro_ansiC}
236
237
238
239 \subsection{Lo standard POSIX}
240 \label{sec:intro_ansiC}
241
242
243
244
245
246