intro.tex

   1 \chapter{Introduzione}
   2 \label{cha:intro_unix}
   3
   4 In questo primo capitolo sarà fatta un'introduzione ai contetti generali su
   5 cui è basato un sistema di tipo unix, per fornire una base di comprensione
   6 mirata a sottolinearne le peculiarità che saranno poi importanti per quello
   7 che rigarda la programmazione; in particolare faremo una panoramica sulla
   8 struttura di un sistema \textit{unix-like} come Linux.
   9
  10 Chi avesse già una conoscenza di questa materia può tranquillamente saltare
  11 il capitolo.
  12
  13 \section{La struttura di un sistema Unix}
  14 \label{sec:intro_unix_struct}
  15
  16 Il concetto base di unix é quello di un nucleo del sistema (il cosiddetto
  17 \textit{kernel}) a cui si demanda la gestione delle risorse essenziali (la
  18 CPU, la memoria, le periferiche); mentre tutto il resto, quindi anche la parte
  19 che prevede l'interazione con l'utente, deve venire realizzato tramite
  20 programmi eseguiti dal kernel e che accedano alle risorse hardware tramite
  21 delle richieste a quest'ultimo.
  22
  23 Fin dall'inizio unix si presenta come un sistema operativo
  24 \textit{multitasking}, cioé in grado di eseguire contemporaneamente più
  25 programmi, e multiutente, in cui é possibile che più utenti siano connessi ad
  26 una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
  27 per macchine a processore singolo, i programmi vengono eseguiti singolarmente
  28 a rotazione).
  29
  30 % Questa e' una distinzione essenziale da capire,
  31 %specie nei confronti dei sistemi operativi successivi, nati per i personal
  32 %computer (e quindi per un uso personale), sui quali l'hardware (allora
  33 %limitato) non consentiva la realizzazione di un sistema evoluto come uno unix.
  34
  35 Gli unix più recenti, come linux, sono stati realizzati usando alcune
  36 caratteristiche dei processori moderni come la gestione hardware della memoria
  37 e la modalità protetta. In sostanza con i processori moderni si può
  38 disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
  39 zone di memoria fisica.  Quello che succede é che il kernel é il solo
  40 programma ad essere eseguito in modalità privilegiata, con il completo accesso
  41 all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
  42 (e non possono accedere direttamente alle zone di memoria riservate, al kernel
  43 o alle porte di input/output).
  44
  45 Una parte del kernel, lo \textit{scheduler}, si occupa di stabilire, ad
  46 intervalli fissi e sulla base di un opportuno calcolo delle priorità, quale
  47 ``processo'' (vedi \capref{cha:process}) deve essere posto in esecuzione (il
  48 cosidetto \textit{prehemptive scheduling}), e questo verrà comunque eseguito
  49 in modelità protetta; quando necessario il processo potrà accedere alle
  50 risorse hardware soltanto attraverso delle opportune chiamate al sistema
  51 (\textit{system call}) con un'interfaccia ben definita e standardizzata che
  52 restituiranno il controllo al kernel.
  53
  54 La memoria viene sempre gestita del kernel attraverso il meccanismo della
  55 memoria virtuale, che consente di assegnare a ciascun processo uno spazio di
  56 indirizzi ``virtuale'' che il kernel stesso, con l'ausilio della unità di
  57 gestione della memoria, si incaricherà di rimappare automaticamente sulla
  58 memoria disponibile, salvando su disco (nella cosiddetta \textit{swap}) quando
  59 necessario le pagine di memoria in eccedenza.
  60
  61 Le periferiche infine vengono viste in genere attraverso un'interfaccia
  62 astratta che permette di trattarle come fossero file. secondo il concetto per
  63 cui \textit{everything is a file}, vedi \capref{cha:files_intro}, (questo
  64 non è vero per le interfacce di rete, ma resta valido il concetto generale che
  65 tutto il lavoro di accesso e gestione a basso livello è effettuato dal
  66 kernel), mentre ai programmi vengono fornite solo delle routine di
  67 interfacciamento; essendo l'argomento principale di cui tratteremo, di esse
  68 parleremo in abbondanza nei capitoli successivi.
  69
  70
  71 \section{User space e kernel space}
  72 \label{sec:intro_userkernel}
  73
  74 Questa architettura fa sì che nei sistemi unix esista una distinzione
  75 essenziale fra il cosiddetto \textit{user space}, che contraddistingue
  76 l'ambiente in cui vengono eseguiti i programmi, e il \textit{kernel space} che
  77 é l'ambiente in cui viene eseguito il kernel. Ogni programma gira come se
  78 avesse la piena disponibilità della macchina e della memoria ed è, salvo i
  79 meccanismi di comunicazione previsti dall'architettura (che esamineremo nel
  80 \capref{cha:IPC}) completamente ignaro del fatto che altri programmi possono
  81 essere messi in esecuzione dal kernel.
  82
  83 In questo non è possibile ad un singolo programma disturbare l'azione di un
  84 altro programma o del sistema e questo è il principale motivo della stabilità
  85 di un sistema unix nei confronti di altri sistemi in cui i processi non hanno
  86 di questi limiti, o che vengono per vari motivi eseguiti al livello del
  87 kernel.
  88
  89 Pertanto deve essere chiaro a chi programma in unix che l'accesso diretto
  90 all'hardware non può avvenire se non all'interno del kernel, al di fuori dal
  91 kernel il programmatore deve usare le opportune interfacce che quest'ultimo
  92 fornisce allo user space.
  93
  94 In genere queste vanno sotto il nome di chiamate al sistema (le cosiddette
  95 \textit{system call}), cioè un insieme di routine che un programma può
  96 chiamare per le quali viene generata una interruzione del medesimo e il
  97 controllo è passato dal programma al kernel, il quale (oltre a fare una serie
  98 di altre cose come controllare a quale processo tocca essere messo in
  99 esecuzione) eseguirà la funzione richiesta in kernel space passando indietro i
 100 risultati.
 101
 102 È da chiarire poi che di solito i programmi non chiamano direttamente le
 103 singole system call, ma usano un insieme di funzioni standard (definite dallo
 104 standard internazionale POSIX1003.a(?)) che sono comuni a tutti gli unix.
 105
 106
 107 \section{Il kernel e il resto}
 108 \label{sec:intro_kernandlib}
 109
 110 Per capire meglio la distinzione fra kernel space e user space si può prendere
 111 in esame la procedura di avvio di un sistema unix; all'avvio il bios (o in
 112 generale il software di avvio posto nelle eprom) eseguirà il \textit{boot}
 113 incarichandosi di caricare il kernel in memoria e di farne partire
 114 l'esecuzione; quest'ultimo, dopo aver inizializzato le periferiche farà
 115 partire il primo processo, \textit{init} che è quello che si incaricherà di
 116 far partire tutti i processi successivi, come quello che si occupa di
 117 dialogare con la tastiera e lo schermo della console, mettendo a disposizione
 118 dell'utente che si vuole collegare un terminale e la stessa \textit{shell} da
 119 cui inviare i comandi.
 120
 121 E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
 122 sistema, non abbia in realtà niente a che fare con il kernel, ma sia
 123 effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
 124 programma di scrittura o di disegno, in user space.
 125
 126 Questo significa ad esempio che il sistema di per sé non dispone di primitive
 127 per tutta una serie di operazioni (come la copia di un file) che altri sistemi
 128 (come windows) hanno invece al loro interno. Per questo può capitare che
 129 alcune operazioni, come quella in esempio, siano implementate come normali
 130 programmi.
 131
 132 %Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
 133 %realizzare un sistema di permessi e controlli che evitano che i programmi
 134 %eseguano accessi non autorizzati.
 135
 136 Per questo motivo è più corretto parlare di sistema GNU/Linux, in quanto da
 137 solo il kernel è assolutamente inutile, quello che costruisce un sistema
 138 operativo utilizzabile è la presenza di tutta una serie di librerie e
 139 programmi di utilità che permettono di eseguire le normali operazioni che ci
 140 si aspetta da un sistema operativo.
 141
 142 Questo è importante anche dal punto di vista della programmazione, infatti
 143 programmare in linux significa anzitutto essere in grado di usare la Libreria
 144 Standard del C, in quanto né il kernel né il linguaggio C implementano
 145 direttamente operazioni comuni come la gestione della memoria, l'input/output
 146 o la manipolazione delle stringhe presenti in qualunque programma.
 147
 148 Per questo in linux una parte essenziale del sistema (senza la quale nulla
 149 funziona) è la realizzazione fatta dalla FSF della suddetta libreria (la
 150 \textit{glibc}), in cui sono state implementate tutte le funzioni essenziali
 151 definite negli standard POSIX e ANSI C, che viene utilizzata da qualunque
 152 programma.
 153
 154
 155 \section{Utenti e gruppi, permessi e protezioni}
 156 \label{sec:intro_usergroup}
 157
 158 Unix nasce fin dall'inizio come sistema multiutente, cioè in grado di fare
 159 lavorare più persone in contemporanea. Per questo esistono una serie di
 160 meccanismi base di sicurezza che non sono previsti in sistemi operativi
 161 monoutente.
 162
 163 Il concetto base è quello di utente (\textit{user}) del sistema, utente che ha
 164 dei ben definiti limiti e capacità rispetto a quello che può fare. Sono così
 165 previsti una serie di meccanismi per identificare i singoli utenti ed uan
 166 serie di permessi e protezioni per impedire che utenti diversi possano
 167 danneggiarsi a vicenda o danneggiare il sistema.
 168
 169 Ad ogni utente è dato un nome \textit{username}, che è quello che viene
 170 richiesto all'ingresso nel sistema dalla procedura di \textit{login}. Questa
 171 procedura si incarica di verificare la identità dell'utente (in genere
 172 attraverso la richiesta di una parola d'ordine, anche se sono possibili
 173 meccanismi diversi).
 174
 175 Eseguita la procedura di riconoscimento in genere il sistema manda in
 176 esecuzione un programma di interfaccia (che può essere la \textit{shell} su
 177 terminale o una interfaccia grafica) che mette a disposizione dell'utente un
 178 meccanismo con cui questo può impartire comandi o eseguire altri programmi.
 179
 180 Ogni utente appartiene anche ad almeno un gruppo (\textit{group}), ma può
 181 essere associato a più gruppi, questo permette di gestire i permessi di
 182 accesso ai file e quindi anche alle periferiche, in maniera più flessibile,
 183 definendo gruppi di lavoro, di accesso a determinate risorse, etc.
 184
 185 L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
 186 un nome in espresso in caratteri \`e inserita nei due files
 187 \texttt{/etc/passwd} e \texttt{/etc/groups}). Questi numeri sono
 188 l'\textit{user identifier}, detto in breve \textit{uid} e il \textit{group
 189  identifier}, detto in breve \textit{gid} che sono quelli che identificano
 190 l'utente di fronte al sistema.
 191
 192 In questo modo il sistema è in grado di tenere traccia per ogni processo
 193 dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
 194 esso. Inoltre con questo sistema viene anche garantita una forma base di
 195 sicurezza interna in quanto anche l'accesso ai file (vedi
 196 \secref{sec:fileintr_access_ctrl}) è regolato da questo meccanismo di
 197 identificazione.
 198
 199 Un utente speciale del sistema è \textit{root}, il cui uid è zero. Esso
 200 identifica l'amministratore del sistema, che deve essere in grado di fare
 201 qualunque operazione; pertanto per l'utente root i meccanismi di controllo
 202 descritti in precedenza sono disattivati.
 203
 204
 205
 206