fornire una base di comprensione mirata a sottolineare le peculiarità del
sistema che sono più rilevanti per quello che riguarda la programmazione.
-Dopo un introduzione sulle caratteristiche principali di un sistema di tipo
-unix passeremo ad illustrare alcuni dei concetti basi dell'architettura di
+Dopo una introduzione sulle caratteristiche principali di un sistema di tipo
+unix passeremo ad illustrare alcuni dei concetti base dell'architettura di
GNU/Linux (che sono comunque comuni a tutti i sistemi \textit{unix-like}) ed
introdurremo alcuni degli standard principali a cui viene fatto riferimento.
-\section{Una panoramica sulla struttura}
+\section{Una panoramica}
\label{sec:intro_unix_struct}
-In questa prima sezione faremo una panoramica sulla struttura di un sistema
-\textit{unix-like} come GNU/Linux. Chi avesse già una conoscenza di questa
-materia può tranquillamente saltare questa sezione.
+In questa prima sezione faremo una breve panoramica sull'architettura del
+sistema. Chi avesse già una conoscenza di questa materia può tranquillamente
+saltare questa sezione.
Il concetto base di un sistema unix-like è quello di un nucleo del sistema (il
cosiddetto \textit{kernel}) a cui si demanda la gestione delle risorse
Fin dall'inizio uno unix si presenta come un sistema operativo
\textit{multitasking}, cioè in grado di eseguire contemporaneamente più
-programmi, e multiutente, in cui é possibile che più utenti siano connessi ad
+programmi, e multiutente, in cui è possibile che più utenti siano connessi ad
una macchina eseguendo più programmi ``in contemporanea'' (in realtà, almeno
per macchine a processore singolo, i programmi vengono eseguiti singolarmente
a rotazione).
caratteristiche dei processori moderni come la gestione hardware della memoria
e la modalità protetta. In sostanza con i processori moderni si può
disabilitare temporaneamente l'uso di certe istruzioni e l'accesso a certe
-zone di memoria fisica. Quello che succede é che il kernel é il solo
+zone di memoria fisica. Quello che succede è che il kernel è il solo
programma ad essere eseguito in modalità privilegiata, con il completo accesso
all'hardware, mentre i programmi normali vengono eseguiti in modalità protetta
(e non possono accedere direttamente alle zone di memoria riservate o alle
soltanto attraverso delle opportune chiamate al sistema che restituiranno il
controllo al kernel.
-La memoria viene sempre gestita del kernel attraverso il meccanismo della
+La memoria viene sempre gestita dal kernel attraverso il meccanismo della
\textsl{memoria virtuale}, che consente di assegnare a ciascun processo uno
spazio di indirizzi ``virtuale'' (vedi \secref{sec:proc_memory}) che il kernel
stesso, con l'ausilio della unità di gestione della memoria, si incaricherà di
Le periferiche infine vengono viste in genere attraverso un'interfaccia
astratta che permette di trattarle come fossero file, secondo il concetto per
cui \textit{everything is a file}, su cui torneremo in dettaglio in
-\capref{cha:files_intro}, (questo non è vero per le interfacce di rete, che
+\capref{cha:file_intro}, (questo non è vero per le interfacce di rete, che
hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto
il lavoro di accesso e gestione a basso livello è effettuato dal kernel).
\section{User space e kernel space}
\label{sec:intro_user_kernel_space}
-Uno dei concetti fondamentale su cui si basa l'architettura dei sistemi unix è
+Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi unix è
quello della distinzione fra il cosiddetto \textit{user space}, che
contraddistingue l'ambiente in cui vengono eseguiti i programmi, e il
-\textit{kernel space} che é l'ambiente in cui viene eseguito il kernel. Ogni
+\textit{kernel space}, che è l'ambiente in cui viene eseguito il kernel. Ogni
programma vede se stesso come se avesse la piena disponibilità della CPU e
della memoria ed è, salvo i meccanismi di comunicazione previsti
dall'architettura, completamente ignaro del fatto che altri programmi possono
Per capire meglio la distinzione fra kernel space e user space si può prendere
in esame la procedura di avvio di un sistema unix; all'avvio il BIOS (o in
generale il software di avvio posto nelle EPROM) eseguirà la procedura di
-avvio del sistema (il cosiddetto \textit{boot}) incaricandosi di caricare il
+avvio del sistema (il cosiddetto \textit{boot}), incaricandosi di caricare il
kernel in memoria e di farne partire l'esecuzione; quest'ultimo, dopo aver
-inizializzato le periferiche farà partire il primo processo, \cmd{init} che è
-quello che a sua volta farà partire tutti i processi successivi,fra i quali
-c'è pure quello che si occupa di dialogare con la tastiera e lo schermo della
-console, e quello che mette a disposizione dell'utente che si vuole collegare
-un terminale e la stessa \textit{shell} da cui inviare i comandi.
+inizializzato le periferiche, farà partire il primo processo, \cmd{init}, che
+è quello che a sua volta farà partire tutti i processi successivi. Fra questi
+ci sarà pure quello che si occupa di dialogare con la tastiera e lo schermo
+della console, e quello che mette a disposizione dell'utente che si vuole
+collegare, un terminale e la \textit{shell} da cui inviare i comandi.
E' da rimarcare come tutto ciò, che usualmente viene visto come parte del
sistema, non abbia in realtà niente a che fare con il kernel, ma sia
effettuato da opportuni programmi che vengono eseguiti, allo stesso modo di un
qualunque programma di scrittura o di disegno, in user space.
-Questo significa ad esempio che il sistema di per sé non dispone di primitive
-per tutta una serie di operazioni (come la copia di un file) che altri sistemi
-(come Windows) hanno invece al loro interno. Pertanto buona parte delle
-operazioni di normale amministrazione di un sistema, come quella in esempio,
-sono implementate come normali programmi.
+Questo significa, ad esempio, che il sistema di per sé non dispone di
+primitive per tutta una serie di operazioni (come la copia di un file) che
+altri sistemi (come Windows) hanno invece al loro interno. Pertanto buona
+parte delle operazioni di normale amministrazione di un sistema, come quella
+in esempio, sono implementate come normali programmi.
%Una delle caratteristiche base di unix \`e perci\`o che \`e possibile
%realizzare un sistema di permessi e controlli che evitano che i programmi
%eseguano accessi non autorizzati.
-Per questo motivo è più corretto parlare di sistema GNU/Linux, in quanto da
-solo il kernel è assolutamente inutile, quello che costruisce un sistema
+Per questo motivo è più corretto parlare di un sistema GNU/Linux, in quanto da
+solo il kernel è assolutamente inutile; quello che costruisce un sistema
operativo utilizzabile è la presenza di tutta una serie di librerie e
programmi di utilità che permettono di eseguire le normali operazioni che ci
si aspetta da un sistema operativo.
Come accennato le interfacce con cui i programmi possono accedere all'hardware
vanno sotto il nome di chiamate al sistema (le cosiddette \textit{system
call}), si tratta di un insieme di funzioni, che un programma può chiamare,
-per le quali viene generata una interruzione processo e il controllo è passato
+per le quali viene generata una interruzione processo ed il controllo passa
dal programma al kernel. Sarà poi quest'ultimo che (oltre a compiere una serie
-di operazioni interne come la gestione del multitasking e il l'allocazione
-della memoria) eseguirà la funzione richiesta in kernel space restituendo i
+di operazioni interne come la gestione del multitasking e l'allocazione della
+memoria) eseguirà la funzione richiesta in \textit{kernel space} restituendo i
risultati al chiamante.
Ogni versione unix ha storicamente sempre avuto un certo numero di queste
chiamate, che sono riportate nella seconda sezione del \textsl{Manuale della
- programmazione di unix} (quella che si accede con il comando \cmd{man 2
- nome}) e GNU/Linux non fa eccezione. Queste sono poi state codificate da vari
-standard, che esamineremo brevemente in \secref{sec:intro_standard}.
+ programmazione di unix} (quella cui si accede con il comando \cmd{man 2
+ nome}) e GNU/Linux non fa eccezione. Queste sono poi state codificate da
+vari standard, che esamineremo brevemente in \secref{sec:intro_standard}.
Normalmente ciascuna di queste chiamate al sistema viene rimappata in
opportune funzioni con lo stesso nome definite dentro la Libreria Standard del
-C, che oltre alle interfacce alle system call contiene anche tutta una serie
-di ulteriori funzioni usate comunemente nella programmazione.
+C, che, oltre alle interfacce alle system call, contiene anche tutta una serie
+di ulteriori funzioni, comunemente usate nella programmazione.
Questo è importante da capire perché programmare in Linux significa anzitutto
-essere in grado di usare la Libreria Standard del C, in quanto né il kernel né
-il linguaggio C implementano direttamente operazioni comuni come la
+essere in grado di usare la Libreria Standard del C, in quanto né il kernel,
+né il linguaggio C, implementano direttamente operazioni comuni come la
allocazione dinamica della memoria, l'input/output bufferizzato o la
-manipolazione delle stringhe presenti in qualunque programma.
+manipolazione delle stringhe, presenti in qualunque programma.
Anche per questo in Linux è in effetti GNU/Linux, in quanto una parte
essenziale del sistema (senza la quale niente può funzionare) è la
realizzazione fatta dalla Free Software Foundation della suddetta libreria (la
-GNU Standard C Library, in breve \textit{glibc}), in cui sono state
+GNU Standard C Library, detta in breve \textit{glibc}), in cui sono state
implementate tutte le funzioni essenziali definite negli standard POSIX e ANSI
C, che vengono utilizzate da qualunque programma.
Le funzioni di questa libreria sono quelle riportate dalla terza sezione del
-Manuale di Programmazione di Unix (cioè accessibili con il comando \cmd{man 2
- nome}), e sono costruite sulla base delle chiamate al sistema del kernel; è
+Manuale di Programmazione di Unix (cioè accessibili con il comando \cmd{man 3
+ nome}) e sono costruite sulla base delle chiamate al sistema del kernel; è
importante avere presente questa distinzione, fondamentale dal punto di vista
-dell'implementazione, anche se poi nella realizzazione di normali programmi
+dell'implementazione, anche se poi, nella realizzazione di normali programmi,
non si hanno differenze pratiche fra l'uso di una funzione di libreria e
quello di una chiamata al sistema.
Linux, come gli altri unix, nasce fin dall'inizio come sistema multiutente,
cioè in grado di fare lavorare più persone in contemporanea. Per questo
-esistono una serie di meccanismi di sicurezza che non sono previsti in sistemi
-operativi monoutente e che occorre tenere presente.
+esistono una serie di meccanismi di sicurezza, che non sono previsti in
+sistemi operativi monoutente, e che occorre tenere presente.
-Il concetto base è quello di utente (\textit{user}) del sistema, utente che ha
-dei ben definiti limiti e capacità rispetto a quello che può fare. Sono così
-previsti una serie di meccanismi per identificare i singoli utenti ed una
-serie di permessi e protezioni per impedire che utenti diversi possano
+Il concetto base è quello di utente (\textit{user}) del sistema, le cui
+capacità rispetto a quello che può fare sono sottoposte a ben precisi limiti.
+Sono così previsti una serie di meccanismi per identificare i singoli utenti
+ed una serie di permessi e protezioni per impedire che utenti diversi possano
danneggiarsi a vicenda o danneggiare il sistema.
Ad ogni utente è dato un nome \textit{username}, che è quello che viene
richiesto all'ingresso nel sistema dalla procedura di \textit{login}. Questa
-procedura si incarica di verificare la identità dell'utente (in genere
+procedura si incarica di verificare la identità dell'utente, in genere
attraverso la richiesta di una parola d'ordine, anche se sono possibili
meccanismi diversi\footnote{Ad esempio usando la libreria PAM
(\textit{Pluggable Autentication Methods}) è possibile astrarre
definendo gruppi di lavoro, di accesso a determinate risorse, etc.
L'utente e il gruppo sono identificati da due numeri (la cui corrispondenza ad
-un nome in espresso in caratteri è inserita nei due files \file{/etc/passwd}
-e \file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto
-in breve \acr{uid} e il \textit{group identifier}, detto in breve \acr{gid}
-che sono quelli che poi vengono usati dal kernel per riconoscere l'utente.
+un nome espresso in caratteri è inserita nei due files \file{/etc/passwd} e
+\file{/etc/groups}). Questi numeri sono l'\textit{user identifier}, detto in
+breve \acr{uid}, e il \textit{group identifier}, detto in breve \acr{gid}, che
+sono quelli che poi vengono usati dal kernel per identificare l'utente.
In questo modo il sistema è in grado di tenere traccia per ogni processo
dell'utente a cui appartiene ed impedire ad altri utenti di interferire con
\secref{sec:file_access_control}) è regolato da questo meccanismo di
identificazione.
-Infine in ogni unix è presente un utente speciale privilegiato, di norma
-chiamato \textit{root}, il cui \acr{uid} è zero. Esso identifica
-l'amministratore del sistema, che deve essere in grado di fare qualunque
-operazione; per l'utente \textit{root} infatti i meccanismi di controllo
-descritti in precedenza sono disattivati\footnote{i controlli infatti vengono
- sempre eseguiti da un codice del tipo \texttt{if (uid) \{ ... \}}}.
+Infine in ogni unix è presente un utente speciale privilegiato, il cosiddetto
+\textit{superuser}, il cui username è di norma \textit{root}, ed il cui
+\acr{uid} è zero. Esso identifica l'amministratore del sistema, che deve
+essere in grado di fare qualunque operazione; per l'utente \textit{root}
+infatti i meccanismi di controllo descritti in precedenza sono
+disattivati\footnote{i controlli infatti vengono sempre eseguiti da un codice
+ del tipo \texttt{if (uid) \{ ... \}}}.
\section{Gli standard di unix e GNU/Linux}
\label{sec:intro_standard}
-In questa sezione prenderemo in esame alcune caratteristiche generali del
-sistema e gli standard adottati per le funzioni, i prototipi, gli errori, i
-tipi di dati.
+In questa sezione faremo una breve panoramica relativa ai vari standard che
+nel tempo sono stati formalizzati da enti, associazioni, consorzi e
+organizzazioni varie al riguardo del sistema o alle caratteristiche che si
+sono stabilite come standard di fatto in quanto facenti parte di alcune
+implementazioni molto diffuse come BSD o SVr4.
-\subsection{Prototipi e puntatori}
-\label{sec:intro_function}
+Ovviamente prenderemo in considerazione solo gli aspetti riguardanti
+interfacce di programmazione e le altre caratteristiche di un sistema
+unix-like ed in particolare a come e in che modo essi sono supportati da
+GNU/Linux (sia per quanto riguarda il kernel che le \acr{glibc}).
\subsection{Lo standard ANSI C}
Lo standard ANSI C è stato definito nel 1989 dall'\textit{American National
Standard Institute}, come standard del linguaggio C ed è stato
successivamente adottatto dalla \textit{International Standard Organisation}
-come standard internazionale con la sigla ISO/IEC 9899:1990.
+come standard internazionale con la sigla ISO/IEC 9899:1990, e va anche sotto
+il nome di standard ISO C.
Scopo dello standard è quello di garantire la portabilità dei programmi C fra
sistemi operativi diversi, ma oltre alla sintassi e alla semantica del
linguaggio C (operatori, parole chiave, tipi di dati) lo standard prevede
-anche una libreria di funzioni standard che devono poter essere implementate
-su qualunque sistema operativo.
-
-Linux, come molti unix moderni, provvede la compatibilità con questo standard,
-fornendo le funzioni di libreria da esso previste; queste sono dichiarate in
-quindici header files, uno per ciascuna delle quindici aree in cui è stata
-suddivisa la libreria. In \ntab\ si sono riportati questi header, insieme a
-quelli definiti negli altri standard descritti nelle sezioni successive.
-
-\subsection{Lo standard POSIX}
+anche una libreria di funzioni che devono poter essere implementate su
+qualunque sistema operativo.
+
+Per questo motivo, anche se lo standard non ha alcun riferimento ad un sistema
+di tipo unix, GNU/Linux (per essere precisi le glibc), come molti unix
+moderni, provvede la compatibilità con questo standard, fornendo le funzioni
+di libreria da esso previste. Queste sono dichiarate in quindici header files
+(anch'essi provvisti dalla \acr{glibc}), uno per ciascuna delle quindici aree
+in cui è stata suddivisa una libreria standard. In \ntab\ si sono riportati
+questi header, insieme a quelli definiti negli altri standard descritti nelle
+sezioni successive.
+
+In realtà \acr{glibc} ed i relativi header file definiscono un insieme di
+funzionalità in cui sono incluse come sottoinsieme anche quelle previste dallo
+standard ANSI C. È possibile ottenere una conformità stretta allo standard
+(scartando le funzionalità adizionali) usando il \cmd{gcc} con l'opzione
+\cmd{-ansi}. Questa opzione istruisce il compilatore a definire nei vari
+header file soltanto le funzionalità previste dallo standard ANSI C e a non
+usare le varie estensioni al linguaggio e al preprocessore da esso supportate.
+
+
+\subsection{Lo standard IEEE -- POSIX}
\label{sec:intro_posix}
-In realtà POSIX è una famiglia di standard diversi, il nome, suggerito da
+Uno standard più attinente al sistema nel suo complesso (e che concerne sia il
+kernel che le librerie e` lo standard POSIX. Esso prende origine dallo
+standard ANSI C, che contiene come sottoinsieme, prevedendo ulteriori capacità
+per le funzioni in esso definite, ed aggiungendone di nuove. Le estensioni
+principali sono
+
+In realtà POSIX è una famiglia di standard diversi, il cui nome, suggerito da
Richard Stallman, sta per \textit{Portable Operating System Interface}, ma la
X finale denuncia la sua stretta relazione con i sistemi unix. Esso nasce dal
lavoro dell'IEEE (\textit{Institute of Electrical and Electronics Engeneers})
-che ne ha prodotto un primo una prima versione, nota come IEEE 1003.1-1988,
-mirante a standardizzare l'interfaccia con il sistema operativo.
+che ne produsse una prima versione, nota come IEEE 1003.1-1988, mirante a
+standardizzare l'interfaccia con il sistema operativo.
Ma gli standard POSIX non si limitano alla standardizzazione delle funzioni di
libreria, e in seguito sono stati prodotti anche altri standard per la shell e
le utilities di sistema (1003.2), per le estensioni realtime e per i thread
-(1003.1d e 1003.1c) e molti altri.
+(1003.1d e 1003.1c) e vari altri.
-Benchè lo standard POSIX sia basato sui sistemi unix esso definisce comunque
-una interfaccia e non fa riferimento ad una specifica implementazione (per cui
-esiste ad esempio anche una implementazione di questo standard pure sotto
-Windows NT). Lo standard si è evoluto nel tempo ed una nuova versione (quella
+Benché lo standard POSIX sia basato sui sistemi unix esso definisce comunque
+una interfaccia e non fa riferimento ad una specifica implementazione (ad
+esempio esiste anche una implementazione di questo standard pure sotto Windows
+NT). Lo standard si è evoluto nel tempo ed una versione più aggiornata (quella
che viene normalmente denominata POSIX.1) è stata rilasciata come standard
-internazionale con la sigla ISO/IEC 9945-1:1990.
+internazionale con la sigla ISO/IEC 9945-1:1996.
+
+Le \acr{glibc} implementano tutte le funzioni definite nello standard POSIX.1,
+e Linux;
\subsection{Lo standard X/Open -- XPG3}
\label{sec:intro_xopen}
-Il consorzio X/Open nasce come consorzio di venditori di sistemi unix, che nel
-1989 produsse una voluminosa guida chiamata \textit{X/Open Portability Guide,
- Issue 3} al cui interno definiva una ulteriore standardizzazione
-dell'interfaccia ad un sistema unix.
+Il consorzio X/Open nacque nel 1984 come consorzio di venditori di sistemi
+unix per giungere ad una armonizzazione dele varie implementazioni di unix.
+Per far questo iniziò a pubblicare una serie di documentazioni e specifiche
+sotto il nome di \textit{X/Open Portability Guide} (che chiameremo XPGn).
+
+
+Nel 1989 produsse una terza versione della sua guida particolarmente
+voluminosa (la \textit{X/Open Portability Guide, Issue 3}), che venne presa
+come riferimento da vari produttori, e al cui interno definiva una ulteriore
+standardizzazione dell'interfaccia ad un sistema unix.
Questo standard, detto anche XPG3 dal nome della suddetta guida, è sempre
-basato sullo standard POSIX.1, ma prevede una serie di funzionalità
-aggiuntive.
+basato sullo standard POSIX.1, ma prevede una serie di funzionalità aggiuntive
+fra cui le specifiche delle API per l'interfaccia grafica (X11).
+
+Nel 1992 lo standard venne rivisto con una nuova versione della guida (XPG4)
+che aggiungeva l'interfaccia XTI (\textit{X transport Interface}) mirante a
+soppiantare (senza molto successo) quella l'interfaccia dei socket derivata da
+BSD.
+
+
+\subsection{Gli standard UNIX -- Open Group}
+\label{sec:intro_opengroup}
-Il consorzio
+Nel 1993 il marchi Unix passò di proprietà dalla Novell (che a sua volta lo
+aveva comprato dalla AT\&T) al consorzio X/Open, che iniziò a pubblicare le
+sue specifiche sotto il nome di \textit{Single UNIX Specification},
-\subsection{Valori e limiti del sistema}
-\label{sec:intro_limits}
+
+
+
+\subsection{Il comportamento standard del \cmd{gcc}}
+\label{sec:intro_gcc_behaviuor}
+
+
+
+
+
+\subsection{Prototipi e puntatori}
+\label{sec:intro_function}
\subsection{Tipi di dati primitivi}
\label{sec:intro_data_types}
+