Finito asyncronous I/O, iniziato mmap.
[gapil.git] / intro.tex
index 6d91ca0ff2f181706721af0c1f7f674add4ddf5b..bf2429d5dab145420dbb9d951f1409fd8dc06b2f 100644 (file)
--- a/intro.tex
+++ b/intro.tex
@@ -1,6 +1,6 @@
 %% intro.tex
 %%
-%% Copyright (C) 2000-2012 Simone Piccardi.  Permission is granted to
+%% Copyright (C) 2000-2015 Simone Piccardi.  Permission is granted to
 %% copy, distribute and/or modify this document under the terms of the GNU Free
 %% Documentation License, Version 1.1 or any later version published by the
 %% Free Software Foundation; with the Invariant Sections being "Un preambolo",
@@ -242,23 +242,26 @@ comando \cmd{man 2 <nome>}, ed anche Linux non fa eccezione. Queste
 \textit{system call} sono poi state codificate da vari standard, che
 esamineremo brevemente in sez.~\ref{sec:intro_standard}.
 
-Normalmente ciascuna chiamata al sistema fornita dal kernel viene associata ad
-una funzione con lo stesso nome definita all'interno della libreria
+Normalmente ciascuna \textit{system call} fornita dal kernel viene associata
+ad una funzione con lo stesso nome definita all'interno della libreria
 fondamentale del sistema, quella che viene chiamata \textsl{Libreria Standard
   del C} (\textit{C Standard Library}) in ragione del fatto che il primo
 kernel Unix e tutti i programmi eseguiti su di esso vennero scritti in C,
-usando le librerie di questo linguaggio. Questa libreria, oltre alle
-interfacce delle \textit{system call}, contiene anche tutta una serie di
-ulteriori funzioni di utilità che vengono comunemente usate nella
-programmazione e sono definite nei vari standard che documentano le interfacce
-di programmazione di un sistema unix-like.
-
-Questo concetto è importante da tener presente perché programmare in Linux
-significa anzitutto essere in grado di usare le funzioni fornite dalla
-\textsl{Libreria Standard del C}, in quanto né il kernel, né il linguaggio C
-implementano direttamente operazioni ordinarie come l'allocazione dinamica
-della memoria, l'input/output bufferizzato sui file o la manipolazione delle
-stringhe, che sono comunemente usate da qualunque programma.
+usando le librerie di questo linguaggio. In seguito faremo riferimento alle
+funzioni di questa libreria che si interfacciano alle \textit{system call}
+come ``\textsl{funzioni di sistema}''.
+
+Questa libreria infatti, oltre alle interfacce delle \textit{system call},
+contiene anche tutta una serie di ulteriori funzioni di utilità che vengono
+comunemente usate nella programmazione e sono definite nei vari standard che
+documentano le interfacce di programmazione di un sistema unix-like. Questo
+concetto è importante da tener presente perché programmare in Linux significa
+anche essere in grado di usare le funzioni fornite dalla \textsl{Libreria
+  Standard del C}, in quanto né il kernel, né il linguaggio C implementano
+direttamente operazioni ordinarie come l'allocazione dinamica della memoria,
+l'input/output bufferizzato sui file o la manipolazione delle stringhe, la
+matematica in virgola mobile, che sono comunemente usate da qualunque
+programma.
 
 Tutto ciò mette nuovamente in evidenza il fatto che nella stragrande
 maggioranza dei casi si dovrebbe usare il nome GNU/Linux in quanto una parte
@@ -340,7 +343,7 @@ la cui corrispondenza ad un nome espresso in caratteri è inserita nei due file
 \conffile{/etc/passwd} e \conffile{/etc/group}.\footnote{in realtà negli
   sistemi più moderni, come vedremo in sez.~\ref{sec:sys_user_group} queste
   informazioni possono essere mantenute, con l'uso del
-  \itindex{Name~Service~Switch} \textit{Name Service Switch}, su varie
+  \itindex{Name~Service~Switch~(NSS)} \textit{Name Service Switch}, su varie
   tipologie di supporti, compresi server centralizzati come LDAP.}  Questi
 identificativi sono l'\textit{user identifier}, detto in breve
 \textsl{user-ID}, ed indicato dall'acronimo \ids{UID}, e il \textit{group
@@ -397,9 +400,10 @@ programmi delle opportune \textit{system call} che consentano di leggere e
 scrivere il contenuto. Tutto ciò ha due aspetti: il primo è che il kernel, per
 il concetto dell'\textit{everything is a file}, deve fornire una interfaccia
 che consenta di operare sui file, sia che questi corrispondano ai normali file
-di dati, sia che siano quei file speciali (i cosiddetti
-\index{file!di~dispositivo} file di dispositivo, o \textit{device file}) che
-permettono di accedere alle periferiche.
+di dati, o ai cosiddetti \index{file!speciali} ``\textsl{file speciali}'',
+come \index{file!di~dispositivo} i file di dispositivo (o \textit{device
+  file}) che permettono di accedere alle periferiche o le fifo ed i socket che
+forniscono funzionalità di comunicazione fra processi.
 
 Il secondo aspetto è che per poter utilizzare dei normali file di dati il
 kernel deve provvedere ad organizzare e rendere accessibile in maniera
@@ -474,7 +478,7 @@ altrettante directory del filesystem radice, su quelli che vengono chiamati
 \index{mount~point} \textit{mount point}.  Questo comunque avverrà sempre in
 un secondo tempo, in genere a cura dei programmi eseguiti nella procedura di
 inizializzazione del sistema, grazie alle funzioni che tratteremo in
-sez.~\ref{sec:sys_file_config}.
+sez.~\ref{sec:filesystem_mounting}.
 
 
 \subsection{La risoluzione del nome di file e directory}
@@ -492,22 +496,26 @@ chiamato il suo \textit{pathname},\footnote{il manuale della \acr{glibc}
   di \textit{filename} e di componente per il nome del file all'interno della
   directory. Non seguiremo questa scelta dato che l'uso della parola
   \textit{pathname} è ormai così comune che mantenerne l'uso è senz'altro più
-  chiaro dell'alternativa proposta.} vale a dire tramite il percorso che si
-deve fare per accedere al file a partire da una certa ``\textit{directory}''.
+  chiaro dell'alternativa proposta.} vale a dire tramite il
+``\textsl{percorso}'' (nome che talvolta viene usato come traduzione di
+\textit{pathname}) che si deve fare per accedere al file a partire da una
+certa ``\textit{directory}''.
 
-Una directory in realta è anch'essa un file, nel senso che è anch'essa un
+Una directory in realtà è anch'essa un file, nel senso che è anch'essa un
 oggetto di un filesystem, solo che è un file particolare che il kernel
 riconosce appositamente come tale per poterlo utilizzare come directory. Il
 suo scopo è quello di contenere una lista di nomi di file e le informazioni
-che associano ciascuno di questi nomi al relativo contenuto.
+che associano ciascuno di questi nomi al relativo contenuto (torneremo su
+questo in sez.~\ref{sec:file_arch_func}).
 
 Dato che questi nomi possono corrispondere ad un qualunque altro oggetto del
 filesystem, compresa un'altra directory, si ottiene naturalmente
 un'organizzazione ad albero inserendo nomi di directory dentro altre
 directory.  All'interno dello stesso albero si potranno poi inserire anche
-tutti gli altri oggetti previsti l'interfaccia del VFS (su cui torneremo in
-sez.~\ref{sec:file_file_types}), come le fifo, i link, i socket e gli stessi
-\index{file!di~dispositivo} file di dispositivo.
+tutti gli altri oggetti previsti l'interfaccia del
+\itindex{Virtual~File~System} VFS (su cui torneremo in
+sez.~\ref{sec:file_file_types}), come le fifo, i collegamenti simbolici, i
+socket e gli stessi \index{file!di~dispositivo} file di dispositivo.
 
 La convenzione usata nei sistemi unix-like per indicare i \textit{pathname}
 dei file è quella di usare il carattere ``\texttt{/}'' come separatore fra i
@@ -515,30 +523,44 @@ nomi che indicano le directory che lo compongono. Dato che la directory radice
 sta in cima all'albero, essa viene indicata semplicemente con il
 \textit{pathname} \file{/}.
 
+\itindbeg{pathname~resolution}
+
 Un file può essere indicato rispetto ad una directory semplicemente
 specificandone il nome, il manuale della \acr{glibc} chiama i nomi contenuti
-nelle directory \textsl{componenti} (in inglese \textit{file name
-  components}), noi li chiameremo più semplicemente \textsl{nomi} o
-\textsl{voci}. Il procedimento con cui dato un \textit{pathname} si individua
-il file a cui esso fa riferimento è chiamato risoluzione del nome
-(\textit{filename resolution} o \textit{pathname resolution}).
-
-La risoluzione viene fatta esaminando il \textit{pathname} da sinistra a
-destra e localizzando ogni nome nella directory indicata dal nome precedente
-usando il carattere ``\texttt{/}'' come separatore. Nel caso si indichi un
-nome vuoto il costrutto ``\texttt{//}'' viene considerato equivalente a
-``\texttt{/}''. Ovviamente perché il procedimento funzioni occorre che i nomi
-indicati come directory esistano e siano effettivamente directory, inoltre i
-permessi (si veda sez.~\ref{sec:file_access_control}) devono consentire
-l'accesso all'intero \textit{pathname}.
+nelle directory ``componenti'' (in inglese \textit{file name components}), noi
+li chiameremo più semplicemente \textsl{nomi} o \textsl{voci}, riservando la
+parola \textsl{componenti} ai nomi che, separati da una ``\texttt{/}'',
+costituiscono il \textit{pathname}. Questi poi dovranno corrispondere, perché
+il \textit{pathname} sia valido, a voci effettivamente presenti nelle
+directory, ma non è detto che un \textit{pathname} debba per forza risultare
+valido.  
+
+Il procedimento con cui dato un \textit{pathname} si individua il file a cui
+esso fa riferimento, è chiamato \textsl{risoluzione del percorso}
+(\textit{filename resolution} o \textit{pathname resolution}). Lo stesso
+procedimento ci può anche dire che il \textit{pathname} usato non è valido.
+La risoluzione viene eseguita esaminando il \textit{pathname} da sinistra a
+destra e localizzando ogni componente dello stesso come nome in una directory
+a partire dalla directory iniziale, usando il carattere ``\texttt{/}'' come
+separatore per scendere dall'una all'altra. Nel caso si indichi un componente
+vuoto il costrutto ``\texttt{//}'' viene considerato equivalente a
+``\texttt{/}''.
+
+Ovviamente perché la risoluzione abbia successo occorre che i componenti
+intermedi esistano e siano effettivamente directory, e che il file o la
+directory indicata dall'ultimo componente esista.  Inoltre i permessi relativi
+alle directory indicate nel \textit{pathname} (torneremo su questo
+sez.~\ref{sec:file_access_control}) dovranno consentire l'accesso all'intero
+\textit{pathname}.
 
 Se il \textit{pathname} comincia con il carattere ``\texttt{/}'' la ricerca
 parte dalla directory radice del processo. Questa, a meno di non avere
 eseguito una \func{chroot} (funzione su cui torneremo in
 sez.~\ref{sec:file_chroot}) è la stessa per tutti i processi ed equivale alla
-directory radice dell'albero dei file; in questo caso si parla di un
-\textsl{pathname assoluto} \itindsub{pathname}{assoluto}.  Altrimenti la
-ricerca parte dalla directory di lavoro corrente del processo (su cui
+directory radice dell'albero dei file montata dal kernel all'avvio del
+sistema; in questo caso si parla di un \textsl{pathname assoluto}
+\itindsub{pathname}{assoluto}.  Altrimenti la ricerca parte dalla
+\index{directory~di~lavoro} directory di lavoro corrente del processo (su cui
 torneremo in sez.~\ref{sec:file_work_dir}) ed il \textit{pathname} è detto
 \itindsub{pathname}{relativo} \textsl{pathname relativo}.
 
@@ -549,14 +571,15 @@ corrente e il secondo alla directory \textsl{genitrice} (o \textit{parent
   directory}) cioè la directory che contiene il riferimento alla directory
 corrente.
 
-In questo modo con ``\file{..}'' si può usare un \textsl{pathname relativo}
-per indicare un file posto al di sopra della directory corrente, tornando
-all'indietro nell'albero dei file.  Questa retromarcia però su fermerà una
-volta raggiunta la directory radice, perché non esistendo in questo caso una
-directory superiore, il nome ``\file{..}'' farà riferimento alla radice
-stessa.
+In questo modo con ``\file{..}'' si può usare un \itindsub{pathname}{relativo}
+\textit{pathname} relativo per indicare un file posto al di sopra della
+directory corrente, tornando all'indietro nell'albero dei file.  Questa
+retromarcia però su fermerà una volta raggiunta la directory radice, perché
+non esistendo in questo caso una directory superiore, il nome ``\file{..}''
+farà riferimento alla radice stessa.
 
 \itindend{pathname}
+\itindend{pathname~resolution}
 
 
 \subsection{I tipi di file}
@@ -714,8 +737,8 @@ interno alcune bufferizzazioni per aumentare l'efficienza nell'accesso ai
 dispositivi. L'accesso viene gestito attraverso i \textit{file descriptor} che
 sono rappresentati da numeri interi (cioè semplici variabili di tipo
 \ctyp{int}).  L'interfaccia è definita nell'\textit{header file}
-\file{unistd.h} e la tratteremo in dettaglio in
-cap.~\ref{cha:file_unix_interface}.
+\headfile{unistd.h} e la tratteremo in dettaglio in
+sez.~\ref{sec:file_unix_interface}.
 
 \itindbeg{file~stream}
 
@@ -732,16 +755,16 @@ specificata dall'ANSI C e perciò si trova anche su tutti i sistemi non
 Unix. Gli \textit{stream} sono oggetti complessi e sono rappresentati da
 puntatori ad un opportuna struttura definita dalle librerie del C, ad essi si
 accede sempre in maniera indiretta utilizzando il tipo \code{FILE *}.
-L'interfaccia è definita nell'\textit{header file} \file{stdio.h} e la
-tratteremo in dettaglio nel cap.~\ref{cha:files_std_interface}.
+L'interfaccia è definita nell'\textit{header file} \headfile{stdio.h} e la
+tratteremo in dettaglio in sez.~\ref{sec:files_std_interface}.
 
 Entrambe le interfacce possono essere usate per l'accesso ai file come agli
 altri oggetti del VFS, ma per poter accedere alle operazioni di controllo
-(descritte in sez.~\ref{sec:file_fcntl} e sez.~\ref{sec:file_ioctl}) su un
-qualunque tipo di oggetto del VFS occorre usare l'interfaccia standard di Unix
-con i file descriptor. Allo stesso modo devono essere usati i file descriptor
-se si vuole ricorrere a modalità speciali di I/O come il
-\itindex{file~locking} \textit{file locking} o l'I/O non-bloccante (vedi
+(descritte in sez.~\ref{sec:file_fcntl_ioctl}) su un qualunque tipo di oggetto
+del VFS occorre usare l'interfaccia standard di Unix con i file
+descriptor. Allo stesso modo devono essere usati i file descriptor se si vuole
+ricorrere a modalità speciali di I/O come il \itindex{file~locking}
+\textit{file locking} o l'I/O non-bloccante (vedi
 cap.~\ref{cha:file_advanced}).
 
 Gli \textit{stream} forniscono un'interfaccia di alto livello costruita sopra
@@ -861,7 +884,7 @@ infinita serie di problemi di portabilità.
                       sez.~\ref{sec:ipc_sysv_generic}).\\
     \type{loff\_t}  & Posizione corrente in un file.\\
     \type{mode\_t}  & Attributi di un file.\\
-    \type{nlink\_t} & Contatore dei link su un file.\\
+    \type{nlink\_t} & Contatore dei collegamenti su un file.\\
     \type{off\_t}   & Posizione corrente in un file.\\
     \type{pid\_t}   & Identificatore di un processo (vedi
                       sez.~\ref{sec:proc_pid}).\\
@@ -877,7 +900,7 @@ infinita serie di problemi di portabilità.
                       sez.~\ref{sec:proc_access_id}).\\
     \hline
   \end{tabular}
-  \caption{Elenco dei tipi primitivi, definiti in \file{sys/types.h}.}
+  \caption{Elenco dei tipi primitivi, definiti in \headfile{sys/types.h}.}
   \label{tab:intro_primitive_types}
 \end{table}
 
@@ -885,7 +908,7 @@ Per questo motivo tutte le funzioni di libreria di solito non fanno
 riferimento ai tipi elementari dello standard del linguaggio C, ma ad una
 serie di \index{tipo!primitivo} \textsl{tipi primitivi} del sistema, riportati
 in tab.~\ref{tab:intro_primitive_types}, e definiti nell'\textit{header file}
-\file{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
+\headfile{sys/types.h}, in modo da mantenere completamente indipendenti i tipi
 utilizzati dalle funzioni di sistema dai tipi elementari supportati dal
 compilatore C.
 
@@ -934,7 +957,7 @@ presenti neanche in System V) sono state tralasciate.
 Le funzionalità implementate sono principalmente il meccanismo di
 intercomunicazione fra i processi e la memoria condivisa (il cosiddetto System
 V IPC, che vedremo in sez.~\ref{sec:ipc_sysv}) le funzioni della famiglia
-\func{hsearch} e \func{drand48}, \func{fmtmsg} e svariate funzioni
+\funcm{hsearch} e \funcm{drand48}, \funcm{fmtmsg} e svariate funzioni
 matematiche.
 
 
@@ -951,7 +974,7 @@ della AT\&T.
 
 Benché BSD non sia mai stato uno standard formalizzato, l'implementazione
 dello Unix dell'Università di Berkeley nella sua storia ha introdotto una
-serie di estensioni e interfacce di grandissima rilevanza, come i link
+serie di estensioni e interfacce di grandissima rilevanza, come i collegamenti
 simbolici, la funzione \code{select} ed i socket di rete. Per questo motivo si
 fa spesso riferimento esplicito alle interfacce presenti nelle varie versioni
 dello Unix di Berkeley con una apposita sigla.
@@ -1014,18 +1037,18 @@ possono recuperare varie (e di norma piuttosto intricate) informazioni è
     \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\
     \hline
     \hline
-    POSIX.1 & 1003.1 & 9945-1& Interfacce di base                           \\
-    POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1                         \\
-    POSIX.2 & 1003.2 & 9945-2& Comandi                                      \\
-    POSIX.3 & 2003   &TR13210& Metodi di test                               \\
-    POSIX.4 & 1003.1b &  --- & Estensioni real-time                         \\
-    POSIX.4a& 1003.1c &  --- & \itindex{thread} Thread                      \\
-    POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time               \\
-    POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA            \\
-    POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza                                 \\
-    POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete                     \\
-    POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77                \\
-    POSIX.12& 1003.1g& 9945-1& Socket                                       \\
+    POSIX.1 & 1003.1 & 9945-1& Interfacce di base.                          \\
+    POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1.                        \\
+    POSIX.2 & 1003.2 & 9945-2& Comandi.                                     \\
+    POSIX.3 & 2003   &TR13210& Metodi di test.                              \\
+    POSIX.4 & 1003.1b &  --- & Estensioni real-time.                        \\
+    POSIX.4a& 1003.1c &  --- & \itindex{thread} Thread.                     \\
+    POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time.              \\
+    POSIX.5 & 1003.5  & 14519& Interfaccia per il linguaggio ADA.           \\
+    POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza.                                \\
+    POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete.                    \\
+    POSIX.9 & 1003.9  &  --- & Interfaccia per il Fortran-77.               \\
+    POSIX.12& 1003.1g& 9945-1& Socket.                                      \\
     \hline
   \end{tabular}
   \caption{Elenco dei vari standard POSIX e relative denominazioni.}
@@ -1339,14 +1362,14 @@ una opportuna macro; queste estensioni sono illustrate nel seguente elenco:
   presente negli standard con i file di grandi dimensioni, ed in particolare
   definire le due funzioni \func{fseeko} e \func{ftello} che al contrario
   delle corrispettive \func{fseek} e \func{ftell} usano il tipo di dato
-  specifico \type{off\_t} (vedi sez.~\ref{sec:file_fseek}).
+  specifico \type{off\_t} (vedi sez.~\ref{sec:file_io}).
 
 \item[\macro{\_LARGEFILE64\_SOURCE}] definendo questa macro si rendono
   disponibili le funzioni di una interfaccia alternativa al supporto di valori
   a 64 bit nelle funzioni di gestione dei file (non supportati in certi
   sistemi), caratterizzate dal suffisso \texttt{64} aggiunto ai vari nomi di
   tipi di dato e funzioni (come \type{off64\_t} al posto di \type{off\_t} o
-  \func{lseek64} al posto di \func{lseek}).
+  \funcm{lseek64} al posto di \func{lseek}).
 
   Le funzioni di questa interfaccia alternativa sono state proposte come una
   estensione ad uso di transizione per le \textit{Single UNIX Specification},
@@ -1375,9 +1398,9 @@ una opportuna macro; queste estensioni sono illustrate nel seguente elenco:
 
 \item[\macro{\_ATFILE\_SOURCE}] definendo questa macro si rendono disponibili
   le estensioni delle funzioni di creazione, accesso e modifica di file e
-  directory che risolvono i problemi di sicurezza insiti nell'uso di pathname
-  relativi con programmi \itindex{thread} \textit{multi-thread} illustrate in
-  sez.~\ref{sec:file_openat}.
+  directory che risolvono i problemi di sicurezza insiti nell'uso di
+  \textit{pathname} relativi con programmi \itindex{thread}
+  \textit{multi-thread} illustrate in sez.~\ref{sec:file_openat}.
 
 \item[\macro{\_REENTRANT}] definendo questa macro, o la equivalente
   \macro{\_THREAD\_SAFE} (fornita per compatibilità) si rendono disponibili le
@@ -1398,10 +1421,10 @@ una opportuna macro; queste estensioni sono illustrate nel seguente elenco:
 
   Le funzioni di libreria che vengono messe sotto controllo quando questa
   funzionalità viene attivata sono, al momento della stesura di queste note,
-  le seguenti: \func{memcpy}, \func{mempcpy}, \func{memmove}, \func{memset},
-  \func{stpcpy}, \func{strcpy}, \func{strncpy}, \func{strcat}, \func{strncat},
-  \func{sprintf}, \func{snprintf}, \func{vsprintf}, \func{vsnprintf}, e
-  \func{gets}.
+  le seguenti: \funcm{memcpy}, \funcm{mempcpy}, \funcm{memmove},
+  \funcm{memset}, \funcm{stpcpy}, \funcm{strcpy}, \funcm{strncpy},
+  \funcm{strcat}, \funcm{strncat}, \func{sprintf}, \func{snprintf},
+  \func{vsprintf}, \func{vsnprintf}, e \func{gets}.
 
   La macro prevede due valori, con \texttt{1} vengono eseguiti dei controlli
   di base che non cambiano il comportamento dei programmi se si richiede una