X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=intro.tex;h=bf2429d5dab145420dbb9d951f1409fd8dc06b2f;hp=500181c217673a8d5f322140dd5cf604c6b2f736;hb=2a44ed509cb94cf27315aaa8c0b496326b7b9cbd;hpb=dcf2c2df897955ff3503a7c426025457ab456fd7 diff --git a/intro.tex b/intro.tex index 500181c..bf2429d 100644 --- a/intro.tex +++ b/intro.tex @@ -1,6 +1,6 @@ %% intro.tex %% -%% Copyright (C) 2000-2012 Simone Piccardi. Permission is granted to +%% Copyright (C) 2000-2015 Simone Piccardi. Permission is granted to %% copy, distribute and/or modify this document under the terms of the GNU Free %% Documentation License, Version 1.1 or any later version published by the %% Free Software Foundation; with the Invariant Sections being "Un preambolo", @@ -242,23 +242,26 @@ comando \cmd{man 2 }, ed anche Linux non fa eccezione. Queste \textit{system call} sono poi state codificate da vari standard, che esamineremo brevemente in sez.~\ref{sec:intro_standard}. -Normalmente ciascuna chiamata al sistema fornita dal kernel viene associata ad -una funzione con lo stesso nome definita all'interno della libreria +Normalmente ciascuna \textit{system call} fornita dal kernel viene associata +ad una funzione con lo stesso nome definita all'interno della libreria fondamentale del sistema, quella che viene chiamata \textsl{Libreria Standard del C} (\textit{C Standard Library}) in ragione del fatto che il primo kernel Unix e tutti i programmi eseguiti su di esso vennero scritti in C, -usando le librerie di questo linguaggio. Questa libreria, oltre alle -interfacce delle \textit{system call}, contiene anche tutta una serie di -ulteriori funzioni di utilità che vengono comunemente usate nella -programmazione e sono definite nei vari standard che documentano le interfacce -di programmazione di un sistema unix-like. - -Questo concetto è importante da tener presente perché programmare in Linux -significa anzitutto essere in grado di usare le funzioni fornite dalla -\textsl{Libreria Standard del C}, in quanto né il kernel, né il linguaggio C -implementano direttamente operazioni ordinarie come l'allocazione dinamica -della memoria, l'input/output bufferizzato sui file o la manipolazione delle -stringhe, che sono comunemente usate da qualunque programma. +usando le librerie di questo linguaggio. In seguito faremo riferimento alle +funzioni di questa libreria che si interfacciano alle \textit{system call} +come ``\textsl{funzioni di sistema}''. + +Questa libreria infatti, oltre alle interfacce delle \textit{system call}, +contiene anche tutta una serie di ulteriori funzioni di utilità che vengono +comunemente usate nella programmazione e sono definite nei vari standard che +documentano le interfacce di programmazione di un sistema unix-like. Questo +concetto è importante da tener presente perché programmare in Linux significa +anche essere in grado di usare le funzioni fornite dalla \textsl{Libreria + Standard del C}, in quanto né il kernel, né il linguaggio C implementano +direttamente operazioni ordinarie come l'allocazione dinamica della memoria, +l'input/output bufferizzato sui file o la manipolazione delle stringhe, la +matematica in virgola mobile, che sono comunemente usate da qualunque +programma. Tutto ciò mette nuovamente in evidenza il fatto che nella stragrande maggioranza dei casi si dovrebbe usare il nome GNU/Linux in quanto una parte @@ -397,9 +400,10 @@ programmi delle opportune \textit{system call} che consentano di leggere e scrivere il contenuto. Tutto ciò ha due aspetti: il primo è che il kernel, per il concetto dell'\textit{everything is a file}, deve fornire una interfaccia che consenta di operare sui file, sia che questi corrispondano ai normali file -di dati, sia che siano quei file speciali (i cosiddetti -\index{file!di~dispositivo} file di dispositivo, o \textit{device file}) che -permettono di accedere alle periferiche. +di dati, o ai cosiddetti \index{file!speciali} ``\textsl{file speciali}'', +come \index{file!di~dispositivo} i file di dispositivo (o \textit{device + file}) che permettono di accedere alle periferiche o le fifo ed i socket che +forniscono funzionalità di comunicazione fra processi. Il secondo aspetto è che per poter utilizzare dei normali file di dati il kernel deve provvedere ad organizzare e rendere accessibile in maniera @@ -474,7 +478,7 @@ altrettante directory del filesystem radice, su quelli che vengono chiamati \index{mount~point} \textit{mount point}. Questo comunque avverrà sempre in un secondo tempo, in genere a cura dei programmi eseguiti nella procedura di inizializzazione del sistema, grazie alle funzioni che tratteremo in -sez.~\ref{sec:sys_file_config}. +sez.~\ref{sec:filesystem_mounting}. \subsection{La risoluzione del nome di file e directory} @@ -492,22 +496,26 @@ chiamato il suo \textit{pathname},\footnote{il manuale della \acr{glibc} di \textit{filename} e di componente per il nome del file all'interno della directory. Non seguiremo questa scelta dato che l'uso della parola \textit{pathname} è ormai così comune che mantenerne l'uso è senz'altro più - chiaro dell'alternativa proposta.} vale a dire tramite il percorso che si -deve fare per accedere al file a partire da una certa ``\textit{directory}''. + chiaro dell'alternativa proposta.} vale a dire tramite il +``\textsl{percorso}'' (nome che talvolta viene usato come traduzione di +\textit{pathname}) che si deve fare per accedere al file a partire da una +certa ``\textit{directory}''. -Una directory in realta è anch'essa un file, nel senso che è anch'essa un +Una directory in realtà è anch'essa un file, nel senso che è anch'essa un oggetto di un filesystem, solo che è un file particolare che il kernel riconosce appositamente come tale per poterlo utilizzare come directory. Il suo scopo è quello di contenere una lista di nomi di file e le informazioni -che associano ciascuno di questi nomi al relativo contenuto. +che associano ciascuno di questi nomi al relativo contenuto (torneremo su +questo in sez.~\ref{sec:file_arch_func}). Dato che questi nomi possono corrispondere ad un qualunque altro oggetto del filesystem, compresa un'altra directory, si ottiene naturalmente un'organizzazione ad albero inserendo nomi di directory dentro altre directory. All'interno dello stesso albero si potranno poi inserire anche -tutti gli altri oggetti previsti l'interfaccia del VFS (su cui torneremo in -sez.~\ref{sec:file_file_types}), come le fifo, i link, i socket e gli stessi -\index{file!di~dispositivo} file di dispositivo. +tutti gli altri oggetti previsti l'interfaccia del +\itindex{Virtual~File~System} VFS (su cui torneremo in +sez.~\ref{sec:file_file_types}), come le fifo, i collegamenti simbolici, i +socket e gli stessi \index{file!di~dispositivo} file di dispositivo. La convenzione usata nei sistemi unix-like per indicare i \textit{pathname} dei file è quella di usare il carattere ``\texttt{/}'' come separatore fra i @@ -519,31 +527,42 @@ sta in cima all'albero, essa viene indicata semplicemente con il Un file può essere indicato rispetto ad una directory semplicemente specificandone il nome, il manuale della \acr{glibc} chiama i nomi contenuti -nelle directory \textsl{componenti} (in inglese \textit{file name - components}), noi li chiameremo più semplicemente \textsl{nomi} o -\textsl{voci}. Il procedimento con cui dato un \textit{pathname} si individua -il file a cui esso fa riferimento è chiamato risoluzione del nome -(\textit{filename resolution} o \textit{pathname resolution}). - -La risoluzione viene fatta esaminando il \textit{pathname} da sinistra a -destra e localizzando ogni nome nella directory indicata dal nome precedente -usando il carattere ``\texttt{/}'' come separatore. Nel caso si indichi un -nome vuoto il costrutto ``\texttt{//}'' viene considerato equivalente a -``\texttt{/}''. Ovviamente perché il procedimento funzioni occorre che i nomi -indicati come directory esistano e siano effettivamente directory, inoltre i -permessi (si veda sez.~\ref{sec:file_access_control}) devono consentire -l'accesso all'intero \textit{pathname}. +nelle directory ``componenti'' (in inglese \textit{file name components}), noi +li chiameremo più semplicemente \textsl{nomi} o \textsl{voci}, riservando la +parola \textsl{componenti} ai nomi che, separati da una ``\texttt{/}'', +costituiscono il \textit{pathname}. Questi poi dovranno corrispondere, perché +il \textit{pathname} sia valido, a voci effettivamente presenti nelle +directory, ma non è detto che un \textit{pathname} debba per forza risultare +valido. + +Il procedimento con cui dato un \textit{pathname} si individua il file a cui +esso fa riferimento, è chiamato \textsl{risoluzione del percorso} +(\textit{filename resolution} o \textit{pathname resolution}). Lo stesso +procedimento ci può anche dire che il \textit{pathname} usato non è valido. +La risoluzione viene eseguita esaminando il \textit{pathname} da sinistra a +destra e localizzando ogni componente dello stesso come nome in una directory +a partire dalla directory iniziale, usando il carattere ``\texttt{/}'' come +separatore per scendere dall'una all'altra. Nel caso si indichi un componente +vuoto il costrutto ``\texttt{//}'' viene considerato equivalente a +``\texttt{/}''. + +Ovviamente perché la risoluzione abbia successo occorre che i componenti +intermedi esistano e siano effettivamente directory, e che il file o la +directory indicata dall'ultimo componente esista. Inoltre i permessi relativi +alle directory indicate nel \textit{pathname} (torneremo su questo +sez.~\ref{sec:file_access_control}) dovranno consentire l'accesso all'intero +\textit{pathname}. Se il \textit{pathname} comincia con il carattere ``\texttt{/}'' la ricerca parte dalla directory radice del processo. Questa, a meno di non avere eseguito una \func{chroot} (funzione su cui torneremo in sez.~\ref{sec:file_chroot}) è la stessa per tutti i processi ed equivale alla -directory radice dell'albero dei file; in questo caso si parla di un -\textsl{pathname assoluto} \itindsub{pathname}{assoluto}. Altrimenti la -ricerca parte dalla \index{directory~di~lavoro} directory di lavoro corrente -del processo (su cui torneremo in sez.~\ref{sec:file_work_dir}) ed il -\textit{pathname} è detto \itindsub{pathname}{relativo} \textsl{pathname - relativo}. +directory radice dell'albero dei file montata dal kernel all'avvio del +sistema; in questo caso si parla di un \textsl{pathname assoluto} +\itindsub{pathname}{assoluto}. Altrimenti la ricerca parte dalla +\index{directory~di~lavoro} directory di lavoro corrente del processo (su cui +torneremo in sez.~\ref{sec:file_work_dir}) ed il \textit{pathname} è detto +\itindsub{pathname}{relativo} \textsl{pathname relativo}. Infine i nomi di directory ``\file{.}'' e ``\file{..}'' hanno un significato speciale e vengono inseriti in ogni directory quando questa viene creata (vedi @@ -553,11 +572,11 @@ corrente e il secondo alla directory \textsl{genitrice} (o \textit{parent corrente. In questo modo con ``\file{..}'' si può usare un \itindsub{pathname}{relativo} -pathname relativo per indicare un file posto al di sopra della directory -corrente, tornando all'indietro nell'albero dei file. Questa retromarcia però -su fermerà una volta raggiunta la directory radice, perché non esistendo in -questo caso una directory superiore, il nome ``\file{..}'' farà riferimento -alla radice stessa. +\textit{pathname} relativo per indicare un file posto al di sopra della +directory corrente, tornando all'indietro nell'albero dei file. Questa +retromarcia però su fermerà una volta raggiunta la directory radice, perché +non esistendo in questo caso una directory superiore, il nome ``\file{..}'' +farà riferimento alla radice stessa. \itindend{pathname} \itindend{pathname~resolution} @@ -719,7 +738,7 @@ dispositivi. L'accesso viene gestito attraverso i \textit{file descriptor} che sono rappresentati da numeri interi (cioè semplici variabili di tipo \ctyp{int}). L'interfaccia è definita nell'\textit{header file} \headfile{unistd.h} e la tratteremo in dettaglio in -cap.~\ref{cha:file_unix_interface}. +sez.~\ref{sec:file_unix_interface}. \itindbeg{file~stream} @@ -737,15 +756,15 @@ Unix. Gli \textit{stream} sono oggetti complessi e sono rappresentati da puntatori ad un opportuna struttura definita dalle librerie del C, ad essi si accede sempre in maniera indiretta utilizzando il tipo \code{FILE *}. L'interfaccia è definita nell'\textit{header file} \headfile{stdio.h} e la -tratteremo in dettaglio nel cap.~\ref{cha:files_std_interface}. +tratteremo in dettaglio in sez.~\ref{sec:files_std_interface}. Entrambe le interfacce possono essere usate per l'accesso ai file come agli altri oggetti del VFS, ma per poter accedere alle operazioni di controllo -(descritte in sez.~\ref{sec:file_fcntl} e sez.~\ref{sec:file_ioctl}) su un -qualunque tipo di oggetto del VFS occorre usare l'interfaccia standard di Unix -con i file descriptor. Allo stesso modo devono essere usati i file descriptor -se si vuole ricorrere a modalità speciali di I/O come il -\itindex{file~locking} \textit{file locking} o l'I/O non-bloccante (vedi +(descritte in sez.~\ref{sec:file_fcntl_ioctl}) su un qualunque tipo di oggetto +del VFS occorre usare l'interfaccia standard di Unix con i file +descriptor. Allo stesso modo devono essere usati i file descriptor se si vuole +ricorrere a modalità speciali di I/O come il \itindex{file~locking} +\textit{file locking} o l'I/O non-bloccante (vedi cap.~\ref{cha:file_advanced}). Gli \textit{stream} forniscono un'interfaccia di alto livello costruita sopra @@ -865,7 +884,7 @@ infinita serie di problemi di portabilità. sez.~\ref{sec:ipc_sysv_generic}).\\ \type{loff\_t} & Posizione corrente in un file.\\ \type{mode\_t} & Attributi di un file.\\ - \type{nlink\_t} & Contatore dei link su un file.\\ + \type{nlink\_t} & Contatore dei collegamenti su un file.\\ \type{off\_t} & Posizione corrente in un file.\\ \type{pid\_t} & Identificatore di un processo (vedi sez.~\ref{sec:proc_pid}).\\ @@ -955,7 +974,7 @@ della AT\&T. Benché BSD non sia mai stato uno standard formalizzato, l'implementazione dello Unix dell'Università di Berkeley nella sua storia ha introdotto una -serie di estensioni e interfacce di grandissima rilevanza, come i link +serie di estensioni e interfacce di grandissima rilevanza, come i collegamenti simbolici, la funzione \code{select} ed i socket di rete. Per questo motivo si fa spesso riferimento esplicito alle interfacce presenti nelle varie versioni dello Unix di Berkeley con una apposita sigla. @@ -1018,18 +1037,18 @@ possono recuperare varie (e di norma piuttosto intricate) informazioni è \textbf{Standard} & \textbf{IEEE} & \textbf{ISO} & \textbf{Contenuto} \\ \hline \hline - POSIX.1 & 1003.1 & 9945-1& Interfacce di base \\ - POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1 \\ - POSIX.2 & 1003.2 & 9945-2& Comandi \\ - POSIX.3 & 2003 &TR13210& Metodi di test \\ - POSIX.4 & 1003.1b & --- & Estensioni real-time \\ - POSIX.4a& 1003.1c & --- & \itindex{thread} Thread \\ - POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time \\ - POSIX.5 & 1003.5 & 14519& Interfaccia per il linguaggio ADA \\ - POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza \\ - POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete \\ - POSIX.9 & 1003.9 & --- & Interfaccia per il Fortran-77 \\ - POSIX.12& 1003.1g& 9945-1& Socket \\ + POSIX.1 & 1003.1 & 9945-1& Interfacce di base. \\ + POSIX.1a& 1003.1a& 9945-1& Estensioni a POSIX.1. \\ + POSIX.2 & 1003.2 & 9945-2& Comandi. \\ + POSIX.3 & 2003 &TR13210& Metodi di test. \\ + POSIX.4 & 1003.1b & --- & Estensioni real-time. \\ + POSIX.4a& 1003.1c & --- & \itindex{thread} Thread. \\ + POSIX.4b& 1003.1d &9945-1& Ulteriori estensioni real-time. \\ + POSIX.5 & 1003.5 & 14519& Interfaccia per il linguaggio ADA. \\ + POSIX.6 & 1003.2c,1e& 9945-2& Sicurezza. \\ + POSIX.8 & 1003.1f& 9945-1& Accesso ai file via rete. \\ + POSIX.9 & 1003.9 & --- & Interfaccia per il Fortran-77. \\ + POSIX.12& 1003.1g& 9945-1& Socket. \\ \hline \end{tabular} \caption{Elenco dei vari standard POSIX e relative denominazioni.} @@ -1343,7 +1362,7 @@ una opportuna macro; queste estensioni sono illustrate nel seguente elenco: presente negli standard con i file di grandi dimensioni, ed in particolare definire le due funzioni \func{fseeko} e \func{ftello} che al contrario delle corrispettive \func{fseek} e \func{ftell} usano il tipo di dato - specifico \type{off\_t} (vedi sez.~\ref{sec:file_fseek}). + specifico \type{off\_t} (vedi sez.~\ref{sec:file_io}). \item[\macro{\_LARGEFILE64\_SOURCE}] definendo questa macro si rendono disponibili le funzioni di una interfaccia alternativa al supporto di valori