X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=fileintro.tex;h=a2735a7dd2e5473902dfe5b9c949deffe8c4de82;hp=dfd3081dc67781aa9984a8052d20dc99818db1ea;hb=66765a9be9a61085dd00abd92d99a24b23dc844b;hpb=efd164169524125422cf9bb80ff70a0b037886a0 diff --git a/fileintro.tex b/fileintro.tex index dfd3081..a2735a7 100644 --- a/fileintro.tex +++ b/fileintro.tex @@ -11,11 +11,11 @@ Questo significa che si pu dalla seriale, alla parallela, alla console, e agli stessi dischi attraverso i cosiddetti file di dispositivo (i \textit{device files}). Questi sono dei file speciali agendo sui quali i programmi possono leggere, scrivere e compiere -operazioni direttamente sulle perferiche, usando le stesse funzioni che si +operazioni direttamente sulle periferiche, usando le stesse funzioni che si usano per i normali file di dati. In questo capitolo forniremo un'introduzione alle principali caratteristiche -di questa interfaccia, su come essa viene implementata in linux e su come sono +di questa interfaccia, su come essa viene implementata in Linux e su come sono organizzati i file nel sistema. @@ -26,18 +26,20 @@ Visto il ruolo fondamentale che i files vengono ad assumere in un sistema unix, è anzitutto opportuno fornire un'introduzione dettagliata su come essi vengono trattati dal sistema. In particolare occorre tenere presente dov'è che si situa il limite fondamentale fra kernel space e user space che tracciavamo -al Cap.~\ref{cha:intro_unix}. +al \capref{cha:intro_unix}. Partiamo allora da come viene strutturata nel sistema la disposizione dei file: per potervi accedere il kernel usa una apposita interfaccia che permetta di strutturare l'informazione tenuta sullo spazio grezzo disponibile sui -dischi, cioè quello che si chiama un \textit{filesystem}. +dischi, cioè quello che si chiama un \textit{filesystem} (useremo per brevità +questo nome al posto della più prolissa traduzione italiana sistema di file). Sarà attraverso quest'ultimo che il kernel andrà a gestire l'accesso ai dati memorizzati all'interno del disco stesso, strutturando l'informazione in files -e directory. Per poter accedere ai file contenuti in un disco occorrerà -perciò attivare il filesystem, questo viene fatto \textsl{montando} il disco -(o la partizione del disco). +e directory (su questo aspetto torneremo con maggiori dettagli in +\secref{sec:filedir_filesystem}). Per poter accedere ai file contenuti in un +disco occorrerà perciò attivare il filesystem, questo viene fatto +\textsl{montando} il disco (o la partizione del disco). %In generale un filesystem piazzerà opportunamente sul disco dei blocchi di %informazioni riservate che tengono conto degli inodes allocati, di quelli @@ -64,20 +66,20 @@ oggetti visti attraverso l'interfaccia che manipola i files come le FIFO, i link, i socket e gli stessi i file di dispositivo (questi ultimi, per convenzione, sono inseriti nella directory \texttt{/dev}). -\subsection{Il \textit{virtual filesystem} di linux} +\subsection{Il \textit{virtual filesystem} di Linux} \label{sec:fileintr_vfs} -Esamineremo adesso come viene implementato l'accesso ai files in linux. Questa +Esamineremo adesso come viene implementato l'accesso ai files in Linux. Questa sezione riporta informazioni sui dettagli di come il kernel gestisce i files, ed è basata sul documento di Richard Goochs distribuito coi sorgenti del -kernel (\texttt{linux/Documentation/vfs.txt}). +kernel (nella directory \texttt{linux/Documentation/vfs.txt}). L'argomento è abbastanza ``esoterico'' e questa sezione può essere saltata ad una prima lettura; è bene però tenere presente che vengono introdotti qui alcuni termini che potranno comparire in seguito, come \textit{inode}, \textit{dentry}, \textit{dcache}. -In linux il concetto di \textit{everything is a file} è stato implementato +In Linux il concetto di \textit{everything is a file} è stato implementato attraverso il \textit{virtual filesystem} (da qui in avanti VFS) che è l'interfaccia astratta che il kernel rende disponibile ai programmi in user space attraverso la quale vengono manipolati i files; esso provvede anche @@ -127,8 +129,9 @@ una struttura di tipo \texttt{file} in cui viene inserito un puntatore alla dentry e una struttura \verb|f_ops| che contiene i puntatori ai metodi che implementano le operazioni disponibili sul file. In questo modo i processi in user space possono accedere alle operazioni attraverso detti metodi, che -saranno diversi a seconda del tipo di file (o dispositivo) aperto. Un elenco -delle operazioni disponibili è riportato in \ntab. +saranno diversi a seconda del tipo di file (o dispositivo) aperto (su questo +torneremo in dettaglio in \secref{sec:fileunix_fd}). Un elenco delle operazioni +previste dal kernel è riportato in \ntab. \begin{table}[htb] \centering @@ -173,8 +176,9 @@ diversi filesystem (come quelli usati da Windows o MacOs) In unix è implementata da qualunque filesystem standard una forma elementare (ma adatta alla maggior parte delle esigenze) di controllo di accesso ai -files. Torneremo sull'argomento in dettaglio più avanti, qui ci limitiamo ad -una introduzione dei concetti essenziali. +files. Torneremo sull'argomento in dettaglio più avanti (vedi +\secref{sec:filedir_access_control}), qui ci limitiamo ad una introduzione dei +concetti essenziali. Si tenga conto poi che quanto diremo è vero solo per filesystem di tipo Unix, e non è detto che sia applicabile (ed infatti non è vero per il filesystem di @@ -184,7 +188,7 @@ di controllo di accesso molto pi Ad ogni file Unix associa sempre l'utente che ne è proprietario (il cosiddetto \textit{owner}) e il gruppo di appartenenza, secondo il meccanismo degli uid e -gid spiegato in Sez.~\ref{sec:intro_usergroup}, e un insieme di permessi che +gid accennato in \secref{sec:intro_usergroup}, e un insieme di permessi che sono divisi in tre classi, e cioè attribuiti rispettivamente al proprietario, a qualunque utente faccia parte del gruppo cui appartiene il file, e a tutti gli altri utenti. @@ -194,10 +198,10 @@ significativi sono usati a gruppi di tre per indicare i permessi base di lettura, scrittura ed esecuzione (indicati rispettivamente con le lettere \textit{w}, \textit{r} \textit{x}) applicabili rispettivamente al proprietario, al gruppo, a tutti (una descrizione più dettagliata dei vari -permessi associati ai file è riportata in \ref{sec:filedir_suid_sgid}). I +permessi associati ai file è riportata in \secref{sec:filedir_suid_sgid}). I restanti tre bit sono usati per indicare alcune caratteristiche più complesse (\textit{suid}, \textit{sgid}, e \textit{sticky}) su cui pure torneremo in -seguito (vedi \ref{sec:filedir_suid_sgid} e \ref{sec:filedir_stiky}). +seguito (vedi \secref{sec:filedir_suid_sgid} e \secref{sec:filedir_sticky}). Tutte queste informazioni sono tenute per ciascun file nell'inode. Quando un processo cerca l'accesso al file esso controlla i propri uid e gid @@ -209,7 +213,7 @@ pertanto accesso senza restrizione a qualunque file del sistema. In realtà il procedimento è più complesso di quanto descritto in maniera elementare qui; inoltre ad un processo sono associati diversi identificatori, -torneremo su questo in maggiori dettagli in seguito in \ref{sec:proc_perms}. +torneremo su questo in maggiori dettagli in seguito in \secref{sec:proc_perms}. \subsection{I tipi di files} \label{sec:fileintr_file_types} @@ -252,16 +256,16 @@ accesso. Una delle differenze principali con altri sistemi operativi (come il VMS o Windows) è che per Unix tutti i file di dati sono identici e contengono un flusso continuo di bytes; non esiste cioè differenza per come vengono visti dal sistema file di diverso contenuto o formato (come nel caso di quella fra -file di testo e binari che c'è in windows) né c'è una strutturazione a record +file di testo e binari che c'è in Windows) né c'è una strutturazione a record per il cosiddetto ``accesso diretto'' come nel caso del VMS. % (con i kernel % della serie 2.4 è disponibile una forma di accesso diretto ai dischi il % \textit{raw access} che però non ha nulla a che fare con questo). -Una seconda differenza è nel formato dei file ascii; in Unix la fine riga è +Una seconda differenza è nel formato dei file ASCII; in Unix la fine riga è codificata in maniera diversa da Windows o MacIntosh, in particolare il fine riga è il carattere \texttt{LF} (o \verb|\n|) al posto del \texttt{CR} -(\verb|\r|) del mac e del \texttt{CR LF} di windows. Questo può causare alcuni +(\verb|\r|) del mac e del \texttt{CR LF} di Windows. Questo può causare alcuni problemi qualora si facciano assunzioni sul terminatore della riga. @@ -306,7 +310,7 @@ operazioni di controllo sul particolare tipo di oggetto del VFS scelto occorre usare l'interfaccia standard di unix coi file descriptors. Allo stesso modo devono essere usati i file descriptor se si vuole ricorrere a modalità speciali di I/O come il polling o il non-bloccante (vedi -\ref{sec:file_bohhhhh}). +\secref{sec:file_xxx}). Gli stream forniscono un'interfaccia di alto livello costruita sopra quella dei file descriptor, che tratta tutti i file nello stesso modo, con @@ -358,7 +362,7 @@ Questo ogni processo avrà la sua posizione corrente nel file, che non sarà influenzata da quello che altri processi possono fare. Anzi, aprire un file significa appunto creare ed inizializzare una tale struttura, per cui se si -apre due volte lo stesso file all'interno dello stesso processo, si otterrano +apre due volte lo stesso file all'interno dello stesso processo, si otterranno due file descriptor o due stream che avranno ancora una posizione corrente nel file assolutamente indipendente. @@ -366,12 +370,18 @@ Si tenga conto inoltre che un'altro dei dati contenuti nella struttura di accesso è un riferimento all'inode del file, pertanto anche se il file viene cancellato da un altro processo, sarà sempre possibile mantenere l'accesso ai dati, e lo spazio su disco non verrà rilasciato fintanto che il file non sarà -chiuso e l'ultimo riferimento cancellato. È pertanto possibile (e pratica -comune) aprire un file provvisorio per cancellarlo immediatamente dopo; in -questo modo all'uscita del programma il file scomparirà definitivamente dal -disco, ma il file ed il suo contenuto saranno disponibili per tutto il tempo -in cui il processo è attivo. +chiuso e l'ultimo riferimento cancellato. È pertanto possibile (come vedremo +in dettaglio in \secref{sec:filedir_link}) aprire un file provvisorio per +cancellarlo immediatamente dopo; in questo modo all'uscita del programma il +file scomparirà definitivamente dal disco, ma il file ed il suo contenuto +saranno disponibili per tutto il tempo in cui il processo è attivo. Ritorneremo su questo più avanti, quando tratteremo l'input/output sui file, esaminando in dettaglio come tutto ciò viene realizzato. +Si ricordi infine che in unix non esistono i tipi di file e che non c'è nessun +supporto per le estensioni come parte del filesystem. Ciò non ostante molti +programmi adottano delle convenzioni per i nomi dei file, ad esempio il codice +C normalmente si mette in file con l'estensione .c, ma questa è, appunto, solo +una convenzione. +