X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=fileunix.tex;h=bc94a0e2f6d650fd91e539f008df2717964cf47b;hp=5734c43c02e99db3ba6261315b1da465ea94597a;hb=dfec603c0424b6ec1e0f8d630dd4303acf2e35a7;hpb=608bbf38416013dc331e1ef2e5dfe01855b6158b diff --git a/fileunix.tex b/fileunix.tex index 5734c43..bc94a0e 100644 --- a/fileunix.tex +++ b/fileunix.tex @@ -15,7 +15,8 @@ ANSI C. In questa sezione faremo una breve introduzione sulla architettura su cui è basata dell'interfaccia dei \textit{file descriptor}, che, sia pure con -differenze di implementazione, è comune ad ogni implementazione di unix. +differenze nella realizzazione pratica, resta sostanzialmente la stessa in +ogni implementazione di unix. \subsection{L'architettura dei \textit{file descriptor}} @@ -166,7 +167,6 @@ system call del kernel. La funzione \func{open} è la funzione fondamentale per accedere ai file, ed è quella che crea l'associazione fra un pathname ed un file descriptor; il suo prototipo è: - \begin{functions} \headdecl{sys/types.h} \headdecl{sys/stat.h} @@ -180,7 +180,6 @@ prototipo La funzione ritorna il file descriptor in caso di successo e -1 in caso di errore. In questo caso la variabile \var{errno} viene settata ad uno dei valori: - \begin{errlist} \item \macro{EEXIST} \var{pathname} esiste e si è specificato \macro{O\_CREAT} e \macro{O\_EXCL}. @@ -213,51 +212,8 @@ di \secref{sec:file_std_descr}: se ad esempio si chiude lo standard input e si apre subito dopo un nuovo file questo diventerà il nuovo standard input (avrà cioè il file descriptor 0). -Il nuovo file descriptor non è condiviso con nessun altro processo, (torneremo -sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in -\secref{sec:file_sharing}). Il nuovo file descriptor è settato di default per -restare aperto attraverso una \func{exec} (come accennato in -\secref{sec:proc_exec}) ed l'offset è settato all'inizio del file. - -Il parametro \var{mode} specifica i permessi con cui il file viene -eventualmente creato; i valori possibili sono gli stessi già visti in -\secref{sec:file_perm_overview} e possono essere specificati come OR binario -delle costanti descritte in \tabref{tab:file_bit_perm}. Questi permessi -filtrati dal valore di \file{umask} (vedi \secref{sec:file_umask}) per il -processo. -La funzione prevede diverse opzioni, che vengono specificate usando vari bit -del parametro \var{flags}. Alcuni di questi bit vanno anche a costituire il -flag di stato del file (o \textit{file status flag}), che è mantenuto nel -campo \var{f\_flags} della struttura \var{file} (al solito si veda lo schema -di \curfig). Essi sono divisi in tre categorie principali: -\begin{itemize} -\item \textsl{i bit delle modalità di accesso}: specificano con quale modalità - si accederà al file: i valori possibili sono lettura, scrittura o - lettura/scrittura. Uno di questi bit deve essere sempre specificato quando - si apre un file. Vengono settati alla chiamata da \func{open}, e possono - essere riletti con una \func{fcntl} (fanno parte del \textit{file status - flag}), ma non modificati. -\item \textsl{i bit delle modalità di apertura}: permettono di specificare - alcune delle caratteristiche del comportamento di \func{open} quando viene - eseguita. Hanno effetto solo al momento della chiamata della funzione e non - sono memorizzati nè possono essere riletti. -\item \textsl{i bit delle modalità di operazione}: permettono di specificare - alcune caratteristiche del comportamento delle future operazioni sul file - (come la \func{read} o la \func{write}). Anch'essi fanno parte del - \textit{file status flag}. Il loro valore è settato alla chiamata di - \func{open}, ma possono essere riletti e modificati (insieme alle - caratteristiche operative che controllano) con una \func{fcntl}. -\end{itemize} - -In \ntab\ si sono riportate, ordinate e divise fra loro secondo le tre -modalità appena elencate, le costanti mnemoniche associate a ciascuno di -questi bit, dette costanti possono essere combinate fra di loro con un OR -aritmetico per costruire il valore (in forma di maschera binaria) del -parametro \var{flags} da passare alla \func{open} per specificarne il -comportamento. - -\begin{table}[!htbp] +\begin{table}[!htb] \centering \footnotesize \begin{tabular}[c]{|l|p{12cm}|} @@ -265,9 +221,9 @@ comportamento. \textbf{Flag} & \textbf{Descrizione} \\ \hline \hline % modailtà di accesso al file - \macro{O\_RDONLY} & apre il file in sola lettura\\ - \macro{O\_WRONLY} & apre il file in sola scrittura\\ - \macro{O\_RDWR} & apre il file lettura/scrittura\\ + \macro{O\_RDONLY} & apre il file in sola lettura. \\ + \macro{O\_WRONLY} & apre il file in sola scrittura. \\ + \macro{O\_RDWR} & apre il file lettura/scrittura. \\ \hline % modalita di apertura del file \hline \macro{O\_CREAT} & se il file non esiste verrà creato, con le regole di @@ -279,26 +235,26 @@ comportamento. usano per stabilire un file di lock possono incorrere in una race condition. Si consiglia come alternativa di usare un file con un nome univoco e la funzione \func{link} per verificarne l'esistenza.} che fa - fallire \func{open} con \macro{EEXIST}.\\ + fallire \func{open} con \macro{EEXIST}. \\ \macro{O\_NONBLOCK} & apre il file in modalità non bloccante. Questo valore specifica anche una modalità di operazione (vedi sotto), e comporta che \func{open} ritorni immediatamente (torneremo su - questo in \secref{sec:file_noblocking}). \\ + questo in \secref{sec:file_noblocking}). \\ \macro{O\_NOCTTY} & se \var{pathname} si riferisce ad un device di terminale, questo non diventerà il terminale di controllo, anche se il - processo non ne ha ancora uno (si veda \secref{sec:sess_xxx}).\\ + processo non ne ha ancora uno (si veda \secref{sec:sess_xxx}). \\ \macro{O\_SHLOCK} & opzione di BSD, acquisisce uno shared lock (vedi - \secref{sec:file_locking}) sul file. Non è disponibile in Linux.\\ + \secref{sec:file_locking}) sul file. Non è disponibile in Linux. \\ \macro{O\_EXLOCK} & opzione di BSD, acquisisce uno lock esclusivo (vedi - \secref{sec:file_locking}) sul file. Non è disponibile in Linux.\\ + \secref{sec:file_locking}) sul file. Non è disponibile in Linux. \\ \macro{O\_TRUNC} & se il file esiste ed è un file di dati e la modalità di apertura consente la scrittura, allora la sua lunghezza verrà troncata a zero. Se il file è un terminale o una fifo il flag verrà ignorato, negli - altri casi il comportamento non è specificato.\\ + altri casi il comportamento non è specificato. \\ \macro{O\_NOFOLLOW} & se \var{pathname} è un link simbolico la chiamata fallisce. Questa è una estensione BSD aggiunta in Linux dal kernel 2.1.126. Nelle versioni precedenti i link simbolici sono sempre seguiti, e questa - opzione è ignorata.\\ + opzione è ignorata. \\ \macro{O\_DIRECTORY} & se \var{pathname} non è una directory la chiamata fallisce. Questo flag è specifico di Linux ed è stato introdotto con il kernel 2.1.126 per evitare dei DoS\footnote{Denial of Service, si chiamano @@ -309,7 +265,7 @@ comportamento. dell'implementazione di \func{opendir}. \\ \macro{O\_LARGEFILE} & nel caso di sistemi a 32 bit che supportano file di grandi dimensioni consente di aprire file le cui dimensioni non possono - essere rappresentate da numeri a 31 bit.\\ + essere rappresentate da numeri a 31 bit. \\ \hline \hline % modalità di operazione col file \macro{O\_APPEND} & il file viene aperto in append mode. Prima di ciascuna @@ -327,13 +283,13 @@ comportamento. causava il ritorno da una \func{read} con un valore nullo e non con un errore, questo introduce una ambiguità, dato che come vedremo in \secref{sec:file_read} il ritorno di zero da parte di \func{read} ha il - significato di una end-of-file} è sinonimo di \macro{O\_NONBLOCK}\\ + significato di una end-of-file} è sinonimo di \macro{O\_NONBLOCK}.\\ \macro{O\_ASYNC} & apre il file per l'input/output in modalità asincrona. Non è supportato in Linux. \\ - \macro{O\_FSYNC} & \\ \macro{O\_SYNC} & apre il file per l'input/output sincrono, ogni \func{write} bloccherà fino al completamento della scrittura di tutti dati - sul sull'hardware sottostante\\ + sul sull'hardware sottostante.\\ + \macro{O\_FSYNC} & sinonimo di \macro{O\_SYNC}. \\ \macro{O\_NOATIME} & blocca l'aggiornamento dei tempi dei di accesso dei file (vedi \secref{sec:file_file_times}). In Linux questa opzione non è disponibile per il singolo file ma come opzione per il filesystem in fase @@ -345,11 +301,54 @@ comportamento. \label{tab:file_open_flags} \end{table} +Il nuovo file descriptor non è condiviso con nessun altro processo, (torneremo +sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in +\secref{sec:file_sharing}). Il nuovo file descriptor è settato di default per +restare aperto attraverso una \func{exec} (come accennato in +\secref{sec:proc_exec}) ed l'offset è settato all'inizio del file. + +Il parametro \var{mode} specifica i permessi con cui il file viene +eventualmente creato; i valori possibili sono gli stessi già visti in +\secref{sec:file_perm_overview} e possono essere specificati come OR binario +delle costanti descritte in \tabref{tab:file_bit_perm}. Questi permessi +filtrati dal valore di \file{umask} (vedi \secref{sec:file_umask}) per il +processo. + +La funzione prevede diverse opzioni, che vengono specificate usando vari bit +del parametro \var{flags}. Alcuni di questi bit vanno anche a costituire il +flag di stato del file (o \textit{file status flag}), che è mantenuto nel +campo \var{f\_flags} della struttura \var{file} (al solito si veda lo schema +di \curfig). Essi sono divisi in tre categorie principali: +\begin{itemize} +\item \textsl{i bit delle modalità di accesso}: specificano con quale modalità + si accederà al file: i valori possibili sono lettura, scrittura o + lettura/scrittura. Uno di questi bit deve essere sempre specificato quando + si apre un file. Vengono settati alla chiamata da \func{open}, e possono + essere riletti con una \func{fcntl} (fanno parte del \textit{file status + flag}), ma non modificati. +\item \textsl{i bit delle modalità di apertura}: permettono di specificare + alcune delle caratteristiche del comportamento di \func{open} quando viene + eseguita. Hanno effetto solo al momento della chiamata della funzione e non + sono memorizzati nè possono essere riletti. +\item \textsl{i bit delle modalità di operazione}: permettono di specificare + alcune caratteristiche del comportamento delle future operazioni sul file + (come la \func{read} o la \func{write}). Anch'essi fanno parte del + \textit{file status flag}. Il loro valore è settato alla chiamata di + \func{open}, ma possono essere riletti e modificati (insieme alle + caratteristiche operative che controllano) con una \func{fcntl}. +\end{itemize} + +In \tabref{tab:file_open_flags} si sono riportate, ordinate e divise fra loro +secondo le tre modalità appena elencate, le costanti mnemoniche associate a +ciascuno di questi bit, dette costanti possono essere combinate fra di loro +con un OR aritmetico per costruire il valore (in forma di maschera binaria) +del parametro \var{flags} da passare alla \func{open} per specificarne il +comportamento. + Nelle prime versioni di unix i flag specificabili per \func{open} erano solo quelli relativi alle modalità di accesso del file. Per questo motivo per creare un nuovo file c'era una system call apposita, \func{creat}, il cui prototipo è: - \begin{prototype}{fcntl.h} {int creat(const char *pathname, mode\_t mode)} Crea un nuovo file vuoto, con i permessi specificati da \var{mode}. É del @@ -359,18 +358,144 @@ prototipo adesso questa funzione resta solo per compatibilità con i vecchi programmi. +\subsection{La funzione \func{close}} +\label{sec:file_close} +La funzione \func{close} permette di chiudere un file, in questo modo il file +descriptor ritorna disponibile; il suo prototipo è: +\begin{prototype}{unistd.h}{int close(int fd)} + Chiude il descrittore \var{fd}. + + La funzione ritorna 0 in caso di successo e -1 n caso di errore. In questo + caso \var{errno} è settata ai valori: + \begin{errlist} + \item \macro{EBADF} \var{fd} non è un descrittore valido. + \item \macro{EINTR} la funzione è stata interrotta da un segnale. + \end{errlist} + ed \macro{EIO}. +\end{prototype} +La chiusura di un file rilascia ogni blocco (il \textit{file locking} è +trattato in \secref{sec:file_locking}) che il processo poteva avere acquisito +su di esso; se \var{fd} è ultimo (di eventuali copie) riferimento ad un file +aperto, tutte le risorse nella file table vengono rilasciate. Infine se il +file descriptor era l'ultimo riferimento ad un file su disco quest'ultimo +viene cancellato. + +Si ricordi che quando un processo termina anche tutti i sui file descriptor +vengono chiusi, molti programmi sfruttano questa caratteristica e non usano +esplicitamente \func{close}. In genere comunque chiudere un file senza +controllarne lo stato di uscita è errore; infatti molti filesystem +implementano la tecnica del \textit{write-behind}, per cui una \func{write} +può avere successo anche se i dati non sono stati scritti, un eventuale errore +di I/O allora può sfuggire, ma verrà riportato alla chiusura del file: per +questo motivo non effettuare il controllo può portare ad una perdita di dati +inavvertita; in Linux questo comportamento è stato osservato con NFS e le +quote su disco. + +In ogni caso una \func{close} andata a buon fine non garantisce che i dati +siano stati effettivamente scritti su disco, perché il kernel può decidere di +ottimizzare l'accesso a disco ritardandone la scrittura. L'uso della funzione +\func{sync} effettua esplicitamente il \emph{flush} dei dati, ma anche in +questo caso resta l'incertezza dovuta al comportamento dell'hardware (che a +sua volta può introdurre ottimizzazioni dell'accesso al disco). -\subsection{La funzione \func{close}} -\label{sec:file_close} \subsection{La funzione \func{lseek}} \label{sec:file_lseek} +Come già accennato in \secref{sec:file_fd} a ciascun file aperto è associata +una \textsl{posizione corrente nel file} (il cosiddetto \textit{file offset}, +mantenuto nel campo \var{f\_pos} di \var{file}) espressa da un numero intero +positivo come numero di bytes dall'inizio del file. Tutte le operazioni di +lettura e scrittura avvengono a partire da questa posizione che viene +automaticamente spostata in avanti del numero di byte letti o scritti. + +In genere (a meno di non avere richiesto la modalità \macro{O\_APPEND}) questa +posizione viene settata a zero all'apertura del file. È possibile settarla ad +un valore qualsiasi con la funzione \func{lseek}, il cui prototipo è: +\begin{functions} + \headdecl{sys/types.h} + \headdecl{unistd.h} + \funcdecl{off\_t lseek(int fd, off\_t offset, int whence)} + La funzione setta la posizione attuale nel file. + + La funzione ritorna valore della posizione corrente in caso di successo e -1 + in caso di errore nel qual caso \var{errno} viene settata ad uno dei valori: + \begin{errlist} + \item \macro{ESPIPE} \var{fd} è una pipe, un socket o una fifo. + \item \macro{EINVAL} \var{whence} non è un valore valido. + \end{errlist} + e \macro{EBADF}. +\end{functions} + +La nuova posizione è settata usando il valore specificato da \var{offset}, +sommato al riferimento dato da \var{whence}; quest'ultimo può assumere i +seguenti valori\footnote{per compatibilità con alcune vecchie notazioni + questi valori possono essere rimpiazzati rispettivamente con 0, 1 e 2 o con + \macro{L\_SET}, \macro{L\_INCR} e \macro{L\_XTND}}: +\begin{description} +\item \macro{SEEK\_SET} si fa riferimento all'inizio del file: il valore di + \var{offset} è la nuova posizione. +\item \macro{SEEK\_CUR} si fa riferimento alla posizione corrente del file: + \var{offset} che può essere negativo e positivo. +\item \macro{SEEK\_END} si fa riferimento alla fine del file: il valore di + \var{offset} può essere negativo e positivo. +\end{description} + +Come accennato in \secref{sec:file_file_size} con \func{lseek} è possibile +settare la posizione corrente anche al di la della fine del file, e alla +successiva scrittura il file sarà esteso. La chiamata non causa nessuna +attività di input/output, si limita a modificare la posizione corrente nel +kernel (cioè \var{f\_pos} in \var{file}, vedi \figref{fig:file_proc_file}). + +Dato che la funzione ritorna la nuova posizione, usando il valore zero per +\func{offset} si può riottenere la posizione corrente nel file chiamando la +funzione con \func{lseek(fd, 0, SEEK\_CUR}. + +Si tenga presente inoltre che usare \macro{SEEK\_END} non assicura affatto che +successiva scrittura avvenga alla fine del file, infatti se questo è stato +aperto anche da un altro processo che vi ha scritto, la fine del file può +essersi spostata, ma noi scriveremo alla posizione settata in precedenza. +Questa è una potenziale sorgente di \textit{race condition}, e quando si vuole +essere sicuri di scrivere alla fine del file questo deve essere posto in +modalità \macro{O\_APPEND}. + +Non tutti i file supportano la capacità di eseguire una \func{lseek}, in +questo caso la funzione ritorna l'errore \macro{EPIPE}. Questo, oltre che per +i tre casi citati nel prototipo, vale anche per tutti quei dispositivi che non +supportano questa funzione, come ad esempio per le \acr{tty}\footnote{altri + sistemi, usando \macro{SEEK\_SET} in questo caso ritornano il numero di + caratteri che vi sono stati scritti}. Lo standard POSIX però non specifica +niente al proposito. Infine alcuni device, ad esempio \file{/dev/null}, non +causano un errore ma restituiscono un valore indefinito. + + \subsection{La funzione \func{read}} \label{sec:file_read} +Per leggere da un file precedentemente aperto, si può la funzione \func{read}, +il cui prototipo è: +\begin{prototype} + \headdecl{unistd.h} + \funcdecl{ssize\_t read(int fd, void * buf, size\_t count)} + + La funzione cerca di leggere \var{count} bytes dal file \var{fd} al buffer + \var{buf}. + + La funzione ritorna il numero di byte letti in caso di successo e -1 in + caso di errore, nel qual caso \var{errno} viene settata ad uno dei valori: + \begin{errlist} + \item \macro{EINTR} la funzione è stata interrotta da un segnale prima di + aver letto quasiasi dato. + \item \macro{EAGAIN} la funzione non aveva nessun dato da restituire e si + era aperto il file in modalità \macro{O\_NONBLOCK}. + \end{errlist} + ed inoltre \macro{EBADF}, \macro{EIO}, \macro{EISDIR}, \macro{EBADF}, + \macro{EINVAL} e \macro{EFAULT}. +\end{prototype} + + \subsection{La funzione \func{write}} \label{sec:file_write} @@ -378,10 +503,10 @@ adesso questa funzione resta solo per compatibilit \section{Funzioni avanzate} \label{sec:file_adv_func} + \subsection{La condivisione dei files} \label{sec:file_sharing} - Si noti che i flag di stato del file, quelli settati dal parametro \var{flag} di \func{open}, essendo tenuti nella vode sulla file table, vengono condivisi, ai file sono però associati anche altri flag, (tenuti invece nella struttura @@ -403,7 +528,3 @@ usato al momento \subsection{La funzione \func{ioctl}} \label{sec:file_ioctl} - - - -