From d58b732f24797c3c17ab1cc8d8aa85ec04df62ed Mon Sep 17 00:00:00 2001 From: Simone Piccardi Date: Fri, 23 Nov 2001 00:23:35 +0000 Subject: [PATCH] Rilettura e inizio degli stream --- filedir.tex | 13 ++++-- fileintro.tex | 2 +- filestd.tex | 111 +++++++++++++++++++++++++++++++++++++++++--------- fileunix.tex | 42 ++++++++++--------- gapil.tex | 4 +- intro.tex | 2 +- 6 files changed, 127 insertions(+), 47 deletions(-) diff --git a/filedir.tex b/filedir.tex index c9884c4..7574ac9 100644 --- a/filedir.tex +++ b/filedir.tex @@ -867,7 +867,8 @@ Il sistema mantiene per ciascun file tre tempi. Questi sono registrati nell'inode insieme agli altri attributi del file e possono essere letti tramite la funzione \func{stat}, che li restituisce attraverso tre campi della struttura \var{stat} di \figref{fig:file_stat_struct}. Il significato di detti -tempi e dei relativi campi è riportato nello schema in \ntab: +tempi e dei relativi campi è riportato nello schema in \ntab, dove si è anche +riportato un esempio delle funzioni che effettuano cambiamenti su di essi. \begin{table}[htb] \centering @@ -878,8 +879,10 @@ tempi e dei relativi campi & \textbf{Opzione} \\ \hline \hline - \var{st\_atime}& ultimo accesso ai dati del file &\func{read}& \cmd{-u}\\ - \var{st\_mtime}& ultima modifica ai dati del file &\func{write}& default\\ + \var{st\_atime}& ultimo accesso ai dati del file &\func{read}, + \func{utime} & \cmd{-u}\\ + \var{st\_mtime}& ultima modifica ai dati del file &\func{write}, + \func{utime} & default\\ \var{st\_ctime}& ultima modifica ai dati dell'inode&\func{chmod}, \func{utime} & \cmd{-c} \\ \hline @@ -997,7 +1000,9 @@ quest'ultimo. Si noti infine come \var{st\_ctime} non abbia nulla a che fare con il tempo di creazione del file, usato in molti altri sistemi operativi, ma che in unix non -esiste. +esiste. Per questo motivo quando si copia un file, a meno di preservare +esplicitamente i tempi (ad esempio con l'opzione \cmd{-p} di \cmd{cp}) esso +avrà sempre il tempo corrente come data di ultima modifica. \subsection{La funzione \func{utime}} diff --git a/fileintro.tex b/fileintro.tex index 640affb..24fec34 100644 --- a/fileintro.tex +++ b/fileintro.tex @@ -1,4 +1,4 @@ -\chapter{I file: l'architettura} +\chapter{L'architettura dei file} \label{cha:file_intro} Uno dei concetti fondamentali della architettura di unix è il cosiddetto diff --git a/filestd.tex b/filestd.tex index 297d2a8..3810f04 100644 --- a/filestd.tex +++ b/filestd.tex @@ -1,33 +1,87 @@ -\chapter{I files: l'interfaccia standard ANSI C} +\chapter{I file: l'interfaccia standard ANSI C} \label{cha:files_std_interface} -% -% Questa va per ultima. Va bene che e` la più usata, ma è basata sulle altre -% -\section{I file stream e gli oggetti \type{FILE}} +Esamineremo in questo capitolo l'interfaccia standard ANSI C per i file, +quella che viene comunemente detta interfaccia degli \textit{stream}. +Dopo una breve sezione introduttiva tratteremo le funzioni base per la +gestione dell'input/output, mentre tratteremo le caratteristiche più aanzate +dell'interfaccia nell'ultima sezione. + + +\section{Introduzione} +\label{sec:file_stream_intro} + +Come visto in \capref{cap:file_unix_interface} le operazioni di I/O sui file +sono gestibili direttamente a basso livello con l'interfaccia standard unix +che ricorre direttamente alle system call messe a disposizione dal kernel. + +Questa interfaccia però non provvede le funzionalità previste dallo standard +ANSI C che invece sono realizzate attraverso opportune funzioni di libreria, +che vengono a costituire il nucleo essenziale\footnote{queste funzioni sono + state implementate la prima volta da Ritchie nel 1976 e da allora sono + rimaste sostanzialmente immutate.} delle \acr{glibc}. + + +\subsection{I \textit{file stream}} \label{sec:file_stream} -Esamineremo in questa sezione l'interfaccia per i file stream, le modalità per -crearli, e le funzioni disponibili per leggere, scrivere e compiere le varie -operazioni connesse all'uso dei file. L'interfaccia è accessibile includendo -l'header file \file{stdio.h}. +Come più volte ribadito l'interfaccia dei file descriptor è una interfaccia di +basso livello, che non provvede nessuna forma di formattazione dei dati, e +nessuna forma di bufferizzazione per ottimizzare le operazioni di I/O. + +In \textit{Advanced Programming in the Unix Environment} Stevens esegue un +raffronto dell'influenza delle dimensioni del blocco di dati (il parametro +\param{buf} di \func{read} e \func{write}) nell'efficienza nelle operazioni di +I/O con i file descriptor, evidenziando come le prestazioni ottimali si +ottengano quando il buffer dei dati ha la stessa dimensione dei blocchi del +filesystem (il valore dato dal campo \var{st\_blksize} di \var{fstat}). + +In questo caso se il porgrammatore non si cura di effettuare le operazioni in +blocchi di dimensioni adeguate, le prestazioni possono deteriorarsi in maniera +evidetne. L'interfaccia degli stream provvede da sola la gestione dei dettagli +della bufferizzazione e dell'esecuzione delle operazioni di lettura e +scrittura effettive in blocchi di dimensioni appropriate all'ottenimento della +massima efficienza. + +Per questo motivo l'interfaccia viene chiamata anche interfaccia dei +\textit{file stream}, dato che non è più necessario doversi preoccupare di +gestire i dettagli della comunicazione con il tipo di hardware sottostante, ed +esso può essere sempre considerato come composto da un flusso (da cui il nome +\textit{stream}) continuo di dati. + +Ma a parte le particolarità della gestione delle operazioni di lettura e +scrittura, i file stream restano del tutto equivalenti ai file descriptor sui +quali sono basati, ed in particolare vale quanto visto in +\secref{sec:file_sharing} a proposito dell'accesso condiviso ed in +\secref{sec:file_access_control} per il controllo di accesso. + + +\subsection{Gli oggetti \type{FILE}} +\label{sec:file_FILE} Per ragioni storiche la struttura di dati che rappresenta un stream è stata chiamata \type{FILE}, questi oggetti sono creati dalle funzioni di libreria e contengono tutte le informazioni necessarie a gestire le operazioni sugli stream, come la posizione corrente, lo stato del buffer e degli indicatori di -stato e di fine del file. Per questo motivo gli utenti non devono mai -utilizzare direttamente o allocare queste strutture, ma usare sempre puntatori -del tipo \type{FILE *} (tanto che in certi casi il termine di puntatore a file -è diventato sinonimo di stream). +stato e di fine del file. + +Per questo motivo gli utenti non devono mai utilizzare direttamente o allocare +queste strutture, ma usare sempre puntatori del tipo \type{FILE *} ottenuti +dalla libreria stessa (tanto che in certi casi il termine di puntatore a file +è diventato sinonimo di stream). + +Tutte le funzioni della libreria che operano sui file accettano come parametri +solo variabili di questo tipo, che diventa accessibile includendo l'header +file \file{stdio.h}. + + \subsection{Gli stream standard} \label{sec:file_std_stream} - -Ai tre file standard (vedi \secref{sec:file_std_descr}) aperti per ogni -processo, corrispondono altrettanti stream predefiniti per ogni processo, che -rappresentano i canali standard di input/output prestabiliti; anche questi +Ai tre file descriptor standard (vedi \secref{sec:file_std_descr}) aperti per +ogni processo, corrispondono altrettanti stream predefiniti per ogni processo, +che rappresentano i canali standard di input/output prestabiliti; anche questi tre stream sono definiti nell'header \file{stdio.h} e sono: \begin{itemize} @@ -42,15 +96,28 @@ tre stream sono definiti nell'header \file{stdio.h} e sono: è associato dalla shell all'output del terminale e scrive sullo schermo. \end{itemize} +Nelle \acr{glibc} \var{stdin}, \var{stdout} e \var{stderr} sono effettivamente +tre variabili che possono essere usate come tutte le altre, ad esempio si può +effettuare una redirezione dell'ouput di un programma con il semplice codice: +\begin{lstlisting}[labelstep=0,frame=,indent=1cm]{} + fclose (stdout); + stdout = fopen ("standard-output-file", "w"); +\end{lstlisting} +ma in altri sistemi possono essere definite come macro, e deve essere pertanto +usata \func{freopen}. -\subsection{La bufferizzazione} -\label{sec:file_buffering} +\subsection{Le modalità di bufferizzazione} +\label{sec:file_buffering} \section{Funzioni base} \label{sec:file_ansi_base_func} +Esamineremo in questa sezione le funzioni base dell'interfaccia degli stream, +che provvedono le modalità per crearli, e le funzioni disponibili per leggere, +scrivere e compiere le varie operazioni connesse all'uso dei file. + \subsection{Apertura di uno stream} \label{sec:file_fopen} @@ -80,11 +147,14 @@ tre stream sono definiti nell'header \file{stdio.h} e sono: \label{sec:file_fclose} - \section{Funzioni avanzate} \label{sec:file_stream_adv_func} +\subsection{Il controllo della bufferizzazione} +\label{sec:file_buffering-ctrl} + + \subsection{Dettagli dell'implementazione} \label{sec:file_stream_details} @@ -103,3 +173,4 @@ tre stream sono definiti nell'header \file{stdio.h} e sono: + diff --git a/fileunix.tex b/fileunix.tex index 5c1ab7c..b9d7219 100644 --- a/fileunix.tex +++ b/fileunix.tex @@ -1,12 +1,12 @@ -\chapter{L'interfaccia unix di I/O con i file} +\chapter{I file: l'interfaccia standard unix} \label{cha:file_unix_interface} Esamineremo in questo capitolo la prima delle due interfacce di programmazione per i file, quella dei \textit{file descriptor}, nativa di unix. Questa è -l'interfaccia di basso livello, che non prevede funzioni evolute come la -bufferizzazione o funzioni di lettura o scrittura formattata, ma è su questa -che è costruita anche l'interfaccia standard dei file definita dallo standard -ANSI C. +l'interfaccia di basso livello provvista direttamente dalle system call, che +non prevede funzionalità evolute come la bufferizzazione o funzioni di lettura +o scrittura formattata, e sulla quale è costruita anche l'interfaccia definita +dallo standard ANSI C che affronteremo in \capref{cha:files_std_interface}. @@ -205,12 +205,7 @@ prototipo La funzione apre il file, usando il primo file descriptor libero, e crea l'opportuna voce (cioè la struttura \var{file}) nella file table. Viene usato -sempre il file descriptor con il valore più basso. Questa caratteristica -permette di prevedere qual'è il valore che si otterrà, e viene talvolta usata -da alcune applicazioni per sostituire i file corrispondenti ai file standard -di \secref{sec:file_std_descr}: se ad esempio si chiude lo standard input e si -apre subito dopo un nuovo file questo diventerà il nuovo standard input (avrà -cioè il file descriptor 0). +sempre il file descriptor con il valore più basso. \begin{table}[!htb] \centering @@ -308,6 +303,13 @@ cio una ambiguità, dato che come vedremo in \secref{sec:file_read} il ritorno di zero da parte di \func{read} ha il significato di una end-of-file.} +Questa caratteristica permette di prevedere qual'è il valore del file +descriptor che si otterrà al ritorno di \func{open}, e viene talvolta usata da +alcune applicazioni per sostituire i file corrispondenti ai file standard di +\secref{sec:file_std_descr}: se ad esempio si chiude lo standard input e si +apre subito dopo un nuovo file questo diventerà il nuovo standard input (avrà +cioè il file descriptor 0). + Il nuovo file descriptor non è condiviso con nessun altro processo, (torneremo sulla condivisione dei file, in genere accessibile dopo una \func{fork}, in @@ -481,8 +483,9 @@ causano un errore ma restituiscono un valore indefinito. \subsection{La funzione \func{read}} \label{sec:file_read} -Per leggere da un file precedentemente aperto, si può la funzione \func{read}, -il cui prototipo è: + +Una volta che un file è stato aperto su possono leggere i dati che contiene +utilizzando la funzione \func{read}, il cui prototipo è: \begin{prototype}{unistd.h}{ssize\_t read(int fd, void * buf, size\_t count)} La funzione cerca di leggere \var{count} byte dal file \var{fd} al buffer @@ -567,17 +570,18 @@ per \func{read} e \func{lseek}. \end{prototype} Questa funzione serve quando si vogliono leggere dati dal file senza -modificarne la posizione corrente. È equivalente alla esecuzione di una -\func{read} e una \func{lseek}, ma dato che la posizione sul file può essere -condivisa fra vari processi (vedi \secref{sec:file_sharing}), essa permette di -eseguire l'operazione atomicamente. Il valore di \var{offset} fa riferimento -all'inizio del file. +modificarne la posizione corrente. È sostanzialmente equivalente alla +esecuzione di una \func{read} e una \func{lseek}, ma dato che la posizione sul +file può essere condivisa fra vari processi (vedi \secref{sec:file_sharing}), +essa permette di eseguire l'operazione atomicamente. Il valore di \var{offset} +fa sempre riferimento all'inizio del file. \subsection{La funzione \func{write}} \label{sec:file_write} -Per scrivere su un file si usa la funzione \func{write}, il cui prototipo è: +Una volta che un file è stato aperto su può scrivere su di esso utilizzando la +funzione \func{write}, il cui prototipo è: \begin{prototype}{unistd.h}{ssize\_t write(int fd, void * buf, size\_t count)} La funzione scrive \var{count} byte dal buffer \var{buf} sul file \var{fd}. diff --git a/gapil.tex b/gapil.tex index 3b8ed0b..ed7c9d6 100644 --- a/gapil.tex +++ b/gapil.tex @@ -1,8 +1,8 @@ -%% +%% %% GaPiL : Guida alla Programmazione in Linux %% %% S. Piccardi Oct. 2000 -%% +%% %% main.tex: file principale, gli altri vanno inclusi da questo. %% \documentclass[a4paper,11pt,twoside,italian]{book} diff --git a/intro.tex b/intro.tex index baa8f71..afd32b4 100644 --- a/intro.tex +++ b/intro.tex @@ -72,7 +72,7 @@ hanno un'interfaccia diversa, ma resta valido il concetto generale che tutto il lavoro di accesso e gestione a basso livello è effettuato dal kernel). -\section{User space e kernel space} +\subsection{User space e kernel space} \label{sec:intro_user_kernel_space} Uno dei concetti fondamentali su cui si basa l'architettura dei sistemi unix è -- 2.30.2