X-Git-Url: https://gapil.gnulinux.it/gitweb/?p=gapil.git;a=blobdiff_plain;f=filestd.tex;h=2e9b05af38d47538260c57eb57836ead8850735e;hp=df1b4655337b218f851cd3e9a15b2ffd9beeeb6d;hb=8afc898ae5530e3ef1073505c894bb1b738ec916;hpb=80ddc5f8b7f561a4fc605330be149089cd838de8 diff --git a/filestd.tex b/filestd.tex index df1b465..2e9b05a 100644 --- a/filestd.tex +++ b/filestd.tex @@ -2,9 +2,9 @@ \label{cha:files_std_interface} Esamineremo in questo capitolo l'interfaccia standard ANSI C per i file, -quella che viene comunemente detta interfaccia degli \textit{stream}. -Dopo una breve sezione introduttiva tratteremo le funzioni base per la -gestione dell'input/output, mentre tratteremo le caratteristiche più avanzate +quella che viene comunemente detta interfaccia degli \textit{stream}. Dopo +una breve sezione introduttiva tratteremo le funzioni base per la gestione +dell'input/output, mentre tratteremo le caratteristiche più avanzate dell'interfaccia nell'ultima sezione. @@ -334,7 +334,7 @@ una operazione nominalmente nulla come \func{fseek(file, 0, SEEK\_CUR)} sufficiente a garantire la sincronizzazione. Una volta aperto lo stream, si può cambiare la modalità di bufferizzazione -(vedi \secref{sec:file_buffering_ctrl}) fintanto che non si è effettuato +(si veda \secref{sec:file_buffering_ctrl}) fintanto che non si è effettuato alcuna operazione di I/O sul file. Uno stream viene chiuso con la funzione \func{fclose} il cui prototipo è: @@ -348,12 +348,12 @@ Uno stream viene chiuso con la funzione \func{fclose} il cui prototipo \func{fflush}).} \end{prototype} -La funzione effettua uno scarico di tutti i dati presenti nei buffer di -uscita e scarta tutti i dati in ingresso, se era stato allocato un -buffer per lo stream questo verrà rilasciato. La funzione effettua lo -scarico solo per i dati presenti nei buffer in user space usati dalle -\acr{glibc}; se si vuole essere sicuri che il kernel forzi la scrittura -su disco occorrerà effettuare una \func{sync}. +La funzione effettua lo scarico di tutti i dati presenti nei buffer di uscita +e scarta tutti i dati in ingresso; se era stato allocato un buffer per lo +stream questo verrà rilasciato. La funzione effettua lo scarico solo per i +dati presenti nei buffer in user space usati dalle \acr{glibc}; se si vuole +essere sicuri che il kernel forzi la scrittura su disco occorrerà effettuare +una \func{sync} (vedi \secref{sec:file_sync}). Linux supporta, come estensione implementata dalle \acr{glibc}, anche una altra funzione, \func{fcloseall}, che serve a chiudere tutti i file, il suo @@ -805,7 +805,7 @@ newline, che deve essere previsto esplicitamente. Come per le funzioni di input/output a caratteri esistono le estensioni per leggere e scrivere caratteri estesi, i loro prototipi sono: \begin{functions} - \headdecl{whar.h} + \headdecl{wchar.h} \funcdecl{wchar\_t *fgetws(wchar\_t *ws, int n, FILE *stream)} Legge un massimo di \param{n} caratteri estesi dal file \param{stream} al buffer \param{ws}. @@ -834,7 +834,7 @@ previste dallo standard ANSI C presentano svariati inconvenienti. Bench \func{fgets} non abbia i gravissimi problemi di \func{gets}, può comunque dare risultati ambigui se l'input contiene degli zeri; questi infatti saranno scritti sul buffer di uscita e la stringa in output -apparirà come più corta dei bytes effettivamente letti. Questa è una +apparirà come più corta dei byte effettivamente letti. Questa è una condizione che è sempre possibile controllare (deve essere presente un newline prima della effettiva conclusione della stringa presente nel buffer), ma a costo di una complicazione ulteriore della logica del @@ -940,13 +940,14 @@ famiglia \func{printf}; le tre pi \bodydesc{Le funzioni ritornano il numero di caratteri stampati.} \end{functions} \noindent le prime due servono per stampare su file (lo standard output -o quallo specificato) la terza permette di stampare su una stringa, in -genere l'uso di \func{sprintf} è sconsigliato in quanto è possibile, se -non si ha la sicurezza assoluta sulle dimensioni del risultato della -stampa, eccedere le dimensioni di \param{str}; per questo motivo si -consiglia l'uso dell'alternativa: +o quello specificato) la terza permette di stampare su una stringa, in genere +l'uso di \func{sprintf} è sconsigliato in quanto è possibile, se non si ha la +sicurezza assoluta sulle dimensioni del risultato della stampa, eccedere le +dimensioni di \param{str} con conseguente sovrascrittura di altre varibili e +possibili buffer overflow; per questo motivo si consiglia l'uso +dell'alternativa: \begin{prototype}{stdio.h} -{snprintf(char *str, size\_t size, const char *format, ...);} +{snprintf(char *str, size\_t size, const char *format, ...)} Identica a \func{sprintf}, ma non scrive su \param{str} più di \param{size} caratteri. \end{prototype} @@ -955,70 +956,178 @@ La parte pi \param{format} che indica le conversioni da fare, da cui poi deriva il numero dei parametri che dovranno essere passati a seguire. La stringa è costituita da caratteri normali (tutti eccetto \texttt{\%}), che vengono passati -invariati all'output, e da direttive di conversione, il cui formato è sempre -del tipo: +invariati all'output, e da direttive di conversione, in cui devono essere +sempre presenti il carattere \texttt{\%}, che introduce la direttiva, ed uno +degli specificatori di conversione (riportati in \ntab) che la conclude. + +\begin{table}[htb] + \centering + \begin{tabular}[c]{|l|l|p{10cm}|} + \hline + \textbf{Valore} & \textbf{Tipo} & \textbf{Significato} \\ + \hline + \hline + \cmd{\%d} &\type{int} & Stampa un numero intero in formato decimale + con segno \\ + \cmd{\%i} &\type{int} & Identico a \cmd{\%i} in output, \\ + \cmd{\%o} &\type{unsigned int}& Stampa un numero intero come ottale\\ + \cmd{\%u} &\type{unsigned int}& Stampa un numero intero in formato + decimale senza segno \\ + \cmd{\%x}, + \cmd{\%X} &\type{unsigned int}& Stampano un intero in formato esadecimale, + rispettivamente con lettere minuscole e + maiuscole. \\ + \cmd{\%f} &\type{unsigned int}& Stampa un numero in virgola mobile con la + notazione a virgola fissa \\ + \cmd{\%e}, + \cmd{\%E} &\type{double} & Stampano un numero in virgola mobile con la + notazione esponenziale, rispettivamente con + lettere minuscole e maiuscole. \\ + \cmd{\%g}, + \cmd{\%G} &\type{double} & Stampano un numero in virgola mobile con la + notazione più appropriate delle due precedenti, + rispettivamente con lettere minuscole e + maiuscole. \\ + \cmd{\%a}, + \cmd{\%A} &\type{double} & Stampano un numero in virgola mobile in + notazione esadecimale frazionaria\\ + \cmd{\%c} &\type{int} & Stampa un carattere singolo\\ + \cmd{\%s} &\type{char *} & Stampa una stringa \\ + \cmd{\%p} &\type{void *} & Stampa il valore di un puntatore\\ + \cmd{\%n} &\type{\&int} & Prende il numero di caratteri stampati finora\\ + \cmd{\%\%}& & Stampa un \% \\ + \hline + \end{tabular} + \caption{Valori possibili per gli specificatori di conversione in una + stringa di formato di \func{printf}.} + \label{tab:file_format_spec} +\end{table} + + +Il formato di una direttiva di conversione prevede una serie di possibili +elementi opzionali oltre al \cmd{\%} e allo specificatore di conversione; in +generale essa è sempre del tipo: \begin{center} \begin{verbatim} -% [n. parametro $] [flag] [larghezza] [. precisione] [tipo] conversione +% [n. parametro $] [flag] [[larghezza] [. precisione]] [tipo] conversione \end{verbatim} \end{center} -in cui devono essere sempre presenti il carattere \texttt{\%}, che introduce -la direttiva, ed uno degli specificatori di conversione (riportatati in \ntab) -che la conclude; gli altri valori, indicati fra parentesi, sono opzionali. +in cui i valori opzionali sono indicati fra parentesi, e prevedono la +presenza, in questo ordine, di: uno specificatore per il parametro da usare +(terminato da un \cmd{\$}, uno o più flag (riassunti in +\tabref{tab:file_format_flag}) che controllano il formato di stampa della +conversione (riassunti in \tabref{tab:file_format_type}), uno specificatore di +larghezza, eventualmente seguito (per i numeri in virgola mobile) da un +specificatore di precisione, uno specificatore del tipo di dato (che ne indica +la lunghezza). \begin{table}[htb] \centering \begin{tabular}[c]{|l|p{10cm}|} \hline - \textbf{Valore} & \textbf{Significato} \\ + \textbf{Valore} & \textbf{Significato}\\ \hline \hline - \cmd{\%d} & Stampa un numero intero in formato decimale - con segno\\ - \cmd{\%i} & Identico a \cmd{\%i} in output, \\ - \cmd{\%o} & Stampa un numero intero come ottale\\ - \cmd{\%u} & Stampa un numero intero in formato decimale senza - segno \\ - \cmd{\%x}, \cmd{\%X} & Stampano un intero in formato esadecimale, - rispettivamente con lettere minuscole e maiuscole. \\ - \cmd{\%f} & Stampa un numero in virgola mobile con la notazione - a virgola fissa \\ - \cmd{\%e}, \cmd{\%E} & Stampano un numero in virgola mobile con la notazione - esponenziale, rispettivamente con lettere minuscole - e maiuscole. \\ - \cmd{\%g}, \cmd{\%G} & Stampano un numero in virgola mobile con la notazione - più appropriate delle due precedenti, - rispettivamente con lettere minuscole e maiuscole. \\ - \cmd{\%a}, \cmd{\%A} & Stampano un numero in virgola mobile in notazione - esadecimale frazionaria\\ - \cmd{\%c} & Stampa un carattere singolo\\ - \cmd{\%s} & Stampa una stringa \\ - \cmd{\%p} & Stampa il valore di un puntatore\\ - \cmd{\%n} & Prende il numero di caratteri stampati finora\\ + \cmd{\#} & Chiede la conversione in forma alternativa. \\ + \cmd{0} & La conversione è riempita con zeri alla sinistra del valore.\\ + \cmd{-} & La conversione viene allineata a sinistra sul bordo del campo.\\ + \cmd{' '}& Mette uno spazio prima di un numero con segno di valore + positivo\\ + \cmd{+} & Mette sempre il segno ($+$ o $-$) prima di un numero.\\ \hline \end{tabular} - \caption{Valori possibili per gli specificatori di conversione in una - stringa di formato per l'output.} - \label{tab:file_format_spec} + \caption{I valori dei flag per il formato di \func{printf}} + \label{tab:file_format_flag} \end{table} +Dettagli ulteriori sulle varie opzioni possono essere trovati nella man page +di \func{printf} e nella documentazione delle \acr{glibc}. +\begin{table}[htb] + \centering + \begin{tabular}[c]{|l|p{10cm}|} + \hline + \textbf{Valore} & \textbf{Significato} \\ + \hline + \hline + \cmd{hh} & una conversione intera corriponde a un \type{char} con o senza + segno, o il puntatore per il numero dei parametri \cmd{n} è di + tipo \type{char}.\\ + \cmd{h} & una conversione intera corriponde a uno \type{short} con o + senza segno, o il puntatore per il numero dei parametri \cmd{n} + è di tipo \type{short}.\\ + \cmd{l} & una conversione intera corriponde a un \type{long} con o + senza segno, o il puntatore per il numero dei parametri \cmd{n} + è di tipo \type{long}, o il carattere o la stringa seguenti + sono in formato esteso.\\ + \cmd{ll} & una conversione intera corriponde a un \type{long long} con o + senza segno, o il puntatore per il numero dei parametri \cmd{n} + è di tipo \type{long long}.\\ + \cmd{L} & una conversione in virgola mobile corrisponde a un + \type{double}.\\ + \cmd{q} & sinonimo di \cmd{ll}.\\ + \cmd{j} & una conversione intera corrisponde a un \type{intmax\_t} o + \type{uintmax\_t}.\\ + \cmd{z} & una conversione intera corrisponde a un \type{size\_t} o + \type{ssize\_t}.\\ + \cmd{t} & una conversione intera corrisponde a un \type{ptrdiff\_t}.\\ + \hline + \end{tabular} + \caption{Il modificatore di tipo di dato per il formato di \func{printf}} + \label{tab:file_format_type} +\end{table} +Una versione alternativa delle funzioni di output formattato, che permettono +di usare il puntatore ad una lista di argomenti (vedi \secref{proc_variadic}), +sono le seguenti: +\begin{functions} + \headdecl{stdio.h} + + \funcdecl{int vprintf(const char *format, va\_list ap)} Stampa su + \var{stdout} gli argomenti della lista \param{ap}, secondo il formato + specificato da \param{format}. + + \funcdecl{int vfprintf(FILE *stream, const char *format, va\_list ap)} + Stampa su \param{stream} gli argomenti della lista \param{ap}, secondo il + formato specificato da \param{format}. + + \funcdecl{int vsprintf(char *str, const char *format, va\_list ap)} Stampa + sulla stringa \param{str} gli argomenti della lista \param{ap}, secondo il + formato specificato da \param{format}. + \bodydesc{Le funzioni ritornano il numero di caratteri stampati.} +\end{functions} +\noindent con queste funzioni diventa possibile selezionare gli argomenti che +si vogliono passare ad una routine di stampa, passando direttamente la lista +tramite il parametro \param{ap}. Per poter far questo ovviamente la lista dei +parametri dovrà essere opportunamente trattata (l'argomento è esaminato in +\secref{sec:proc_variadic}), e dopo l'esecuzione della funzione l'argomento +\param{ap} non sarà più utilizzabile (in generale dovrebbe essere eseguito un +\macro{va\_end(ap)} ma in Linux questo non è necessario). + +Come per \func{sprintf} anche per \func{vsprintf} esiste una analoga +\func{vsnprintf} che pone un limite sul numero di caratteri che vengono +scritti sulla stringa di destinazione: +\begin{prototype}{stdio.h} +{vsnprintf(char *str, size\_t size, const char *format, va\_list ap)} + Identica a \func{vsprintf}, ma non scrive su \param{str} più di + \param{size} caratteri. +\end{prototype} - - +Per evitare questi problemi con la stampa su stringhe di lunghezza +insuffciente le \acr{glibc} supportano una estensione specifica GNU che alloca +dinamicamente tutto lo spazio necessario; l'estensione si attiva al solito +definendo \macro{\_GNU\_SOURCE}, \subsection{Posizionamento su uno stream} \label{sec:file_fseek} Come per i file descriptor è possibile anche con gli stream spostarsi -all'interno di un file per effettuare operazioni di lettura o scrittura -in un punto prestabilito; questo fintanto che l'operazione di -riposizionamento è supportata dal file sottostante lo stream, quando -cioè si ha a che fare con quelio che viene detto un file ad -\textsl{accesso casuale}. +all'interno di un file per effettuare operazioni di lettura o scrittura in un +punto prestabilito; questo fintanto che l'operazione di riposizionamento è +supportata dal file sottostante lo stream, quando cioè si ha a che fare con +quello che viene detto un file ad \textsl{accesso casuale}. In GNU/Linux ed in generale in ogni sistema unix-like la posizione nel file è espressa da un intero positivo, rappresentato dal tipo